古いMacで電子書籍のePubファイルを扱う(その1)
最近よく話題にあがる電子書籍だが、そのフォーマットの一つにePubがある。仕事でこのePubの内容を確認して、必要な箇所(テキスト)を転記するというケースが増えてきた。
ところが、ePubは英語圏で普及した国際標準規格なので、日本語を使ったePubを古いMacで閲覧する場合、いろいろ面倒が生じる。
例えば、Adobe AIRのアプリ「Adobe Digital Editions.app」だが、作成した際の文字コードによるのかもしれないが、日本語が文字化けしてしまう。
● ePub閲覧ソフトの動きが重すぎる
calibre.appというアプリは日本語が使えるePub作成ソフト。ePubビューワ(E-Book Viewer)の機能もあり、日本語でも文字化け無しに閲覧できるが、どうも動きが重すぎる。maxメモリが2GBの古いMacBookではちょっと辛い。
Sigil.appというebook エディターは、文字化け無しで比較的軽く動作するが、現在入手できるバージョンは、対応がMac OS X 10.6以上で、Mac OS X 10.5以下では動かない。
Mac OS X 10.5以上なら、プラグインの「EPUB QuickLook.qlgenerator」を入れたクイックルックで内容を確認できるはずだが、どうも環境が合わないのか、表示されない(Mac OS X 10.5とMac OS X 10.6で試した結果)。もっとも、クイックルックではテキストのコピーはできないだろうけど。
そこで、ePubの中身のテキストや画像を簡単にコピーできる裏技
ePubのファイル形式の実態は、XHTMLやCSS、画像などのファイルをまとめてzip圧縮、コンテナ化したものなので、拡張子「.epub」を「.zip」に変えて、解凍すればコンテナの中身に触れることができる。
● ただしここで問題が
このzipファイルをダブルクリックして解凍しようとすると、Mac OS付属の「アーカイブユーティリティ.app」(Mac OS X 10.5以上の場合)が立ち上がり、拡張子「.cpgz」というファイルに変えてしまう。「.cpgz」というのは、Unix系ファイルフォーマットcpioをアーカイブしたもの。
「アーカイブユーティリティ.app」は、mimetypeが「application/epub+zip」のものをzipではなくcpioと認識して圧縮してしまうためらしい。「.cpgz」をダブルクリックすると、「.cpgz」が解凍され、また「.zip」ができ上がり、これを繰り返してしまう。
Mac OS X 10.4でも、同じく「BOMArchiveHelper.app」が立ち上がり、同様の結果になる(正常に解凍できるケースもあったが)。
ちなみに「アーカイブユーティリティ.app」は、ビルドバージョンは違うが「BOMArchiveHelper.app」と同じもの。「アーカイブユーティリティ.app」のvresion.plistのProjectNameにBomArchiveHelperと記されている。このappのある場所は、いずれも「システム/ライブラリ/CoreServices」の中。
● 解決法
もしくは、「.epub」を「.zip」ではなく、「.sit」にリネームしてダブルクリックすれば、StuffIt Expander.appが立ち上がり解凍できる。
● ePubの中身を確認
解凍されたePubのフォルダを開くと下の画像のようになる。
この中のOEBPSフォルダがコンテンツの実体
OEBPSは、「Open eBook Publication Structure」の略。
「OEBPSフォルダ」→「Text」→「Section0001.xhtml」このxhtmlをテキストエディット.appなどにドロップすれば、テキストをコピーできる。画像は、「OEBPSフォルダ」→「Images」にある。
● この記事内に登場したアプリ
Adobe Digital Editions.app:無料 Adobe AIRのアプリ
calibre.app:無料
最新版はMac OS X 10.5以上。10.4Tiger・PowerPC用、Windows用、Linux用もある。
Sigil.app:無料 ebook エディター
StuffIt Expander.app:無料
Mac OS 9 の頃は、解凍ソフトの定番。
The Unarchiver.app:無料
もしくは、Mac App Storeから(Mac OS X 10.7用)。
古いMac用は、「Older versions」から。Windows用もある。
0 件のコメント:
コメントを投稿