2009年9月5日 星期六

最近瘋電子書和電子書工具

最近發現電子書很好玩,不過,我特別討厭像Amazon那樣出了個只能讀取一種「封閉性」電子書格式的Kindle閱讀器,因此,我特別熱衷尋找可以處理任何電子書格式的工具和掌上型閱讀器的組合,這一來,便可滿足我一向喜歡把「資料電子化」的願望,我想,今天我終於找到了!

答案就是: Calibre。

這是個免費的Windows版電子書全方位管理工具,幾乎所有功能都有了,唯一無法做到的是以下幾項:

1. 不能讀取.imp格式的電子書---還好,有人好心用C和Perl寫了可以從.imp檔抓取出文字和圖片的工具,叫做 imp_dump,速度極快。

2. 雖能讀取Sony格式的.lrf,卻不能轉成epub---沒關係,可以用免費的ABC Amber Sony Conveter轉成txt,再轉epub。

3. 不能讀取微軟早期的說明文件.chm格式---沒關係,可以用另一個工具ICE Book Reader Professional(免費的「嘮叨軟體」),同樣先轉成txt再轉epub。

4. PDF若有圖和表,幾乎無法成功轉換成epub---這真是美中不足,因為當今市面上量最大的商業、技術文件全都是用PDF製成的,內容五花八門,圖片和表格特別多。

目前,可以在掌上輕鬆閱讀PDF,同時可以放大頁面的工具有:

a. Sony即將推出的「Daily Reader」,好期待!

b. Amazon的Kindle DX。我看過Youtube上的demo後覺得它的PDF功能挺讓人失望,第一,不能縮放,只有固定的兩種landscape和portrait閱讀方式。第二,圖片多時,換頁速度可能慢到5-10秒。

再回到Calibre,我用Calibre(或imp_dump或ICE Reader)讀取輸入格式,轉換成epub格式,再打開Calibre附帶的內容伺服器功能,既能讓我iPhone上的Stanza閱讀器輕鬆透過雲端取得剛剛出爐的epub電子書,開始享受掌上閱讀!

中文呢?

我很驚奇地發現,Calibre + Stanza 遇到中文也不怕,只要轉成UTF-8,照樣在Stanza可以顯示閱讀。有個小撇步: 最好把每個中文字左右各加一個空格,以便在Stanza中可以自由選擇一段中文字做注記,如果沒有空格,則只能選取整個段落!

以下是Calibre支援的格式:

What formats does calibre support conversion to/from?¶

calibre supports the conversion of many input formats to many output formats. It can convert every input format in the following list, to every output format.

Input Formats: CBZ, CBR, CBC, EPUB, FB2, HTML, LIT, MOBI, ODT, PDF, PRC**, PDB, PML, RB, RTF, TXT

Output Formats: EPUB, FB2, OEB, LIT, LRF, MOBI, PDB, PML, RB, PDF, TXT

** PRC is a generic format, calibre supports PRC files with TextRead and MOBIBook headers

What are the best source formats to convert?¶

In order of decreasing preference: LIT, MOBI, EPUB, HTML, PRC, RTF, TXT, PDF

Why does the PDF conversion lose some images/tables?¶

The PDF conversion tries to extract the text and images from the PDF file and convert them to and HTML based ebook. Some PDF files have images in a format that cannot be extracted (vector images). All tables are also represented as vector diagrams, thus they cannot be extracted.

1 則留言:

Vic Jang 提到...

hi 我最近也在研究電子書管理的工具.
我現在的問題是我手邊的 pdb 檔, 用 Stanza PC 版可以開, 也可以轉成 epub, 傳到 iPhone 3G 用 Stanza 看

但問題是用 Stanza 一個一個檔案轉實在太慢了
所以我找到了你這篇文章, 也安裝了 calibre
但是 calibre 開啟我的 pdb 檔卻是亂碼, 我試過幾種方法把 pdb 轉成 txt, 或直接用 editor 打開再存成 UTF-8 格式, 但似乎都不太行, 到了 calibre 開啟來依然是亂碼。

想請問你文中所說的 "轉成UTF-8" 的轉檔動作是怎麼完成的呢? 謝謝!!~