- 本文說的“書”,指的是可以在電腦上閱讀的電子書,不是出版社出版的實(shí)體書。而且為了避免過多爭論,本文雖然題目叫“經(jīng)驗(yàn)談”,但是對書的收藏標(biāo)準(zhǔn)、讀書方法、圖書分類等見仁見智的問題都沒有涉及,只是介紹我在收書、讀書、看書過程中曾經(jīng)使用過的軟件,其實(shí)應(yīng)該叫“軟件使用(或選擇)經(jīng)驗(yàn)談”才對。如果您看到軟件就頭昏(人格保證我在此絕對沒有任何貶義的意思),或者對電子書沒有興趣,請不必再浪費(fèi)時(shí)間往下看。
- 本文所說的電子書,不僅包括EXE、CHM等“打包”格式,也包括HTML、TXT、PDF等“散裝”格式。請不要和我爭論什么格式的文件才叫電子書,我沒有這種興趣(沒錯(cuò),這句話就是專門說給某幾位人士聽的)。
- 本文談到的所有軟件均可用google搜索,當(dāng)然下載的時(shí)候要注意版權(quán)。軟件名稱后面帶星號(hào)的都是我的原創(chuàng)作品,可以直接到我的網(wǎng)站(http://stronghorse.yeah.net)下載。純免費(fèi)。
- 對所有軟件的功能描述以我在本文中提到的版本為準(zhǔn)。不排除以后軟件功能會(huì)有改進(jìn),或出現(xiàn)功能更強(qiáng)大的其它軟件,不過我畢竟沒有見到。
- 身為軟件開發(fā)人員,我很清楚花哨的界面需要付出什么樣的代價(jià),因此我在評(píng)價(jià)軟件的時(shí)候,將功能、可靠性、使用方便性等放在前面,對界面是否漂亮、是否允許換膚等從不考慮,所以我介紹的某些軟件可能與目前的潮流有些偏差。
- 如果您有更好的經(jīng)驗(yàn)或軟件,歡迎交流,我相信有交流才有提高。
目錄
1. 前言
2. 收書
2.1 網(wǎng)頁下載
2.2 文件下載
3. 藏書
3.1 解壓
3.2 反編譯
3.3 整理
3.4 壓縮
4. 讀書
4.1 讀書軟件
4.2 讀書環(huán)境
5. 管書
5.1 全文檢索
5.2 文件夾分類
6. 結(jié)論
1. 前言
在討論如何收書、看書之前,先要明確一個(gè)問題:書是用來干什么的?對這個(gè)問題的回答不同,自然就會(huì)有不同的步驟,使用不同的軟件。
我的回答是:書第一是拿來看的,第二是拿來用的,絕對不是拿來擺好看的。因此
- 對我來說,不支持書簽的電子書或讀書軟件都沒有什么意義,我的記憶力還沒有好到能夠記住每一本書我看到哪里了。
- 書是否好用,在我看來就是能否在需要的時(shí)候快速查找到我想要的內(nèi)容。畢竟電子書已經(jīng)“告別鉛與火,迎來光與電”,有N多搜索軟件可以作為輔助工具,但是目前還沒有能夠在EXE、CHM等打包格式電子書中進(jìn)行批量查找的工具,因此為了達(dá)到“拿來用”的目的,我絕對不會(huì)收藏這些格式的電子書,書一到手就反編譯再壓縮成zip包。由此又帶來對讀書軟件的第二個(gè)要求:能夠直接讀取壓縮文件中的內(nèi)容,HTML必須保持所有鏈接關(guān)系,支持加密zip/rar就更好。
下面描述的藏書、讀書、管書過程,都是圍繞這種看、用的目的展開。如果您不能認(rèn)同我的觀點(diǎn),歡迎交流,
我相信每個(gè)人都應(yīng)該有最適合自己的目的和手段;如果連自己想要的是什么都搞不清楚,也可以先看看,說不定能有點(diǎn)啟發(fā)。
2. 收書
這里說的“收書”,指的是如何將網(wǎng)絡(luò)上的電子書,下載到本地硬盤。
在我看來,收書的對象可以分為兩種:網(wǎng)頁和文件。
所謂網(wǎng)頁,指的是書的內(nèi)容分成若干HTML頁,然后有一個(gè)HTML頁作為目錄頁,需要把全部HTML頁面下載下來,才能獲得書籍的完整內(nèi)容?;旧纤性诰€閱讀的電子書都是這種格式。
所謂文件,指的是電子書內(nèi)容已經(jīng)被打包成了一個(gè)文件,可能是zip/rar文件,也可能是exe、chm、pdf等,只要下載一個(gè)(分卷壓縮文件可能是多個(gè))文件,即可獲得書籍內(nèi)容。
這兩種對象的下載工具可能不同,參見我寫的短文《網(wǎng)絡(luò)下載工具的分類》。
2.1 網(wǎng)頁下載
批量下載HTML文件的軟件有專門的分類名稱,專業(yè)點(diǎn)的叫“離線瀏覽器”,因?yàn)樵局荒茉诰€瀏覽的內(nèi)容,下載完后就可以在本地離線瀏覽了;通俗點(diǎn)就叫“搬網(wǎng)站工具”,因?yàn)槭褂眠@類工具,可以將您想搬的網(wǎng)站整個(gè)搬到您的硬盤上,只要您的時(shí)間、硬盤、帶寬都足夠。
離線瀏覽器推薦使用MetaProducts Offline Explorer (以下簡稱MOE),理由如下:
- 穩(wěn)定,能夠長期自動(dòng)堅(jiān)持工作。畢竟搬大型網(wǎng)站是一項(xiàng)很艱苦的工作,馬虎點(diǎn)的工具很難撐住。
- 能夠解析JavaScrip代碼,從中發(fā)現(xiàn)動(dòng)態(tài)生成的鏈接。
- 能夠設(shè)定過濾條件,包括include、exclude條件。我個(gè)人認(rèn)為這是MOE最好用的地方,但是在我接觸過的一些人中,這也是他們最不愿意用這個(gè)軟件的原因:不是人人都知道該怎么設(shè)置過濾條件的。大概也正是因?yàn)檫@個(gè)原因,某些專搬特定網(wǎng)站(如專門下載新浪讀書頻道)的軟件才會(huì)受到歡迎。
- 能夠?qū)TML中的鏈接地址,自動(dòng)更改為相對地址。這個(gè)應(yīng)該是離線瀏覽器的基本功能。
- 速度。MOE的作者為了研究如何用最快的速度下載文件,還專門開發(fā)了其它周邊產(chǎn)品。
不過MOE也不是萬能,有時(shí)候?yàn)榱吮苊饴闊?,也可以先用HtmlOrder*生成一個(gè)索引頁,再用MOE下載;或者干脆將目錄頁上的鏈接全部拖到FlashGet里下載。
如果只是對某個(gè)網(wǎng)頁感興趣,我通常直接用IE保存全部,再用TextForever的“HTML整理”功能去掉無聊的廣告鏈接等,然后用IE另存為mht格式。如果對TextForever的整理結(jié)果不放心,在另存為mht前也可以用FrontPage、Dreamweaver或UltraEdit32檢查、編輯一下網(wǎng)頁。FrontPage的特點(diǎn)是容易上手,不過有些網(wǎng)頁的顯示可能會(huì)亂,兼容性不如Dreamweaver。UltraEdit32則用來快速查看、編輯HTML、css、js等源代碼,和某些人慣用的EditPlus差不多,不過因?yàn)镋ditPlus不支持十六進(jìn)制編輯,所以我從來不裝。
2.2 文件下載
文件下載工具很多,多半都屬于斷點(diǎn)續(xù)傳類。下面用表格的形式加以說明。
名稱 |
版本 |
說明 |
FlashGet |
1.70 |
這個(gè)還用說嗎?我最欣賞的是批量下載和站點(diǎn)管理功能。新版已經(jīng)去掉了廣告鏈接,純免費(fèi),用起來更放心了。 |
FlashFxp |
3.1.10 |
優(yōu)秀的FTP客戶端,主要是速度。 |
FtpList* |
1.14 |
這個(gè)其實(shí)不是下載工具,不過在從某些龜速FTP下載時(shí),可以先用它列出目錄,從中抽取自己需要的部分,再交給FlashGet下載,要比直接用FTP客戶端可靠一些。用它也可以列本地磁盤目錄,雖然在某些機(jī)器上顯示中文可能出現(xiàn)亂碼,但是存盤后用記事本打開就正常了。 |
HtmlOrder* |
1.10 |
這個(gè)也不是下載工具,而是MOE、FlashGet輔助工具:根據(jù)文件名前綴、后綴及中間的數(shù)字范圍,自動(dòng)產(chǎn)生HTML,包含所需的全部鏈接(前綴+數(shù)字+后綴)。與FlashGet的“添加成批任務(wù)”差不多,不過FlashGet只有一個(gè)參數(shù),這個(gè)允許同時(shí)使用兩個(gè)參數(shù)。生成的結(jié)果可以直接用MOE下載,也可以拖到FlashGet里下載。 |
NoteIcon* |
1.20 |
這個(gè)同樣不是下載工具,但是提供類似FlashGet的下載懸浮窗,某些含有特殊字符的鏈接直接批量拖到FlashGet里可能識(shí)別錯(cuò)誤,可以先拖到NoteIcon里,然后再批量復(fù)制/粘貼到FlashGet。 |
IE |
6.0 |
偶爾也有直接下載的時(shí)候吧?對于只有一個(gè)頁面的網(wǎng)頁,我一般先用IE保存“網(wǎng)頁,全部”,再整理、編輯,然后用IE另存為mht文件。 |
3. 藏書
為了讓書能夠“拿來用”,我的藏書過程可以劃分為解壓、反編譯、整理、壓縮幾個(gè)階段。
3.1 解壓
如果下載到的是壓縮包,第一步當(dāng)然是解壓。
名稱 |
版本 |
說明 |
BatchUnRar* |
1.02 |
批量RAR解壓工具。某些論壇上的分卷RAR會(huì)被重新命名為200512310423834.rar、200512311289544.rar之類的名字,用它可以直接解,不需要手工改文件名。對加密RAR能夠記憶密碼,相同的密碼只需要輸入一次就夠了。 |
Zip2Dir* |
1.31 |
批量zip解壓工具,能夠?qū)敵龅哪夸浗Y(jié)構(gòu)進(jìn)行控制,對加密zip能夠記憶密碼,相同的密碼只需要輸入一次就夠了。我多半用它來解壓漫畫,而且都是從資源管理器的右鍵菜單啟動(dòng)。 |
WinRAR |
3.42 |
這個(gè)不用說了吧? |
WinZip |
8.0 |
現(xiàn)在真的很少用了。 |
3.2 反編譯
反編譯的目的,是將不能編輯、查找的打包電子書,包括EXE、CHM、EBX等,解包成原始的HTML、文本等格式。對反編譯技術(shù)有興趣的可以參閱我寫的《常見電子書格式及其反編譯思路》、《用JavaScript獲取網(wǎng)頁中的js、css、Flash等文件》,在我的網(wǎng)站上都有全文。
名稱 |
版本 |
說明 |
UnEBook* |
1.01 |
可能是目前最好的CHM、HLP、EBX批量反編譯軟件之一,純免費(fèi)。由于曾經(jīng)連續(xù)下載到幾個(gè)暗含木馬的CHM文件,現(xiàn)在在用UnEBook反編譯前,我絕不在本機(jī)上打開任何下載到的CHM文件。 |
miniKillEBook* |
1.05 |
KillEBook的縮水版,對付基于IE內(nèi)核的電子書還可以。 |
CtrlN* |
1.04 |
IECracker的脫水+減料版,對付基于IE內(nèi)核電子書。 |
KillEBook |
|
這個(gè)與各位無關(guān)。 |
IECracker |
|
同上。 |
unEbookWorkshop |
1.42 |
批量反編譯EbookWorkshop電子書的專用工具。 |
Acrobat Professional |
7.03 |
忘記那些雜七雜八的PDF2Word、PDF2Txt吧,這個(gè)才是將PDF轉(zhuǎn)換成Word、txt的王道。7.0升級(jí)到7.02后打開PDF速度快了許多。 |
VMware Workstation |
4.0.5 |
大名鼎鼎的虛擬機(jī)軟件,可以在Windows 2000/XP下構(gòu)筑一臺(tái)虛擬計(jì)算機(jī),安裝其它版本的操作系統(tǒng)。對于從網(wǎng)上下載的EXE電子書,在虛擬機(jī)里打開、反編譯可能會(huì)更安全些。 |
對于目前不能反編譯的電子書,如用Desktop Author制作的EXE電子書,我一般看完就刪,有必要保留的就根據(jù)內(nèi)容用google查找原始素材網(wǎng)頁,畢竟現(xiàn)在絕大多數(shù)電子書素材都來自網(wǎng)上。
3.3 整理
我收藏的電子書多半打算在電腦上看,因此保持原始的素材格式(HTML、TXT)就好,不過HTML中可能會(huì)有一些無聊的廣告鏈接,或讓我看了心煩的css設(shè)置,因此在收藏前,我都會(huì)刪掉或替換掉不想要的內(nèi)容。一般使用TextForever*的“文本替換”、“整理HTML”、“正則表達(dá)式”功能足矣。
而對于TXT文件,整理過程可能還包括文件合并、重新排版等工作。可能的步驟包括:
HTML轉(zhuǎn)TXT->編碼轉(zhuǎn)換(繁體轉(zhuǎn)簡體)->段落合并->文本替換(或用正則表達(dá)式替換)。
有些書我也會(huì)在手機(jī)上看,整理過程要多一個(gè)打成TCR包的環(huán)節(jié),可能的步驟包括:
HTML轉(zhuǎn)TXT->編碼轉(zhuǎn)換(繁體轉(zhuǎn)簡體)->文件合并->打包成TCR。
以前我曾經(jīng)在不同步驟使用過不同的工具,但是慢慢地就只用TextForever*——我所需要的全部書籍整理功能都已經(jīng)集成在這個(gè)軟件中了,而且支持批量處理、參數(shù)記憶。未來如果還會(huì)出現(xiàn)目前未知的整理技術(shù),我相信也會(huì)被集成到TextForever中,只要這種技術(shù)真的對我有用。
3.4 壓縮
素材文件整理完后,當(dāng)然不可能就這么一堆放在那里,我都是每本書打包成一個(gè)zip文件。由于我都用MyReader*看書,看的時(shí)候也沒有必要解壓。
壓縮普通電子書的時(shí)候我推薦用Winzip,壓縮漫畫的時(shí)候我只用Zip2Dir*,并且勾選“只打包不壓縮”選項(xiàng)。
我不將我收藏的電子書打包成任何其它電子書格式(如EXE、CHM格式)的原因,我想我在本文前言和《常見電子書格式及其反編譯思路》一文中已經(jīng)說清了。而我收藏的所有書籍都只打包成zip格式,絕對不打包成rar格式(除非是不得已)的原因也非常簡單:zip文件有目錄表(Table of Contents,TOC),隨機(jī)訪問速度很快,而rar文件沒有這種優(yōu)勢。至于漫畫,都是jpg文件,壓縮也壓縮不到哪里去,還不如只打包不壓縮,ComicsViewer*訪問起來還快點(diǎn)。
4. 讀書
4.1 讀書軟件
在電腦上閱讀HTML、TXT格式的電子書,我以前曾經(jīng)用過好幾個(gè)讀書軟件,現(xiàn)在我只用MyReader*。雖然它還遠(yuǎn)遠(yuǎn)稱不上完美(我手上就有長長一串改進(jìn)計(jì)劃),但是已經(jīng)足夠讓我刪掉其它讀書軟件了。另外MyReader*可以與Findstr*聯(lián)動(dòng),實(shí)現(xiàn)文本搜索功能,包括zip/rar中的搜索。
對于漫畫、影集等純圖片書,我都用ComicsViewer*看,支持加密zip/rar、支持書簽,還允許加注釋。
由于業(yè)務(wù)關(guān)系,很多外文資料我只能看PDF版的,這些東西我認(rèn)為用Acrobat Professional閱讀,要比用Adobe Reader方便,專業(yè)版就是專業(yè)版,不論是復(fù)制/粘貼,還是轉(zhuǎn)存成Word格式都強(qiáng)多了。
在手機(jī)上讀書,我只用MicroReader,有興趣的可以參閱我寫的《幾個(gè)J2ME讀書軟件的比較與猜想》。
4.2 讀書環(huán)境
在我看來,讀書不是有了書、有了讀書的軟件就可以讀的,尤其是對于長期閱讀來說,環(huán)境是否合適不僅直接影響到閱讀時(shí)的心情和效果,對閱讀者的身體健康也有長期影響,不可不慎。遺憾的是,能夠把讀書環(huán)境的重要性上升到如此高度的人實(shí)在不多,下面說的東西其實(shí)我早就和不少人說過,但是能夠引起共鳴的人實(shí)在沒有幾個(gè),不過我還是忍不住要說,我是不是正在變成唐僧呢?擔(dān)心ing...
在PC上讀書,我認(rèn)為好的讀書環(huán)境應(yīng)該包括以下幾個(gè)方面:
- 合適的燈光,以保證顯示器周圍的光亮,不致于與顯示器本身的光亮差太多,并且避免明顯的斜射光源。這個(gè)比較容易解決,就算是葛朗臺(tái)再世,我想對目前節(jié)能燈的花費(fèi)應(yīng)該也能容忍。
- 買一臺(tái)您買得起的最好的顯示器。我見過太多人在采購PC時(shí),把顯示器當(dāng)作壓縮預(yù)算的對象。在俺看來,這些人根本不把自己當(dāng)人看,他們給自己的標(biāo)價(jià)還不夠那區(qū)區(qū)幾百塊錢:CPU慢點(diǎn)、硬盤小點(diǎn)將來都可以慢慢換,可是眼睛如果壞了,您打算上哪個(gè)柜臺(tái)去換?
- 如果由于種種原因,您現(xiàn)在只能用普通CRT顯示器(用液晶的可以忽略本條建議),那么即使顯示器廠家已經(jīng)承諾顯示器符合十七八個(gè)國家的標(biāo)準(zhǔn),俺還是建議您再花幾十(15")到100多(17")元(中關(guān)村實(shí)際單塊不含稅采購價(jià)),買一個(gè)真正起作用的視保屏掛在顯示器前面。我周圍的人初聽到這個(gè)建議時(shí)都不以為然,不過在實(shí)際試過我買的視保屏效果后,過半數(shù)的人都跟著去采購了一塊。那么什么樣的視保屏才算有效呢?我認(rèn)為最起碼需要滿足以下兩點(diǎn):
1、必須是真正含鉛的鉛玻璃,金屬絲網(wǎng)的絕對不能考慮,樹脂的材料則實(shí)在難于確認(rèn)。
2、必須帶防炫光涂層。這個(gè)比較好鑒別:把帶涂層一面對著您垂直放置,如果在視保屏上只能隱約看到您的尊容,馬馬虎虎就算合格了;如果能當(dāng)鏡子用,建議您還是趁早別買。某些品牌的涂層斜對著光能夠看到蘭紫色的金屬質(zhì)感反光(正對光看不到),可以當(dāng)作是鑒別正品的標(biāo)志之一。
別看只有兩個(gè)小小的要求,能夠滿足的已經(jīng)越來越少了,俺最后一次買的時(shí)候,花了兩個(gè)周末走遍中關(guān)村,才在一個(gè)小攤位上找到滿意的視保屏,假貨率都快趕上潘家園了。
- 如果您已經(jīng)換了液晶,建議不要用缺省的最高分辨率。以我的17"液晶為例,缺省最高分辨率是1280*1024,相當(dāng)于19"CRT的分辨率,但是它的尺寸確確實(shí)實(shí)到不了19",所以使用1280*1024的時(shí)候,文字看起來未免有點(diǎn)費(fèi)勁,我還是設(shè)置為1024*768,看起來爽多了。
- 在裝好顯卡驅(qū)動(dòng)后,將顯示器的刷新速率調(diào)合適了。尤其是是CRT顯示器,65Hz的缺省刷新率簡直就是視力殺手。這個(gè)一般老手都知道,新手只會(huì)抱怨一看顯示器就頭暈眼花。
- 不論您買的是CRT還是液晶,在燈光調(diào)好后,將顯示器的亮度、對比度調(diào)到您能夠忍受的最低限。這個(gè)不僅能夠避免太強(qiáng)光刺激造成視覺疲勞,而且能夠延長顯示器壽命:將來如果因?yàn)槔匣霈F(xiàn)亮度、對比度下降,還可以調(diào)回去;如果一開始就看慣了出廠時(shí)設(shè)置的最大亮度、對比度,老化后就沒法調(diào)了。注意這個(gè)調(diào)整要適當(dāng),別一聽我說能省錢就死命往下調(diào),調(diào)太暗對視力也不好。
- 除了硬件外,俺還習(xí)慣在軟件方面做兩個(gè)設(shè)置,這都是我經(jīng)過長期人體疲勞試驗(yàn)得出的結(jié)論:
1、將Windows窗口背景色設(shè)置為對話框前景色,即灰色。
2、在IE的Internet選項(xiàng)的“常規(guī)”頁,點(diǎn)“輔助功能”按鈕,選擇“不使用網(wǎng)頁中的顏色”,然后確認(rèn)退出。以后網(wǎng)頁上的所有背景色都是Windows窗口背景色,即前面設(shè)置的灰色。不僅保護(hù)視力,而且能夠突出內(nèi)容。
基本上到目前為止,我接觸到的人中能夠理解以上兩點(diǎn)的人沒有幾個(gè),不過能夠理解的人,都不是路人甲之類的角色,起碼能夠理解“五色令人盲”的哲學(xué)意義。
- 有人習(xí)慣在眼睛發(fā)干時(shí)點(diǎn)兩滴眼藥水,我更習(xí)慣含一顆魚肝油膠囊:不僅比眼藥水便宜(北京價(jià)),而且感覺更健康一些。
- 上小學(xué)時(shí)老師有沒有告訴你要每天堅(jiān)持做眼保健操?聽老師的話吧,至少我到目前為止還在每天堅(jiān)持做。
以上建議的效果如何呢?在您身上效果如何我不敢說,不過對我來說,每年365天,每天看屏幕的時(shí)間平均近10小時(shí),已經(jīng)持續(xù)10年以上了(家里的剛換成液晶近一年,在公司一直用CRT),但是到現(xiàn)在為止我還沒有戴眼鏡:左眼能夠看到視力表最下面一行,右眼能看倒數(shù)第2、3行,這還是小時(shí)候斜坐著看電視造成的影響。
在手機(jī)上看書時(shí)的環(huán)境設(shè)置,我在《幾個(gè)J2ME讀書軟件的比較與猜想》中已經(jīng)說過,有興趣的可以去看看。
5. 管書
電子書收多了,如何有效管理、有效使用自然就成了一個(gè)問題。
在軟件界,相關(guān)的管理系統(tǒng)原先叫“文檔管理”,后來叫“內(nèi)容管理”,最近似乎“知識(shí)管理”這個(gè)詞更時(shí)髦一些。由于業(yè)務(wù)關(guān)系,我不僅參與過企業(yè)級(jí)知識(shí)管理系統(tǒng)的研發(fā)、部署,而且我的同事中還有專人對知識(shí)管理系統(tǒng)進(jìn)行研究,包括大名鼎鼎的Documentum、Interwoven、IBM等公司的產(chǎn)品。這些產(chǎn)品當(dāng)然功能強(qiáng)大,不過軟件報(bào)價(jià)動(dòng)輒上百萬,服務(wù)器一報(bào)一大堆,就算經(jīng)過一再瘦身的開發(fā)版,也要服務(wù)器級(jí)PC才跑得動(dòng),所以相信除了象我等偶爾利用工作之便搭搭順風(fēng)車外,不會(huì)有幾個(gè)常人消受得起。
專門針對個(gè)人的PC版電子書管理軟件我也用過幾個(gè),甚至還自己寫過。所有這些軟件雖然在規(guī)模上與Documentum等企業(yè)級(jí)產(chǎn)品沒法比,但是在原理上都是一樣的:將需要管理的數(shù)據(jù)分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)兩個(gè)部分分別存儲(chǔ),然后建立相關(guān)索引,再提供檢索、管理等功能。結(jié)構(gòu)化數(shù)據(jù)包括文件的編目信息,如書名、作者、出版社、分類號(hào)、內(nèi)容摘要、關(guān)鍵字、目錄等,非結(jié)構(gòu)化數(shù)據(jù)就是書籍文件本身。這種管理方式其實(shí)是從傳統(tǒng)圖書館學(xué)來的:書籍按書庫、書架存放,然后建立書籍卡片供人檢索。
在我對企業(yè)級(jí)、個(gè)人級(jí)的知識(shí)管理軟件都有所了解,并且用它們實(shí)際管理過一段時(shí)間自己的電子書后,我終于悟了:對我這樣的超級(jí)大懶人來說,所有基于編目的管理都是胡說八道,只有全文檢索才是真的。原因很簡單:十本、二十本書的時(shí)候,我可能還會(huì)敲一敲編目;一百、二百本的時(shí)候,基本上就要不想了;到上千本的時(shí)候,根本就是在自虐:畢竟我不是以敲編目為業(yè)的文檔管理員。而全文檢索是不需要建編目的。
5.1 全文檢索
在對本地文件進(jìn)行全文檢索方面,我也用過幾個(gè)工具,包括Google等公司的產(chǎn)品,但是這些工具用了沒多久就被我放棄了:這些工具雖然都說是針對個(gè)人桌面系統(tǒng)的,但是在原理上還是基于海量檢索算法,因此要先對文件建立索引,然后才能基于索引進(jìn)行檢索。雖然建立索引這個(gè)過程是自動(dòng)的,不需要我自己敲什么,但是一來索引需要消耗磁盤空間,二來要隨時(shí)保持最新索引也不是件容易的事情,對系統(tǒng)性能總會(huì)造成影響,所以連Windows本身的索引功能都被我關(guān)了,這些軟件的索引就更加不能容忍。
好在不需要建立索引的全文檢索工具也不是沒有,不過除了PDF外,其他能夠被檢索的文件多半都是文本格式,這也就是為什么我在前面說了半天要把電子書進(jìn)行反編譯,只保留文本或HTML的原因。
名稱 |
版本 |
說明 |
FindStr* |
4.69 |
可以在指定的文件夾(包括文件夾中的普通文件、壓縮文件)中查找字符串,支持多關(guān)鍵字,碰到加密zip/rar時(shí)能夠自動(dòng)記憶密碼,能夠與MyReader*等軟件聯(lián)動(dòng),查看搜索結(jié)果很方便。 |
WinRAR |
3.42 |
可以在指定的文件夾(包括文件夾中的普通文件、壓縮文件)中查找字符串,不過感覺功能比FindStr弱,尤其是對加密zip/rar的支持。 |
UltraEdit32 |
10.10a |
查找文本信息的速度超快,支持正則表達(dá)式,但是不支持在壓縮文件中查找。 |
Adobe Reader Acrobat Professional |
7.03 |
不論是Reader還是Professional,現(xiàn)在都可以對指定文件夾下的PDF進(jìn)行全文檢索,當(dāng)然只能檢索帶文本信息的PDF,對純圖像的PDF沒招。 |
5.2 文件夾分類
即使有了全文檢索工具,也不可能把所有文件往硬盤里一扔就不管。如果按照合理的分類準(zhǔn)則建立文件夾,將文件分類后再放入文件夾保存,不僅自己找起來會(huì)快一些,就是用工具檢索,也可以縮小檢索范圍,縮短檢索時(shí)間。
曾經(jīng)有人建議用國家標(biāo)準(zhǔn)的圖書分類來管理自己的圖書,我的意見是:除非您自己就是專業(yè)的圖書館管理員,不然還是不要給自己出難題了,如此復(fù)雜的東東不是業(yè)余人士玩得動(dòng)的。自己規(guī)定一個(gè)能搞懂的文件夾結(jié)構(gòu)就好,沒有必要大而全,但是拿到一本書后,自己一定要知道該放到哪個(gè)文件夾。
下表給出我自己的部分目錄結(jié)構(gòu)(二級(jí)以下從略),供各位參考。這個(gè)結(jié)構(gòu)不一定是最合理的,但一定是我自己最熟悉的。另外分類可能顯得有點(diǎn)粗,我的經(jīng)驗(yàn)是:如果分得太細(xì),有時(shí)候反而不知道該歸哪類。
一級(jí)文件夾 |
二級(jí)文件夾 |
動(dòng)漫游戲 |
|
兒童文學(xué) |
|
科幻科普 |
科幻小說、科普專著 |
歷史軍事 |
西方歷史軍事、東方歷史軍事 |
時(shí)尚生活 |
愛好收藏、傳統(tǒng)文化、機(jī)械交通、建筑美術(shù)、旅游風(fēng)光、美食文化、攝影藝術(shù)、時(shí)文選讀、書畫藝術(shù)、數(shù)碼影音、體育健身、性福生活、醫(yī)療健康、陰陽命理、語言學(xué)習(xí) |
外國文學(xué) |
名家名著、英文原作 |
武俠作品 |
名家名著、俠骨柔情、網(wǎng)絡(luò)武俠 |
言情浪漫 |
|
幽默笑話 |
|
偵探小說 |
|
政經(jīng)法哲 |
經(jīng)濟(jì)管理、論理法律、政治哲學(xué)、宗教哲學(xué) |
中國文學(xué) |
古典文學(xué)(傳說演義、經(jīng)史子集、散文筆記、詩詞戲曲、香艷春宮、刑兵工禮)、現(xiàn)代文學(xué) |
6、結(jié)論
不管別人怎么說,最適合自己的才是最好的。但是要搞清楚什么最適合自己,可能需要一個(gè)過程,關(guān)鍵是要在不斷借鑒、嘗試過程中進(jìn)行總結(jié)。期待能夠看到其他人的類似經(jīng)驗(yàn)。