大部分PDF文件可以用OCR識(shí)別,圖片不行
http://www./forum/dispq.asp?LID=28281 如何將caj格式轉(zhuǎn)化為word格式 caj文件的識(shí)別: 1)局部文字識(shí)別:直接使用caj瀏覽器的ocr 2)全文件識(shí)別:打印到Microsoft Office Document Image Writer打印機(jī),選擇打印形成的文件的保存位置,然后會(huì)自動(dòng)形成一個(gè)MDI文件,并且自動(dòng)用Microsoft Office Document Image打開(kāi)此文件,然后選擇“工具”菜單下的“使用ocr識(shí)別文本”,識(shí)別完成后,在選擇“工具”下的,“將文本發(fā)送到word”,最后將把整個(gè)PDF文件識(shí)別輸出到word文件中。 注意:Microsoft Office Document Image可以非常準(zhǔn)確的全文件識(shí)別轉(zhuǎn)化中文、英文、表格,但是無(wú)法將圖形輸出到word,而是把文件中的所有圖形單獨(dú)形成一個(gè)個(gè)獨(dú)立的圖片文件,放在相同位置的一個(gè)相同名稱的文件夾中,因此可用snagit軟件將圖形打開(kāi),然后復(fù)制到word中。(所有的識(shí)別軟件都不能很好的處理圖形的識(shí)別問(wèn)題,Microsoft Office Document Image的這種處理方法已經(jīng)是非常好的解決這個(gè)問(wèn)題了。) 3)博碩論文全文下載:在線閱讀博碩論文,待可以看到最后一頁(yè)后,不要關(guān)閉caj瀏覽器,到caj安裝目錄下cache中找到一個(gè)較大的文件,拷貝到其他位置即可。然后使用2)全部轉(zhuǎn)化為word。 二種方法: 先用CAJViewer打開(kāi)caj文件,然后,然后請(qǐng)看以下: 在編輯菜單欄中包括【復(fù)制】、【復(fù)制位圖】、【查找】、【全部選擇】,可以方便地實(shí)現(xiàn)文本摘錄,摘錄結(jié)果可以方便的粘貼到WPS、WORD 等編輯器中進(jìn)行任意編輯,方便讀者摘錄和保存。 【操作】 1.在【瀏覽】菜單中點(diǎn)擊【鼠標(biāo)用于選擇后】(鼠標(biāo)變?yōu)?箭頭+T形狀),按方向鍵上下移動(dòng),可以滾動(dòng)瀏覽屏幕。箭頭指向左上方時(shí)點(diǎn)擊開(kāi)頭,指向右上方時(shí)點(diǎn)擊結(jié)尾,使其呈反色顯示,按工具欄的【復(fù)制】按鈕。 2. 打開(kāi)word新建文檔進(jìn)行【粘貼】即可得到摘錄的文本。同時(shí)也可以編輯存盤(pán)。 【復(fù)制】:可以復(fù)制選定的文件或其中部分內(nèi)容。 【復(fù)制位圖】:系統(tǒng)默認(rèn)設(shè)置,鼠標(biāo)所在的位置出現(xiàn)一個(gè)十字,點(diǎn)住拖到選定位置 劃出一片區(qū)域,點(diǎn)復(fù)制,將選中區(qū)域內(nèi)容復(fù)制到剪貼板。 【查找】:在彈出的對(duì)話框里輸入要查找的文字,點(diǎn)擊【查找】進(jìn)行查找,按下【向前查找】或【向后查找】按紐, 可以翻到上一頁(yè)、下一頁(yè)查找。 【全部選擇】:將頁(yè)面的內(nèi)容全部選定。 |
|
來(lái)自: milo2008 > 《我的圖書(shū)館》