不知道選擇哪一款OCR工具,進來讓我告訴你
OCR,即文字識別
你看見的文字,都應(yīng)該是字符
圖片、電子書、掃描件、公式等所有無法選中的文字,都可以通過 OCR 提取轉(zhuǎn)化為字符
不想通讀全文的,可以直接瀏覽下面的導(dǎo)圖,然后選擇其中推薦指數(shù)較高的軟件進行閱讀
甚至不想閱讀文章就要直接獲取所有軟件,OK,文章中出現(xiàn)的所有軟件(包括未提供官網(wǎng)/開源地址的),請在公重號「小帥隨筆」回復(fù):ocr
一. 在線版+離線版
1.1 eSearch(win/mac/linux)
官網(wǎng):https://lify.app
開源:https://github.com/xushengfeng/eSearch
使用方法:默認快捷鍵「alt+c
」截取文字,然后按下「enter
」鍵可進行 OCR 識別
eSearch 提供了離線 OCR 和其他在線 OCR,可以在設(shè)置中選擇。
離線版識別效果如下圖所示,準確率較高。
eSearch 目前支持的在線 OCR 服務(wù)是百度 OCR 和有道 OCR,調(diào)用第三方在線接口可能需要付費。
百度 OCR 教程(免費領(lǐng)取):https://cloud.baidu.com/doc/OCR/s/dk3iqnq51
獲取 API Key 和 Secret Key,并填入設(shè)置中。
有道 OCR 教程(付費):https://ai.youdao.com/doc.s
獲取應(yīng)用 ID 和密鑰,并填入設(shè)置中。
其它功能:
- 搭配搜索引擎,讓文字可被搜索
- 聚合多家翻譯,支持多個引擎同時翻譯
- 支持以圖搜圖(Yandex、Google、百度),輕松得到圖片的更多信息
- 輕松錄制屏幕,并通過 FFmpeg 轉(zhuǎn)化為多種格式(mp4、gif、mkv、webm……)
下方的圖片是小帥個人習(xí)慣的默認引擎和快捷鍵:
1.2 OCR工具集(win)
官網(wǎng):https://fm323.
吾愛大佬 「fm32
」 開發(fā),軟件完全免費。
使用方法:「快捷鍵 F4
」或者「雙擊任務(wù)欄圖標
」,鼠標左鍵繪制出需要識別的區(qū)域,松開鼠標,軟件開始自動識別。
在線版:搜狗 OCR 識別(準確率比較高)
這個 OCR 功能在搜狗輸入法中也內(nèi)置,在輸入法的工具欄中有一個「文字識別
」功能。
搜狗公司在2021年被騰訊收購,所以說現(xiàn)在的產(chǎn)品都是騰訊旗下。
離線版:RapidOCR 識別(準確率一般,支持簡體中文、繁體中文、日文、韓文、英文5種語言)
二. 在線版
其實電腦在聯(lián)網(wǎng)時,如果只是最基本的文本識別,很多人更傾向于使用 QQ 或者 微信 的 OCR 工具。
電腦端使用方法:打開其自帶的截圖工具,截取頁面,然后選擇「提取文字
」按鈕
手機端使用方法:長按帶有文字的圖片,然后選擇「提取文字
」
下面以電腦端的 OCR 識別進行舉例。
2.1 QQ(全端)
QQ 自帶截圖工具的啟動快捷鍵需要在設(shè)置里面查看
小帥把快捷鍵設(shè)置為:「ctrl+alt+q
」
我還測試了一款從 QQ9.5.4 版本提取出來的截圖工具,發(fā)現(xiàn)中文識別效果比最新版的要好一些。
2.2 微信(全端)
微信 自帶截圖工具的啟動快捷鍵需要在設(shè)置里面查看
小帥把快捷鍵設(shè)置為:「ctrl+alt+w
」
經(jīng)過測試,QQ 和微信的識別效果幾乎沒有什么差別。
2.3 天若OCR官方版(win)
官網(wǎng):https://ocr.
使用方法:「快捷鍵 F4
」或者「雙擊任務(wù)欄圖標
」,鼠標左鍵繪制出需要識別的區(qū)域,松開鼠標,軟件開始自動識別。
免費版支持最基本的文本識別,專業(yè)版永久 59¥只是能使用高級功能,但是并不包含付費的接口
2.4 PandaOCR(win)
PandaOCR普通版:https://github.com/miaomiaosoft/PandaOCR
PandaOCR專業(yè)版:https://github.com/miaomiaosoft/PandaOCR.Pro
普通版支持最基本的文本識別,但 PandaOCR 專業(yè)版不花錢也可以使用普通版的功能,如要使用直接建議下載專業(yè)版,因為普通版的識別效果真的很差,如下圖所示:
而使用專業(yè)版的免費功能識別后中文全部正確。
2.5 千百圖片識別(win)
官網(wǎng):http://spf.cn/ocr
調(diào)用的百度的 OCR 接口,使用作者提供的每天可以免費識別6次,并且每個月要獲取一下 token, 想要不限量推薦自己申請一個 百度OCR 接口,然后在此軟件「百度接口
」->「添加獨立接口
」填入即可。
百度 OCR 教程(免費領(lǐng)?。?/span>https://cloud.baidu.com/doc/OCR/s/dk3iqnq51
使用方法:「快捷鍵 ctrl+alt+d
」或者在軟件中選擇「屏幕截圖
」,鼠標左鍵繪制出需要識別的區(qū)域,接著鼠標左鍵雙擊這個區(qū)域使其加載到軟件中,最后點擊「開始識別
」。
PS:
- 填入自己申請的接口后,記得開啟「
高精度識別
」以獲得更好的體驗。 - 每次的設(shè)置關(guān)閉軟件后都會重置,使用起來不太方便。
該軟件還有很多其它功能,比如:繁體豎排識別、圖片尺寸處理、識別文字并翻譯等。
2.6 OCR文字識別(win)
該軟件最后一版是 2018.5.2 開發(fā),目前有道OCR和有道翻譯仍可使用,OCR文字提取效果還不錯
三. 離線版
3.1 平平OCR(win)
吾愛大佬 「zbb2012
」 開發(fā),軟件完全免費。識別準確率比較高。
使用方法:「快捷鍵 Alt+Q
」或者「雙擊任務(wù)欄圖標
」,鼠標左鍵繪制出需要識別的區(qū)域,松開鼠標,軟件開始自動識別。
本 OCR 為離線識別,使用 CPU 推理,識別速度取決于你的 CPU 性能。
截圖的功能和天若 OCR 一樣都使用的是 ShareX 開源組件庫。
后期版本更新中作者會逐步加上一些高級功能,例如:批量證件的識別并導(dǎo)出到表格。值得一用。
3.2 天若OCR本地版(win)
唉可悲修改版:https://gitee.com/wanglifree/tianruoocr-cl
使用方法:「快捷鍵 F4
」或者「雙擊任務(wù)欄圖標
」,鼠標左鍵繪制出需要識別的區(qū)域,松開鼠標,軟件開始自動識別。
識別效果:會有個別字出現(xiàn)問題,整體來說還可以。
該軟件支持自定義百度 OCR 接口 和百度翻譯 API 接口。
百度 OCR 教程(免費領(lǐng)?。?/span>https://cloud.baidu.com/doc/OCR/s/dk3iqnq51
百度翻譯 API (可免費使用):http://api.fanyi.baidu.com/api/trans/product/index
3.3 傻木攝影_表單識別(win)
文字識別,使用方法:點擊「開始截圖
」,鼠標左鍵繪制出需要識別的區(qū)域,松開鼠標,軟件開始自動識別。
OCR表單識別效果也不錯,識別完成后會自動生成一個 xls 文件并打開。
3.4 Umi-OCR(win)
開源: https://github.com/hiroi-sora/Umi-OCR
使用方法:「快捷鍵 win+alt+c
」或者「右擊任務(wù)欄圖標選擇-屏幕截圖
」,鼠標左鍵繪制出需要識別的區(qū)域,松開鼠標,軟件開始自動識別。
識別效果:會有一些中文字出現(xiàn)問題,有一點差強人意。
四. 特殊OCR
4.1 圖片批量識別重命名(win)
吾愛大佬「echocccc
」開發(fā),改軟件通過批量掃描圖片并提取圖片上的文字,然后將提取到的文字作為圖片的名稱。
用途:圖片(如:證件照等)不能直接搜索,通過此工具修改名稱后,接著用 everything 軟件即可實現(xiàn)快速搜索。
使用方法:將圖片拖拽至軟件左側(cè),依次執(zhí)行「本地OCR部署
」->「列表文件OCR
」->「批量重命名
」,每次打開軟件都需要先點擊「本地OCR部署
」,等待旁邊出現(xiàn)綠色的圓形按鈕才能進行 OCR
4.2 PDF文件OCR(win)
測試了幾款,最終發(fā)現(xiàn) ABBYY_FineReader 效果最好。
使用方法:鼠標左鍵繪制一個需要識別的區(qū)域,然后根據(jù)區(qū)域右下角出現(xiàn)的三個功能進行操作:
由于這個圖片里是表格,這里我們使用「復(fù)制為表格
」,下面是粘貼到 excel 中的效果:
五. OCR排版
其實現(xiàn)在的很多 OCR 工具識別后都內(nèi)置了排版功能,但畢竟不是全部,因此這款文字排版工具也可以收藏一下。
5.1 OCR排版伴侶(win)
吾愛大佬「海洋之心專用
」開發(fā),軟件的功能可以看一下原作者的演示:
該工具可用于處理 OCR 識別的文字 或 部分網(wǎng)頁 或 pdf 復(fù)制 出現(xiàn)的“非正常斷行”現(xiàn)象。

打包獲取本文所有軟件,關(guān)注公重號:小帥隨筆,后臺發(fā)送以下關(guān)鍵詞:ocr