hello大家好,前幾天老Y在github上閑逛,發(fā)現(xiàn)了一個(gè)大神項(xiàng)目,這個(gè)工具已經(jīng)被標(biāo)星將近5K,可見(jiàn)其受歡迎程度。 這個(gè)工具叫Tabula,它是用于提取pdf中的數(shù)據(jù)表格工具。我們知道pdf中的數(shù)據(jù)表格,不好復(fù)制,即使用文字識(shí)別工具也未能很好的識(shí)別,更別說(shuō)直接生成excel表格了。 而Table可以將pdf中的數(shù)據(jù)直接提取到csv或excel表格中,很實(shí)用很方便的一個(gè)工具。Table支持Windows、Mac OS X、Linux三大系統(tǒng)。 下面老Y在windows中用個(gè)例子說(shuō)明一下。 在Windows中,工具下載后只有一個(gè)exe文件如下圖所示,使用方法很簡(jiǎn)單直接雙擊就可以了。 運(yùn)行后會(huì)自動(dòng)跳出網(wǎng)頁(yè),如果沒(méi)有自動(dòng)跳出,在瀏覽器輸入http://localhost:8080即可. |
|