推薦一款可以把圖片文字提取出來(lái)的小工具,經(jīng)常碰到圖片里的精彩文字而不能復(fù)制下來(lái)而感到遺憾嗎,那么試試這個(gè)小軟件吧,說(shuō)不定能幫到你。有些圖片可以,有些會(huì)出現(xiàn)亂碼。這是我測(cè)的一個(gè)圖片確實(shí)可以。
軟件介紹:
不同于商業(yè)Ocr軟件,本軟件是免費(fèi)的,可以自由使用。第二個(gè)不同之處,本軟件的識(shí)別對(duì)象是屏幕出現(xiàn)的“顯示漢字”,而不是針對(duì)掃描儀掃出來(lái)的“打印漢字”。
二者有什么不同呢?最重要的一點(diǎn): 掃描出來(lái)的打印漢字的高度和寬度一般都在30多個(gè)像素點(diǎn)之上,這是我用畫(huà)圖軟件,打開(kāi)某個(gè)商業(yè)Ocr的samples\sample1.tif,然后一點(diǎn)一點(diǎn)數(shù)出來(lái)的。
從文件名和目錄名的中文含意可以看出,這個(gè)點(diǎn)數(shù)應(yīng)該是一個(gè)典型值。那么,如果用商業(yè)Ocr識(shí)別屏幕上出現(xiàn)的小五號(hào)字,漢字的高度是12個(gè)像素點(diǎn),會(huì)出現(xiàn)什么情況呢?
測(cè)試方法:
用記事本隨便寫(xiě)幾行漢字,設(shè)置字體為小五號(hào)字。這大概是看著還算舒服的最小號(hào)的漢字字體了(高度是12個(gè)像素點(diǎn)),如果再小,字體就很難看了。
然后,按拷屏鍵PrtSc,把屏幕的圖像拷貝、粘貼到畫(huà)圖軟件中,修剪尺寸后,保存為bmp的格式。
然后,我找了兩個(gè)國(guó)內(nèi)最著名的Ocr軟件進(jìn)行測(cè)試,結(jié)果讓人大吃一驚,識(shí)別率幾乎為零。
把圖像放大兩倍,再測(cè)試,結(jié)果仍然很不理想,大概也只有百分之二三十的樣子。
- PC官方版
- 安卓官方手機(jī)版
- IOS官方手機(jī)版