東坡下載:內(nèi)容最豐富最安全的下載站!

首頁IT技術軟件教程 → 尚書七號文字識別軟件提取文字技巧

尚書七號文字識別軟件提取文字技巧

相關文章發(fā)表評論 來源:本站整理時間:2015/1/5 10:26:46字體大。A-A+

更多

作者:佚名點擊:506次評論:0次標簽: 文字識別

尚書七號是一款很不錯的文字識別軟件,怎么樣準確提取圖片上面的文字還是需要一定的技巧的,注意一點技巧,工作效率還是會提高的,下面給大家分享的是尚書七號文字識別軟件提取文字技巧。

基本使用方法:

1、打開尚書七號,選擇打開圖象。(我用的版本可以識別的格式有bmp、tif、jpg)

2、選擇開始識別或按F8。識別結果將顯示在窗口上部,下部顯示版面分析結果。其中紅線為可識別部分,綠線為不可識別。

3、選擇輸出--到指定格式文件,將識別結果保存為需要的格式。

識別前應注意的問題:

1、圖片質(zhì)量。批量識別時,首先應確保要識別的圖片質(zhì)量。如不能識別還需要重新處理,甚至會導致軟件死掉,浪費時間。我本人就曾深受其苦。圖片分辨率應稍高,肉眼看感覺偏大,因為識別工具是有點近視的,文字和底色對比要求不高,通常來說,肉眼能看清楚即可,底色發(fā)灰或發(fā)黑基本不會影響識別結果。

2、避免有不規(guī)則形狀(圖片)出現(xiàn)。識別工具在進行版面分析時,只能采用方形切割,當圖片中存在文字環(huán)繞不規(guī)則形狀時,則無法將文字和該形狀劃分開,則將出現(xiàn)錯誤或無法識別。此時,較快的辦法是在PS中,吸取該圖片附近的頁面底色,用粗畫筆將該區(qū)域涂上,不必講求效果,顏色沒有太大差別即可,重新保存圖片。

3、避免圖象傾斜。尚書七號中也有自動傾斜校正和手動傾斜校正工具,但即使經(jīng)過校正,識別率還是低很多。如果是拍攝的書本,可能會產(chǎn)生一定弧度,此時保證行的兩端對齊即可。另外在拍攝時應避免高光等會使圖象各部分亮度反差大的情況。

書本轉(zhuǎn)換(掃描、拍攝)技巧

1、可以將書攤平,一次將兩邊都掃描或拍攝下來,節(jié)省時間。處理圖片時不必剪開,這時要用到尚書七號的分欄工具了。直接用鼠標在打開的圖象上拖拽,可出現(xiàn)選框,分成左右兩個分欄,分欄左上角的編號就是識別結果的排列順序。它會將自動按照編號順序?qū)⑺蟹謾诘膬?nèi)容連接在一起。

2、手動分欄可解決部分圖象無法識別的問題。在進行識別后,可以看到版面分析結果,有時候由于圖象質(zhì)量原因,自動分析出的有效版面只是很小的一部分。此時可以按ctrl+del取消版面分析結果,用鼠標拖拽,劃定需要識別的范圍,重新進行識別。當圖片質(zhì)量問題不大時,這個辦法有效。

有時候(尤其是拍攝所得圖片),文字扭曲嚴重,即使用PS也無法調(diào)整好?蓢L試手動分欄,多劃分幾欄,每一欄包含一行或少數(shù)幾行文字,這樣對于每個分欄來說,它所包含的范圍內(nèi)誤差度相對減小,可提高識別率。

3、使用批量識別功能。尚書七號可以一次性識別大量圖片。但在實際應用中,依次識別不宜過多,便于隨時檢查識別結果,發(fā)現(xiàn)錯誤及時修正。

4、批量識別圖象時,保存文件也要花費大量時間。事實上,尚書七號在識別文件的同時,會在圖片所在文件夾生成文本文檔,名稱與圖片名稱相同。因此,如果不是特別需要,可以不必再保存輸出結果。

如所識別內(nèi)容屬于一部分,可以將左側(cè)的圖象列表全選(ctrl+A),再選擇“輸出--到指定格式文件”,則當前所有識別內(nèi)容按照圖片排列順序保存在一個文件中。

我使用的尚書七號不能記憶保存路徑,每次選擇保存時,都會默認打開程序安裝目錄下的“outout”文件夾,不必每次都選擇路徑,可以先保存在這里,然后一起轉(zhuǎn)移文件。

5、如果想保留文件中的圖片,在輸出結果時選用RTF格式,再用word打開,可以看到格式完全正確的文字和圖片了。

6、用書本的頁碼給文件命名是明智的選擇。我曾經(jīng)用內(nèi)容摘要命名,自以為清晰明了,結果在最后修正錯誤字符時悔恨交加。

7、當一個圖象完全無法識別時,可稍稍增加亮度或?qū)Ρ榷,有時候只差那么一點點,它也不給你工作。

8、分欄的幾個類型。當單擊一個分欄時,工具欄中會相應分欄類型的按紐會按下。分欄有橫欄(橫排文字)、豎欄(豎排文字)、圖片、表格等幾個類型,一般情況下可以自動識別類型,但手動分欄時一定要選擇相應的類型,以提高識別率。

以上問題針對拍攝情況而言,掃描的話相信會減少問題,如果能拆書的話,最好還是拆吧。

  • PDF文字提取軟件
  • 手機圖片文字識別軟件
  • 文字識別軟件
PDF文字提取軟件
(12)PDF文字提取軟件

PDF文字識別軟件相信有不少人都是想要的,這種軟件其實是非常多的,一般的只需要上傳或者是通過相機進行掃描就可以掃描出正確的文字出來!現(xiàn)在為大家?guī)肀姸郟DF文字識別軟件!每一個都是可以掃描pdf文件的!

...更多>>
  • 白描app2.2.1 安卓手機版

    10-06 / 13.9M

    推薦理由:白描app是一款免費的手機ocr文字識別軟件,支持的語言非常多,有中文、英文、日語、韓、法、德、俄等等,使
  • 帶有OCR的PDF掃描儀手機版1.0.0 安

    01-18 / 25.0M

    推薦理由:帶有OCR的PDF掃描儀手機版是一款pdf掃描儀軟件,可以直接的讓你的手機變成掃描儀,可以快速的把你的文件以及
  • 文字掃描識別軟件(文字掃描王)1.4.

    08-15 / 13.2M

    推薦理由:圖片自動轉(zhuǎn)換成文字識別,可以對錯誤文字修正。文字掃描王不需要pdf和打印文件了。節(jié)約成本的同時提升了辦公
  • 圖片文字識別(OCR app)1.0.16 安卓

    01-15 / 1.8M

    推薦理由:有些圖片上會有很多的文字,想要獲取上面的文字除了一個個手打外,今天小編知道一個快捷的方法,那就是用OC
  • 快證通拍照識別文字app1.0.1.1 手機

    12-31 / 9.9M

    推薦理由:通過拍一張照片就可以自動獲取證件里面的信息,快證通拍照識別文字app為用戶帶來了極大的方便,再也不用一個
  • apus文字識別手機版2.0.187 去廣告

    12-22 / 1.7M

    推薦理由:apus文字識別手機版軟件是一款手機上的圖片識別文字神器,幫助用戶快速識別圖片上的文字信息,可以支持多種
手機圖片文字識別軟件
(6)手機圖片文字識別軟件

一張圖片上的文字,想要COPY下來是不可能的,那么如何才能將圖片上的文字轉(zhuǎn)換成文檔呢?東坡小編為大家推薦手機圖片文字識別軟件,智能識別圖片上的文字,并可以形成文檔格式保存,非常方便,歡迎來下載使用!

...更多>>
文字識別軟件
(6)文字識別軟件

文字識別軟件現(xiàn)在也是很不多的朋友都是非常的需要使用到的,那么現(xiàn)在小編就給你介紹下目前世面上的一些文字識別軟件識別率高的,以及還是免費版下載的,有這方面需要的朋友現(xiàn)在小編就給你介紹下面的這些吧!趕快來下載試試看!

...更多>>
更多精彩內(nèi)容請點擊

文字識別軟件

專題

擴展知識

相關評論

閱讀本文后您有什么感想? 已有 人給出評價!

  • 2791 喜歡喜歡
  • 2101 頂
  • 800 難過難過
  • 1219 囧
  • 4049 圍觀圍觀
  • 5602 無聊無聊
熱門評論
最新評論
發(fā)表評論 查看所有評論(0)
昵稱:
表情: 高興 可 汗 我不要 害羞 好 下下下 送花 屎 親親
字數(shù): 0/500 (您的評論需要經(jīng)過審核才能顯示)