文字識(shí)別軟件能幫助我們很快捷的把一些圖片上面的文字拷貝下來,這里給大家?guī)淼氖乔迦A紫光ocr2000文字識(shí)別軟件使用教程,希望對(duì)大家有所幫助。
清華紫光OCR2000的作用----文字識(shí)別
為達(dá)到快速錄入,常將一些報(bào)紙書刊等使用掃描儀掃描到電腦中;但掃描后生成的是一個(gè)圖像文件,不能進(jìn)行字處理編緝;所以使用OCR軟件將掃描后的圖像文件識(shí)別WORD文件、EXEL文件或記事本文件,可進(jìn)行字處理編緝。
為達(dá)到快速錄入,常將一些報(bào)紙書刊等使用掃描儀掃描到電腦中;但掃描后生成的是一個(gè)圖像文件,不能進(jìn)行字處理編緝;所以使用OCR軟件將掃描后的圖像文件識(shí)別WORD文件、EXEL文件或記事本文件,可進(jìn)行字處理編緝。
文字識(shí)別的處理流程
1 掃描
2 識(shí)別
3 編緝修改
4 輸出
掃 描
安裝好掃描儀及相關(guān)驅(qū)動(dòng)
掃描設(shè)置
字號(hào)在5號(hào)字以上,設(shè)分辨率300;普通印刷品,亮度為0。
使用“掃描”按鈕掃描
識(shí)別
1 版面調(diào)整 旋轉(zhuǎn)、傾斜校正、剪裁、反轉(zhuǎn)等操作
撤消版面調(diào)整操作可使用“恢復(fù)圖像”命令
2 版面分析 清華TH-OCR 2000千禧專業(yè)版的版面區(qū)域共有四種類型,即橫排正文 、豎排正文 、表格 和圖形圖像 。在進(jìn)行識(shí)別前必須正確定義圖像中各區(qū)域的區(qū)域類型。
1) 先使用鼠標(biāo)拖畫出一個(gè)方框?qū)⑺枰膮^(qū)域圍住,再定義區(qū)域?qū)傩?
2)對(duì)于比較簡(jiǎn)單的版面,也可使用“命令”菜單中的“版面分析”命令(F6)
識(shí)別
3)圖像內(nèi)如含表格,應(yīng)先將表格建為獨(dú)立的區(qū)域,然后確定其表格屬性。這時(shí)系統(tǒng)即自動(dòng)進(jìn)行框線檢測(cè)并將檢出的框線(包括內(nèi)部的表格線)用粉紅色線表示。
當(dāng)要識(shí)別的圖象表格框線不全時(shí),必須進(jìn)行虛擬框線檢測(cè)。(F8)選擇【命令[C]】菜單的【 虛擬框線檢測(cè)[I] 】,系統(tǒng)會(huì)將框線自動(dòng)修補(bǔ)好。
虛擬框線檢測(cè)必須在框線檢測(cè)完成后才能進(jìn)行
識(shí)別
3 識(shí)別(F2)和 多頁識(shí)別(CTRL+F2)
編緝修改
顯示菜單下---“后編改狀態(tài)”
前向詞匯,以光標(biāo)所在處前一字為準(zhǔn),進(jìn)行詞匯聯(lián)想,列出光標(biāo)處可能的字。
逆向詞匯 以光標(biāo)所在處后一字為準(zhǔn),進(jìn)行詞匯聯(lián)想,列出光標(biāo)處可能的字。
相似字 列出與當(dāng)前光標(biāo)處相似的字
常用符號(hào) 列出鍵盤不易輸入,但又常用的標(biāo)點(diǎn)符號(hào)。
行逆序?qū)iT為港臺(tái)的部分報(bào)紙和其它印刷品設(shè)計(jì)的。一般橫排文字的排列是從左到右,而豎排文字則從右到左。在部分繁體材料中有時(shí)會(huì)出現(xiàn)相反的情況。這時(shí)使用行逆序就很方便了。
輸出
使用文件菜單中的“導(dǎo)出”命令
若導(dǎo)出的文件想在WORD中進(jìn)行編緝,則選擇“RTF”格式;若是表格,想在EXEL中編緝,則選擇“HTML”;也可選擇“TXT”,可在任意字處理軟件中編緝,但不保留識(shí)別前文件的排版格式。