當(dāng)前位置：軟件下載吧 > 應(yīng)用軟件 > 轉(zhuǎn)換翻譯 > 漢王PDF OCR v8.1.4.16官方正式版

漢王PDF OCR

v8.1.4.16官方正式版

軟件大小：23.72 MB
軟件語(yǔ)言：簡(jiǎn)體中文
更新時(shí)間：2024-01-12
軟件類型：國(guó)產(chǎn)軟件 / 轉(zhuǎn)換翻譯
運(yùn)行環(huán)境：winall/win7/win10/win11
軟件授權(quán)：免費(fèi)軟件
官方主頁(yè)：http://m.jlass.com.cn
軟件等級(jí) :
軟件廠商：暫無(wú)

立即高速安全下載

介紹說(shuō)明
下載地址
精品推薦
相關(guān)軟件
網(wǎng)友評(píng)論

　　漢王PDF OCR 漢王 PDF OCR官方版是漢王OCR 6.0 和尚書七號(hào)的升級(jí)版，新增PDF文件的處理功能，可以把PDF文件(包括文本型和圖片型)轉(zhuǎn)化為可編輯的各種文檔,如(PDFTOWORD)或(PDFTOTXT)。漢王 PDF OCR官方版現(xiàn)已全面升級(jí)，并且對(duì)個(gè)人用戶免費(fèi)，無(wú)功能限制。

　　快捷鍵速記

　　掃描文件：按下“Ctrl+N”調(diào)出掃描程序，掃描圖像文件。

　　打開(kāi)文件：按下“Ctrl+O”打開(kāi)圖像文件，追加圖像文件。

　　保存圖像：按下“Ctrl+S”鍵保存圖像。

　　圖像反白：按下“Ctrl+I”將圖像反白。

　　自動(dòng)傾斜校正：按下“Ctrl+D”進(jìn)行自動(dòng)傾斜校正。

　　手動(dòng)傾斜校正：按下“Ctrl+M”進(jìn)行手動(dòng)傾斜校正。

　　版面分析：按下“F5”鍵，對(duì)選中的文件進(jìn)行版面分析。

　　取消版面分析：按下“Ctrl+Del”鍵，取消當(dāng)前頁(yè)的版面分析。

漢王PDF OCR軟件特色

　　1.圖像輸入、圖像前處理、預(yù)識(shí)別。

　　2.圖像輸入

　　漢王PDF OCR官方版對(duì)于不同的圖像格式，有著不同的存儲(chǔ)格式，不同的壓縮方式，目前有OpenCV、CxImage等開(kāi)源項(xiàng)目。

　　3.預(yù)處理

　　漢王ocr文字識(shí)別軟件功能主要包括二值化，噪聲去除，傾斜較正等。

　　4.二值化

　　對(duì)攝像頭拍攝的圖片，大多數(shù)是彩色圖像，彩色圖像所含信息量巨大，對(duì)于圖片的內(nèi)容，可以簡(jiǎn)單的分為前景與背景，為了讓計(jì)算機(jī)更快的、更好地識(shí)別文字，我們需要先對(duì)彩色圖進(jìn)行處理，使圖片只前景信息與背景信息，可以簡(jiǎn)單的定義前景信息為黑色，背景信息為白色，這就是二值化圖。

　　5.噪聲去除

　　對(duì)于不同的文檔，對(duì)噪聲的定義可以不同，根據(jù)噪聲的特征進(jìn)行去燥，就叫做噪聲去除。

　　6.傾斜校正

　　由于一般用戶，在拍照文檔時(shí)，都比較隨意，因此拍照出來(lái)的圖片不可避免的產(chǎn)生傾斜，這就需要文字識(shí)別軟件進(jìn)行較正。

　　7.版面分析

　　漢王ocr文字識(shí)別軟件可以將文檔圖片分段落，分行的過(guò)程就叫做版面分析，由于實(shí)際文檔的多樣性，復(fù)雜性，因此，目前還沒(méi)有一個(gè)固定的，最優(yōu)的切割模型。

　　8.字符切割

　　由于拍照條件的限制，經(jīng)常造成字符粘連，斷筆，因此極大限制了識(shí)別系統(tǒng)的性能。

　　9.字符識(shí)別

　　這一研究已經(jīng)是很早的事情了，比較早有模板匹配，后來(lái)以特征提取為主，由于文字的位移，筆畫的粗細(xì)，斷筆，粘連，旋轉(zhuǎn)等因素的影響，極大影響特征的提取的難度。

　　10.版面還原

　　人們希望識(shí)別后的文字，仍然像原文檔圖片那樣排列著，段落不變，位置不變，順序不變地輸出到Word文檔、PDF文檔等，這一過(guò)程就叫做版面還原。

　　11.后處理、校對(duì)

　　漢王PDF OCR根據(jù)特定的語(yǔ)言上下文的關(guān)系，對(duì)識(shí)別結(jié)果進(jìn)行校正，就是后處理。

使用方法

漢王PDF OCR

　　文件管理區(qū)：對(duì)文件進(jìn)行管理和整理。

　　1.打開(kāi)文件：選擇“文件”菜單，選擇打開(kāi)圖像文件的路徑，圖像文件便顯示在管理區(qū)用鼠標(biāo)可將圖像文件拖拽到管理區(qū)，也可將打開(kāi)的圖像頁(yè)復(fù)制、粘貼到管理區(qū)。

　　2.刪除文件：按鍵盤上的“Delete”鍵將文件刪除。

　　3.調(diào)整文件：選中一個(gè)文件或按住Ctrl可以選擇多個(gè)文件，把文件拖放到要調(diào)整的位置。

　　4.文件格式：本系統(tǒng)支持TIF、BMP、PDF，彩色灰度圖還支持JPG格式。

　　5.文件語(yǔ)言：本系統(tǒng)支持中文簡(jiǎn)體、英文、簡(jiǎn)繁體混排方式、以及中英文混排方式。

　　6.圖像文件重命名：選中文件，點(diǎn)擊文件菜單選擇可保存成TIF、BMP、JPG文件(說(shuō)明：本系統(tǒng)不支持批量圖像文件的改名)。

　　7.圖像文件保存路徑：在漢王PDF OCR 中可以設(shè)置獲取圖像文件的路徑、名稱、格式。如該路徑不存在，系統(tǒng)會(huì)提示是否創(chuàng)建該路徑;如果要選擇已存在的某個(gè)路徑,可以點(diǎn)擊“掃描到”按鈕，彈出選擇路徑對(duì)話框，選擇需要保存圖像的路徑。

　　侯選字區(qū)：修改識(shí)別結(jié)果時(shí)，可以選擇侯選區(qū)的字直接修改當(dāng)前字。

　　識(shí)別結(jié)果區(qū)：顯示當(dāng)前圖像文件的識(shí)別結(jié)果。

　　原圖像區(qū)：顯示當(dāng)前正處理的圖像。

　　搜索區(qū)：百度、Google搜索。

FAQ

如何使用?

1.運(yùn)行漢王PDF OCR軟件

2.點(diǎn)擊左上角【文件】-【打開(kāi)圖像】，選擇一副包含文字的圖片。

3.點(diǎn)擊【識(shí)別】-【開(kāi)始識(shí)別】。

4.漢王ocr文字識(shí)別軟件會(huì)識(shí)別出圖片上的文字，可以對(duì)一些識(shí)別錯(cuò)誤的字進(jìn)行手動(dòng)修改。

5.修改完成后點(diǎn)擊【輸出】-【到指定格式】，保存識(shí)別出來(lái)的文本。

用戶評(píng)論

轉(zhuǎn)換：

軟件很好用，免費(fèi)，簡(jiǎn)單實(shí)用。

大海全是水：

軟件很實(shí)用，使用起來(lái)也很方便。

悟空：

還可以將圖片轉(zhuǎn)換為PDF，功能還挺全的。

小編寄語(yǔ)

小知識(shí)：漢王 PDF OCR文字識(shí)別技術(shù)

光學(xué)字符識(shí)別(英語(yǔ)：Optical Character Recognition， OCR)是指對(duì)文本資料的圖像文件進(jìn)行分析識(shí)別處理，獲取文字及版面信息的過(guò)程。

OCR的概念是在1929年由德國(guó)科學(xué)家Tausheck最先提出來(lái)，并申請(qǐng)了專利。后來(lái)美國(guó)科學(xué)家Handel也提出了利用技術(shù)對(duì)文字進(jìn)行識(shí)別的想法。國(guó)內(nèi)最早的OCR商業(yè)應(yīng)用是由中國(guó)科學(xué)家王慶人教授在南開(kāi)大學(xué)開(kāi)發(fā)出來(lái)的，并在美國(guó)市場(chǎng)投入商業(yè)使用。