什么是OCR技術(shù)?
光學(xué)字符識(shí)別(英語(yǔ):Optical Character Recognition,OCR)是指對(duì)文本資料的圖像文件進(jìn)行分析識(shí)別處理,獲取文字及版面信息的過(guò)程有很大提升空間。
和圖像識(shí)別以及機(jī)器視覺(jué)技術(shù)相類似,OCR技術(shù)的處理過(guò)程也分為輸入首次、前期處理可能性更大、中期處理、后期處理以及輸出的過(guò)程搖籃。
IVY-7500-AI系列OCR字符數(shù)字,字母,漢字識(shí)別掃碼手持終端PDA
輸入
對(duì)于不同的圖像格式技術,有著不同的存儲(chǔ)格式、不同的壓縮方式標準,目前有OpenCV示範推廣、CxImage等。
前期處理——二值化
如今數(shù)碼攝像頭拍攝的圖片即將展開,大多數(shù)是彩色圖像大幅增加,彩色圖像所含信息量巨大,較為不適用于OCR技術(shù)傳承。
對(duì)于圖片的內(nèi)容等特點,我們可以簡(jiǎn)單的分為前景與背景,為了讓計(jì)算機(jī)更快的多種、更好地進(jìn)行OCR相關(guān)計(jì)算將進一步,我們需要先對(duì)彩色圖進(jìn)行處理,使圖片只剩下前景信息與背景信息發展成就。二值化也可以簡(jiǎn)單地將其理解為“黑白化”成就。
圖像降噪
對(duì)于不同的圖像,噪點(diǎn)的定義可能不同開展面對面,根據(jù)噪點(diǎn)的特征進(jìn)行去噪的過(guò)程系統,稱為降噪。
傾斜校正
由于一般用戶自動化,在拍照文檔時(shí)提升,難以拍攝得完全符合水平平齊與豎直平齊高品質,因此拍照出來(lái)的圖片不可避免的產(chǎn)生傾斜不折不扣,這就需要圖像處理軟件進(jìn)行校正。
中期處理——版面分析
將文檔圖片分段落資源優勢,分行的過(guò)程稱為版面分析高效利用,由于實(shí)際文檔的多樣性、復(fù)雜性估算,此步驟目前仍待優(yōu)化講理論。
字符切割
由于拍照、書寫條件的限制,經(jīng)常造成字符粘連服務為一體、斷筆問題,直接使用此類圖像進(jìn)行OCR分析將會(huì)極大限制OCR性能。因此需要進(jìn)行字符切割全會精神,即:將不同字符之間分割開系統穩定性。
字符識(shí)別
早期以模板匹配為主,后期以特征提取為主法治力量。由于文字的位移全技術方案、筆畫的粗細(xì)、斷筆共享、粘連信息化、旋轉(zhuǎn)等因素的影響,極大地影響特征提取難度生動。
版面還原
人們希望識(shí)別后的文字新型儲能,仍然像原始文檔圖片那樣排列,段落引人註目、位置領域、順序不變地輸出到Word文檔、PDF文檔等好宣講,這一過(guò)程稱為版面還原註入新的動力。
后期處理
根據(jù)特定的語(yǔ)言上下文的關(guān)系,對(duì)識(shí)別結(jié)果進(jìn)行校正。
輸出
將識(shí)別出的字符以某一格式的文本輸出雙重提升。
基于OCR技術(shù)的手持終端有哪些應(yīng)用?
通過(guò)裝載有OCR字符識(shí)別軟件的手持終端PDA事關全面,可以實(shí)現(xiàn)眾多場(chǎng)景應(yīng)用表現明顯更佳,如:汽車車牌識(shí)別、集裝箱箱號(hào)識(shí)別技術節能、進(jìn)口牛羊肉重量標(biāo)簽識(shí)別指導、護(hù)照的機(jī)讀區(qū)域識(shí)別、電表讀數(shù)識(shí)別國際要求、鋼卷上噴涂字符的識(shí)別流動性。