人工智能迎來了新的突破,隨之而來的是爆炸性的市場消費(fèi)。除了眾所周知的人臉識別、指紋識別、虹膜識別等熱門股,一些看起來不是那么起眼的技術(shù)也迎來了自己的時(shí)代,以更加低調(diào)的姿態(tài)挺入消費(fèi)端。OCR智能識別技術(shù)便是一個(gè)典型案例。
日常接觸到的檔案、文獻(xiàn)、資料數(shù)字化等工作,一般都由專人負(fù)責(zé)。早期的文檔數(shù)字化工作,不管是錄入、編輯還是校對都依賴人工手動(dòng)完成,效率低下。隨著OCR技術(shù)的成熟,“人工數(shù)字化”現(xiàn)狀被打破,市場逐漸放棄低效率高成本的人工錄入,轉(zhuǎn)而借助OCR技術(shù)完成文檔數(shù)字化工作。
多語種多場景精準(zhǔn)識別
目前,已經(jīng)有不少行業(yè)引入OCR技術(shù),用于協(xié)助文字電子化處理工作。行業(yè)不同,對OCR技術(shù)應(yīng)用要求自然也不盡相同。為滿足日常工作需求,包括云脈在內(nèi)的技術(shù)團(tuán)隊(duì),相繼推出文檔識別,名片識別,票據(jù)識別等技術(shù),快速實(shí)現(xiàn)名片信息采集,票據(jù)電子管理,文獻(xiàn)檔案數(shù)字化等實(shí)際應(yīng)用需求。從小處入手,推動(dòng)文本識別領(lǐng)域的消費(fèi)升級。
據(jù)介紹,OCR技術(shù)能夠被眾多的社會單位機(jī)構(gòu)接納,與其不斷優(yōu)化的場景適應(yīng)性,日益攀升的識別率不無關(guān)系。為滿足多樣化多語種的識別需求,云脈OCR技術(shù)支持中文簡繁體英法德等十多種語言文字識別,斷點(diǎn)分行,方便編輯排版。
除了多語種識別,OCR技術(shù)還會對圖片掃描件進(jìn)行美化。部分紙質(zhì)文本檔案會因?yàn)橛∷⑹д`、水浸、蟲蛀等原因出現(xiàn)字形畸變、模糊斷裂等現(xiàn)象,影響最終的識別結(jié)果。除噪美化、去紋理背景可以有效提升識別結(jié)果的準(zhǔn)確率。
云脈OCR一體化智能服務(wù)
紙質(zhì)資料的電子化是為了更好的分享和保存。“高精度識別雖然是OCR技術(shù)被市場接納的基礎(chǔ),但不可能只在識別率這一條道路上狂奔。”云脈技術(shù)解釋道,“OCR一體化智能服務(wù)才是王道。”為實(shí)現(xiàn)一體化的電子信息智能管理服務(wù),云脈技術(shù)在保證高精度的識別基礎(chǔ)上,添加圖片文字檢索、分類、分享、備份和管理等功能。
在人工手動(dòng)錄入存在明顯的效率缺陷的情況下,OCR技術(shù)的出現(xiàn)有效提升各大行業(yè)業(yè)務(wù)辦理、資料電子化工作效率,減輕員工負(fù)擔(dān),降低企業(yè)成本付出。前面也說了,不同的行業(yè)對OCR技術(shù)的具體應(yīng)用要求也是不同的,因此云脈OCR SDK開發(fā)者平臺開放了API訪問接口,降低OCR技術(shù)應(yīng)用門檻,開發(fā)者可自由接入使用,節(jié)省開發(fā)成本。
在人工智能拔地而起的時(shí)代,OCR技術(shù)成為其中不可或缺的一塊奠基石。隨著研究的深入,OCR技術(shù)應(yīng)用也將不斷拓展,更多的語種識別,更加復(fù)雜的場景應(yīng)用,未來我們將在更多的領(lǐng)域見到OCR的身影。