銀聯(lián)商務(wù)引入譯圖智訊OCR智能識別平臺及多項核心識別能力,并作為“銀商大腦2.0”的核心之一,實現(xiàn)了對文檔、票據(jù)、卡證等關(guān)鍵信息自動識別錄入,為商戶服務(wù)、智慧城市建設(shè)、普惠金融等領(lǐng)域提供了數(shù)智化識別解決方案。
譯圖智訊與銀聯(lián)商務(wù)深度合作,打造了自主可控的文字識別能力基石,滿足了“新支付”中各業(yè)務(wù)場景的定制化、多元化需求,使企業(yè)針對新場景、新需求,具備快速響應(yīng)文字識別的能力,助力企業(yè)在數(shù)字化轉(zhuǎn)型發(fā)展過程中,降低業(yè)務(wù)風(fēng)險、提高效率。
一、實施背景
隨著深度學(xué)習(xí)和計算機(jī)視覺技術(shù)的不斷發(fā)展,OCR識別技術(shù)越來越成熟,其準(zhǔn)確度和適用性實現(xiàn)了大幅提升。在銀行、證券、保險、企業(yè)辦公等場景中,OCR識別技術(shù)廣泛應(yīng)用于構(gòu)建自動化數(shù)據(jù)采集、自動化審核流程,從而提高企業(yè)運營效率,成熟的應(yīng)用如證照智能分類識別、表單憑證識別、發(fā)票識別、合同識別比對、文本檔案等非結(jié)構(gòu)化數(shù)據(jù)的識別和提取。據(jù)市場研究數(shù)據(jù),全球金融業(yè)OCR識別市場預(yù)計從2019年的50億美元增長到2025年的120億美元,年均增長率超過15%,預(yù)示隨著金融業(yè)務(wù)的數(shù)字化和自動化程度不斷提高,OCR識別技術(shù)的應(yīng)用將更加廣泛。
當(dāng)前,在用戶注冊、遠(yuǎn)程開戶、商戶入網(wǎng)、財務(wù)報銷、金融信貸審批等場景中,存在海量的卡證、票據(jù)、表單憑證、合同需要數(shù)字化后審核,這些紙質(zhì)資料易丟失、損壞,不易保存和傳遞,傳統(tǒng)管理方式都是采用人工錄入的方式進(jìn)行信息采集、審核、存檔,但因內(nèi)容較多、錄入字段繁雜,還要面對模糊不清、光斑折痕、傾斜旋轉(zhuǎn)等低質(zhì)量圖片,人工操作面臨著耗時長、易出錯、風(fēng)險高、運營成本高等問題;另一方面,業(yè)務(wù)數(shù)據(jù)采用圖片的形式存儲,導(dǎo)致系統(tǒng)里都是非結(jié)構(gòu)化文檔,無法準(zhǔn)確檢索和流轉(zhuǎn),對后續(xù)流程造成諸多不便。
銀聯(lián)商務(wù)股份有限公司作為國內(nèi)最大的銀行卡專業(yè)化服務(wù)機(jī)構(gòu),在全國除臺灣以外的所有省級行政區(qū)設(shè)立機(jī)構(gòu),在國內(nèi)銀行卡專業(yè)化服務(wù)領(lǐng)域占據(jù)了近50%的市場份額,業(yè)務(wù)量巨大。在處理銀行卡證業(yè)務(wù)流程中,傳統(tǒng)的信息錄入非常繁瑣和耗時,需要手動輸入大量的文字和數(shù)據(jù),這不僅降低了工作效率,還可能導(dǎo)致錯誤?;诂F(xiàn)實的業(yè)務(wù)挑戰(zhàn),銀聯(lián)商務(wù)上線了譯圖智訊旗下的OCR文字識別平臺,用于解決業(yè)務(wù)過程中大量卡證、票據(jù)、文檔等材料手動上傳與錄入的難題。
二、實施目標(biāo)
譯圖智訊作為專注研發(fā)圖像識別、OCR文字識別的人工智能企業(yè),核心技術(shù)包括圖像OCR識別引擎、深度學(xué)習(xí)OCR引擎、自然語言理解(NLP)等技術(shù),具備成熟穩(wěn)定的OCR識別解決方案,致力于為客戶構(gòu)建數(shù)據(jù)自動化采集、業(yè)務(wù)自動化審核的業(yè)務(wù)流程,助力企業(yè)實現(xiàn)數(shù)智化轉(zhuǎn)型,為用戶降本增效。
銀聯(lián)商務(wù)上線譯圖智訊OCR文字識別平臺,將極大提高信息錄入效率和準(zhǔn)確性,降低人工成本。通過引入OCR技術(shù),實現(xiàn)對各類票據(jù)、證件等紙質(zhì)文件的自動識別和數(shù)字化處理,減少人工干預(yù),提高工作效率。同時,通過優(yōu)化算法和模型,提高識別準(zhǔn)確率,避免因人為錯誤導(dǎo)致的業(yè)務(wù)風(fēng)險。
此外,譯圖智訊OCR文字識別平臺還可以為銀聯(lián)商務(wù)提供更豐富的數(shù)據(jù)資源,支持精準(zhǔn)營銷、風(fēng)險管理等業(yè)務(wù)發(fā)展,有助于提升企業(yè)核心競爭力,進(jìn)而為其客戶提供更優(yōu)質(zhì)的服務(wù)。
三、建設(shè)內(nèi)容
(一)OCR文字識別平臺工作模式
譯圖智訊OCR文字識別平臺是集多種識別模塊于一體、可自主進(jìn)行模型管控的識別平臺。銀聯(lián)商務(wù)OCR文字識別項目應(yīng)用譯圖智訊OCR文字識別平臺,集OCR識別、NLP自然語言處理、深度學(xué)習(xí)、智能文檔處理等多項核心技術(shù)于一體,包含文字識別、表格識別、卡證識別、票據(jù)識別、房產(chǎn)證識別等全品類識別產(chǎn)品的技術(shù)體系,其識別服務(wù)具有多場景、多應(yīng)用、多部署方式,高精度、高速度、高穩(wěn)定性的特點與優(yōu)勢。
通過提供管控平臺、模型推理端源碼,企業(yè)可根據(jù)模型結(jié)構(gòu)、推理過程及其它功能,實現(xiàn)OCR識別模型的自主可控,真正將OCR的能力賦能于企業(yè),并共同進(jìn)行技術(shù)創(chuàng)新,探索OCR識別的更多可能性。
(二)OCR識別平臺技術(shù)底座
譯圖智訊OCR識別平臺深度學(xué)習(xí)技術(shù)的應(yīng)用,使OCR識別性能得到了跨越式的升級。深度學(xué)習(xí)OCR借助神經(jīng)網(wǎng)絡(luò)可模仿人腦機(jī)制對圖像、文本等數(shù)據(jù)進(jìn)行分析,可更加可靠、快速的完成海量樣本的訓(xùn)練,得到近似專家能力的最優(yōu)模型,同時在低質(zhì)量圖像、生僻字、非均勻背景、多語言混合等復(fù)雜場景中實現(xiàn)了高效精準(zhǔn)的識別與分類。
NLP智能提取技術(shù)的研發(fā),實現(xiàn)了文檔圖像的關(guān)鍵信息分析和提取,可自動從非結(jié)構(gòu)化信息中提取目標(biāo)數(shù)據(jù),可滿足所有文本的關(guān)鍵信息提取需求。通過模型管控,企業(yè)可通過少量樣本,高效完成模型的標(biāo)注訓(xùn)練,自定義創(chuàng)建提取模型。
通過不斷技術(shù)創(chuàng)新,譯圖智訊OCR識別產(chǎn)品性能一直處于行業(yè)領(lǐng)先地位,識別率高于99%、識別平均耗時低于200ms,并可針對證件更新進(jìn)行快速響應(yīng)推出新產(chǎn)品。
譯圖智訊OCR文字識別平臺具有以下技術(shù)優(yōu)勢:
(1)識別速度快:譯圖智訊OCR文字識別平臺卡證識別平均識別速度200ms,A4紙張識別速度1秒,識別速度快,耗時短,開箱即用。
(2)識別能力強:支持識別圖像、文本、表格等各種文件,不受光照、背景、傾斜、模糊、折痕等復(fù)雜環(huán)境的干擾,對于拍照模糊的圖像也能準(zhǔn)確識別。
(3)識別準(zhǔn)確率高:支持識別數(shù)字、英文字母、手寫文本等字符,數(shù)字英文識別率≥99.9%,中文字符識別率≥99.5%,手寫字符識別率≥96.0%,識別內(nèi)容準(zhǔn)確率高,不易出錯。
(4)構(gòu)建自動化采集審核系統(tǒng):譯圖智訊OCR文字識別平臺基于圖像OCR識別引擎、深度學(xué)習(xí)OCR引擎、自然語言理解(NLP)等技術(shù),結(jié)合業(yè)務(wù)規(guī)則邏輯,可構(gòu)建起完整的自動化采集審核系統(tǒng),縮短人工作業(yè)時長。
(5)為用戶降本增效:部署譯圖智訊OCR文字識別平臺后,系統(tǒng)能夠自動識別和處理大量數(shù)據(jù),實時處理和解析圖像、文字、數(shù)字、表格等信息,大大提高工作效率,同時避免了人工處理時可能出現(xiàn)的錯誤;通過OCR系統(tǒng)將大量紙質(zhì)文件進(jìn)行數(shù)字化處理,從而節(jié)省大量存儲空間。
銀聯(lián)商務(wù)部署OCR識別平臺后,一方面可以整合資源,向各部門、各分支機(jī)構(gòu),以及外部合作單位提供公有云接口輸出或者本地化部署服務(wù);另一方面可以助力金融業(yè)務(wù)辦理流程的降本增速,提升業(yè)務(wù)效率,提高客戶體驗感。
四、實施效果
引用OCR識別平臺后,通過計算機(jī)代替人工操作,實現(xiàn)全票據(jù)、人證、車證、企業(yè)證件、各類文檔的信息自動識別、自動分類、自動錄入,可將紙質(zhì)文件的數(shù)據(jù)信息轉(zhuǎn)換成計算機(jī)可編輯的結(jié)構(gòu)化數(shù)據(jù),工作人員只需上傳文件即可實現(xiàn)一鍵識別、一鍵錄入、一鍵分類,節(jié)省95%以上的工作量。
針對關(guān)鍵字段審核難題,也可通過關(guān)鍵點的標(biāo)注訓(xùn)練,進(jìn)行關(guān)鍵詞的提取審閱和系統(tǒng)錄入,真正做到對文檔憑證的高效管理,提高了業(yè)務(wù)辦理流程的電子化、數(shù)據(jù)化能力,使得用戶業(yè)務(wù)辦理更便捷、更安全、更高效,節(jié)省的人力時間成本可創(chuàng)造更多價值。
銀聯(lián)商務(wù)上線譯圖智訊的OCR文字識別平臺代替人工操作,一秒鐘可完成三張卡證的識別審核,單頁文檔識別只需要2-3秒,業(yè)務(wù)辦理審核效率提升幾十倍,新商戶入網(wǎng)達(dá)200多萬家。
如今,銀聯(lián)商務(wù)布設(shè)的百萬級海量終端已全面擁抱互聯(lián)網(wǎng),實體服務(wù)網(wǎng)絡(luò)覆蓋中國大陸所有地級以上城市及港澳地區(qū),并拓展至96%的縣域,在線上和線下的支付場景中形成了完整的服務(wù)能力。
憑借譯圖智訊為銀聯(lián)商務(wù)定制提供的OCR文字識別平臺解決方案,賦能企業(yè)業(yè)務(wù)流程數(shù)智化,降低企業(yè)成本、提升業(yè)務(wù)效率,贏得了客戶的高度認(rèn)可與肯定。在第六屆(2023)數(shù)字金融創(chuàng)新大賽中,該解決方案脫穎而出,榮膺數(shù)智平臺·數(shù)字賦能方向金獎,受到多家銀行、金融科技機(jī)構(gòu)等專業(yè)人士關(guān)注。