早在十幾二十年前,隨便走進(jìn)一家電子廠,人們會(huì)看到一排排工人正在進(jìn)行裝配、貼標(biāo)或質(zhì)檢等重復(fù)性的勞動(dòng)作業(yè)。這是工業(yè)1.0、2.0時(shí)代司空見慣的場(chǎng)景。
滄海桑田,如今,在許多現(xiàn)代化工廠,工人變成了流水線旁負(fù)責(zé)巡檢的“配角”,工業(yè)機(jī)器人替代了繁重的人工作業(yè),電子信息技術(shù)的廣泛應(yīng)用讓生產(chǎn)的自動(dòng)化水平大幅提高,工業(yè)界也由此步入了3.0時(shí)代。
然而,傳統(tǒng)的工業(yè)機(jī)器人大多是通過(guò)示教再現(xiàn)或者預(yù)編程來(lái)實(shí)現(xiàn)各種簡(jiǎn)單的操作,這極大地限制了機(jī)器人的應(yīng)用。如果能讓機(jī)器像人一樣具有自我意識(shí),可以根據(jù)產(chǎn)品的位置、亮度、顏色、表面特征等信息進(jìn)行對(duì)應(yīng)的操作,顯然能進(jìn)一步解放生產(chǎn)力,完成柔性化的制造,而實(shí)現(xiàn)這一切的前提就是為機(jī)器人裝上“眼睛”,也就是“機(jī)器視覺”。
某種意義上可以說(shuō),機(jī)器視覺是賦予工業(yè)機(jī)器人智慧化,并助力整個(gè)工業(yè)從3.0時(shí)代步入4.0時(shí)代的關(guān)鍵一環(huán),為智能制造的落地打開了“新窗口”。
“神通廣大”的機(jī)器視覺
顧名思義,機(jī)器視覺就是用機(jī)器代替人眼來(lái)做測(cè)量和判斷,通過(guò)視覺系統(tǒng)對(duì)產(chǎn)品圖像攝取,同時(shí)將被攝取的目標(biāo)轉(zhuǎn)換為圖像信號(hào)傳送給專用的圖像處理系統(tǒng),得到被攝目標(biāo)的形態(tài)信息,再將像素分布和亮度、顏色等信息轉(zhuǎn)變成數(shù)字化信號(hào),圖像系統(tǒng)對(duì)這些信號(hào)進(jìn)行各種運(yùn)算來(lái)抽取目標(biāo)的特征,進(jìn)而根據(jù)判別結(jié)果來(lái)控制現(xiàn)場(chǎng)的設(shè)備動(dòng)作。
和人眼相比,機(jī)器視覺具有效率快、精準(zhǔn)性高且永不知疲倦等顯著優(yōu)勢(shì),因而被廣泛應(yīng)用于工業(yè)制造的各個(gè)環(huán)節(jié),比如上下料過(guò)程中使用機(jī)器視覺進(jìn)行定位,引導(dǎo)機(jī)械手臂準(zhǔn)確抓??;比如在自動(dòng)化包裝領(lǐng)域進(jìn)行物品數(shù)量的識(shí)別和數(shù)據(jù)的追溯;再比如對(duì)一些精密度較高的產(chǎn)品進(jìn)行分類和瑕疵檢測(cè),這也是機(jī)器視覺目前應(yīng)用最廣泛、取代人工最多的環(huán)節(jié)。
我們不妨以汽車輪轂分類/分割場(chǎng)景為例:作為輪胎的骨架,輪轂扮演著汽車配件中的重要角色,根據(jù)直徑、寬度、成型方式、材料不同種類繁多。
從制造的維度來(lái)看,汽車輪轂大多是鑄件,鑄造完成后要進(jìn)行精加工,輪轂有上百種類型,不同的類型應(yīng)選擇不同加工路線、加工機(jī)床、刀具等。在自動(dòng)化生產(chǎn)線上要實(shí)現(xiàn)多品種的混流生產(chǎn),首先要完成的就是輪轂類型的識(shí)別。除此之外,輪轂的質(zhì)量好壞還直接決定了車輛行駛過(guò)程中的安全性能,然而其制造成型過(guò)程中受工藝參數(shù)、冷卻系統(tǒng)等因素的影響,卻極易產(chǎn)生氣孔、縮孔、縮松等內(nèi)部缺陷。為了保證產(chǎn)品質(zhì)量,缺陷檢測(cè)/分割環(huán)節(jié)也必不可少。
無(wú)論是輪轂分類還是分割,這些任務(wù)早期都是由人工方式來(lái)完成,流水線周而復(fù)始,工人沒(méi)有片刻休息時(shí)間。在工作強(qiáng)度大、時(shí)間長(zhǎng)、長(zhǎng)期緊張的工作狀態(tài)下,工人容易感到疲倦,在作業(yè)中也不可避免地受到情緒波動(dòng)、注意力不集中、疏忽大意等因素的影響,導(dǎo)致分類/分割工作的速度、穩(wěn)定性和準(zhǔn)確性都無(wú)法保障。
不斷迭代的機(jī)器視覺方案
對(duì)癥下藥,基于上述痛點(diǎn),越來(lái)越多機(jī)構(gòu)開始探索自動(dòng)化甚至智能化的輪轂分類/分割方案。
自動(dòng)輪轂檢測(cè)場(chǎng)景
先來(lái)看輪轂分割場(chǎng)景。X射線無(wú)損探傷是目前檢測(cè)輪轂內(nèi)部缺陷的最佳方式,具體而言,初始成型的毛坯輪轂被機(jī)電系統(tǒng)送入鉛房后,分區(qū)域多次成像,能實(shí)現(xiàn)整只輪轂的全部檢測(cè)。
為了替代傳統(tǒng)的手動(dòng)檢測(cè),有的企業(yè)采取半自動(dòng)檢測(cè)的方式,即提前在下位機(jī)設(shè)置好輪轂的運(yùn)行流程,每個(gè)部位的成像過(guò)程無(wú)需人工干預(yù),檢測(cè)人員僅需觀察該部位的X射線圖像來(lái)決定產(chǎn)品質(zhì)量;還有企業(yè)更進(jìn)一步,在上位機(jī)設(shè)置好輪轂缺陷檢測(cè)的相關(guān)參數(shù),整個(gè)過(guò)程無(wú)需人工干預(yù),全部自動(dòng)完成,而在全自動(dòng)的檢測(cè)過(guò)程中,輪轂缺陷的自動(dòng)分割算法起著至關(guān)重要的作用。
再來(lái)看輪轂分類場(chǎng)景,當(dāng)前,已經(jīng)有不少高校提出了基于機(jī)器視覺的分類算法。
東北大學(xué)提出了一種基于機(jī)器視覺的汽車輪轂識(shí)別系統(tǒng),其根據(jù)實(shí)驗(yàn)選擇了五個(gè)特征:輪轂中心是否有孔洞,輪轂邊緣區(qū)域的孔數(shù),輪轂半徑,輪轂面積,以及旋轉(zhuǎn)不變性,利用投票分類器對(duì)提取的特征進(jìn)行分類。與傳統(tǒng)方法相比能達(dá)到較好的效果,缺點(diǎn)是先驗(yàn)信息太多,需要人工選擇較明顯的特征費(fèi)時(shí)費(fèi)力,且由于提取到的特征較少,對(duì)于結(jié)構(gòu)復(fù)雜的輪轂辨識(shí)度差,結(jié)構(gòu)相近的輪轂也難以區(qū)分。
中北大學(xué)提出了一種基于OpenCV和MFC平臺(tái)的輪轂分類技術(shù),與傳統(tǒng)的識(shí)別方法相比節(jié)省了時(shí)間,但由于形態(tài)學(xué)處理的破壞,泛化程度較低;南京信息工程大學(xué)提出了一種基于統(tǒng)計(jì)模型的輪轂分類方法,使用背景去除、形態(tài)學(xué)處理、局部二值化和邊緣提取算子等多種方法進(jìn)行特征提取,能進(jìn)一步提高分類精度,但能夠成功識(shí)別分類的輪轂類型較少且檢測(cè)方法非常耗時(shí)……
通過(guò)上述分析我們可以得知,機(jī)器視覺解決方案的部署本身是一項(xiàng)非常復(fù)雜的工作,涉及許多專業(yè)技術(shù),需要很多專業(yè)人才,期間會(huì)耗費(fèi)大量成本且涉及大量試錯(cuò),制造商想要依靠自身開發(fā)這樣的一套解決方案,可謂難如登天。
讓機(jī)器視覺不再遙不可及
如何讓制造商快速掌握機(jī)器學(xué)習(xí)這項(xiàng)“秘密武器”?英特爾與無(wú)錫信捷電氣股份有限公司(下稱“信捷”)聯(lián)合推出了一套基于深度學(xué)習(xí)的輪轂分類/分割解決方案,為輪轂檢測(cè)行業(yè)提供了新的思路。
基于信捷自主研發(fā)的新一代機(jī)器視覺應(yīng)用開發(fā)平臺(tái)X-SIGHT VISION STUDIO Pro,制造商無(wú)需編寫代碼,只用在軟件中拖拽組件,就能完成開發(fā)——這相當(dāng)于把復(fù)雜的專業(yè)攝像機(jī)直接變成了“傻瓜相機(jī)”,大大降低了用戶入門的門檻。
除了具備圖形化界面、提供快速的應(yīng)用開發(fā)環(huán)境,幫助用戶快速上手并輕松創(chuàng)建典型應(yīng)用之外,該平臺(tái)還提供了強(qiáng)大的圖像分析能力,甚至具備自我學(xué)習(xí)優(yōu)化能力,是一個(gè)不斷進(jìn)化迭代的平臺(tái)。得益于此,用戶能以更高的效率開發(fā)定制化的大規(guī)模項(xiàng)目,從而縮短研發(fā)周期和成本。
你可能會(huì)疑惑,為什么信捷的平臺(tái)能夠?qū)C(jī)器學(xué)習(xí)“化繁為簡(jiǎn)”?原來(lái)其平臺(tái)背后,集成了英特爾®OpenVINO™、oneAPI加速方案。這些軟件就如同“催化劑”一般,為信捷的方案部署和模型加速提供了更高效的工具。
其中,OpenVINO™視覺工具套件是一款面向高性能計(jì)算機(jī)視覺和深度學(xué)習(xí)應(yīng)用的快速開發(fā)套件,基于最新一代人工神經(jīng)網(wǎng)絡(luò),包括卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)網(wǎng)絡(luò)和基于注意力的網(wǎng)絡(luò),可跨英特爾硬件擴(kuò)展至計(jì)算機(jī)視覺和非視覺的工作,從而最大限度地提高性能,在邊緣到云端都能展現(xiàn)高性能AI和深度學(xué)習(xí)推理部屬的加速。這增強(qiáng)了信捷產(chǎn)品的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)推理能力,助力其為客戶提供更優(yōu)的解決方案。oneAPI則是一種跨行業(yè)、開放、基于標(biāo)準(zhǔn)的統(tǒng)一編程庫(kù),可提供跨加速架構(gòu)的通用開發(fā)體驗(yàn),幫助信捷提高應(yīng)用性能、工作效率和創(chuàng)新能力。
機(jī)器視覺場(chǎng)景復(fù)雜,英特爾為此開發(fā)了諸多工具套件,以滿足用戶在各類工業(yè)場(chǎng)景下的需求,促進(jìn)更多的機(jī)器視覺應(yīng)用案例落地,為工業(yè)機(jī)器視覺的發(fā)展提供技術(shù)支持。
基于信捷和英特爾的這套聯(lián)合解決方案,制造商能夠通過(guò)攝像頭采集輪轂圖像,傳輸至網(wǎng)絡(luò)進(jìn)行識(shí)別分類,實(shí)現(xiàn)快速、準(zhǔn)確、穩(wěn)定的響應(yīng),從而大大降低人力成本,提高生產(chǎn)效率。
結(jié)語(yǔ)
以智能制造為主導(dǎo)的工業(yè)革命4.0正影響著各行各業(yè),而工業(yè)機(jī)器視覺將是驅(qū)動(dòng)未來(lái)工業(yè)數(shù)字化、智能化的重要?jiǎng)幽?,不僅是汽車制造產(chǎn)業(yè)鏈在積極引入機(jī)器視覺解決方案,更廣泛的工業(yè)領(lǐng)域也期望借助該技術(shù)實(shí)現(xiàn)數(shù)字化升級(jí)、柔性制造的變革。