數(shù)字孿生為深度學(xué)習(xí)彌合了數(shù)據(jù)鴻溝

數(shù)字孿生是實(shí)際物理過程、系統(tǒng)或設(shè)備的數(shù)字復(fù)制品。最重要的是,數(shù)字孿生兄弟可能是DL項(xiàng)目成功的關(guān)鍵,尤其是涉及危險(xiǎn)、昂貴或耗時(shí)的過程的DL項(xiàng)目。

當(dāng)今世界,數(shù)據(jù)為王。世界上價(jià)值最高的公司,無論是亞馬遜、蘋果、Facebook、谷歌、沃爾瑪還是Netflix,都有一個(gè)共同點(diǎn):數(shù)據(jù)是它們最有價(jià)值的資產(chǎn)。所有這些公司都使用深度學(xué)習(xí)(deep learning,DL)將這些數(shù)據(jù)付諸實(shí)施。

不管你從事什么行業(yè),你的數(shù)據(jù)都是你最寶貴的資產(chǎn)。你需要做你自己的DL來保護(hù)你的資產(chǎn)。DL成功的最重要因素是擁有足夠的正確數(shù)據(jù)。這就是數(shù)字孿生的由來。

數(shù)字孿生是實(shí)際物理過程、系統(tǒng)或設(shè)備的數(shù)字復(fù)制品。最重要的是,數(shù)字孿生兄弟可能是DL項(xiàng)目成功的關(guān)鍵,尤其是涉及危險(xiǎn)、昂貴或耗時(shí)的過程的DL項(xiàng)目。

深度學(xué)習(xí)帶來的競(jìng)爭(zhēng)優(yōu)勢(shì)

到目前為止,幾乎每一個(gè)行業(yè)(包括半導(dǎo)體制造業(yè))都認(rèn)識(shí)到了DL創(chuàng)造戰(zhàn)略優(yōu)勢(shì)的潛力。DL采用神經(jīng)網(wǎng)絡(luò)進(jìn)行高級(jí)模式匹配。在人臉識(shí)別、語(yǔ)音識(shí)別、醫(yī)學(xué)圖像分析、生物信息學(xué)、材料檢測(cè)等領(lǐng)域有著廣泛的應(yīng)用。在半導(dǎo)體制造中,DL已經(jīng)應(yīng)用于缺陷分類等領(lǐng)域。大多數(shù)領(lǐng)先的公司都在爭(zhēng)先恐后地在這個(gè)充滿希望的新競(jìng)爭(zhēng)環(huán)境中取得優(yōu)勢(shì)。

隨著公司開始探索DL以及它如何幫助他們,許多公司發(fā)現(xiàn)了兩件事:第一,很容易得到DL原型,第二,很難從“良好原型”的結(jié)果獲得“生產(chǎn)質(zhì)量”的結(jié)果。隨著免費(fèi)的DL平臺(tái)、工具和工具包的出現(xiàn),與傳統(tǒng)的應(yīng)用程序開發(fā)相比,DL應(yīng)用程序的初始開發(fā)是非??焖俸拖鄬?duì)容易的。然而,生產(chǎn)DL應(yīng)用程序并不比生產(chǎn)常規(guī)應(yīng)用程序容易,而且可能更難。原因在于數(shù)據(jù)。擁有足夠的數(shù)據(jù),以及足夠的正確數(shù)據(jù),通常是不能提供生產(chǎn)質(zhì)量結(jié)果的DL應(yīng)用程序和徹底改變處理特定問題的方式的DL應(yīng)用程序之間的區(qū)別。

深度學(xué)習(xí)的數(shù)據(jù)鴻溝

DL是基于模式匹配的,模式匹配是通過向神經(jīng)網(wǎng)絡(luò)提供表示待匹配目標(biāo)的數(shù)據(jù)來“編程”的。需要大量的數(shù)據(jù)訓(xùn)練一個(gè)網(wǎng)絡(luò)來識(shí)別目標(biāo),并且需要知道它何時(shí)不是目標(biāo)。

DL在快速生成原型和提供概念證明方面非常強(qiáng)大。但DL的真正優(yōu)勢(shì)并不是開發(fā)速度,而是它釋放了數(shù)據(jù)的力量,使之能夠完成其他任何方式都做不到的事情。

任何DL應(yīng)用程序的成功都取決于培訓(xùn)中使用的數(shù)據(jù)集的深度和廣度。如果訓(xùn)練數(shù)據(jù)集太小、太窄或太“正常”,那么DL方法不會(huì)比標(biāo)準(zhǔn)技術(shù)做得更好——事實(shí)上,它可能做得更糟。重要的是要訓(xùn)練一個(gè)包含代表所有重要狀態(tài)或表示的數(shù)據(jù)的網(wǎng)絡(luò),足夠的數(shù)據(jù)量讓網(wǎng)絡(luò)學(xué)會(huì)捕捉問題的正確本質(zhì)。

對(duì)于一些領(lǐng)域來說,比如自主駕駛或半導(dǎo)體制造,困難在于一些最嚴(yán)重的異常情況(謝天謝地)很少發(fā)生(圖1)。然而,如果你想讓一個(gè)DL應(yīng)用程序識(shí)別出一個(gè)孩子在汽車前面飛奔或者一個(gè)致命的光掩模錯(cuò)誤,你就必須用這些場(chǎng)景訓(xùn)練網(wǎng)絡(luò),這些場(chǎng)景在現(xiàn)實(shí)世界中是非常稀少的。數(shù)字孿生是產(chǎn)生足夠多異常數(shù)據(jù)以正確訓(xùn)練網(wǎng)絡(luò)識(shí)別這些條件的唯一方法。

圖1. 標(biāo)準(zhǔn)差正態(tài)分布曲線的圖解。在半導(dǎo)體制造業(yè)中,與開車一樣,“離群”事件非常罕見,但神經(jīng)網(wǎng)絡(luò)必須接受同樣多的訓(xùn)練,因?yàn)樽顗那闆r下的事件會(huì)導(dǎo)致芯片故障;使得平均效果不夠好。

數(shù)字孿生彌補(bǔ)了鴻溝

數(shù)字孿生,即實(shí)際進(jìn)程、系統(tǒng)和設(shè)備的虛擬表示,是創(chuàng)建正確數(shù)量的正確數(shù)據(jù)以成功訓(xùn)練DL網(wǎng)絡(luò)的關(guān)鍵工具。使用數(shù)字孿生兄弟創(chuàng)建DL培訓(xùn)數(shù)據(jù)有以下幾個(gè)原因:

數(shù)據(jù)屬于客戶,因此不能將其用于DL培訓(xùn)。

創(chuàng)建DL所需數(shù)據(jù)資源已被完全投入到客戶項(xiàng)目中。

已經(jīng)開發(fā)了DL應(yīng)用程序,但發(fā)現(xiàn)需要特定的數(shù)據(jù)來調(diào)整和訓(xùn)練神經(jīng)網(wǎng)絡(luò),以達(dá)到所需的精度水平,但是使用maskshop/fab資源創(chuàng)建數(shù)據(jù)的成本令人望而卻步。

無法找到足夠的異常數(shù)據(jù)來充分訓(xùn)練您的DL網(wǎng)絡(luò)。

最后一個(gè)案例幾乎是普遍的。理想情況下,要保持對(duì)數(shù)據(jù)的完全控制,需要三個(gè)數(shù)字孿生體:在制造流程中原有流程/設(shè)備的數(shù)字孿生體,為您自己的流程模擬提供輸入數(shù)據(jù);您自己的流程/設(shè)備的數(shù)字孿生體;以及在制造流程中跟隨您的流程/設(shè)備的數(shù)字孿生兄弟,以便您可以將輸出反饋到下游進(jìn)行驗(yàn)證。

在2019年的SPIE光掩模技術(shù)會(huì)議上,D2S提交了一篇文章,展示了使用使用DL技術(shù)創(chuàng)建的兩個(gè)數(shù)字孿生體:一個(gè)掃描電子顯微鏡(SEM)數(shù)字孿生體,一個(gè)曲線反光刻技術(shù)(ILT)數(shù)字孿生體(圖2顯示了掃描電子顯微鏡數(shù)字孿生體的輸出)。雖然數(shù)字孿生的輸出通常不足以精確到制造業(yè),但這些數(shù)字孿生已經(jīng)被用于訓(xùn)練DL神經(jīng)網(wǎng)絡(luò)和驗(yàn)證。重要的是,這些數(shù)字孿生體是由深度學(xué)習(xí)產(chǎn)生的,而不是通過仿真產(chǎn)生的。這是一個(gè)使用DL作為生成其它DL所需數(shù)據(jù)的工具的示例,它演示了投資DL的復(fù)合收益。

圖2. 由SEM數(shù)字孿生生成的掩模SEM圖像和真實(shí)SEM圖像的兩個(gè)示例。顯示了在同一位置的水平切割線上的圖像強(qiáng)度。不僅圖像看起來非常相似,而且邊緣的信號(hào)響應(yīng)也相似。

一般來說,人工操作人員執(zhí)行的繁瑣/容易出錯(cuò)且很難用傳統(tǒng)算法實(shí)現(xiàn)自動(dòng)化的工藝過程,是進(jìn)行深度學(xué)習(xí)的良好候選者。無論是通過目視檢查還是其它方式,檢查特定情況的專業(yè)人員都很有可能正確執(zhí)行任務(wù)。但在許多類似情況下,人類會(huì)犯錯(cuò)誤,變得越來越不可靠。特殊情況下,DL可能不如人類做得好。但它在一些情況下的成功概率卻和時(shí)間和次數(shù)無關(guān)。隨著執(zhí)行任務(wù)的次數(shù)和/或時(shí)間的增加,人類會(huì)犯更多的錯(cuò)誤,但DL的成功概率不會(huì)隨著時(shí)間和數(shù)量的增加而降低。

縮小與DL成功的差距

一旦您確定了一個(gè)DL項(xiàng)目,就有各種可用的資源可以讓您走上成功的道路,同時(shí)仍然可以讓您對(duì)自己的數(shù)據(jù)保持嚴(yán)格的控制。如果您是新手,并希望為您的試點(diǎn)項(xiàng)目提供全面的支持,您可以加入電子制造深度學(xué)習(xí)中心(CDLe,www.cdle.ai網(wǎng)站),一個(gè)由行業(yè)領(lǐng)袖組成的聯(lián)盟,旨在匯集人才和資源,為獨(dú)特的問題推廣DL的最新技術(shù),并加速DL的采用,以改進(jìn)產(chǎn)品。

如果您已經(jīng)開始了您的DL項(xiàng)目,但由于DL數(shù)據(jù)鴻溝而遇到了問題,D2S可以幫助您構(gòu)建數(shù)字孿生兄弟。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無評(píng)論