全球芯片持續(xù)短缺,半導體制造商如何擴大AI部署?

機器之能
芯片是非常精密的產(chǎn)品,在生產(chǎn)過程中質(zhì)量檢測壓力巨大,每一道工序的質(zhì)檢都相當重要。傳統(tǒng)生產(chǎn)主要通過在前端和后端生產(chǎn)過程的早期檢測缺陷來幫助確保質(zhì)量。例如,使用攝像頭、顯微鏡或掃描電子顯微鏡。

360截圖16450626515344.png

麥肯錫最近對半導體設備制造商的調(diào)查顯示,只有大約30%的受訪者表示,他們已經(jīng)通過AI/ML創(chuàng)造了價值。其他的受訪者(約70%)仍處于人AI/ML的試點階段,進展已經(jīng)停滯。

AI/ML在半導體行業(yè)具有巨大的價值創(chuàng)造潛力。半導體公司如何大規(guī)模部署AI并獲取這種價值?

從整個行業(yè)來看,制造環(huán)節(jié)將從AI/ML中獲得最大的價值。最大相對開支減少將發(fā)生在研究和設計方面,主要是由于芯片設計和驗證的自動化。其他領域,包括計劃、采購、銷售和定價,都將受益于AI/ML用例。通常,這些用例并不特定于半導體行業(yè)。

半導體公司轉(zhuǎn)型并進行大規(guī)模部署,需要關注六個推動因素,包括戰(zhàn)略路線、數(shù)據(jù)、技術、人才、敏捷交付、集成等。

半導體行業(yè)正處于一個轉(zhuǎn)折點,那些不將大量資源投入AI/ML戰(zhàn)略的公司可能會落伍。盡管半導體公司可能會采用不同的方法,具體取決于業(yè)務模型,在AI/ML方面的經(jīng)驗以及戰(zhàn)略重點,但目標是相同的:將生產(chǎn)力和創(chuàng)新提升到新的水平。

從研究、設計到生產(chǎn)銷售,人工智能/機器學習(AI/ML)有潛力為半導體公司在每一個步驟產(chǎn)生巨大的商業(yè)價值。但是,麥肯錫最近對半導體設備制造商的調(diào)查顯示,只有大約30%的受訪者表示,他們已經(jīng)通過AI/ML創(chuàng)造了價值。值得注意的是,這些公司在AI/ML人才、數(shù)據(jù)基礎設施、技術和其他促進因素方面進行了大量投資,并且已經(jīng)完全擴大了它們的初始用例。其他的受訪者(約70%)仍處于AI/ML的試點階段,進展已經(jīng)停滯。

麥肯錫相信,AI/ML在半導體行業(yè)的應用將在未來幾年內(nèi)急劇加速。現(xiàn)在采取措施擴大規(guī)模將使公司充分利用這些技術的好處。

需要說明的,本文所說的設備制造商,主要包括集成設備制造商(IDMs)、無廠半導體公司(fabless)、代工廠和半導體組裝和測試服務商(SATS)。

一AI在應對未來挑戰(zhàn)中的作用

由于對資本的高要求,半導體公司處于贏者通吃或贏者通吃的環(huán)境中。因此,他們一直試圖縮短產(chǎn)品生命周期,積極追求創(chuàng)新,以更快地推出產(chǎn)品,保持競爭力。但賭注也越來越高。隨著每一個新技術節(jié)點的出現(xiàn),費用都會上升,因為隨著結(jié)構(gòu)變小,研究和設計投資以及生產(chǎn)設備的資本支出都會大幅增加。

例如,65納米芯片的研究和設計成本大約2800萬美元,如今前沿5納米節(jié)點的研發(fā)設計成本已經(jīng)暴增到大約5.4億美元(表1)。與此同時,相同節(jié)點的fab建設成本已經(jīng)從4億美元增加到54億美元。

360截圖16450626515344.png

表1:芯片設計以及工廠建設成本,隨著芯片日益復雜而水漲船高。

隨著公司試圖提高研究、芯片設計和制造的生產(chǎn)率,同時加快上市時間,AI/ML正成為整個價值鏈上越來越重要的工具。麥肯錫研究表明,現(xiàn)在,AI/ML每年為半導體公司貢獻50億至80億美元的息稅前利潤(表2)。數(shù)字令人印象深刻,但僅反映出AI/ML在行業(yè)內(nèi)全部潛力的10%左右。

未來兩到三年內(nèi),AI/ML每年可能產(chǎn)生350億到400億美元的價值。在更長的時間范圍內(nèi)——未來四年或更長時間內(nèi)——這一數(shù)字可能會上升到每年850億至950億美元。這一數(shù)字相當于該行業(yè)當前5000億美元年收入的20%,幾乎相當于2019年1100億美元的資本支出。

雖然這種價值很大一部分將不可避免地傳遞給客戶,但獲取這種價值的競爭優(yōu)勢,尤其是對早期的先行者來說,將是不可能被忽視的。

360截圖16450626515344.png

表2:長遠來看,人工智能可以為半導體公司帶來850億到950億美元的收益。

二半導體行業(yè)的AI/ML用例

AI/ML的落地案例橫跨了半導體設備制造商的整個價值鏈(表3)。有些案例還會勾連多個價值鏈條環(huán)節(jié),比如,需求預測和庫存優(yōu)化領域的案例,會與制造、采購、銷售和運營計劃產(chǎn)生關聯(lián)。

360截圖16450626515344.png

表3:全面案例熱圖。

從整個行業(yè)來看,制造環(huán)節(jié)將從AI/ML中獲得最大的價值(表4,長期來看,降本達38%)。鑒于半導體制造涉及的資本支出、運營支出和材料成本,這一結(jié)論并不奇怪。最大相對開支減少將發(fā)生在研究和設計方面(降本28%-32%),主要是由于芯片設計和驗證的自動化。

360截圖16450626515344.png

表4:制造業(yè)將從AI/ML中獲得最大的價值。最大的相對開支減少將發(fā)生在研究和設計領域。

1、制造中的AI/ML用例

作為一個大型制造企業(yè),人力和生產(chǎn)等制造成本一直居高不下。生產(chǎn)制造也是半導體行業(yè)最大的成本驅(qū)動因素,而AI/ML用例將帶來最大的價值——約占總價值的40%。它們可以降低成本,提高產(chǎn)量,或者增加工廠的生產(chǎn)能力。從長遠來看,麥肯錫估計他們將降低生產(chǎn)成本(包括銷售成本和折舊)高達17%。以下是幾個例子。

調(diào)整工具參數(shù)。定義工藝配方時,半導體公司通常會指定一個恒定的時間范圍。但是,對某些個別晶圓來說,設定的時間范圍會出現(xiàn)系統(tǒng)性或者統(tǒng)計意義上的波動,因此,工藝過程會在已經(jīng)產(chǎn)生所需結(jié)果(例如特定的蝕刻深度)之后,繼續(xù)運行,進而增加時間,浪費甚至損壞芯片。

為了實現(xiàn)更高的精度,半導體公司可以使用現(xiàn)場工具傳感器數(shù)據(jù)、計量讀數(shù)和先前工藝步驟中的工具傳感器讀數(shù),從而允許機器學習模型捕捉工藝時間和結(jié)果之間的非線性關系,如蝕刻深度。收集的數(shù)據(jù)可能包括蝕刻過程中的電流、光刻過程中的光強和烘烤過程中的溫度。有了這些模型,可以在每個晶片或每個批次的基礎上實現(xiàn)最佳工藝時間,以縮短處理時間,提高產(chǎn)量,或兩者兼得,從而降低銷售成本(COGS)和提高吞吐量。

晶圓片外觀檢查。芯片是非常精密的產(chǎn)品,在生產(chǎn)過程中質(zhì)量檢測壓力巨大,每一道工序的質(zhì)檢都相當重要。傳統(tǒng)生產(chǎn)主要通過在前端和后端生產(chǎn)過程的早期檢測缺陷來幫助確保質(zhì)量。例如,使用攝像頭、顯微鏡或掃描電子顯微鏡。但是,傳統(tǒng)系統(tǒng)無法對這些圖像缺陷進行精細的分類與定位,仍然需要人工下載每張圖片判定種類及其潛在影響,以及后續(xù)工藝如何處理。不僅容易出現(xiàn)錯誤和積壓,也將生產(chǎn)成本不斷推高。

先進的計算機視覺深度學習技術使現(xiàn)代晶圓檢測系統(tǒng)成為可能,通過訓練,系統(tǒng)可以自動檢測和分類晶圓上的缺陷,其準確性與人類檢查員相當,甚至更好。專門的硬件(如張量處理單元)和云服務使計算機視覺算法的自動化培訓成為可能。這反過來又允許更快的操作、實時推斷和可伸縮的部署。

通過這種方法,公司可以獲得對潛在工藝或工具偏差的早期洞察,允許他們更早地發(fā)現(xiàn)問題并提高產(chǎn)量,同時降低成本。

比如,在華星光電,導入AI判片(不過,這里是面板生產(chǎn)),一整個面板的片子識別速度已經(jīng)做到15毫秒左右,而人工大概需要五分鐘。同時,缺陷識別準確率已超過90%,超過人類。最開始人員替代只有二三十人,團隊用了兩年時間提升系統(tǒng),現(xiàn)在替代數(shù)量達到140人,未來總體可以替代50%人力。

2、研究和芯片設計中的AI/ML用例

AI/ML用例可以幫助半導體公司優(yōu)化他們的投資組合,并在研究和芯片設計階段提高效率。通過消除缺陷和超差的過程步驟,公司可以避免耗時的迭代,加速成品率的上升,并降低維持成品率所需的成本。它們還可以自動處理與物理布局設計和驗證過程相關的耗時過程。

盡管我們還沒有達到AI/ML加速可以應用到設計和芯片設計所有階段的地步,但是,也沒有反例證明它不能隨著時間的推移進一步滲透。麥肯錫預測,AI/ML最終可能會將目前的研發(fā)成本基礎降低28%至32%,甚至高于制造業(yè)的預期收益。

集成電路設計中的自動良率學習。如果在集成電路(IC)設計過程中出現(xiàn)失誤,半導體公司必須根據(jù)制造商的反饋進行多次昂貴且復雜的迭代。

半導體公司可以通過部署ML算法來識別組件故障中的模式,預測新設計中可能出現(xiàn)的故障并提出最佳布局以提高良率來避免此問題。在此過程中,借助基于AI的分析,將IC設計分解為關鍵組件。然后,算法將這些組件結(jié)構(gòu)與現(xiàn)有設計進行比較,以識別單個微芯片布局內(nèi)的問題位置并改善設計。因此,AI和ML輔助設計可以大大降低COGS,提高終端產(chǎn)量,并縮短新產(chǎn)品的上市時間。它還可以減少維持最終產(chǎn)量所需的精力。

例如,有的公司通過引入預測及認知技術,由過去依賴設計師和工程師的個人經(jīng)驗,轉(zhuǎn)移到利用AI提高設計效率,降低驗證成本。通過輸入歷史數(shù)據(jù)和相關參數(shù),系統(tǒng)會自動獲得設計結(jié)果,并在模擬器上預測設計效果,在人類工程師配合下快速修正設計。而且,人工智能通過學習,還能給設計者帶來一些新的想法和創(chuàng)造力。這也是目前一個比較好的AI/ML落地方向。

其他領域。所有其他功能,包括計劃、采購、銷售和定價,都將受益于AI/ML用例。通常,這些用例并不特定于半導體行業(yè),而是部分地建立在其他行業(yè)中,因此允許更快地實現(xiàn)??偟膩碚f,將AI/ML用例應用到其他功能上可以產(chǎn)生高達200億美元的年價值。

三AI/ML大規(guī)模成功實施的六個關鍵因素

半導體公司進行AI/ML轉(zhuǎn)換并大規(guī)模部署用例,麥肯錫建議關注六個推動因素:戰(zhàn)略路線圖的制定,人才戰(zhàn)略,敏捷交付,技術,數(shù)據(jù)以及采用和擴展(表5)。

360截圖16450626515344.png

表5:六個賦能因素對于AI規(guī)?;瘜嵤﹣碚f,非常關鍵。他們分別是:路線圖、人才與組織、技術、數(shù)據(jù)、采納與擴展以及敏捷交付。

1、創(chuàng)建戰(zhàn)略路線圖

最重要的是,擴展AI/ML的努力必須成為公司的戰(zhàn)略優(yōu)先事項。最初的工作涉及協(xié)調(diào)數(shù)據(jù),在優(yōu)先使用案例上達成共識,并鼓勵合適的業(yè)務,數(shù)據(jù)科學和工程技術人才之間的協(xié)作,這些工作太大了,因此無法作為一個自下而上的項目獲得成功。

理想情況下,最好將AI/ML工作與明確的業(yè)務目標聯(lián)系在一起,使業(yè)務部門和業(yè)務職能部門共同致力于成功實現(xiàn)轉(zhuǎn)型。

例如,公司可以為預測性維護案例項目確定要節(jié)省的成本,并適當提供資源。節(jié)省下的成本將有助于贊助案例并提供適當資源,使其能夠?qū)崿F(xiàn)其業(yè)務目標。這樣的收獲將極大激勵職能部門支持AI/ML的實施。設定明確的業(yè)務目標還可以幫助公司衡量每個案例項目隨著時間變化帶來的收益。

根據(jù)定義的目標,公司應確定特定的業(yè)務領域和價值杠桿,這將是他們的重點。然后,他們可以選擇相關案例,以允許他們使用這些杠桿。

在確定用例優(yōu)先級時,公司應強調(diào)其總價值,可行性和實現(xiàn)價值的時間。隨著經(jīng)驗和能力的增長,他們可以承擔其他案例,這些案例往往更難實現(xiàn),或者需要更長時間才能實現(xiàn)。在確定潛在案例價值時,公司應研究經(jīng)常被忽視的杠桿,例如與縮短上市時間和提高質(zhì)量相關的競爭優(yōu)勢。這樣的細節(jié)將使他們能夠準確地確定計劃的大小和優(yōu)先級。

在確定了優(yōu)先事項之后,半導體公司必須為其AI/ML計劃分配足夠的資源,并研究與具備互補技能的第三方的支持性合作關系,而不是試圖自己重新發(fā)明輪子。一些更大的公司可能有能力在內(nèi)部開發(fā)大多數(shù)功能,以及從他們龐大的工具群中獲得足夠的數(shù)據(jù)來訓練AI/ML模型,使他們能夠完全控制所有相關的知識產(chǎn)權。

考慮到所需的資源,較小的參與者可能會發(fā)現(xiàn),在可用的地方利用商業(yè)上可用的解決方案,或與他人合作開發(fā)或共享算法,或創(chuàng)建聯(lián)合數(shù)據(jù)共享平臺,以增加培訓模型可用的信息量,都是有益的。潛在合作伙伴的例子包括其他半導體設備制造商、電子設計自動化公司、超大規(guī)模云供應商或設備OEM。

2、人才戰(zhàn)略

大多數(shù)成功實現(xiàn)AI/ML的公司都創(chuàng)建了一個集中的組織,如卓越中心(COE)專注于此類活動。該組織為所需的新人才提供了清晰的家園,并負責定義通用標準并建立最佳實踐和知識的中央存儲庫。一些領先的半導體公司已經(jīng)對AI/ML COE進行了大量投資,其中包括數(shù)百名工程師。

在為中央團隊雇用技術人員時,半導體公司應仔細權衡角色組成,以確保其具有從試點到全面擴展用例的正確能力。例如,試行AI/ML用例需要數(shù)據(jù)科學家和數(shù)據(jù)工程師,但是需要ML工程師,基礎架構(gòu)設計師或全棧開發(fā)人員來推動擴展。通常,半導體公司沒有擁有這些資質(zhì)的員工,必須從外部招聘他們。

集中式AI/ML功能無法與將部署用例的業(yè)務和功能隔離開來。為了建立聯(lián)系,具有業(yè)務/運營領域?qū)iL的人員,如研發(fā)設計師、流程工程師和設備工程師,應該包括在AI/ML功能中。這些團隊成員在識別AI/ML用例中扮演關鍵角色,并在組織內(nèi)充當AI/ML解決方案的大使。

同樣,成功的公司將確保本地站點(無論是工廠還是職能部門)為他們的AI/ML團隊增加數(shù)據(jù)科學專業(yè)知識。受訓成為「數(shù)據(jù)公民」的員工可以與AI/ML COE的專家角色共同工作,以領導用例選擇并支持跨功能團隊中的實現(xiàn)。

3、敏捷交付

為了避免AI/ML案例因為使用或規(guī)模有限而陷入「概念驗證」的螺旋陷阱,團隊應該專注實現(xiàn)業(yè)務價值,并著重于迭代改進。

敏捷方法是軟件開發(fā)的核心,它可以幫助半導體公司實現(xiàn)這一目標。盡管AI/ML開發(fā)涉及到大量發(fā)現(xiàn)和探索,半導體公司也應該從使用者那里得到持續(xù)反饋。許多敏捷團隊都通過利用「垂直分片」方法獲得了成功,該方法包括在第一個或第二個sprint中創(chuàng)建一個端到端分析管道,包括數(shù)據(jù)吸收、建模、建議開發(fā)和部署到用戶(通常是企業(yè)所有者或在工廠工作的工程師)。這種垂直分割的方法可能與許多既定的做法相反,因為半導體公司通常只有在完全確定這種轉(zhuǎn)變將帶來完美結(jié)果的情況下,才會在制造工程方面做出改變。

從運營的角度來看,敏捷團隊是有益的,因為他們減少了對團隊外部人員的依賴。通常,很難避免這種依賴關系,因為數(shù)據(jù)所有者、AI/ML專家和IT基礎設施之間通常存在組織劃分。但是,敏捷AI/ML團隊是跨界的,并且包含了用例所需的所有專業(yè)知識,即使一些成員只包含在有限數(shù)量的sprint中。敏捷團隊還可以利用自助服務資源,比如訪問數(shù)據(jù)和基礎設施。

向敏捷AI/ML交付的轉(zhuǎn)變應該盡快發(fā)生,如果高層領導給予支持,公司試圖改變思維方式和流程,那么,這種轉(zhuǎn)變將更有可能獲得牽引。

4、技術

在晶廠內(nèi)部,成功的公司會建立一個連接層,用于實時訪問相關數(shù)據(jù)源,包括生產(chǎn)和測量工具、輔助設備、設施等。工具OEM可以幫助確保這種連接性,這對于制造用例是特別重要的。

半導體公司也需要一個通用的數(shù)據(jù)集成層。在開發(fā)環(huán)境中部署分析引擎和用例之前,這一層首先結(jié)合數(shù)據(jù)。為了獲得最好的結(jié)果,半導體公司必須找到方法,將來自不同工具供應商的數(shù)據(jù)和用例結(jié)合起來,以限制復雜性,并防止多個物聯(lián)網(wǎng)堆在平行的豎井中。

成功的公司將利用edge和云計算來支持他們的AI/ML用例。由于一些工具會生成大量數(shù)據(jù),因此實時應用程序通常需要邊緣計算能力(在工具內(nèi)或接近工具的地方部署AI/ML用例)。云解決方案提供了規(guī)模經(jīng)濟,并使不同工廠之間的鏈接成為可能,增加了用例的培訓數(shù)據(jù)池。(半導體公司歷來都對數(shù)據(jù)安全持謹慎態(tài)度,因此它們可能會限制將敏感數(shù)據(jù)部署到本地解決方案中。)

5、數(shù)據(jù)

半導體公司在每個晶圓廠都有幾百種工具,其中一些會產(chǎn)生數(shù)兆兆字節(jié)的數(shù)據(jù),要檢查每一條信息是不可能的。為了確保最大的有效性和效率,參與者必須對可能支持多個用例的數(shù)據(jù)進行優(yōu)先級排序,因為這將比單個計劃有更大的影響。

即使玩家限制所分析的信息數(shù)量,他們的AI/ML計劃仍然需要大量的時間和資源,例如AI/ML團隊中有足夠數(shù)量的數(shù)據(jù)工程師。需要嚴格的數(shù)據(jù)治理策略,以確保現(xiàn)有數(shù)據(jù)和新生成的數(shù)據(jù)立即可用,始終保持高質(zhì)量和值得信賴。成功的公司通常有一個專門的數(shù)據(jù)治理團隊,以確保數(shù)據(jù)一致性以及新數(shù)據(jù)和現(xiàn)有數(shù)據(jù)的質(zhì)量。

6、采用和擴展

從設計階段開始,半導體公司應嚴格關注優(yōu)先使用案例的可擴展性。必須盡早包括來自多個站點或工廠的專家,以確保以后可以在各個位置部署用例。

一些半導體公司正在晶圓廠領域內(nèi)設立焦點小組,以計劃擴大規(guī)模。對于特定領域,他們選擇一個晶圓廠作為主要站點,然后確定用例,從其他晶圓廠收集需求,創(chuàng)建實施計劃,并確保知識轉(zhuǎn)移。如前所述,半導體公司將需要在全面擴展后根據(jù)其用例的價值來優(yōu)先考慮部署用例。

其次,半導體公司在開發(fā)和擴展用例時應確保整個組織遵循標準和最知名的方法(BKM)。在整個組織中規(guī)范和強制使用BKMs可以確保解決方案的持續(xù)和改進,允許機器學習在站點間獲得最大的規(guī)模。通常,中央AI/ML團隊負責監(jiān)督這項關鍵任務。

最后,半導體公司必須將用例無縫集成到最終用戶的數(shù)字化工作流程中,以確保采用。許多公司都忽略了這一步驟,但是這種疏忽會帶來嚴重的后果。在我們的調(diào)查中,近一半的半導體設備制造商表示,缺乏集成是擴展AI/ML用例的第二大問題。如果組織在AI/ML功能和業(yè)務端之間形成緊密的聯(lián)系,那么,在最初設計用例時就會更容易從用戶的角度考慮問題。

參考鏈接:

https://www.mckinsey.com/industries/semiconductors/our-insights/scaling-ai-in-the-sector-that-enables-it-lessons-for-semiconductor-device-makers?cid=other-eml-alt-mip-mck&hdpid=7b1e528b-c7dc-45a7-843e-cc7a86c82c5b&hctky=12582690&hlkid=aed6941cb178401180472aae8e2692a1

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論