【案例剖析】人工智能發(fā)展中存在的5個限制性問題,五解解千愁

WatchStor.com
工程機械模擬器
人工智能似乎無處不在。我們在家里和手機上都能體驗到。在我們意識到這一點之前——如果企業(yè)家和商業(yè)創(chuàng)新者是值得信賴的——人工智能將出現(xiàn)在我們購買和使用的幾乎所有產(chǎn)品和服務(wù)中。此外,它在...

人工智能似乎無處不在。我們在家里和手機上都能體驗到。在我們意識到這一點之前——如果企業(yè)家和商業(yè)創(chuàng)新者是值得信賴的——人工智能將出現(xiàn)在我們購買和使用的幾乎所有產(chǎn)品和服務(wù)中。此外,它在解決業(yè)務(wù)問題方面的應(yīng)用也在飛速發(fā)展。與此同時,人們越來越擔心人工智能所造成的影響:人工智能驅(qū)動自動化對工作場所、就業(yè)和社會產(chǎn)生的影響。

在如Alexa、Siri和AlphaGo這樣的令人恐懼且賺足流量的勝利中,有時候會使人看不清一個事實:人工智能技術(shù)本身——即機器學習和它的子集,深度學習——有很多的局限性,仍然需要不遺余力去克服。這是一篇有關(guān)講述這些限制的文章,旨在幫助高管們更好地理解什么可能會阻礙他們的人工智能的發(fā)展。在此過程中,我們(Michael Chui,James Manyika,and Mehdi Miremadi)還將強調(diào)有希望取得的進展,這些進展將有助于解決一些限制并創(chuàng)造一波新的機遇。

我們的觀點來源于前沿工作的分析總結(jié)——研究、分析和評估數(shù)以百計的真實應(yīng)用案例——以及我們與一些思想領(lǐng)袖、前沿科學家和人工智能前沿工程師的合作。我們一直在努力總結(jié)這種經(jīng)驗以幫助那些據(jù)我們所知往往只接觸到他們自己的倡議,而沒有很好地校準哪里才是前沿陣地,或者步調(diào)制定者已經(jīng)在用人工智能做什么的高管們。

簡而言之,人工智能的挑戰(zhàn)和局限性正在為領(lǐng)導者創(chuàng)造一個“移動目標”問題:很難達到始終處于領(lǐng)先的優(yōu)勢。同樣令人挫敗的是,人工智能的發(fā)展遇到了現(xiàn)實世界的障礙,可能會降低人們對進一步投資的興趣,或鼓勵人們持觀望態(tài)度。正如麥肯錫全球研究所最近的研究顯示,在跨部門和部門內(nèi)應(yīng)用人工智能方面,領(lǐng)導者和落后者之間存在著巨大的鴻溝(見表1)。

希望縮小差距的高管們必須能夠以一種明智的方式解決人工智能問題。換句話說,他們不僅需要了解人工智能在哪些方面可以促進創(chuàng)新、洞察力和決策;導致收入增加;以及提高效率,還要了解人工智能在哪些方面還不能產(chǎn)生價值。更重要的是,他們必須理解技術(shù)約束和組織約束(如文化障礙)之間的關(guān)系和區(qū)別;缺乏能夠構(gòu)建業(yè)務(wù)就緒、人工智能驅(qū)動的應(yīng)用程序的人員;以及將人工智能嵌入產(chǎn)品和流程的“最后一英里”挑戰(zhàn)。如果你想成為一名領(lǐng)導者,你就應(yīng)該了解一些阻礙人工智能發(fā)展的關(guān)鍵技術(shù)挑戰(zhàn),并準備開發(fā)一些有前景的發(fā)展項目,這些項目可以克服這些限制,并有可能改變?nèi)斯ぶ悄馨l(fā)展的軌跡。

挑戰(zhàn)、限制與機遇

一個有用的出發(fā)點是了解深度學習技術(shù)的最新進展。可以這么說,人工智能領(lǐng)域最令人興奮的進展是,這些發(fā)展在分類和預(yù)測的準確性方面取得了飛躍,而且沒有與傳統(tǒng)的監(jiān)督學習相關(guān)聯(lián)的常規(guī)“特征工程”有任何聯(lián)系。深度學習使用大型的神經(jīng)網(wǎng)絡(luò),它可以包含數(shù)以百萬計的具有結(jié)構(gòu)分層的模擬“神經(jīng)元”。最常見的網(wǎng)絡(luò)稱為卷積神經(jīng)網(wǎng)絡(luò)和遞歸神經(jīng)網(wǎng)絡(luò),這些神經(jīng)網(wǎng)絡(luò)通過訓練數(shù)據(jù)和反向傳播算法來學習。

雖然已經(jīng)取得了許多進展,但還有更多的工作要做。關(guān)鍵的一步是將人工智能方法適用于 問題和數(shù)據(jù)的可用性。由于這些系統(tǒng)是經(jīng)過“訓練”的,而不是經(jīng)過編程的,因此各種過程通常需要大量的標記數(shù)據(jù)才能準確地執(zhí)行復雜的任務(wù)。獲取大型數(shù)據(jù)集可能很困難。在某些領(lǐng)域,它們可能根本不可用,但即使可用,標識工作也可能需要大量人力資源。

此外,很難辨別通過深度學習訓練出來的數(shù)學模型是如何獲得特定的預(yù)測、推薦或決策的。一個黑盒,即使是做它的本職工作,獲得的效用也可能有限,特別是當預(yù)測或決定影響社會并產(chǎn)生可能影響個人幸福的后果時。在這種情況下,用戶有時需要知道運作背后的“原由”,例如為什么算法可以從具有法律影響的事實調(diào)查結(jié)果到具有監(jiān)管影響的商業(yè)決策(如貸款)中給出推薦建議,以及為什么某些因素(而非其他因素)在特定情況下如此重要。

讓我們探索五種相互關(guān)聯(lián)的方式,在這些方式中,這些限制和開始迎戰(zhàn)它們的解決方案正發(fā)揮作用。

限制1:數(shù)據(jù)標簽

目前大多數(shù)人工智能模型都是通過“監(jiān)督學習”進行訓練的。這意味著,人類必須對底層數(shù)據(jù)進行標記和分類,這可能是一個相當龐大且容易出錯的任務(wù)。例如,開發(fā)自動駕駛汽車技術(shù)的公司雇傭了數(shù)百人來手工標注原型車的視頻輸入時數(shù)來幫助培訓這些系統(tǒng)。與此同時,有前景的新技術(shù)正在出現(xiàn),例如流內(nèi)監(jiān)控(由Eric Horvitz和他在微軟研究院的同事演示),數(shù)據(jù)可以在自然使用過程中進行標記。無監(jiān)督或半監(jiān)督的方法減少了對大型標記數(shù)據(jù)集的需要。兩種有前景的技術(shù)分別是強化學習和生成式對抗網(wǎng)絡(luò)(GANs)。

強化學習。這種無人監(jiān)督的技術(shù)允許算法簡單地通過試錯來學習任務(wù)。這種方法采用的是“胡蘿卜加大棒”的方法:對于算法在執(zhí)行任務(wù)時的每一次嘗試,如果行為成功,它都會得到“獎勵”(比如更高的分數(shù)),反之則會得到“懲罰”。只要學習環(huán)境是真實世界的表征,通過重復,行為就會得到改善,在很多情況下甚至超越人類的能力。

強化學習以訓練計算機玩游戲而聞名——最近,它與深度學習技術(shù)結(jié)合在一起。例如,在2017年5月,它幫助人工智能系統(tǒng)AlphaGo在圍棋比賽中擊敗了世界冠軍柯潔。在另一個例子中,微軟提供了基于強化學習和適應(yīng)用戶偏好的決策服務(wù)。強化學習的潛在應(yīng)用跨越了許多商業(yè)領(lǐng)域??赡艿那闆r包括,一個由人工智能驅(qū)動的交易組合在價值上分別因收益而獲得點數(shù)或因損失而失去點數(shù);一個每次在推薦驅(qū)動的銷售中獲得積分的產(chǎn)品推薦引擎;以及因按時交付或減少燃料消耗而獲得獎勵的卡車路線軟件。

強化學習還可以幫助人工智能通過開發(fā)以前無法想象的解決方案和策略(即使是經(jīng)驗豐富的從業(yè)者也可能從未考慮過這些解決方案和策略)來超越人類標記的自然和社會局限性。例如,最近,AlphaGo Zero系統(tǒng)使用一種新的強化學習方式,在從頭開始學習圍棋之后打敗了它的前身AlphaGo。這意味著要從完全隨機的游戲開始,而不是從訓練人類及與人類一起玩的圍棋游戲開始。

生成式對抗網(wǎng)絡(luò)(GANs)。在這種半監(jiān)督學習方法中,兩個網(wǎng)絡(luò)相互競爭,以改進和完善他們對概念的理解。例如,為了識別鳥類的樣子,一個網(wǎng)絡(luò)試圖區(qū)分真實的和虛假的鳥類圖像,而它的對手網(wǎng)絡(luò)則試圖通過制作看起來很像鳥類的圖像來迷惑它,但事實上并沒有。當這兩個網(wǎng)絡(luò)互相吻合時,每個模型對鳥類的表征就變得更加準確。

GANs生成越來越可信的數(shù)據(jù)示例能力可以顯著減少對人類標記的數(shù)據(jù)集的需求。例如,訓練一種從醫(yī)學圖像中識別不同類型腫瘤的算法,通常需要數(shù)百萬個具有特定腫瘤類型或階段的人類標記圖像。但通過使用一種經(jīng)過訓練的GAN來生成越來越逼真的不同類型腫瘤的圖像,研究人員可以訓練一種腫瘤檢測算法,該算法結(jié)合了一個更小的具有GAN輸出的人類標記數(shù)據(jù)集。

雖然GANs在精確的疾病診斷中的應(yīng)用還遠未完成,但是研究人員已經(jīng)開始在越來越復雜的環(huán)境中使用GANs。這些包括以特定藝術(shù)家的風格理解和創(chuàng)作藝術(shù)作品,利用衛(wèi)星圖像以及對地理特征的理解,來創(chuàng)建快速發(fā)展地區(qū)的最新地圖。

限制2:獲取大量的訓練數(shù)據(jù)集

已經(jīng)證明,使用線性模型的簡單人工智能技術(shù)在某些情況下與醫(yī)學和其他領(lǐng)域?qū)<业哪芰ο虢咏H欢?,當前機器學習浪潮需要訓練數(shù)據(jù)集,這些數(shù)據(jù)集不僅要有標記,而且要足夠龐大和全面。深度學習方法需要成千上萬的數(shù)據(jù)記錄,才能使模型在分類任務(wù)上變得相對優(yōu)秀,在某些情況下,還需要數(shù)以百萬計的數(shù)據(jù)記錄才能達到人類的水平。

復雜之處在于,對于許多業(yè)務(wù)用例來說,大量的數(shù)據(jù)集可能很難獲得或創(chuàng)建(試想:利用有限的臨床試驗數(shù)據(jù)來更準確地預(yù)測治療結(jié)果)。在分配的任務(wù)中,每一個微小的變化都需要另一個大數(shù)據(jù)集進行更多的訓練。例如,教一輛自動駕駛汽車在天氣不斷變化的采礦地點進行導航將需要一個包含車輛可能遇到的不同環(huán)境狀況的數(shù)據(jù)集。

一次性學習是一種可以減少對大型數(shù)據(jù)集需求的技術(shù),允許人工智能模型在給出少量真實環(huán)境演示或示例(在某些情況下甚至只有一個)時學習一個主題。在只展示一個樣本(例如一輛小貨車)后,人工智能的能力將更接近于人類的水平,就能相對準確地識別一個類別的多個實例的能力。在這個仍在開發(fā)中的方法中,數(shù)據(jù)科學家首先會在模擬的虛擬環(huán)境中對一個模型進行預(yù)先訓練,這個虛擬環(huán)境呈現(xiàn)一個任務(wù)的變體,或者在圖像識別的情況下,顯示對象的外觀。然后,在展示了人工智能模型在虛擬訓練中沒有看到的一些真實世界的變化之后,模型將利用它的知識來找到正確的解決方案。

這種一次性的學習方式最終可以幫助系統(tǒng)掃描侵犯版權(quán)的文本,或者只顯示一個標記后識別視頻中的公司徽標。如今,這類應(yīng)用才剛剛起步,但是他們的效用和效率很可能會迅速地擴大人工智能跨越多個行業(yè)的使用范圍。

局限性3:可解釋性問題

人工智能系統(tǒng)的可解釋性并不是一個新問題。但是,隨著深度學習的成功和采用,它也在不斷發(fā)展,帶來了更多樣化、更先進的應(yīng)用,也帶來了更多的不透明性。更大及更復雜的模型使我們很難用人類的語言來解釋為什么會做出某種決定(而在實時做出某種決定時就更難了)。這是一些人工智能工具在可解釋性有用或確實需要的應(yīng)用領(lǐng)域的使用率仍然很低的原因之一。此外,隨著人工智能應(yīng)用的擴展,監(jiān)管規(guī)定也可能推動對更多可解釋的人工智能模型的需求。

有望提高模型透明度的兩種新生方法是局部可解釋模型不可知解釋(LIME)和注意技術(shù)(見表2)。LIME嘗試識別訓練模型最依賴的是輸入數(shù)據(jù)的哪些部分,以便在開發(fā)進行預(yù)測。這種技術(shù)每次都考慮特定的數(shù)據(jù)片段,并觀察預(yù)測結(jié)果的變化,從而對代理模型進行微調(diào)并開發(fā)一種更精確的解釋(例如,排除眼睛,而不是通過鼻子來測試哪個對面部識別更重要)。注意技術(shù)將模型在做出特定決策時最??紤]的輸入數(shù)據(jù)可視化(例如,將注意力集中在嘴巴上,以確定圖像是否對人類進行了描述)。

另一種已經(jīng)使用了一段時間的技術(shù)是廣義相加模型(GAMs)的應(yīng)用。通過使用單特性模型,GAMs限制了特性之間的交互,從而使每個用戶更容易地進行解釋。使用這些技術(shù)來揭開人工智能決策的神秘面紗,有望在很大程度上促進人工智能的應(yīng)用。

限制4:學習的普遍性

與人類的學習方式不同,人工智能模型很難將它們的經(jīng)驗從一種環(huán)境轉(zhuǎn)移到另一種環(huán)境。實際上,模型為給定用例實現(xiàn)的任何東西都只適用于該用例。因此,即使用例非常相似,公司也必須反復提交資源來培訓另一個模型。

應(yīng)對這一挑戰(zhàn)的一個前景可期的答案是學習遷移。在這種方法中,一個人工智能模型被訓練完成一個特定的任務(wù),然后快速地將學習應(yīng)用到一個相似但不同的活動中。DeepMind的研究人員還在實驗中展示了學習遷移的前景,在實驗中,模擬訓練被轉(zhuǎn)移到真正的機器人手臂上。

隨著學習遷移和其他通用方法的成熟,它們可以幫助組織更快地構(gòu)建新的應(yīng)用程序,并使現(xiàn)有的應(yīng)用程序具有更多樣化的功能。例如,在創(chuàng)建一個虛擬的個人助理時,學習遷移可以將一個領(lǐng)域(比如音樂)的用戶偏好推廣到其他領(lǐng)域(書籍)。而且用戶并不局限于數(shù)字原生用戶。例如,學習轉(zhuǎn)移可以使油氣生產(chǎn)商擴大其對人工智能算法的使用,訓練這些算法為其他設(shè)備(如管道和鉆井平臺)的油井提供預(yù)測性維護。學習遷移甚至有可能徹底改變商業(yè)智能:試想一個數(shù)據(jù)分析的人工智能工具,它可以理解如何優(yōu)化航空公司的收入,然后可以根據(jù)天氣或當?shù)亟?jīng)濟的變化調(diào)整其模型。

另一種方法是使用某種近似可應(yīng)用于多個問題的廣義結(jié)構(gòu)的東西。例如,DeepMind的AlphaZero在三種不同的游戲中使用了相同的結(jié)構(gòu):可以訓練出一種在一天內(nèi)學會國際象棋的具有廣義結(jié)構(gòu)的新模型,然后它就可以很好地打敗世界冠軍的國際象棋程序。

最后,考慮到出現(xiàn)試圖自動設(shè)計機器學習模型的元學習技術(shù)的可能性。例如,谷歌智囊團使用AutoML自動設(shè)計神經(jīng)網(wǎng)絡(luò)來在大規(guī)模數(shù)據(jù)集中對圖像進行分類。這些技術(shù)目前表現(xiàn)得和人類的設(shè)計不相上下。這是一個很有前途的發(fā)展,特別是在許多組織人才依舊短缺的情況下。元學習方法也有可能超越人類的能力,產(chǎn)生更好的結(jié)果。然而,重要的是,這些技術(shù)還處于早期階段。

局限性5:數(shù)據(jù)和算法中的偏差

到目前為止,我們專注于通過在工作中已經(jīng)應(yīng)用的技術(shù)解決方案可以克服的一些限制,其中一些我們上文已經(jīng)講述過。偏差是另一種挑戰(zhàn)。當人類的偏好(有意識或無意識)在選擇使用哪些數(shù)據(jù)點和忽視哪些數(shù)據(jù)點時,會產(chǎn)生潛在的破壞性的社會影響。此外,當數(shù)據(jù)收集本身的過程和頻率在不同的組別觀察到的行為不一致時,算法分析數(shù)據(jù)、學習和預(yù)測的方式很容易出現(xiàn)問題。負面影響包括錯誤的招聘決策、錯誤的科學或醫(yī)學預(yù)測、扭曲的金融模型和刑事司法決策,以及在法律尺度上的不當使用(虛擬)手指。在許多情況下,這些偏見在“高級數(shù)據(jù)科學”、“專有數(shù)據(jù)和算法”或“客觀分析”的面紗下被忽視或忽略。

當我們在新的領(lǐng)域部署機器學習和人工智能算法時,可能會有更多的實例將這些潛在偏差問題納入數(shù)據(jù)集和算法中。這種偏差一般根深蒂固,因為識別它們并采取措施解決它們需要深入掌握數(shù)據(jù)科學技術(shù),以及對現(xiàn)有社會力量(包括數(shù)據(jù)收集)的更深的元認識??偠灾?,去偏差被證明是迄今為止最令人畏懼的障礙之一,當然也是最讓社會擔憂的障礙之一。

目前正在進行多項研究工作,同時也在努力進行最佳實踐,以促進學術(shù)、非營利和私營部門的研究中解決這些問題。這一切都不會進展太快,因為挑戰(zhàn)很可能會變得十分嚴峻,會出現(xiàn)更多的問題。舉例來說,考慮到許多基于學習和統(tǒng)計的預(yù)測方法都隱含地假設(shè)未來會像過去一樣。在社會文化背景下,我們正在努力促進變革,而根據(jù)過去的行為做出決定會阻礙進步(或者更糟糕的是,建立在抵制變革的基礎(chǔ)上),這時我們又應(yīng)該做些什么呢?。許多領(lǐng)導人,包括商界領(lǐng)袖,可能很快會要求就有關(guān)問題給出他們的回答。

擊中移動目標

要解決我們所描述的局限性以及在商業(yè)上廣泛實施本文所描述的許多先進技術(shù),可能還需要數(shù)年時間。但人工智能的應(yīng)用范圍之廣令人驚嘆,這表明人工智能最大的限制可能是想象力。以下是一些建議,是給那些努力保持領(lǐng)先的領(lǐng)導人的,或者至少不要落得太遠。

做好功課,做好校準,跟上步伐。雖然大多數(shù)管理人員不需要知道卷積神經(jīng)網(wǎng)絡(luò)和遞歸神經(jīng)網(wǎng)絡(luò)的區(qū)別,但是您應(yīng)該對當今工具的功能有一個大致的了解,對哪些方面可能會有短期進展有一個認識,以及對未來的展望。 利用您數(shù)據(jù)科學和機器學習專家的知識,與一些人工智能先驅(qū)者交談以獲得校準,并參加一兩場人工智能會議來幫助你獲得真正的資訊;新聞媒體可能會有所幫助,但它們也可能是炒作機器的一部分。知識淵博的從業(yè)者正在進行跟蹤研究(如人工智能指數(shù)(一項基于斯坦福大學的人工智能百年研究項目)),這是另一種有助于保持先進的方法。

采用復雜的數(shù)據(jù)策略。人工智能算法需要幫助解開隱藏在系統(tǒng)生成的數(shù)據(jù)中的有價值的見解。您可以通過開發(fā)一個全面的數(shù)據(jù)策略來提供幫助,該策略不僅關(guān)注從不同系統(tǒng)收集數(shù)據(jù)池所需的技術(shù),還關(guān)注數(shù)據(jù)的可用性和獲取、數(shù)據(jù)標記和數(shù)據(jù)治理。雖然更新的技術(shù)承諾會減少訓練人工智能算法所需的數(shù)據(jù)量,但數(shù)據(jù)饑渴的監(jiān)督學習仍然是當今最流行的技術(shù)。即使是旨在最小化所需數(shù)據(jù)量的技術(shù)仍然需要一些數(shù)據(jù)。這其中的一個關(guān)鍵部分就是充分了解你自己的數(shù)據(jù)點以及如何利用它們。

從側(cè)面思考。學習遷移技術(shù)仍處于起步階段,但有辦法在多個領(lǐng)域利用人工智能解決方案。如果您解決了大型倉庫設(shè)備的預(yù)測性維護這樣的問題,您是否也可以將相同的解決方案應(yīng)用于消費產(chǎn)品?一個有效的下一個產(chǎn)品到購買的解決方案是否可以在多個分銷渠道中使用?鼓勵業(yè)務(wù)單位分享知識,這些知識可能會揭示如何在公司的多個領(lǐng)域使用你最好的人工智能解決方案。

做一個開拓者。與當今的人工智能技術(shù)和用例保持同步并不足以長期保持競爭力。讓您的數(shù)據(jù)科學員工或合作伙伴與外部專家合作,使用新生的技術(shù)(如本文中討論的技術(shù))來解決影響巨大的用例問題,這些問題有望實現(xiàn)突破。此外,要了解什么是可能的,什么是可用的。許多用于標準應(yīng)用程序(包括語音、視覺和情感檢測)的機器學習工具、數(shù)據(jù)集和訓練過的模型正在廣泛使用。有時它們是開源的,而在其他情況下則是通過由先驅(qū)研究人員和公司創(chuàng)建的應(yīng)用程序編程接口(APIs)來實現(xiàn)的。密切關(guān)注這些可能性可以增加你成為先行者或先行者優(yōu)勢的幾率。

人工智能的前景是巨大的,實現(xiàn)這一愿景所需的技術(shù)、工具和過程還沒有完全實現(xiàn)。如果你認為你可以促進技術(shù)發(fā)展,然后成為一個成功的領(lǐng)先追隨者,那就再想想吧。要從立竿見影的角度進行跨越是非常困難的,尤其是當目標變化得如此之快,而你又不明白人工智能工具現(xiàn)在能做什么、不能做什么時。隨著研究人員和人工智能先驅(qū)們準備解決當今最棘手的一些問題,現(xiàn)在是時候開始了解人工智能前沿領(lǐng)域正在發(fā)生的事情了,這樣您就可以定位您的組織來學習、開發(fā),甚至可能推進新的可能性。

看好AI的發(fā)展,但是突破可能不在軟件上,AI真正的突破還是在硬件上,芯片,芯片,芯片,重要的事情說三遍,我們的各種芯片已經(jīng)足夠復雜了,但是現(xiàn)在的芯片是按一定的規(guī)則進行設(shè)計的,很可能這些規(guī)則阻礙了AI的自我崛起,解放這些規(guī)則,芯片發(fā)生革命性的變化,軟件才能有革命性的產(chǎn)生,AI在這個基礎(chǔ)上可以加速進化了,但是進化后的AI,和人類有什么相干嗎?人類追求進步是為了人類的什么福祉?AI的進化追求的又是AI的的福祉呢還是人類的福祉?

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論