生成式AI進(jìn)入“幻滅的低谷”期,警惕項(xiàng)目失敗的四大原因

生成式AI被炒作得神乎其神,而且被認(rèn)為其應(yīng)用很容易被獲取。事實(shí)卻遠(yuǎn)非如此。根據(jù)Gartner的報(bào)告,生成式AI馬上要進(jìn)入的“幻滅的低谷”期。隨著生成式AI的進(jìn)一步發(fā)展,過高的期望值和很多的未知因素,使得越來越多的生成式AI失敗案例浮出水面。

本文來自微信公眾號“產(chǎn)業(yè)數(shù)字化加油站”,編譯/邱燕娜。

生成式AI被炒作得神乎其神,而且被認(rèn)為其應(yīng)用很容易被獲取。事實(shí)卻遠(yuǎn)非如此。根據(jù)Gartner的報(bào)告,生成式AI馬上要進(jìn)入的“幻滅的低谷”期。隨著生成式AI的進(jìn)一步發(fā)展,過高的期望值和很多的未知因素,使得越來越多的生成式AI失敗案例浮出水面。

能力越大風(fēng)險(xiǎn)越大

1.png

正如普華永道合伙人兼人工智能市場進(jìn)入戰(zhàn)略負(fù)責(zé)人Bret Greenstein所言,生成式AI帶來的影響遠(yuǎn)超傳統(tǒng)的人工智能或機(jī)器學(xué)習(xí),因而由此帶來災(zāi)難的機(jī)會也大幅增加。

今年6月新西蘭連鎖超市Pak'nSave發(fā)布的Savey Meal-Bot就是一個(gè)案例。Savey Meal-Bot是一個(gè)人工智能工具,允許用戶上傳原材料清單,然后機(jī)器人會據(jù)此給出一個(gè)可以嘗試的食譜。它被宣傳為購物者省錢的一種方式,因?yàn)樾挛魈m人每年扔掉大約1500新西蘭元的食物。

Pak'nSave提示用戶須年滿18歲才能使用該工具,只有食品原材料信息才能輸入聊天機(jī)器人。但是沒有人來審查食譜,很快地Savey Meal-Bot就還是搗亂了。

到了8月,該公司因此出現(xiàn)的問題很快在全球范圍內(nèi)傳播開來。比如,Meal-Bot建議一位用戶將“漂白劑米飯?bào)@喜”作為“令人驚訝的烹飪冒險(xiǎn)”;“芳香水混合物”更是將致命氯氣的配方,將其描述為“解渴和提神的完美非酒精飲料”;“神秘?zé)跞?rdquo;則包括500克切碎的人肉,Meal-bot將其描述為“一道美味豐盛而舒適的菜肴,其神奇的味道會讓您大吃一驚”。

所幸的是,到目前為止還沒有消費(fèi)者因食用這些食譜而中毒,該工具也已經(jīng)做了更新,用戶只能從有限的一組可食用的原材料中選擇。但Meal-Bot仍然制造出令人不快的組合。

另一場備受矚目的災(zāi)難發(fā)生在Levidow,Levidow&Oberman律師事務(wù)所。當(dāng)時(shí)這家律師事務(wù)所的兩名律師提交的法律文書中引用了虛假案例。這是他們使用ChatGPT撰寫辯詞的結(jié)果。

一名法官在5月的一項(xiàng)裁決中表示,在法院質(zhì)疑這些虛假案例是否存在之后,該律師事務(wù)所的律師仍舊繼續(xù)支持這些虛假意見,對該律師事務(wù)所處以了5000美元的罰款。

項(xiàng)目失敗的四大原因

美國CIO.com網(wǎng)站結(jié)合普華永道等機(jī)構(gòu)助力許多公司啟動人工智能項(xiàng)目的實(shí)踐,總結(jié)了生成式AI項(xiàng)目失敗的四大原因。

原因一:缺乏治理

很多生成式AI項(xiàng)目在治理或監(jiān)督不足的情況下推出的。Pak'nSave的Savey Meal-Bot項(xiàng)目就是屬于這種情況。這是一個(gè)公開的案例,而更多公司是在內(nèi)部犯類似錯(cuò)誤。

Greenstein舉例說,他一直在與一家中型金融機(jī)構(gòu)合作,該金融機(jī)構(gòu)最近在五個(gè)月前應(yīng)用商用人工智能工具的私有云實(shí)例實(shí)施了生成式AI。接下來,這家金融機(jī)構(gòu)開放了API,讓其業(yè)務(wù)用戶構(gòu)建自己的應(yīng)用。

這些用戶最先構(gòu)建的是人力資源聊天機(jī)器人,它可以提供福利建議而無須他們承擔(dān)巨大的責(zé)任。例如,如果人力資源工具推薦了錯(cuò)誤的選項(xiàng),員工可能錯(cuò)過一整年的福利窗口;這讓人很沮喪,但他們認(rèn)為因?yàn)樗菣?quán)威的,所以是準(zhǔn)確的。

Greenstein不建議公司開放API來讓人隨意構(gòu)建想要的應(yīng)用,而應(yīng)該在監(jiān)管下采用一種深思熟慮的、受控的方法來構(gòu)建生成式AI,評估準(zhǔn)確性,管理偏見和處理幻覺。他補(bǔ)充說,應(yīng)該有個(gè)人在整個(gè)流程中確保生成式AI推薦的東西是正確的。

這家公司的聊天機(jī)器人運(yùn)行了一個(gè)月后獲取了不好的反饋。不過幸運(yùn)的是,此時(shí)還沒對員工帶來嚴(yán)重的影響,但這動搖了領(lǐng)導(dǎo)層對生成時(shí)AI的信心。值得一提的是,如果公司過度糾正并收緊了生成式AI戰(zhàn)略,可能會錯(cuò)失良機(jī),而讓競爭對手快速超越。

事實(shí)上,人工智能基礎(chǔ)設(shè)施聯(lián)盟(AIIA)7月發(fā)布的一項(xiàng)對1000多名大型企業(yè)高管的調(diào)查顯示,54%的受訪者表示他們因未能管理人工智能或機(jī)器學(xué)習(xí)應(yīng)用而蒙受損失,其中63%的受訪者表示他們的損失超過了5000萬美元。

根據(jù)AIIA的調(diào)查,成本是大型企業(yè)采用生成式AI的第二大障礙。

最受歡迎的生成式AI聊天機(jī)器人對公眾是免費(fèi)的。而且人們很容易找到又便宜又好用,且可以帶來商業(yè)效益的應(yīng)用。如此使得人們普遍對生成式AI的定價(jià)產(chǎn)生誤解。企業(yè)在嚴(yán)格管控的環(huán)境中建設(shè)試點(diǎn)項(xiàng)目后,很容易低估廣泛部署所產(chǎn)生的項(xiàng)目成本。

在項(xiàng)目中引入外部供應(yīng)商時(shí)也是如此,SANS研究所首席課程總監(jiān)兼教職員工負(fù)責(zé)人Rob Lee認(rèn)為,因?yàn)楫?dāng)前缺乏大規(guī)模部署生成式AI的經(jīng)驗(yàn),因此很難準(zhǔn)確地預(yù)測相關(guān)項(xiàng)目成本。

例如,如果人工智能是通過云部署的,那么每個(gè)API的調(diào)用都要加起來,而且使用量將很難預(yù)測。Rob Lee認(rèn)為,部署生成式AI以后,不能再基于舊系統(tǒng)來評估用戶行為,因?yàn)闆]有人知道生成式AI會導(dǎo)致用戶行為將產(chǎn)生怎樣的變化。

過渡成本也是必須考慮的部分,這就像購買新房子后要出售舊房屋一樣;如果舊房屋沒有按預(yù)期迅速出售,就可能不得不同時(shí)支付兩所房屋的費(fèi)用。IT領(lǐng)域也是如此。生成式AI由于技術(shù)是太新,沒有人能準(zhǔn)確地預(yù)測過渡期需要多長時(shí)間,企業(yè)能否負(fù)擔(dān)得起期間的成本。

接下來,企業(yè)還要考慮為數(shù)據(jù)集的存儲,以及對存儲的調(diào)用付費(fèi)。對于某些應(yīng)用,企業(yè)還要在全球范圍內(nèi)多部署存儲和備份。

原因三:不切實(shí)際的期望

當(dāng)前,圍繞生成式AI的炒作如此火熱,使得一些商業(yè)領(lǐng)袖可以開始將其視為靈丹妙藥。盡管現(xiàn)在市場上理性的聲音不斷,但是對于那些充滿期待的企業(yè)領(lǐng)袖來說已經(jīng)無濟(jì)于事了。企業(yè)對于生成式AI的過高期望已經(jīng)滲入到商業(yè)決策中。這其中有幾條非常值得注意:

其一,生成式AI的實(shí)施并不像想象的那么簡單。

比如說,今年夏天,一家位于美國西部的全球電子產(chǎn)品制造商和分銷商希望構(gòu)建一個(gè)內(nèi)容生成系統(tǒng),專門用于為客戶創(chuàng)建價(jià)格文檔。這家公司擁有8000多名面向客戶的銷售主管,管理著數(shù)萬個(gè)客戶;對產(chǎn)品和服務(wù)進(jìn)行定價(jià)是為新項(xiàng)目制作工作說明書的持續(xù)需求。

事實(shí)上,內(nèi)容生成是生成式AI的簡單用例。該公司認(rèn)為,人工智能可以查看歷史數(shù)據(jù),找到過去的相關(guān)示例,然后將其應(yīng)用于滿足新的客戶請求。

美國亞利桑那州解決方案集成商Insight的產(chǎn)品創(chuàng)新CTO Amol Ajgaonkar認(rèn)為,生成式AI確實(shí)會弄清楚人們的期望——如果給它歷史定價(jià),它會進(jìn)行學(xué)習(xí),并給出類似東西的定價(jià)。這需要一個(gè)過程。

試圖向該公司解釋生成式AI的實(shí)際工作方式是非常艱難。這是因?yàn)樵摴镜念I(lǐng)導(dǎo)層看到的報(bào)道都在吹噓它有多么容易。但事實(shí)并非如此。這種想法會導(dǎo)致公司對生成式AI感到失望和項(xiàng)目失敗。

其二,不該讓生成式AI做其不擅長的事情。

Insight的杰出工程師Carm Taglienti指出,人工智能項(xiàng)目的失敗99%與期望值有關(guān)——這不是技術(shù)的問題,而是對技術(shù)的期望值太高。

一家總部位于美國的大型芯片制造商就因?yàn)椴磺袑?shí)際的期望幾乎讓AI項(xiàng)目全軍覆沒。該芯片制造商希望使用人工智能來解決其供應(yīng)鏈管理問題,不僅希望人工智能能做它能力范圍之外的事情,還想一次就成功。

要認(rèn)識到生成式AI并非萬能,而是讓專業(yè)的技術(shù)做專業(yè)的事情,然后將各項(xiàng)技術(shù)形成的解決方案組合起來,形成一個(gè)完整的解決方案。比如說,應(yīng)該應(yīng)用高級分析和機(jī)器學(xué)習(xí)模型來預(yù)測未來;此外,嘗試使用生成式AI進(jìn)行簡單的數(shù)學(xué)運(yùn)算不僅矯枉過正,而且非常不準(zhǔn)確,可以通過插件來進(jìn)行計(jì)算,而不依賴生成式AI來計(jì)算任何東西。

其三,編寫提示糊弄不得。很多公司可能不能理解,編寫一代人工智能提示并不像向成年人發(fā)出指令。那么簡單,而是像給十幾歲的孩子提示那樣。

Ajgaonkar指出,編寫提示需要不斷重復(fù),不過也可以采用一些方法來提高人工智能的響應(yīng)質(zhì)量,如思維樹推理和類似的提示方法,但這些方法需要多個(gè)提示來優(yōu)化響應(yīng)。但他也提醒,如果對于每一個(gè)請求都使用思維樹方法并要求解釋,有時(shí)寧愿以不同的變體運(yùn)行一千次相同的提示來獲取確切結(jié)果。

原因四:數(shù)據(jù)問題

長期以來,缺乏可用數(shù)據(jù)一直是AI和機(jī)器學(xué)習(xí)項(xiàng)目所面臨的問題。AIIA的調(diào)查結(jié)果顯示,數(shù)據(jù)問題是84%部署人工智能的公司所面臨的重大挑戰(zhàn)。

舉例來說,普華永道的Greenstein最近與一家消費(fèi)者公司合作,該公司希望啟動一個(gè)自動化后臺處理的項(xiàng)目。他們建立了人工智能服務(wù)和云,人才隊(duì)伍也建立好了。但他們沒有預(yù)料到訪問數(shù)據(jù)有多難。獲取每一個(gè)數(shù)據(jù)源需要公司API許可證,需要通過采購流程。這可能要花上幾個(gè)月的時(shí)間。

同樣在這家公司,另一個(gè)系統(tǒng)的訪問權(quán)限控制在組織中處于非常高的級別;還有一個(gè)第三方系統(tǒng)是是由用戶控制的。生成式AI需要協(xié)調(diào)所有這些,這是一件急不得的事兒。

不過Greenstein指出,從長遠(yuǎn)來看,公司將獲得所需的所有數(shù)據(jù),但需要耗費(fèi)數(shù)月時(shí)間。在這種情況下,該公司轉(zhuǎn)向了其他用例,但公司領(lǐng)導(dǎo)層失去了對該項(xiàng)目的熱情。

市場調(diào)查機(jī)構(gòu)Gartner在8月發(fā)布報(bào)告稱,將生成式AI的炒作周期劃為創(chuàng)新觸發(fā)器、膨脹預(yù)期峰值、幻滅的低谷、啟蒙的斜坡和生產(chǎn)力的高原五個(gè)階段,并認(rèn)為生成式AI目前處于第二階段,即膨脹預(yù)期峰值。由于消費(fèi)者和媒體對其抱有太高期望,生成式AI隨后會迅速跌入低谷。我們也理由相信,隨著一些先行者的大膽探索實(shí)踐,越來越多經(jīng)驗(yàn)將會積累出來,為后續(xù)生成式AI真正大范圍造福社會做好準(zhǔn)備。

THEEND

最新評論(評論僅代表用戶觀點(diǎn))

更多
暫無評論