人工智能在企業(yè)內(nèi)部的使用通常起步緩慢,從概念階段到試點(diǎn)選擇,再到測(cè)試和最終部署。但隨著這些開創(chuàng)性項(xiàng)目的成熟,以及更多的人工智能應(yīng)用的發(fā)現(xiàn)和嘗試,企業(yè)必須不斷重新評(píng)估其戰(zhàn)略,并尋求加快其人工智能部署,以跟上步伐,瞄準(zhǔn)更大的目標(biāo)。
這是摩根大通(JPMorgan Chase)商業(yè)銀行人工智能和機(jī)器學(xué)習(xí)部門負(fù)責(zé)人Daniel Wu的建議。
近年來,由于計(jì)算能力、開放靈活的軟件、強(qiáng)大的算法及人工智能相關(guān)應(yīng)用的發(fā)展,人工智能在各個(gè)行業(yè)的迅速崛起和擴(kuò)張,但企業(yè)不應(yīng)固守人工智能早期的成功。相反,隨著更多經(jīng)驗(yàn)的積累,現(xiàn)在是加速這些努力和進(jìn)一步普及人工智能創(chuàng)新的好時(shí)機(jī),這能夠幫助企業(yè)使用這些仍在開發(fā)的工具來推動(dòng)他們的商業(yè)目標(biāo)和戰(zhàn)略。
為了進(jìn)一步推動(dòng)人工智能應(yīng)用落地,企業(yè)需要從他們已經(jīng)知道的基礎(chǔ)開始,包括數(shù)據(jù)、硬件、IT人員、治理和運(yùn)營(yíng)。
我們應(yīng)該如何構(gòu)建人工智能能力是一個(gè)十分棘手的問題,無論對(duì)于任何規(guī)模的組織和其擁有的資源類型來說。當(dāng)然,數(shù)據(jù)是最引人注意,對(duì)于數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)從業(yè)者來說,最大的痛點(diǎn)是“臟數(shù)據(jù)”(深度閱讀—)。
“大約60%的開發(fā)人員認(rèn)為‘臟數(shù)據(jù)’是他們的主要問題,大約30%的數(shù)據(jù)科學(xué)家說數(shù)據(jù)的可用性是他們的主要障礙。
這樣的數(shù)據(jù)挑戰(zhàn)并不新鮮,而且已經(jīng)存在很長(zhǎng)時(shí)間了。你可以看到到處都是數(shù)據(jù)豎井,跨職能領(lǐng)域,每個(gè)團(tuán)隊(duì)開發(fā)自己的解決方案,創(chuàng)建自己的數(shù)據(jù)資產(chǎn),而不考慮數(shù)據(jù)資產(chǎn)如何在整個(gè)組織中使用。對(duì)于許多多年前開發(fā)的IT系統(tǒng)來說,并沒有在創(chuàng)建之初就考慮到正確的數(shù)據(jù)模型的重要性。在當(dāng)時(shí),功能和性能需求是最重要的,很少考慮到數(shù)據(jù)未來用于其他需求。
DanielWu說:“即使在今天,很多公司都在經(jīng)歷數(shù)字轉(zhuǎn)型,他們正在將自己的本地?cái)?shù)據(jù)中心引入云計(jì)算。在這個(gè)過渡期間,會(huì)出現(xiàn)一種混合的、尷尬的狀態(tài),一部分?jǐn)?shù)據(jù)在云端,另一部分?jǐn)?shù)據(jù)在你自己的私人數(shù)據(jù)中心。大多數(shù)時(shí)候,這會(huì)造成不必要的重復(fù)。”
為了解決這個(gè)問題,并更好地為今天的人工智能使用準(zhǔn)備數(shù)據(jù),一種策略是投資于數(shù)據(jù)清理,這是一次性的前期成本,清理和整合數(shù)據(jù)。他說,為了確保在未來更好地發(fā)揮作用,企業(yè)應(yīng)該實(shí)踐以數(shù)據(jù)為中心的設(shè)計(jì),數(shù)據(jù)應(yīng)該從一開始就放在首位,作為每個(gè)流程和技術(shù)的一部分。數(shù)據(jù)不應(yīng)該是“二等公民”。我們應(yīng)該使數(shù)據(jù)處理自動(dòng)化。許多組織仍然有許多手動(dòng)步驟來執(zhí)行某些步驟或腳本,以完成他們的ETL(提取、轉(zhuǎn)換、加載)。自動(dòng)化的一部分是確保在過程中納入數(shù)據(jù)治理和編目,使其成為一個(gè)完整的過程。
必須讓數(shù)據(jù)更容易獲取,以進(jìn)一步推動(dòng)人工智能的使用。
可以通過為組織和數(shù)據(jù)工作者建立一些自助工具來實(shí)現(xiàn)這一點(diǎn),這樣他們可以更容易地獲得數(shù)據(jù)。同時(shí)也應(yīng)該強(qiáng)調(diào)可重用性。這些步驟還將幫助企業(yè)在模型開發(fā)過程中節(jié)省大量時(shí)間。從功能集的角度考慮,這是一個(gè)非常流行的趨勢(shì),這些可重用的功能,你可以使用它來構(gòu)建多個(gè)解決方案。
在創(chuàng)建更多的語(yǔ)言模型方面,Daniel Wu也有新的想法。
“沒有必要讓每個(gè)組織都開發(fā)不同的大型語(yǔ)言模型,”Wu說。“我們應(yīng)該利用已經(jīng)開發(fā)的東西,只需要對(duì)模型進(jìn)行一些改進(jìn)和調(diào)整,使其服務(wù)于不同的業(yè)務(wù)用例。”
企業(yè)可以考慮利用分層的人工智能模型架構(gòu),這種架構(gòu)在大多數(shù)情況下更通用,同時(shí)允許創(chuàng)建更具體的模型,以滿足特定的業(yè)務(wù)情況??偟膩碚f,要推動(dòng)人工智能加速,需要的不僅僅是數(shù)據(jù)、計(jì)算和建模。還需要技術(shù)熟練、訓(xùn)練有素、富有想象力的IT工作者,他們可以將自己的創(chuàng)新帶入人工智能,幫助推動(dòng)公司的使命。
“我們都知道全球人工智能人才短缺,”他說,但人才分布不平衡也加劇了這個(gè)問題。為了解決這個(gè)問題,企業(yè)必須找到減輕AI團(tuán)隊(duì)負(fù)擔(dān)的方法,確保他們專注于開發(fā)模型,而不是處理組織中的瑣事。
38%的組織把數(shù)據(jù)科學(xué)家50%以上的時(shí)間花在操作上,特別是部署他們的模型。只有11%的公司能在一周內(nèi)將模型投入生產(chǎn)。大約64%的人需要一個(gè)月或更長(zhǎng)時(shí)間來完成生產(chǎn)集成,并對(duì)模型進(jìn)行充分的培訓(xùn)、驗(yàn)證和測(cè)試。對(duì)于大多數(shù)組織來說,最終完成需要一個(gè)多月的時(shí)間。
我們需要建立機(jī)器學(xué)習(xí)操作能力,從以模型為中心的想法轉(zhuǎn)變?yōu)橐詳?shù)據(jù)為中心的想法。想想你可以通過獲得更好的數(shù)據(jù)來訓(xùn)練模型,而不是專注于發(fā)明另一個(gè)更強(qiáng)大的模型架構(gòu)本身,從而輕松獲得多大的提升。
控制這些問題的一個(gè)重要步驟是認(rèn)識(shí)到變更管理的重要性,同時(shí)還要保持從數(shù)據(jù)到模型的清晰邏輯,這樣您就可以擁有或增加復(fù)制模型的能力。
最終,即使一個(gè)組織的模型被開發(fā)和部署,部署解決方案并將其帶給客戶什么風(fēng)險(xiǎn)?這是事后才想到的,這通常是最后最大的障礙,阻止了解決方案的應(yīng)用落地和普及。
企業(yè)面臨的挑戰(zhàn)是不要只考慮產(chǎn)品上線時(shí)間。還需要考慮做正確的事情,這樣你就不會(huì)回到起點(diǎn),不得不去重新開發(fā)整個(gè)解決方案,那要貴得多。同時(shí)也要滿足監(jiān)管要求——在人工智能開發(fā)方面有很多道德規(guī)范,組織必須盡早解決,以降低這些風(fēng)險(xiǎn)。