為什么很多機(jī)器學(xué)習(xí)策略會(huì)失敗

毫無疑問,機(jī)器學(xué)習(xí)在幾乎每個(gè)領(lǐng)域都有美好的應(yīng)用前景。將機(jī)器學(xué)習(xí)模型應(yīng)用到實(shí)際工作中的一些好處是降低成本、提高精度、更好的客戶體驗(yàn)以及推出新功能,但是機(jī)器學(xué)習(xí)并不是萬能的,在將人工智能和機(jī)器學(xué)習(xí)技術(shù)應(yīng)用到組織的業(yè)務(wù)和運(yùn)營(yíng)之前,必須克服一些障礙。

根據(jù)云計(jì)算服務(wù)提供商Rackspace Technology公司最近進(jìn)行的一項(xiàng)調(diào)查,大多數(shù)組織都在努力制定可行的人工智能策略。這項(xiàng)調(diào)查涵蓋了制造、金融、零售、政府以及醫(yī)療保健等各行業(yè)領(lǐng)域的1,870個(gè)組織。調(diào)查表明,只有20%的組織擁有成熟的人工智能/機(jī)器學(xué)習(xí)計(jì)劃,而其余的組織仍在試圖弄清楚如何讓其發(fā)揮更大的作用。

毫無疑問,機(jī)器學(xué)習(xí)在幾乎每個(gè)領(lǐng)域都有美好的應(yīng)用前景。將機(jī)器學(xué)習(xí)模型應(yīng)用到實(shí)際工作中的一些好處是降低成本、提高精度、更好的客戶體驗(yàn)以及推出新功能,但是機(jī)器學(xué)習(xí)并不是萬能的,在將人工智能和機(jī)器學(xué)習(xí)技術(shù)應(yīng)用到組織的業(yè)務(wù)和運(yùn)營(yíng)之前,必須克服一些障礙。

組織在將人工智能技術(shù)整合到運(yùn)營(yíng)中時(shí)面臨的三個(gè)關(guān)鍵挑戰(zhàn)是技能、數(shù)據(jù)和策略,Rackspace公司的調(diào)查報(bào)告清楚地說明了一些機(jī)器學(xué)習(xí)策略遭遇失敗的原因。

機(jī)器學(xué)習(xí)與數(shù)據(jù)有關(guān)

機(jī)器學(xué)習(xí)模型以計(jì)算資源和數(shù)據(jù)為基礎(chǔ)。采用云計(jì)算服務(wù),對(duì)訓(xùn)練和運(yùn)行人工智能模型所需的硬件的訪問變得更加容易和負(fù)擔(dān)得起。

但在計(jì)劃和采用人工智能戰(zhàn)略的不同階段,數(shù)據(jù)仍然是一個(gè)主要障礙。在Rackspace公司的調(diào)查中,34%的受訪者表示,數(shù)據(jù)質(zhì)量較差是機(jī)器學(xué)習(xí)研發(fā)失敗的主要原因,另有31%的受訪者表示,他們?nèi)狈ΜF(xiàn)成的生產(chǎn)數(shù)據(jù)。

這凸顯了將機(jī)器學(xué)習(xí)技術(shù)應(yīng)用于現(xiàn)實(shí)問題時(shí)的主要障礙之一。盡管人工智能研究社區(qū)可以訪問許多公共數(shù)據(jù)集來訓(xùn)練和測(cè)試其最新的機(jī)器學(xué)習(xí)技術(shù),但要將這些技術(shù)應(yīng)用于應(yīng)用程序時(shí),要獲得高質(zhì)量的數(shù)據(jù)并不容易。這在工業(yè)、衛(wèi)生和政府部門尤其如此,因?yàn)檫@些部門的數(shù)據(jù)往往很少或受到嚴(yán)格的監(jiān)管。

當(dāng)機(jī)器學(xué)習(xí)計(jì)劃從研究階段轉(zhuǎn)移到生產(chǎn)階段時(shí),數(shù)據(jù)問題再次出現(xiàn)。在使用機(jī)器學(xué)習(xí)來提取具有價(jià)值的見解方面,數(shù)據(jù)質(zhì)量仍然是最大的障礙。數(shù)據(jù)工程問題也帶來了一個(gè)嚴(yán)重的問題,例如數(shù)據(jù)孤島、缺乏連接不同數(shù)據(jù)源的人才,以及以更具意義的方式處理數(shù)據(jù)的速度不夠快。

數(shù)據(jù)是從機(jī)器學(xué)習(xí)模型中獲取可行見解時(shí)最關(guān)鍵的要素

Rackspace Technology公司首席技術(shù)官Jeff DeVerter表示,初創(chuàng)企業(yè)和成熟企業(yè)都面臨數(shù)據(jù)問題,不過規(guī)模是兩者之間的關(guān)鍵區(qū)別。DeVerter評(píng)論說:“初創(chuàng)企業(yè)往往沒有足夠的資源來實(shí)施高質(zhì)量的數(shù)據(jù)管道,并隨著時(shí)間的推移對(duì)其進(jìn)行持續(xù)的管理。而成熟企業(yè)通常更具規(guī)模,而面臨的是更嚴(yán)格的要求。”

組織應(yīng)對(duì)人工智能策略的數(shù)據(jù)挑戰(zhàn)的最佳方法是對(duì)其數(shù)據(jù)基礎(chǔ)設(shè)施進(jìn)行全面評(píng)估。消除孤島應(yīng)該成為每個(gè)機(jī)器學(xué)習(xí)計(jì)劃中的關(guān)鍵優(yōu)先事項(xiàng)。組織還應(yīng)具有清理數(shù)據(jù)的正確程序,以提高其機(jī)器學(xué)習(xí)模型的準(zhǔn)確性和性能。

對(duì)人工智能的人才需求仍然很高

對(duì)于大多數(shù)組織來說,面臨的第二個(gè)難題是獲取機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)人才。根據(jù)Rackspace公司的調(diào)查,缺乏內(nèi)部專業(yè)知識(shí)是導(dǎo)致機(jī)器學(xué)習(xí)項(xiàng)目研發(fā)計(jì)劃失敗的第二大原因。

許多公司都在努力獲取人才以實(shí)施其人工智能策略

隨著機(jī)器學(xué)習(xí)和深度學(xué)習(xí)直到最近才在各行業(yè)組織的生產(chǎn)環(huán)境中得到主流應(yīng)用,許多規(guī)模較小的組織并不具備開發(fā)人工智能模型的數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)工程師。

而且數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)工程師的平均薪酬與經(jīng)驗(yàn)豐富的軟件工程師相當(dāng),這使得許多組織難以組建一支能夠領(lǐng)導(dǎo)其人工智能計(jì)劃的優(yōu)秀團(tuán)隊(duì)。

雖然機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)人才的短缺是眾所周知的,但有一件事并沒有引起人們的關(guān)注,那就是需要招募更多的數(shù)據(jù)工程師,即建立、維護(hù)和更新數(shù)據(jù)庫、數(shù)據(jù)倉庫和數(shù)據(jù)湖的工作人員。根據(jù)Rackspace公司的調(diào)查,許多組織的機(jī)器學(xué)習(xí)的項(xiàng)目都失敗了,因?yàn)樗麄儧]有能力將其數(shù)據(jù)基礎(chǔ)設(shè)施調(diào)整為機(jī)器學(xué)習(xí)的目的。打破孤島、遷移到云平臺(tái)、建立Hadoop集群,以及創(chuàng)建能夠利用不同平臺(tái)能力的混合系統(tǒng),這些都是組織非常缺乏相關(guān)人才的領(lǐng)域。這些問題使得他們無法在組織范圍內(nèi)落實(shí)機(jī)器學(xué)習(xí)計(jì)劃。

隨著新的機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)工具的發(fā)展,人才短缺問題將變得不那么突出。谷歌、微軟和亞馬遜已經(jīng)推出了一些平臺(tái),使得開發(fā)機(jī)器學(xué)習(xí)模型更加容易。微軟的Azure機(jī)器學(xué)習(xí)服務(wù)就是一個(gè)例子,它提供了一個(gè)帶有拖放組件的可視化界面,使得不需要編程就可以更容易地創(chuàng)建機(jī)器學(xué)習(xí)模型。另一個(gè)例子是谷歌公司的AutoML,它可以自動(dòng)完成繁瑣的超參數(shù)調(diào)優(yōu)過程。雖然這些工具并不能取代機(jī)器學(xué)習(xí)人才,但它們?yōu)橄胍M(jìn)入該領(lǐng)域的人員降低了門檻,并將使許多組織能夠?yàn)檫@些不斷增長(zhǎng)的領(lǐng)域招聘更多技術(shù)人才。

DeVerter說:“缺乏內(nèi)部數(shù)據(jù)科學(xué)人才并不是過去的障礙,現(xiàn)在更多的組織能夠利用自己的機(jī)器學(xué)習(xí)提供幫助,以及可以獲得擁有這些人才的咨詢公司的幫助。”

該領(lǐng)域的其他發(fā)展是云存儲(chǔ)和分析平臺(tái)的發(fā)展,這顯著降低了創(chuàng)建和運(yùn)行人工智能系統(tǒng)所需的數(shù)據(jù)基礎(chǔ)設(shè)施的復(fù)雜性。其中一個(gè)例子就是谷歌公司的BigQuery,這是一個(gè)基于云計(jì)算的數(shù)據(jù)倉庫,可以輕松地查詢存儲(chǔ)在各種來源中的大量數(shù)據(jù)。

機(jī)器學(xué)習(xí)工具的兼容性和集成功能正在不斷增強(qiáng),這將使組織更輕松地將機(jī)器學(xué)習(xí)工具集成到其現(xiàn)有軟件和數(shù)據(jù)生態(tài)系統(tǒng)中。

在實(shí)施人工智能計(jì)劃之前,每個(gè)組織都必須對(duì)內(nèi)部人才、可用工具和集成可能性進(jìn)行全面評(píng)估。組織需要了解自己在多大程度上依賴內(nèi)部工程師,以及雇傭人才需要多少成本,這將成為決定機(jī)器學(xué)習(xí)計(jì)劃成敗的決定性因素。另外,考慮一下重新學(xué)習(xí)技能是否是一個(gè)可行的行動(dòng)方案。如果能在數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)項(xiàng)目上提高工程師的技能,從長(zhǎng)遠(yuǎn)的發(fā)展來看將會(huì)獲得更多的好處。

外包人工智能的人才

近年來增長(zhǎng)的另一個(gè)趨勢(shì)是人工智能項(xiàng)目的外包。在Rackspace公司的調(diào)查中,只有38%的受訪者表示依靠?jī)?nèi)部人才來開發(fā)人工智能應(yīng)用程序。其余的受訪者表示,或者完全外包他們的人工智能項(xiàng)目,或者雇用內(nèi)部員工和外包人才。

大多數(shù)組織依靠外部人才來規(guī)劃和實(shí)施他們的人工智能計(jì)劃

現(xiàn)在有一些公司專門研究和實(shí)施人工智能策略。例如專門為多個(gè)行業(yè)領(lǐng)域提供人工智能解決方案的提供商C3.ai公司。該公司為亞馬遜、微軟和谷歌等云計(jì)算提供商提供人工智能工具。該公司還提供人工智能咨詢和專業(yè)知識(shí),以逐步引導(dǎo)客戶完成戰(zhàn)略制定和實(shí)施階段。

Rackspace公司的調(diào)查報(bào)告指出:“成熟的供應(yīng)商可以帶來從戰(zhàn)略到實(shí)施,再到維護(hù)和支持的一切。其提供的策略可以避開人工智能和機(jī)器學(xué)習(xí)工作可能失去動(dòng)力或陷入復(fù)雜性的領(lǐng)域。技術(shù)專家還可以使組織免于混亂的清理和維護(hù)工作。將這些專門知識(shí)組合在一起,可以在最終取得成功方面發(fā)揮重要作用。”

但是,值得注意的是,將組織的人工智能戰(zhàn)略完全移交給外部提供商可能是一把雙刃劍。成功的策略需要人工智能專家與實(shí)施該策略組織的技術(shù)專家之間的密切合作。

DeVerter說,“這與采用DevOps開發(fā)方法并試圖將整個(gè)開發(fā)進(jìn)行外包的組織非常相似。DevOps需要開發(fā)人員、業(yè)務(wù)分析師和其他業(yè)務(wù)人員之間的密切合作。同樣,人工智能項(xiàng)目需要策略和技術(shù)專長(zhǎng),但也需要與組織以及領(lǐng)導(dǎo)層緊密合作。”

人工智能外包人才必須一絲不茍地完成工作。雖然外包可以加快開發(fā)和實(shí)施人工智能策略的過程,但組織必須確保其內(nèi)部人員充分參與到這一過程中。在理想情況下,組織應(yīng)該發(fā)展和壯大自己的數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)工程師團(tuán)隊(duì),并在需要的情況下與外部專家開展合作。

如何評(píng)估人工智能策略?

最后,另一個(gè)讓開始人工智能之旅的組織感到痛苦的領(lǐng)域是預(yù)測(cè)人工智能戰(zhàn)略的結(jié)果和價(jià)值。鑒于機(jī)器學(xué)習(xí)在許多領(lǐng)域的應(yīng)用都是新生事物,因此很難預(yù)先知道人工智能策略將計(jì)劃和實(shí)施多長(zhǎng)時(shí)間以及投資回報(bào)率是多少。反過來,在獲得對(duì)人工智能計(jì)劃的支持時(shí),組織的創(chuàng)新者很難讓其他人參與進(jìn)來。

在Rackspace調(diào)查的中,18%的受訪者認(rèn)為,缺乏明確的業(yè)務(wù)案例是組織采用人工智能策略面臨的主要障礙。組織高管人員缺乏承諾也是最大的障礙之一。缺乏用例和高級(jí)管理層的承諾再次成為機(jī)器學(xué)習(xí)過程中的主要挑戰(zhàn)。

DeVerter說,“人工智能通常會(huì)尋找組織內(nèi)部的問題。我認(rèn)為這是在組織內(nèi)部廣泛采用人工智能的最大障礙之一。由于人工智能工作人員可以展示有關(guān)人工智能如何使他們的組織受益的實(shí)例,將進(jìn)一步為這些活動(dòng)獲得資金。組織領(lǐng)導(dǎo)者需要知道它將如何幫助節(jié)省成本或獲得利潤(rùn)。”

評(píng)估人工智能計(jì)劃的結(jié)果非常困難。調(diào)查表明,衡量人工智能項(xiàng)目成功與否的兩大關(guān)鍵績(jī)效指標(biāo)是利潤(rùn)率和收入增長(zhǎng)??梢岳斫?,這種對(duì)快速利潤(rùn)的關(guān)注部分是由于人工智能項(xiàng)目的高成本。根據(jù)Rackspace公司的調(diào)查,每家組織每年在人工智能項(xiàng)目花費(fèi)的費(fèi)用平均為106萬美元。

但是,盡管良好的人工智能計(jì)劃可以增加收入和降低成本,但在許多情況下,機(jī)器學(xué)習(xí)的長(zhǎng)期價(jià)值是開發(fā)新的用例和產(chǎn)品。

DeVerter說:“短期的財(cái)務(wù)收益如果沒有與由這些短期收益提供資金的長(zhǎng)期戰(zhàn)略相匹配,那么這種收益不會(huì)長(zhǎng)久。”

對(duì)于負(fù)責(zé)組織中的人工智能計(jì)劃的工作人員來說,需要清楚地列出人工智能策略的用例、成本和收益。組織的決策者應(yīng)清楚了解將要開展的工作。他們應(yīng)該了解投資人工智能的短期利益,但也應(yīng)該知道從長(zhǎng)遠(yuǎn)來看會(huì)獲得什么收益。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無評(píng)論