“人工智能”這一術(shù)語如今似乎無處不在,這在行業(yè)市場的應(yīng)用中造成一些混亂,甚至可能讓技術(shù)決策者感到困惑。
人工智能到底是什么?一個常見的定義是“在機器中模擬人類的智能,這些機器被編程為像人類一樣思考并模仿他們的行為。”人工智能系統(tǒng)可以看作表現(xiàn)出與人類思維相關(guān)特征并具備學(xué)習(xí)和解決問題的能力的任何系統(tǒng)。
具有人工智能功能的技術(shù)、產(chǎn)品和服務(wù)可以為組織帶來巨大的好處:提高效率、實現(xiàn)人工流程的自動化、增強決策能力、改善客戶服務(wù)和體驗,以及解決復(fù)雜問題的能力等等。
但是,IT和業(yè)務(wù)領(lǐng)導(dǎo)者必須善于將炒作與現(xiàn)實區(qū)分開。正如研究機構(gòu)Gartner公司指出的那樣,許多組織都在努力為人工智能賦予現(xiàn)實價值。組織領(lǐng)導(dǎo)者往往高估了人工智能技術(shù)的影響,而低估了其復(fù)雜性。
該公司在2020年初發(fā)布了一份有關(guān)組織采用人工智能的報告,該報告基于對來自美國、德國和英國的組織的600多名高級管理人員的調(diào)查。報告表明,三分之一以上的受訪者表示已經(jīng)部署并使用了人工智能,超過一半的受訪者表示計劃在一年之內(nèi)部署人工智能。約三分之一的受訪者表示計劃在兩年內(nèi)部署人工智能。
該報告稱,組織平均需要9個月的時間才能開發(fā)出從原型到生產(chǎn)的人工智能計劃。盡管人工智能技術(shù)人才的普遍短缺,但人才的缺乏并不是成功部署人工智能的主要障礙。人工智能成功應(yīng)用的主要限制因素是缺乏明確的結(jié)果。
制定策略
Gartner公司的調(diào)查報告指出,組織還面臨著涉及集成、安全性和隱私問題的挑戰(zhàn),這些挑戰(zhàn)使他們無法有效地將人工智能實踐從原型轉(zhuǎn)移到生產(chǎn)中。
這就是人工智能工程可以發(fā)揮關(guān)鍵作用的地方。卡內(nèi)基梅隆大學(xué)軟件工程研究所(SEI)新興技術(shù)中心主任、美國國家人工智能工程計劃負(fù)責(zé)人Matt Gaston說,“人工智能工程是設(shè)計、構(gòu)建、測試、部署、操作和發(fā)展可靠人工智能系統(tǒng)的過程、工具和最佳實踐。人工智能本身就是關(guān)于創(chuàng)造智能模型或能力的特定人工智能技術(shù),例如機器學(xué)習(xí)。人工智能工程將這些智能模型或功能轉(zhuǎn)變?yōu)楣δ苋娴南到y(tǒng),以提供業(yè)務(wù)、運營或任務(wù)解決方案。”
Gartner公司副總裁兼分析師Erick Brethenoux表示,人工智能工程將組織中的各個學(xué)科整合在一起,為實現(xiàn)多種人工智能技術(shù)的組合提供了一條實現(xiàn)價值的更清晰的途徑,并將人工智能工程列為2021年最具戰(zhàn)略意義的技術(shù)趨勢之一。
與客戶合作采用人工智能工程策略的Brethenoux表示,穩(wěn)健的人工智能工程策略將促進人工智能模型的性能、可擴展性、可解釋性和可靠性,同時實現(xiàn)人工智能投資的全部價值。他說:“人工智能工程包括將人工智能投入生產(chǎn)的方法、最佳實踐、能力和技術(shù),可以管理和監(jiān)控組織的人工智能使用。”
Brethenoux指出,通??梢詫⑷斯ぶ悄芊譃閮蓚€主要周期:第一個周期是根據(jù)應(yīng)用程序類型開發(fā)和訓(xùn)練機器學(xué)習(xí)模型,例如基于規(guī)則的模型、優(yōu)化模型或自然語言處理模型。第二個周期是組織內(nèi)部模型的實施。
Brethenoux說:“眾所周知,一些組織在實施人工智能模型方面表現(xiàn)不佳。他們擅長開發(fā)模型,并大量開發(fā)了許多模型。但是使用這些模型投入生產(chǎn)是困難的。我們需要一種將這些模型的生產(chǎn)系統(tǒng)化的方法,這正是人工智能工程發(fā)揮重要作用的地方。”
Brethenoux表示,人工智能工程不應(yīng)該是為特定項目實施人工智能的非正式或臨時性工作。與其相反,它應(yīng)該在組織中實現(xiàn)正式化,以使其成為所有使用人工智能和機器學(xué)習(xí)的最佳實踐。
Gaston指出,“人工智能工程是一門新興學(xué)科,它將隨著時間的推移而發(fā)展壯大,并與我們在人工智能領(lǐng)域看到的快速創(chuàng)新保持同步。也就是說,組織正在使用人工智能工程來創(chuàng)建和維護包含人工智能技術(shù)的業(yè)務(wù)解決方案。”
這其中包括確保系統(tǒng)需求由業(yè)務(wù)需求驅(qū)動,為這些需求選擇適當(dāng)?shù)娜斯ぶ悄芗夹g(shù)、測試和監(jiān)控工具,以確保系統(tǒng)繼續(xù)按預(yù)期運行。隨著需求或運營環(huán)境的變化,流程和框架已經(jīng)到位,可以更新和發(fā)展人工智能系統(tǒng)。
主要組件
成功使用人工智能的關(guān)鍵之一是認(rèn)識到進入運營階段不僅是一個技術(shù)問題,而且也是一個業(yè)務(wù)問題。
Brethenoux說,“將人工智能投入生產(chǎn)時,組織必須與主題專家討論它們正在運行的應(yīng)用程序,人工智能的用例以及這些應(yīng)用程序如何為組織服務(wù),然后必須知道已建立的關(guān)鍵績效指標(biāo)是否真的有效。”
Brethenoux表示,組織需要將業(yè)務(wù)用戶置于其人工智能工程實踐的核心,以確保人工智能交付組織所要實現(xiàn)的目標(biāo)。
這并不是說技術(shù)不重要。人工智能團隊在選擇工具和技術(shù)時需要有敏銳的洞察力,以確保他們能夠?qū)崿F(xiàn)組織在人工智能方面的目標(biāo),并且能夠輕松地與現(xiàn)有產(chǎn)品以及其他新的人工智能工具集成。
另一個重要的考慮因素是組織輸入模型的數(shù)據(jù)的質(zhì)量。Brethenoux說,“數(shù)據(jù)來自哪里,它的可靠性如何?”
可以幫助組織提高數(shù)據(jù)質(zhì)量的一個相對較新的學(xué)科是DataOps,DataOps是數(shù)據(jù)分析團隊使用的一種自動化的、面向過程的方法,旨在通過敏捷方法來提高數(shù)據(jù)質(zhì)量,并縮短分析周期。
DataOps適用于從數(shù)據(jù)準(zhǔn)備到報告的完整數(shù)據(jù)生命周期,并且它承認(rèn)數(shù)據(jù)分析團隊和IT運營是相互聯(lián)系的。
希望利用人工智能的組織還需要具備適當(dāng)?shù)募寄?。其中包括使用Python、R、Java、C++等編程語言的經(jīng)驗;包括算法和數(shù)據(jù)庫的機器學(xué)習(xí);數(shù)據(jù)科學(xué)神經(jīng)網(wǎng)絡(luò)架構(gòu);包括概率和統(tǒng)計的應(yīng)用數(shù)學(xué);機器人技術(shù)計算機視覺。從事人工智能項目的專業(yè)人士也需要軟技能,如良好的溝通和協(xié)作、批判性思維和創(chuàng)造力。
Brethenoux表示,新興的相關(guān)技能之一是機器學(xué)習(xí)驗證。模型驗證是使用測試數(shù)據(jù)集評估經(jīng)過訓(xùn)練的模型的過程。使用測試數(shù)據(jù)集的主要原因是測試訓(xùn)練模型的一般能力。
Brethenoux說:“這些人員將參與人工智能模型的整個生命周期,從數(shù)據(jù)的角度進行驗證,然后從開發(fā)的角度進行驗證,然后從操作的角度進行驗證。他們將評估使用這些模型所做的一切是否有效、合法和技術(shù)上可行。”
Brethenoux表示,獲得人工智能技能并不像許多組織認(rèn)為的那么難。組織內(nèi)部需要擁有正確的人才發(fā)現(xiàn)計劃、適當(dāng)?shù)奶嵘寄芎徒逃龑嵺`,以及外部人才組合,這是他們?nèi)〉贸晒λ枰囊磺小?/p>
人工智能的未來發(fā)展
Gaston表示,許多組織意識到人工智能可以通過多種方式提供真正的商業(yè)價值,并開始建立自己的數(shù)據(jù)科學(xué)、機器學(xué)習(xí)和人工智能團隊。
Gaston說,“雖然這些都是重要的第一步,但大多數(shù)數(shù)據(jù)科學(xué)或機器學(xué)習(xí)團隊的功能是在受嚴(yán)格控制的環(huán)境中使用數(shù)據(jù)生成模型。至關(guān)重要的是,組織必須從整體上著眼于如何實現(xiàn)、運營和維護用于業(yè)務(wù)解決方案的人工智能,并且它們需要為此帶來各種才能、思想和經(jīng)驗。”
組織無需制定人工智能工程策略即可推進人工智能項目。但是,如果這樣做的話,該技術(shù)獲得長期和全面成功的可能性將會受到限制。這是一個具有戰(zhàn)略性和強大功能的工具,不適合隨意使用。
Brethenoux說,“我認(rèn)為這是解決人工智能問題的唯一途徑。如果不從事人工智能工程設(shè)計,那么只有約35%到45%的模型會找到他們的生產(chǎn)方式。因此,組織將會浪費其余的模型,并且每次都必須從頭開始。”
人工智能的主要問題之一將繼續(xù)從開發(fā)和培訓(xùn)階段過渡到運營/產(chǎn)品階段。如果組織不對人工智能采用結(jié)構(gòu)化、工程化的方法,這仍然是一個問題。
Brethenoux說:“那些在人工智能方面做得很好的組織正在更系統(tǒng)地完成這項工作,他們從中獲得了非常好的收益。我很想問,‘如果組織并沒有計劃實現(xiàn)運營目標(biāo),為什么還要采用人工智能呢?’在此之前,這只是一個有趣的智力練習(xí)。當(dāng)組織部署人工智能時,它將成為一種經(jīng)濟優(yōu)勢。”
人工智能工程的基礎(chǔ)實踐
作為卡內(nèi)基梅隆大學(xué)一部分的聯(lián)邦資助的研發(fā)中心,其軟件工程研究所(SEI)已為人工智能工程編寫了11項“基礎(chǔ)實踐”。這些是軟件工程、網(wǎng)絡(luò)安全和應(yīng)用人工智能領(lǐng)域的專家為IT和業(yè)務(wù)決策者提供的建議。以下是對這些實踐的總結(jié):
•確保組織存在應(yīng)該采用人工智能解決的問題。從定義明確的問題開始,了解組織要完成的工作和所需的結(jié)果,同時確??梢允褂脭?shù)據(jù)來實現(xiàn)這些結(jié)果。
•在組織的軟件工程團隊中包括各種主題專家,如數(shù)據(jù)科學(xué)家和數(shù)據(jù)架構(gòu)師。有效的人工智能工程團隊包括問題領(lǐng)域的專家、數(shù)據(jù)工程、模型選擇和優(yōu)化、硬件基礎(chǔ)設(shè)施和軟件架構(gòu),以及軟件工程專業(yè)知識。
•認(rèn)真對待數(shù)據(jù)。數(shù)據(jù)接收、清理、保護、監(jiān)視和驗證對于設(shè)計成功的人工智能系統(tǒng)至關(guān)重要,它們需要大量的資源、時間和注意力。確保組織的流程考慮到環(huán)境的變化、可能的偏見和潛在的對抗性利用。
•根據(jù)組織需要模型執(zhí)行的操作而不是其流行程度來選擇機器學(xué)習(xí)算法。算法在幾個重要方面有所不同,其中包括它們可以解決的問題類型、輸出信息的詳細(xì)程度以及輸出和模型的可解釋性。組織需要選擇適合解決特定問題并滿足業(yè)務(wù)和工程需求的算法。
•通過部署集成的監(jiān)視和緩解策略來保護人工智能系統(tǒng)。軟件工程研究所(SEI)的研究表明,人工智能系統(tǒng)的攻擊面正在擴大,而更廣泛的攻擊面又加劇了運營環(huán)境的脆弱性。通過進行持續(xù)的評估和驗證來應(yīng)對這一問題。考慮到新威脅的出現(xiàn)速度很快,這一點尤其重要。
•定義檢查點以說明恢復(fù)、可追溯性和決策依據(jù)的潛在需求。人工智能系統(tǒng)對輸入數(shù)據(jù)、訓(xùn)練數(shù)據(jù)和模型之間的依賴關(guān)系非常敏感。對任何一個系統(tǒng)的版本或特征的任何更改都可能很快影響其他系統(tǒng)。
•結(jié)合用戶體驗和交互,不斷驗證和發(fā)展模型。盡可能使用自動化的方法來獲取系統(tǒng)輸出的反饋并改進模型。監(jiān)控用戶體驗,盡早發(fā)現(xiàn)問題。另外,還要考慮到用戶的偏見。
•為解釋輸出做好準(zhǔn)備。軟件工程研究所(SEI)的研究表明與其他大多數(shù)系統(tǒng)相比,人工智能輸出需要更多的解釋。人工智能系統(tǒng)引入的不確定性在某些情況下可能是不可接受的。結(jié)合機器學(xué)習(xí)組件也需要設(shè)計輸出的不確定性。
•實現(xiàn)可擴展或替換的松散耦合工具,以適應(yīng)不可避免的數(shù)據(jù)和模型更改。與傳統(tǒng)系統(tǒng)相比,人工智能系統(tǒng)組件之間的邊界惡化的速度更快。
•組織在系統(tǒng)的整個生命周期中投入足夠的時間和專業(yè)知識來進行持續(xù)不斷的變化。很多組織的團隊嚴(yán)重低估了所需的資源。構(gòu)建人工智能系統(tǒng)最初需要更多的資源,這些資源需要迅速擴展,并且在系統(tǒng)的整個生命周期中都需要投入大量資源。
•將道德作為軟件設(shè)計和政策考慮的因素。評估人工智能系統(tǒng)的各個方面是否存在潛在的道德問題,并說明該系統(tǒng)各個方面的組織和社會價值,其內(nèi)容從數(shù)據(jù)收集到?jīng)Q策,再到績效和有效性的驗證和監(jiān)控。