隨著越來越多的組織采用大數(shù)據(jù)技術(shù)處理大量、快速、多變的信息資產(chǎn),通常很快就會面臨如何從中有效地獲得洞察力和商業(yè)價值的問題。
Talend公司產(chǎn)品高級總監(jiān)Jean-Michel Franco為此表示,“大數(shù)據(jù)技術(shù)自然可以帶來高級分析措施。但當組織可以捕獲有關(guān)可以改進業(yè)務(wù)主題的大量信息時,不要只是了解事物表面,還想發(fā)現(xiàn)事物本質(zhì),找出根本原因,預(yù)測將要發(fā)生的事情,并準確地解決問題。而人類在沒有機器幫助的情況下獨自完成是很難做到的。”而人工智能技術(shù)已經(jīng)成為一種理解所有信息的方式,并且實際上成為一種需要大量數(shù)據(jù)才能實施的學科。
因此,大數(shù)據(jù)和人工智能技術(shù)總是結(jié)合在一起是很自然的。商業(yè)轉(zhuǎn)型和外包咨詢服務(wù)商PaceHarmon公司總監(jiān)JP Baritugo說:“大數(shù)據(jù)和人工智能之間存在著緊密的關(guān)系。大數(shù)據(jù)是燃料,人工智能是手段。”
但是在這一過程中,人們對人工智能和大數(shù)據(jù)如何協(xié)同工作產(chǎn)生了一些誤解,導致潛在的混亂,IT領(lǐng)導者應(yīng)在采用數(shù)據(jù)驅(qū)動型策略時進行澄清:
1.某些類型的人工智能可能不需要大數(shù)據(jù)
例如,一些聊天機器人學習的輸入數(shù)據(jù)集可能比人工智能技術(shù)還要少。
Baritugo說,“‘垃圾輸入,垃圾輸出’的數(shù)據(jù)分析理念是適用的,因為組織需要足夠的良好數(shù)據(jù)來從其人工智能工作中驅(qū)動具有意義的價值。但需要多少數(shù)據(jù)可能會有所不同。”
Everest集團執(zhí)行副總裁兼資深分析師Sarah Burnett為此解釋說:“大數(shù)據(jù)意味著由結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)組成的大數(shù)據(jù)集,可以為人工智能的一些應(yīng)用提供數(shù)據(jù),例如需要大量數(shù)據(jù)來訓練人工智能、分析信息以發(fā)現(xiàn)模式,并用概率來提出問題的答案時,并非所有人工智能都需要大量數(shù)據(jù)。”
Baritugo說,“通過設(shè)計,人工智能通常需要大型的規(guī)范化數(shù)據(jù)集(即大數(shù)據(jù)的“清理”子集)來有意義地識別模式并生成必要的輸出,其所需的數(shù)據(jù)量(包括培訓和評估數(shù)據(jù)集)主要由問題的復雜性、需要評估的輸入功能的數(shù)量以及所使用的算法決定。”
例如,機器學習(ML)通常需要比深度學習(機器學習的另一個子集)更少的數(shù)據(jù)來進行訓練。
2.并非所有大數(shù)據(jù)都需要人工智能的應(yīng)用
人工智能可能有助于推動數(shù)據(jù)分析,但不一定需要從大數(shù)據(jù)中提取價值。ISG公司認知自動化和創(chuàng)新總監(jiān)Wayne Butterfield說,“高級分析已成為大多數(shù)組織多年來利用的概念。這實際上取決于數(shù)據(jù)集的大小和需要分析的不同數(shù)據(jù)集的數(shù)量。就算專家擁有最聰明的頭腦,也不可能在有限的時間內(nèi)在一些大型數(shù)據(jù)集中找到具有洞察力的模式,因此機器學習在完成繁重工作方面具有一定優(yōu)勢,但是并非所有數(shù)據(jù)集都是龐大而多樣的,因此不一定總是需要采用機器學習(ML)才能從中獲得洞察力。”
IT組織還可以使用商業(yè)智能、分析和數(shù)據(jù)倉庫解決方案來分析數(shù)據(jù)并可視化見解。
3.高級分析和人工智能并不一樣
很多時候,人們使用“大數(shù)據(jù)”一詞來更廣泛地描述這些信息資產(chǎn)的高級分析,這并沒有什么問題。但是他們可能認為高級分析和人工智能也是可以互換的術(shù)語,這種想法是不對的。
Burnett說:“人工智能和高級分析緊密聯(lián)系在一起,但存在一些關(guān)鍵區(qū)別。例如,人工智能可以嘗試各種假設(shè)、自我學習并增強其分析。盡管人工智能技術(shù)可以分析數(shù)據(jù),卻無法自我學習,只能依靠人類來設(shè)置其參數(shù)。”
4.大數(shù)據(jù)可能會扭曲人工智能模型
Franco說,“大數(shù)據(jù)為人工智能和機器學習奠定了基礎(chǔ)。獲得的數(shù)據(jù)越多,模型就越好。但是當數(shù)據(jù)不受控制時,也會給人工智能和機器學習帶來偏差。”
過分關(guān)注數(shù)據(jù)的數(shù)量而不是質(zhì)量往往是罪魁禍首。Franco說:“當人們無法控制基礎(chǔ)數(shù)據(jù)時,人工智能和機器學習不可避免地會遭遇失敗。將大量數(shù)據(jù)收集到數(shù)據(jù)湖中并不能為人工智能和機器學習的成功奠定足夠的基礎(chǔ)。”
5.組織可能已經(jīng)將人工智能和大數(shù)據(jù)結(jié)合在一起但卻不知情
Burnett談到智能文檔處理(IDP)軟件時說:“有些軟件解決方案已經(jīng)內(nèi)置了人工智能功能,可以隨時安裝、訓練和使用。這些解決方案加速了人工智能的采用,并幫助組織處理特定的業(yè)務(wù)需求。在這些情況下,不一定需要了解人工智能技術(shù)才能獲得收益。”
6.人類證明了將大數(shù)據(jù)和人工智能結(jié)合起來的必要性
當涉及大數(shù)據(jù)和人工智能時,信任和透明度是關(guān)鍵。Franco說,“組織需要扎實的數(shù)據(jù)基礎(chǔ),才能使用人工智能獲得正確的見解。而且,組織員工需要參與到數(shù)據(jù)治理的過程,以控制數(shù)據(jù)(數(shù)據(jù)質(zhì)量、代表性、數(shù)據(jù)隱私)和算法(使用可解釋的人工智能能夠理解算法的內(nèi)容)。”
7.并非所有數(shù)據(jù)都對人工智能有用
Butterfield說:“與人工智能結(jié)合使用時,通常在擁有大量數(shù)據(jù)和擁有正確數(shù)據(jù)以提供見解之間有著很好的平衡。人工智能并不是解決所有問題的靈丹妙藥,至少到目前為止是這樣。企業(yè)領(lǐng)導者需要意識到這一點。”