大多數(shù)IT領(lǐng)導(dǎo)者都認(rèn)為自己完全掌握了數(shù)據(jù)中心的管理、運營和規(guī)劃,但實際上他們并沒有。
任何IT領(lǐng)導(dǎo)者或IT專家團隊都無法對基本的數(shù)據(jù)中心任務(wù)進行逐秒(甚至更為精細(xì)的)控制。人類,即使是受過高等教育和訓(xùn)練的專業(yè)人員在未來規(guī)劃和其他重要職責(zé)任方面也會受到個人偏好、偏見和誤解的影響。
人工智能就沒有這些缺點。這就是為什么即使數(shù)據(jù)中心運營商面臨著混合環(huán)境、物聯(lián)網(wǎng)和其他挑戰(zhàn),仍要考慮人工智能對一系列關(guān)鍵數(shù)據(jù)中心運營和服務(wù)產(chǎn)生的影響。
以下七件事情是每位IT領(lǐng)導(dǎo)人都需要知道的,這些事情事關(guān)人工智能如何將數(shù)據(jù)中心變得更為強大,更為高效。
1、不同類型的數(shù)據(jù)中心都可以從人工智能受益
曾擔(dān)任紐約市法律部門首席信息官,現(xiàn)任企業(yè)備份與災(zāi)難恢復(fù)技術(shù)提供商Cloud Daddy首席執(zhí)行官的Joe Merces指出,任何類型的數(shù)據(jù)中心都可以從人工智能中受益,但是受益最多的通常是大型設(shè)施,如大型企業(yè)數(shù)據(jù)中心、公有云數(shù)據(jù)中心、主機代管數(shù)據(jù)中心和外包數(shù)據(jù)中心。
IEEE研究員兼數(shù)據(jù)存儲分析公司Coughlin Associates總裁的Tom Coughlin認(rèn)為,任何數(shù)據(jù)中心都可以利用如機器學(xué)習(xí)等人工智能方法來更好地管理內(nèi)部資源,對未來的硬件和數(shù)據(jù)要求進行預(yù)測。他指出,“人工智能正在成為最重要的數(shù)據(jù)中心應(yīng)用程序之一。”
數(shù)據(jù)中心維護服務(wù)提供商Park Place科技的創(chuàng)新主管Paul Mercina解釋道,機器學(xué)習(xí)正在從基本模式識別和傳統(tǒng)算法轉(zhuǎn)變?yōu)楦鼜?fù)雜的深度學(xué)習(xí)領(lǐng)域。“機器學(xué)習(xí)的一個關(guān)鍵貢獻是它們能夠使用迭代方法發(fā)現(xiàn)數(shù)據(jù)中的結(jié)構(gòu),無需人類從任何理論或假設(shè)開始進行測試。”深度學(xué)習(xí)使用了多層人工神經(jīng)網(wǎng)絡(luò),在對象檢測、分類、語音識別、語言翻譯等任務(wù)中能夠提供更高的準(zhǔn)確性。
2、人工智能可幫助提升數(shù)據(jù)中心能效
在過去幾年當(dāng)中,人工智能工具在降低數(shù)據(jù)中心能耗和減少浪費方面發(fā)揮著越來越重要的作用。“這些應(yīng)用程序有助于降低功耗,對低下的冷卻效率進行報告并分析關(guān)鍵任務(wù)系統(tǒng)的健康狀況,以提高效率、節(jié)約能源,”Mercina指出。
荷蘭數(shù)據(jù)中心協(xié)會常務(wù)董事Stijn Grove說:“數(shù)據(jù)中心是一個不斷變化的環(huán)境。” 他表示,通過人工智能分析和監(jiān)測當(dāng)前的室內(nèi)外溫度并對近期天氣進行預(yù)測,可幫助數(shù)據(jù)中心優(yōu)化冷卻資源從而達到節(jié)約能源的目的。
服務(wù)器是所有數(shù)據(jù)中心中最耗能的地方。Grove指出,“當(dāng)你具備了在需要時自動擴展或降低云服務(wù)器規(guī)模的能力,那么充分發(fā)揮每臺服務(wù)器潛力并關(guān)閉未使用的容量,你就會節(jié)約大量的能源。”
人工智能還可以顯著降低存儲的能耗。通過使用人工智能監(jiān)控和分析預(yù)測各類用戶活動,數(shù)據(jù)中心可以快速地將較少使用的數(shù)據(jù)轉(zhuǎn)移到低能耗的存儲資源上,將頻繁使用的數(shù)據(jù)轉(zhuǎn)移到更高性能的存儲。“此外,人工智能還可以最大限度地在處理過程中減少數(shù)據(jù)的來回移動,”Coughlin說。“數(shù)據(jù)智能存放可以讓使用中的數(shù)據(jù)更靠近處理數(shù)據(jù)的地方,通過減少數(shù)據(jù)移動來降低能耗。”
3、人工智能可提高數(shù)據(jù)中心的安全性
數(shù)據(jù)中心的安全需求正在迅速發(fā)展。一直以來,數(shù)據(jù)中心面臨的最大威脅主要是來自內(nèi)部員工或相對原始的外部暴力攻擊??▋?nèi)基梅隆大學(xué)泰珀商學(xué)院商業(yè)技術(shù)副教授Param Vir Singh表示,“如今,黑客也在構(gòu)建基于人工智能的算法,這些算法正試圖找到數(shù)據(jù)中心的弱點。人工智能則是應(yīng)對這一挑戰(zhàn)的最佳技術(shù)。”
Mercina表示:“人工智能應(yīng)用程序使得數(shù)據(jù)中心能夠更快地適應(yīng)不斷變化的安全要求,同時為用戶提供更為安全的環(huán)境,并且無需強制執(zhí)行嚴(yán)苛的規(guī)定。人工智能解決方案還可以幫助檢測惡意軟件和垃圾郵件,分析正常和異常的活動模式,識別弱點并加強對潛在威脅的防護。”
Coughlin稱,人工智能能夠?qū)阂馊肭中袨橐T至“蜜罐”當(dāng)中,在那里對它們進行密切監(jiān)控,甚至追蹤入侵者。
4、人工智能可以優(yōu)化數(shù)據(jù)中心的性能
通過不斷監(jiān)控和調(diào)整資源(包括處理、網(wǎng)絡(luò)和內(nèi)存等),人工智能可讓企業(yè)以最高的效率運行數(shù)據(jù)中心。“人工智能可用于監(jiān)控工作負(fù)載分配,使基礎(chǔ)設(shè)施更具可擴展性,同時提升冷卻和能耗效率,”Merces說。人工智能還可用于優(yōu)化服務(wù)器配置和利用率。“例如,人工智能可通過移動工作負(fù)載并通過軟重啟、硬重啟和重新制作鏡像等方法識別和修復(fù)基礎(chǔ)設(shè)施中存在的問題。”
Coughlin也認(rèn)為,人工智能在優(yōu)化服務(wù)器使用方面具有獨特的優(yōu)勢。他說:“這包括將相應(yīng)的處理流程交給到針對特定應(yīng)用程序的處理器,例如GPU和TPU。” 人工智能還可以優(yōu)化數(shù)據(jù)中心軟件性能。“例如,限制數(shù)據(jù)庫中相同數(shù)據(jù)的輪詢或限制重復(fù)過程,”Grove補充道。
5、人工智能可改善基礎(chǔ)設(shè)施管理
據(jù)Ponemon Institute的研究顯示,2016年各行業(yè)數(shù)據(jù)中心宕機時間的平均成本約為每分鐘8850美元。“如果我們能夠在維護性問題發(fā)生前預(yù)測到它們,那么我們就可以采取預(yù)防措施,”Singh說。
通過不斷改進的基礎(chǔ)設(shè)施管理技術(shù)和智能傳感器,神經(jīng)網(wǎng)絡(luò)可被訓(xùn)練用于分析當(dāng)前基礎(chǔ)設(shè)施的需求和容量,以便利用最適合的設(shè)備來滿足這些需求。專攻商業(yè)法和企業(yè)法的Tuck Northman律師事務(wù)所合伙人Tuck Northman稱:“人工智能可以處理比人類或人類團隊更多的信息,幾乎是實時處理,并且以人工智能為導(dǎo)向的系統(tǒng)更加有效、更加可靠。” 同時,他還指出傳感器還可以幫助數(shù)據(jù)中心管理員預(yù)測或減輕災(zāi)難性故障。
Mercina說,大多數(shù)數(shù)據(jù)中心如今都由訓(xùn)練有素的人員進行管理、監(jiān)控和運維,他們的日常任務(wù)包括巡查數(shù)據(jù)中心、查找表示硬件發(fā)生故障的指示燈等。“通過消除無謂的猜測和讓整個生態(tài)系統(tǒng)具備主動性,人工智能和機器學(xué)習(xí)能夠徹底改變目前這種過時的范式。”
人工智能有望對數(shù)據(jù)中心安排日常維護任務(wù)的方式產(chǎn)生重大影響。通過仔細(xì)審查所有相關(guān)的數(shù)據(jù)中心資源,人工智能很快就能夠預(yù)測出特定設(shè)施何時需要服務(wù)、升級和更換。因此,定期維護計劃將逐漸會被人工智能生成的建議所取代。Grove認(rèn)為 “這將改善正常運行時間并降低成本。”
6、人工智能正在成為強大的數(shù)據(jù)中心規(guī)劃工具
規(guī)劃是最令人感興趣的人工智能數(shù)據(jù)中心應(yīng)用之一。通過從數(shù)據(jù)中心傳感器中獲取大量信息和利用從以往情境中進行學(xué)習(xí)的能力,人工智能可以提供精細(xì)的預(yù)測,更重要的是,它們可以對修改過的設(shè)想中存在的差異進行建模。Northman說:“系統(tǒng)部署時間越長,獲得的信息就越多,預(yù)測的結(jié)果也就越準(zhǔn)確。”
“目前這種情況正在發(fā)生。”例如,將人工智能用于規(guī)劃和配置電力資源,預(yù)測冷卻需求。他表示:“它們還被用在了規(guī)劃和管理網(wǎng)絡(luò)和帶寬的利用率和優(yōu)化工作上。”
7、人工智能將管理越來越多的數(shù)據(jù)中心任務(wù)
Grove指出,人工智能幾乎可以完全管理目前由人類管理的數(shù)據(jù)中心任務(wù)。“數(shù)字生態(tài)系統(tǒng)需要更多的即時控制和操作,這些只能通過人工智能和機器學(xué)習(xí)來實現(xiàn)。此外,隨著邊緣計算的出現(xiàn),為了能夠管理眾多的無人站點,我們也需要人工智能來完成這些工作。”
實現(xiàn)一個能夠監(jiān)控、診斷和自我修復(fù)的完全自動化數(shù)據(jù)中心是人們一直追求的目標(biāo)。大數(shù)據(jù)分析公司Guavus的首席科學(xué)家Roger Brooks說:“這需要人工智能、機器人甚至是增強現(xiàn)實技術(shù),讓機器之間能夠互相照顧。”
然而,至少從人類的角度來看,人工智能目前仍然無法可靠地執(zhí)行高級推理和決策任務(wù)。不過,Merces預(yù)測說,“隨著所有工作都進入了人工智能時代,它們將被劃分為特定的功能,雖然這些功能將變得極為高效,但是它們終究不會獲得智慧。”
對于這一觀點,Northman 表示同意。“雖然管理人員會越來越依賴人工智能來操作和管理數(shù)據(jù)中心,但是這些流程并非完全不需要人類參與。管理者在一些特定中心的作用將會降低……但是人類還會作為一個防故障要素繼續(xù)存在于各個環(huán)節(jié)當(dāng)中。”