如今,人工智能(AI)在捕獲、處理和分析數(shù)據(jù)方面發(fā)揮著關(guān)鍵作用,其速度比以往任何時(shí)候都要快。采用人工智能技術(shù)整合數(shù)據(jù)和管理數(shù)據(jù)中心也將變得更加高效和有用。
隨著數(shù)據(jù)成為支撐幾乎所有組織運(yùn)營業(yè)務(wù)以獲得洞察力和業(yè)務(wù)成果的先決條件,數(shù)據(jù)中心成為這一數(shù)字化轉(zhuǎn)型的關(guān)鍵。這些容納計(jì)算機(jī)和設(shè)備的物理設(shè)施為現(xiàn)代經(jīng)濟(jì)的信息需求提供動力。數(shù)據(jù)中心提供無縫的數(shù)據(jù)備份和恢復(fù)設(shè)施,同時(shí)支持云存儲應(yīng)用程序和事務(wù)。除了促進(jìn)經(jīng)濟(jì)發(fā)展之外,數(shù)據(jù)中心生態(tài)系統(tǒng)還吸引了更多科技公司的進(jìn)入。此外,建設(shè)和運(yùn)營數(shù)據(jù)中心可以確保當(dāng)?shù)厣鐓^(qū)具有良好的投資環(huán)境和就業(yè)機(jī)會。
盡管數(shù)據(jù)中心在帶來數(shù)字革命方面發(fā)揮了關(guān)鍵作用,但并非沒有遇到問題和挑戰(zhàn)。調(diào)研機(jī)構(gòu)Gartner公司分析師Dave Cappuccio表示,到2025年,全球80%的組織將關(guān)閉其內(nèi)部部署數(shù)據(jù)中心??紤]到傳統(tǒng)數(shù)據(jù)中心面臨的諸多問題,如升級準(zhǔn)備不足、基礎(chǔ)設(shè)施的挑戰(zhàn)、環(huán)境問題等,關(guān)閉和淘汰這些數(shù)據(jù)中心是適當(dāng)?shù)?。解決這些問題的方法是利用人工智能來增強(qiáng)數(shù)據(jù)中心基礎(chǔ)設(shè)施的功能。
根據(jù)《福布斯洞察》發(fā)布的一份調(diào)查報(bào)告,在2020年初,人工智能對數(shù)據(jù)中心管理、生產(chǎn)力和基礎(chǔ)設(shè)施產(chǎn)生了巨大影響。同時(shí),人工智能技術(shù)繼續(xù)提供數(shù)據(jù)中心的潛在解決方案,以改善長期運(yùn)營。作為回報(bào),由人工智能加速計(jì)算能力支持的數(shù)據(jù)中心將能夠更有效地處理人工智能工作負(fù)載。
眾所周知,數(shù)據(jù)中心消耗大量能源,因此訓(xùn)練人工智能系統(tǒng)以提高數(shù)據(jù)中心能源使用效率(PUE)是一個關(guān)鍵目標(biāo)。PUE是衡量數(shù)據(jù)中心效率的重要指標(biāo)。,谷歌公司于2014年通過在其一個數(shù)據(jù)中心設(shè)施中部署Deepmind AI,將其制冷設(shè)施的用電量減少了40%,這相當(dāng)于在考慮了電力損耗和其他非冷卻設(shè)施的損耗之后,PUE整體成本減少15%。它還產(chǎn)生了該數(shù)據(jù)中心有史以來最低的PUE值。Deepmind分析了數(shù)據(jù)中心內(nèi)的100多個不同變量,以提高運(yùn)營效率并降低功耗。
數(shù)據(jù)中心也容易受到各種網(wǎng)絡(luò)威脅。網(wǎng)絡(luò)攻擊者總是在尋找從數(shù)據(jù)中心獲取數(shù)據(jù)或進(jìn)行數(shù)據(jù)泄露攻擊的新方法。通過學(xué)習(xí)正常的網(wǎng)絡(luò)行為,并根據(jù)這種行為的偏差來檢測網(wǎng)絡(luò)威脅,人工智能再次證明了其能力,通過分析多個系統(tǒng)的事件和輸入,設(shè)計(jì)合適的事件響應(yīng)系統(tǒng),人工算法可以補(bǔ)充當(dāng)前的安全事件和事件管理(SIEM)系統(tǒng)。
在數(shù)據(jù)中心運(yùn)營中,經(jīng)常部署或從機(jī)架上移除IT設(shè)備,這會帶來大量零碎的資源,這些資源無法監(jiān)控或管理,很容易被浪費(fèi)。通過使用智能硬件和物聯(lián)網(wǎng)傳感器,人工智能允許有效的數(shù)據(jù)中心基礎(chǔ)設(shè)施管理軟件監(jiān)控?cái)?shù)據(jù)中心,并通過自動化技術(shù)減少重復(fù)性工作。在這里,數(shù)據(jù)中心管理人員可以自動執(zhí)行諸如溫度管理、設(shè)備狀態(tài)監(jiān)控、樓層安全、火災(zāi)隱患緩解、通風(fēng)和冷卻系統(tǒng)管理等活動。與預(yù)測分析相結(jié)合,自動化技術(shù)也有助于數(shù)據(jù)中心的預(yù)測性維護(hù)。
此外,這種基于人工智能的預(yù)測分析可以幫助數(shù)據(jù)中心將工作負(fù)載分布到組織的許多服務(wù)器上。因此,可以更有效地預(yù)測和管理數(shù)據(jù)中心負(fù)載。它還將有助于優(yōu)化服務(wù)器存儲系統(tǒng)、查找系統(tǒng)中可能出現(xiàn)的故障點(diǎn)、縮短處理時(shí)間,并更快地降低風(fēng)險(xiǎn)。
麻省理工學(xué)院的研究人員最近開發(fā)了一個人工智能系統(tǒng),可以自動學(xué)習(xí)如何在數(shù)千臺服務(wù)器上安排數(shù)據(jù)處理操作。根據(jù)觀察,在完成關(guān)鍵數(shù)據(jù)中心任務(wù)的高流量期間,處理速度是原來的兩倍。研究人員指出,這種人工智能系統(tǒng)可以使數(shù)據(jù)中心以更快的速度處理相同的工作負(fù)載,并使用更少的資源。
此外,通過深度學(xué)習(xí)(DL)應(yīng)用程序,人工智能可以提前預(yù)測故障和停機(jī)。例如HPE公司的人工智能預(yù)測引擎有助于識別和解決數(shù)據(jù)中心的瓶頸。根據(jù)一項(xiàng)對200家公司進(jìn)行的調(diào)查,全球的數(shù)據(jù)中心每年由于停機(jī)造成的損失超過265億美元,網(wǎng)絡(luò)停機(jī)每分鐘的成本約為7900美元。通過監(jiān)視服務(wù)器性能、網(wǎng)絡(luò)擁塞和磁盤利用率,人工智能可以檢測和預(yù)測數(shù)據(jù)中斷。此外,它還可以實(shí)施緩解策略,幫助數(shù)據(jù)中心從數(shù)據(jù)中斷中恢復(fù),從而提高客戶滿意度,并將此類中斷期間的損失降至最低。