在當(dāng)前的大型視頻運(yùn)維過(guò)程中,CDN故障硬盤(pán)的置換是一個(gè)大問(wèn)題。為了避免軟件和硬件風(fēng)險(xiǎn),提高數(shù)據(jù)中心管理效率并制定合理的數(shù)據(jù)備份和遷移計(jì)劃,業(yè)內(nèi)主要的主流IT公司已開(kāi)始進(jìn)行硬盤(pán)故障預(yù)測(cè)的研究工作。
相關(guān)學(xué)者認(rèn)為,借助這種預(yù)測(cè)技術(shù),可以大大提高服務(wù)/存儲(chǔ)系統(tǒng)的整體可用性。稍后將介紹基于機(jī)器學(xué)習(xí)的CDN硬盤(pán)故障預(yù)測(cè)的示例。工業(yè)領(lǐng)域中硬盤(pán)狀態(tài)監(jiān)視和故障警告技術(shù)的事實(shí)上的標(biāo)準(zhǔn)是自我監(jiān)視分析和報(bào)告技術(shù)(SMART)。根據(jù)科學(xué)研究,硬盤(pán)的某些屬性值(例如溫度和讀取錯(cuò)誤率)與硬盤(pán)是否發(fā)生故障有一定關(guān)系。如果檢測(cè)到的屬性值超過(guò)預(yù)設(shè)閾值,將發(fā)出警報(bào)。但是,硬盤(pán)制造商估計(jì),這種基于閾值的算法只能實(shí)現(xiàn)3%至10%的故障預(yù)測(cè)準(zhǔn)確率和較低的預(yù)警率。
學(xué)術(shù)界和工業(yè)界已經(jīng)通過(guò)使用機(jī)器學(xué)習(xí)方法提高了SMART硬盤(pán)故障預(yù)測(cè)的準(zhǔn)確性,并取得了一定的成果,但是受數(shù)據(jù)集大小的限制,用現(xiàn)有方法實(shí)現(xiàn)的預(yù)測(cè)模型仍然遠(yuǎn)遠(yuǎn)不能期望。近年來(lái),在越來(lái)越多的制造商的關(guān)注下,基于SMART檢測(cè)數(shù)據(jù)的硬盤(pán)故障預(yù)測(cè)研究已應(yīng)用于大規(guī)模工業(yè)數(shù)據(jù)集的研究中,這反映在硬盤(pán)規(guī)模的快速增長(zhǎng)和硬盤(pán)的快速發(fā)展上。抽樣工作正規(guī)化。在這些高質(zhì)量,大規(guī)模數(shù)據(jù)的支持下,基于SMART檢查數(shù)據(jù)的故障預(yù)測(cè)水平得到了顯著提高。
在大視頻的運(yùn)維中,基于SMART數(shù)據(jù)的硬盤(pán)故障預(yù)測(cè),采用了基于旋轉(zhuǎn)森林的集成預(yù)測(cè)模型解決方案。過(guò)程如下
在當(dāng)前的信息和通信技術(shù)(ICT)時(shí)代,運(yùn)營(yíng)商網(wǎng)絡(luò)和業(yè)務(wù)系統(tǒng)的支持需要加快人工智能技術(shù)的實(shí)施,以提供高度自動(dòng)化和智能的運(yùn)維解決方案。在大視頻的運(yùn)維中,人工智能和機(jī)器學(xué)習(xí)技術(shù)的智能推廣的關(guān)鍵點(diǎn)是運(yùn)維模式已經(jīng)從被動(dòng)的事后分析變?yōu)橹鲃?dòng)的預(yù)測(cè),分析和決策。
隨著人工智能技術(shù)的加速發(fā)展,大視頻運(yùn)維與人工智能技術(shù)的融合將越來(lái)越緊密。大型視頻運(yùn)維技術(shù)將朝著更加智能的方向發(fā)展,實(shí)現(xiàn)更加自動(dòng)化,準(zhǔn)確的故障預(yù)測(cè)和故障排除,并主動(dòng)發(fā)現(xiàn)和修復(fù)業(yè)務(wù)系統(tǒng)中的故障或薄弱環(huán)節(jié)。在實(shí)現(xiàn)智能運(yùn)維的基礎(chǔ)上,通過(guò)對(duì)視頻業(yè)務(wù)用戶(hù)的行為分析,家庭和用戶(hù)畫(huà)像等進(jìn)行一系列建模和分析,充分挖掘海量數(shù)據(jù)的價(jià)值,推導(dǎo)新的業(yè)務(wù)形式,智能操作系統(tǒng)為運(yùn)營(yíng)商創(chuàng)造新的商機(jī)。