流媒體帶寬壓力大,視頻云的脫困之法

由于4K以上的超高清視頻原始數(shù)據(jù)過大,對網(wǎng)絡(luò)傳輸帶寬和存儲都會造成巨大的壓力,所以我們需要更高效的視頻編解碼技術(shù),諸如H.265、AV1等。但為了更高效地實現(xiàn)理想的壓縮率,我們必須要依仗編解碼的軟硬件優(yōu)化,這也是各大云服務(wù)平臺加大相關(guān)投入的一大原因。

本文來自微信公眾號“電子發(fā)燒友網(wǎng)”,文/周凱揚。

由于4K以上的超高清視頻原始數(shù)據(jù)過大,對網(wǎng)絡(luò)傳輸帶寬和存儲都會造成巨大的壓力,所以我們需要更高效的視頻編解碼技術(shù),諸如H.265、AV1等。但為了更高效地實現(xiàn)理想的壓縮率,我們必須要依仗編解碼的軟硬件優(yōu)化,這也是各大云服務(wù)平臺加大相關(guān)投入的一大原因。

亞馬遜Graviton

亞馬遜作為全球最大的云服務(wù)廠商,過去在面對視頻編解碼的負載時主要使用英特爾的至強系列處理器,利用其AVX指令等矢量處理功能來加速視頻處理。而亞馬遜在推出自研CPU Graviton系列之后,就開始探索用Arm處理器和軟件來完成高清視頻的編碼任務(wù)。

360截圖16251112669372.png

Graviton 3 CPU/亞馬遜

自2021年以來,開源H.265編碼器libx265獲得了相當多的優(yōu)化,尤其是對Arm的Neon指令做了優(yōu)化.像亞馬遜Graviton 2這樣基于Arm Neoverse架構(gòu)的平臺,都可以通過其支持的Neon指令來加速編碼效率。

根據(jù)亞馬遜給出的數(shù)據(jù),與基于x86 CPU的C6i實例相比,基于Graviton 3的C7g實例在H.264編碼性能上提升了63%,在H.265編碼性能上提升了60%,與此同時還將成本降低了20%左右。Graviton CPU在高并發(fā)下的性能也允許將4K視頻同時編碼成不同分辨率,以滿足不同設(shè)備的觀看需求。

平頭哥倚天710

面對阿里云在音視頻領(lǐng)域日益劇增的需求,平頭哥選擇了用軟硬結(jié)合+自研編碼內(nèi)核的方式來解決。2021年,平頭哥發(fā)布了倚天710這顆基于ARMv9架構(gòu)5nm工藝的CPU,核心數(shù)多達128顆,主頻最高3.2GHz。

360截圖16251112669372.png

倚天710 CPU/平頭哥

阿里云也基于這一CPU打造了倚天ECS,借其算力和功耗優(yōu)勢來賦能視頻云轉(zhuǎn)碼業(yè)務(wù),并對阿里自研的HEVC、AVC編碼器s265、s264編碼器進行了深度的優(yōu)化。比如在高并發(fā)的視頻編解碼任務(wù)下,倚天710也不會大幅降頻,從而維持高性能運轉(zhuǎn)。

而相比之下,基于x86架構(gòu)的CPU在高并發(fā)的情況下,就會為了控制功耗而選擇降頻,從而影響了單核的編解碼性能。目前阿里云也已經(jīng)將ECS部署在視頻云點播上,大幅提升編碼性能的同時,還些許提高了壓縮率,實現(xiàn)了成本與效率雙贏,滿足視頻云生態(tài)的高清化普及。

更復(fù)雜的H.266

最后我們再來看看2020年推出的VVC編碼,也就是H.266編碼。H.266相較于H.265,壓縮效率提高了50%,但編碼的復(fù)雜程度也提升了近十倍。騰訊在H.266第一版標準確定后不久,就已經(jīng)推出了經(jīng)過優(yōu)化的266解碼器,并針對Arm平臺做了優(yōu)化,可靠單核解碼1080p,多核實現(xiàn)4K串流。

2021年7月,騰訊云宣布商用H.266編解碼標準,其轉(zhuǎn)碼和媒體處理應(yīng)用將支持H.266,播放器和其他產(chǎn)品將支持H.266解碼,幫助用戶節(jié)省空間和帶寬的同時保證視頻質(zhì)量,這也使其成了首個支持H.266標準的云服務(wù)廠商。

但無論是云端還是終端,支持H.266硬件編解碼的芯片并不多,已知的有聯(lián)發(fā)科的Pentonic 2000/1000/700電視芯片以及瑞昱的RTD1319D機頂盒芯片,至于軟件編解碼的方案在效率上肯定是難以與硬件方案比肩的。

問題在于目前H.266尚沒有獲得大規(guī)模普及,就像當年的H.265一樣。H.265推出不久,硬件加速解碼并沒有完全普及,且因為授權(quán)限制不少公司沒法提供軟件支持,但如今H.265帶來的體積和畫質(zhì)優(yōu)勢。

小結(jié)

從主流流媒體平臺來看,AV1、HEVC、AVC三者仍會是短期內(nèi)的首選,但如果視頻內(nèi)容生態(tài)逐漸轉(zhuǎn)向8K、120FPS這樣的超高規(guī)格,效率更高的H.266將成為最理想的編碼,也會催生出一批新的編解碼硬件。

至于視頻直播應(yīng)用,最適合的還是Xilinx Alveo加速卡或英偉達GPU這樣的方案,因為這種場景追求的還是低延遲傳輸高質(zhì)量圖像。CPU的軟件編解碼方案雖然靈活性更高,但在實時傳輸上還是稍遜一籌,作為視頻流媒體網(wǎng)站離線編解碼的高性價方案倒是很合適。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論