人工智能算力及應(yīng)用

浪潮電子信息
人工智能芯片發(fā)展驅(qū)動力增強,未來發(fā)展前景廣闊:芯片產(chǎn)業(yè)不僅是信息產(chǎn)業(yè)的核心部分,也是國家信息安全的硬件保障。在政策支持以及資本推動等多重因素驅(qū)動下,人工智能芯片專利數(shù)量不斷增加,產(chǎn)業(yè)鏈和應(yīng)用場景持續(xù)完善擴充,人工智能芯片產(chǎn)業(yè)發(fā)展前景廣闊。

本文來自微信公眾號“工信頭條”,作者/浪潮電子信息產(chǎn)業(yè)股份有限公司。

1.png

中國算力規(guī)模,尤其是智能算力規(guī)模,正在高速增長。2021年中國智能算力規(guī)模達155.2百億億次每秒浮點運算(EFLOPS),2022年中國智能算力規(guī)模將達到268EFLOPS,預(yù)計2026年中國智能算力規(guī)模將進入每秒十萬億億次浮點計算(ZFLOPS)級別,達到1271.4EFLOPS。2021年中國通用算力規(guī)模達47.7EFLOPS,預(yù)計到2026年通用算力規(guī)模將達到111.3EFLOPS。2021—2026年期間,預(yù)計中國智能算力規(guī)模年復(fù)合增長率為52.3%,同期通用算力規(guī)模的年復(fù)合增長率為18.5%。伴隨人工智能算力需求的高速增長,建立健全助商惠民的數(shù)字基礎(chǔ)設(shè)施服務(wù)體系、推進算力基建化發(fā)展勢在必行。

本文即從算力基礎(chǔ)架構(gòu)層面,對人工智能芯片、服務(wù)器、計算架構(gòu)、算法,及應(yīng)用等方面的發(fā)展近況進行分析。

芯片:需求日益增長,發(fā)展空間廣闊

在中國,人工智能芯片產(chǎn)業(yè)發(fā)展體現(xiàn)出以下趨勢。

人工智能芯片發(fā)展驅(qū)動力增強,未來發(fā)展前景廣闊:芯片產(chǎn)業(yè)不僅是信息產(chǎn)業(yè)的核心部分,也是國家信息安全的硬件保障。在政策支持以及資本推動等多重因素驅(qū)動下,人工智能芯片專利數(shù)量不斷增加,產(chǎn)業(yè)鏈和應(yīng)用場景持續(xù)完善擴充,人工智能芯片產(chǎn)業(yè)發(fā)展前景廣闊。

不同類型人工智能芯片發(fā)展進度參差不齊:在面向人工智能領(lǐng)域的芯片中,用于終端產(chǎn)品的應(yīng)用層芯片發(fā)展較快,而用于云計算等領(lǐng)域的通用基礎(chǔ)層芯片發(fā)展則較為滯后。

人工智能芯片低能耗為大勢所趨:低功耗人工智能芯片是時代之需,這對實現(xiàn)數(shù)據(jù)中心的總功耗降低具有重要價值。此外,低功耗人工智能芯片也是實現(xiàn)邊緣智能的重要環(huán)節(jié),能滿足更多復(fù)雜、極端的邊緣側(cè)應(yīng)用場景的需求。

產(chǎn)業(yè)分工初成雛形,逐步完善生態(tài)建設(shè):企業(yè)面對多元化的算力和海量的數(shù)據(jù),期待技術(shù)創(chuàng)新可以為企業(yè)帶來活力。但由于芯片架構(gòu)繁雜,開發(fā)工具匱乏,系統(tǒng)軟件、應(yīng)用開發(fā)平臺配套少,應(yīng)用難以遷移,資源不能復(fù)用和共享等問題使得生態(tài)復(fù)雜離散。面對這樣的現(xiàn)狀,芯片技術(shù)廠商(含設(shè)計、制造、應(yīng)用等流程)應(yīng)聯(lián)合上下游廠商,建立技術(shù)生態(tài)系鏈條,加速人工智能場景的落地。

目前,中國大部分基礎(chǔ)芯片主要依靠國外廠商的供應(yīng),國產(chǎn)芯片廠商在全球產(chǎn)業(yè)鏈中不具有明顯優(yōu)勢。

服務(wù)器:中國市場領(lǐng)跑全球,綠色節(jié)能引領(lǐng)未來

人工智能服務(wù)器仍是人工智能市場增長的主力軍。IDC數(shù)據(jù)顯示,2021年全球人工智能服務(wù)器市場的同比增速超過全球整體人工智能市場的增速,是整體人工智能市場增長的推動力。

根據(jù)IDC數(shù)據(jù),2021年中國人工智能服務(wù)器市場規(guī)模達到59.2億美元,與2020年相比增長68.2%。其中,浪潮信息、新華三、寧暢、安擎、華為等諸多中國廠商正加速推動人工智能基礎(chǔ)設(shè)施產(chǎn)品的優(yōu)化更新,探索賦能技術(shù)升級,為人工智能技術(shù)的用戶帶來價值。IDC調(diào)研顯示,超過80%的中國企業(yè)將在未來一年持續(xù)增加人工智能服務(wù)器的投資規(guī)模,中國人工智能服務(wù)器市場將在未來五年保持穩(wěn)定增長,預(yù)計到2026年,中國人工智能服務(wù)器市場規(guī)模將達到123.4億美元。

從工作負載角度而言IDC認為,企業(yè)將更多地使用人工智能服務(wù)器處理推理工作負載。伴隨企業(yè)人工智能應(yīng)用成熟度逐步遞增,企業(yè)將把精力更多從人工智能訓(xùn)練轉(zhuǎn)移到人工智能推理工作負載上,這意味著人工智能模型將逐步進入廣泛投產(chǎn)模式,這將對企業(yè)的人工智能基礎(chǔ)設(shè)施規(guī)劃帶來影響,企業(yè)需要更好地制定運營支出規(guī)劃,提升服務(wù)器利用率。據(jù)IDC數(shù)據(jù),2021年中國數(shù)據(jù)中心用于推理的服務(wù)器的市場份額占比已經(jīng)過半,達到57.6%,預(yù)計到2026年,用于推理的工作負載將達到62.2%。

從部署位置而言,產(chǎn)業(yè)側(cè)對于低時延人工智能服務(wù)應(yīng)用需求遞增。相較于科研、重型產(chǎn)業(yè)能夠通過大模型、高密度人工智能計算滿足需求的場景,便捷、低時延的人工智能應(yīng)用場景愈發(fā)普遍。越來越多的數(shù)據(jù)將在邊緣位置進行收集、分析等操作,并可被移動到數(shù)據(jù)中心以進行進一步價值挖掘。越來越多的企業(yè)將構(gòu)建跨本地數(shù)據(jù)中心、云、邊緣的全鏈路人工智能基礎(chǔ)設(shè)施,形成一個包括數(shù)據(jù)收集、分析、匯總和存儲等所有環(huán)節(jié)的人工智能戰(zhàn)略。

綠色節(jié)能化發(fā)展:人工智能服務(wù)器將朝著綠色節(jié)能的方向發(fā)展,實現(xiàn)低功耗、高效率的計算。

計算架構(gòu):以系統(tǒng)創(chuàng)新為基礎(chǔ),支持多元算力發(fā)展

在通用算力技術(shù)演進節(jié)奏放緩的大背景下,針對特定問題或特定領(lǐng)域來定義計算架構(gòu)成為市場的普遍訴求,基于DSA(Domain-Specific Architectures,特定領(lǐng)域架構(gòu))思想設(shè)計的人工智能芯片,在特定人工智能工作負載上表現(xiàn)出遠超通用芯片的處理能力,大大推動了人工智能芯片的多元化發(fā)展,并為產(chǎn)業(yè)AI化的加速提供了重要的產(chǎn)業(yè)基礎(chǔ)和更加豐富的選擇。

然而,多元算力從“能用”到“好用”并且為企業(yè)創(chuàng)造業(yè)務(wù)價值,還有比較長的路要走,尤其是以百花齊放的AI算力芯片為核心,打造出一個通用性強、綠色高效、安全可靠的計算系統(tǒng),對于推動人工智能技術(shù)普及應(yīng)用至關(guān)重要。

在系統(tǒng)層面,由于人工智能芯片發(fā)展呈現(xiàn)多元化趨勢,各廠商采用不同技術(shù)路線,產(chǎn)業(yè)面臨硬件體系孤島和生態(tài)割裂問題。加速人工智能技術(shù)產(chǎn)業(yè)發(fā)展,系統(tǒng)級產(chǎn)品創(chuàng)新是關(guān)鍵——在基礎(chǔ)硬件、基礎(chǔ)軟件、核心應(yīng)用、上層生態(tài)間建立起統(tǒng)一的技術(shù)路線及標準API接口,將加速器模塊標準化,簡化人工智能基礎(chǔ)架構(gòu)設(shè)計,縮短硬件開發(fā)和產(chǎn)業(yè)賦能的周期。

在異構(gòu)協(xié)議層面,為了提高CPU與多元算力芯片間的數(shù)據(jù)傳輸效率,業(yè)內(nèi)在互聯(lián)技術(shù)方面展開了新的探索,近年涌現(xiàn)了一系列新興的互連協(xié)議標準,包括QPIUPI、CXL、GenZ、CCIX等,其中浪潮信息研發(fā)了支持CXL高速總線的智能加速器F26A,與傳統(tǒng)的PCIe、DMA方式相比,CPU與加速器之間的平均數(shù)據(jù)訪問延遲降低80%,同時可擴展2倍的內(nèi)存容量。

在跨節(jié)點層面,節(jié)點之間的網(wǎng)絡(luò)通信所產(chǎn)生的RPC、協(xié)議處理、內(nèi)存拷貝、壓縮會占用30%左右的CPU資源,成為數(shù)據(jù)中心級的“通信稅”。業(yè)內(nèi)嘗試通過智能網(wǎng)卡卸載計算密集型業(yè)務(wù),將NVMe-oF、無損網(wǎng)絡(luò)能力等功能遷移到智能網(wǎng)卡上由專有硬件負責處理,能夠提升通信性能并降低CPU占用率。通過智能數(shù)據(jù)處理單元和高速網(wǎng)絡(luò)形成分布式互連交換,可實現(xiàn)CPU與各種加速芯片的算力協(xié)同以及內(nèi)存池化、新型存儲池化,節(jié)點間的數(shù)據(jù)訪問延遲可低至亞微秒級別。

云服務(wù):市場規(guī)模穩(wěn)步提升,算力設(shè)施提供強力支撐

云計算的出現(xiàn)為企業(yè)提供更豐富的算力支持。通過AIaaS(AI即服務(wù))提供AI平臺和AI服務(wù),因其快速的產(chǎn)品迭代能力和豐富的場景化人工智能能力,越來越被用戶接受。

在圖像視頻領(lǐng)域,視頻結(jié)構(gòu)化、多模態(tài)人工智能等技術(shù)的創(chuàng)新促進了該領(lǐng)域市場增長。公有云廠商一方面通過視覺開放平臺輸出圖像視頻領(lǐng)域的人工智能能力,另一方面則專注于開發(fā)基于場景的解決方案。在自然語言處理方面,2021年NLP市場較2020年實現(xiàn)了126.9%的增長;在技術(shù)方面,得益于大型模型的推廣;在市場方面,與應(yīng)用場景的發(fā)展(如機器翻譯、文檔處理、智能寫作等)息息相關(guān)。同時,智能語音公有云服務(wù)市場已經(jīng)實現(xiàn)了高增長,2021年市場規(guī)模較2020年增長52.3%,目前已進入應(yīng)用場景深化階段。智能客服、客服質(zhì)量控制、客服數(shù)據(jù)分析、智能營銷等應(yīng)用推動了對話式人工智能的市場增長,2021年較2020年增長109.6%。

算法模型:加速大模型行業(yè)落地,助力實體經(jīng)濟發(fā)展

大模型是在智算算力驅(qū)動下最為典型的重大創(chuàng)新之一。得益于模型泛化能力強、長尾數(shù)據(jù)的低依賴性,以及下游模型使用效率的提升,大模型被認為具備了“通用智能”的雛形,并成為業(yè)內(nèi)探索實現(xiàn)普惠人工智能的重要途徑之一。

從算力的視角看,語言類、視覺類模型容量和相應(yīng)的算力需求都在快速擴大。如果用“算力當量”(PetaFlopss-day,PD),即每秒千萬億次的計算機完整運行一天消耗的算力總量,來對人工智能任務(wù)所需算力總量進行度量,AI+Science領(lǐng)域的AlphaFold2、自動駕駛系統(tǒng)、GPT-3等模型訓(xùn)練需要幾百甚至幾千PD的算力支持,如GPT-3訓(xùn)練需要3640PD的算力。

大模型的發(fā)展同樣給算力帶來巨大的挑戰(zhàn)。大模型訓(xùn)練的計算和存儲資源開銷之大,對加速計算系統(tǒng)和人工智能軟件棧都有很高的要求,訓(xùn)練千億、萬億模型動輒需要上千塊加速卡,對大模型的推廣和普惠帶來了很大的挑戰(zhàn)。同時,受限于邊際遞減效應(yīng),模型復(fù)雜度與精度的進一步提升將會需要更大比例的計算資源開銷,對計算效率問題的顧慮會限制大模型參數(shù)規(guī)模的持續(xù)擴張。

1.png

在學(xué)術(shù)界,除了對預(yù)訓(xùn)練大模型進行性能優(yōu)化,有大量研究集中在提升大模型的落地能力上,包括降低模型在預(yù)訓(xùn)練、適配下游任務(wù)和推理過程中的算力開銷,通過模型壓縮、剪枝、蒸餾等方式加快模型部署效率。

在工業(yè)界,互聯(lián)網(wǎng)企業(yè)推動自研大模型在電子商務(wù)、社交網(wǎng)絡(luò)、搜索引擎、廣告推薦等重點業(yè)務(wù)場景落地,并將內(nèi)部大模型部署的成功經(jīng)驗固化為預(yù)訓(xùn)練平臺,以標準化服務(wù)的形式將預(yù)訓(xùn)練模型的能力下沉到各行各業(yè),通過集中式的數(shù)據(jù)和算力開發(fā)模式提供平臺黏性,以期實現(xiàn)人工智能普惠化目標。加速硬件供應(yīng)商提供分布式加速計算集群解決方案,通過并行算法與計算資源的合理匹配,提升加速計算集群整體利用率和大模型的訓(xùn)練效率,并優(yōu)化推理加速庫,以最少的計算資源達到最好的推理服務(wù)速度。

生態(tài):推進產(chǎn)業(yè)化布局,發(fā)揮平臺價值

對于人工智能產(chǎn)業(yè),快速將創(chuàng)新要素轉(zhuǎn)化為物質(zhì)或知識資本,并形成規(guī)模效應(yīng)和范圍效應(yīng),關(guān)鍵在于協(xié)同創(chuàng)新平臺的搭建。近年來,包括政府、企業(yè)、科研機構(gòu)都在嘗試構(gòu)建人工智能協(xié)同創(chuàng)新平臺,聚焦當前階段產(chǎn)業(yè)AI化的落地應(yīng)用需求,平臺的存在可以更快實現(xiàn)人工智能生態(tài)伙伴的業(yè)務(wù)聚合、資源聚合和戰(zhàn)略聚合,平臺內(nèi)的各方主體以人工智能算力輸出、服務(wù)能力優(yōu)化,及人才培養(yǎng)等層面的要素供給,達成產(chǎn)業(yè)鏈上下游的通力合作形態(tài),以生態(tài)聚合成就行業(yè)用戶。

標準化是技術(shù)規(guī)模化應(yīng)用的必要前提,但對于目前的人工智能技術(shù)及基礎(chǔ)架構(gòu)來說,定制化的工作量依然很大,主要集中在多元人工智能芯片適配,人工智能算力資源管理和調(diào)度,數(shù)據(jù)整合及加速,深度學(xué)習(xí)開發(fā)環(huán)境部署等各個方面。

近年來,包括公有云廠商和服務(wù)器廠商,都在推出具有標準服務(wù)能力的人工智能異構(gòu)計算平臺和算力、算法一體化的新型基礎(chǔ)設(shè)施,一方面布局建設(shè)智算中心,統(tǒng)籌算力的生產(chǎn)、聚合、調(diào)度和釋放,為傳統(tǒng)行業(yè)數(shù)字化轉(zhuǎn)型、區(qū)域產(chǎn)業(yè)升級和基礎(chǔ)科學(xué)研究等需求提供算力服務(wù)、數(shù)據(jù)服務(wù)和算法服務(wù);另一方面從定制化DSA芯片、人工智能計算系統(tǒng)、高速互聯(lián)網(wǎng)絡(luò)、大吞吐低時延并行文件系統(tǒng)、人工智能增強容器調(diào)度等層面,輸出多年技術(shù)沉淀和實踐經(jīng)驗,為多樣化人工智能場景提供軟硬一體解決方案。

應(yīng)用:場景化落地縱深發(fā)展,加速智算力向創(chuàng)新力轉(zhuǎn)化

對于宏觀層面而言,人工智能算力為國家創(chuàng)造力的發(fā)展帶來實質(zhì)性推進。

創(chuàng)新環(huán)境。如“十四五”規(guī)劃所講,人工智能已然成為“事關(guān)國家安全和發(fā)展全局的基礎(chǔ)核心領(lǐng)域”,所以中國將持續(xù)瞄準前沿領(lǐng)域的發(fā)展,補足自身在人工智能基礎(chǔ)理論研究、算法研究、芯片研發(fā)、原創(chuàng)性模型及框架的研發(fā)與迭代等方面存在的短板和劣勢,加速人工智能單點技術(shù)的研究和創(chuàng)新,以政策支持、行業(yè)落地和企業(yè)推進為支撐點,加速相關(guān)產(chǎn)業(yè)的發(fā)展和人才培養(yǎng)。

創(chuàng)新科研。作為創(chuàng)新的原動力,科學(xué)研究是人類發(fā)展和社會變革最主要的推動力量。隨著人工智能技術(shù)的快速發(fā)展,人工智能不僅在應(yīng)用科學(xué)的突破上發(fā)揮了重要作用,也開始滲透到基礎(chǔ)科學(xué)領(lǐng)域,極大提高了科學(xué)研究的效率,并加速科學(xué)發(fā)展的進程,包括生命科學(xué)、數(shù)學(xué)、化學(xué)等多個領(lǐng)域。人工智能算力的重要性不言而喻。與行業(yè)應(yīng)用不同的是,人工智能在科研領(lǐng)域所需要的數(shù)據(jù)精準度更高、模型更復(fù)雜,對于算力需求也更大。因此,人工智能算力、算法、數(shù)據(jù)和平臺的結(jié)合能夠為科研創(chuàng)新發(fā)揮更大的作用。

創(chuàng)新產(chǎn)業(yè)。據(jù)工信部數(shù)據(jù),目前,中國人工智能核心產(chǎn)業(yè)規(guī)模超過4000億元,企業(yè)數(shù)量超過3000家,領(lǐng)軍龍頭企業(yè)覆蓋無人機、語音識別、圖像識別、智能機器人、智能汽車、可穿戴設(shè)備、虛擬現(xiàn)實等諸多領(lǐng)域,已經(jīng)在智能芯片、開源框架等關(guān)鍵核心技術(shù)取得重要突破。根據(jù)美國斯坦福大學(xué)《2021年人工智能(AI)指數(shù)報告》,中國在2021年提交了全球一半以上的人工智能專利申請,2021年全球約三分之一的人工智能期刊論文和人工智能引用是由中國研究人員所貢獻。

對于企業(yè)而言,人工智能算力可為企業(yè)帶來切實的創(chuàng)新成效。

根據(jù)IDC針對企業(yè)應(yīng)用人工智能現(xiàn)狀調(diào)研發(fā)現(xiàn),企業(yè)利用人工智能應(yīng)用獲得了顯著收益,尤其是在研發(fā)速度和流程的創(chuàng)新,產(chǎn)品和服務(wù)的創(chuàng)新,以及決策制定的創(chuàng)新等維度。

研發(fā)速度和流程:根據(jù)IDC針對企業(yè)應(yīng)用人工智能及算力現(xiàn)狀調(diào)研發(fā)現(xiàn),目前借助人工智能,資源利用率平均提升12%,員工生產(chǎn)和研發(fā)效率增加8%。

產(chǎn)品和服務(wù):人工智能在為企業(yè)開發(fā)更多定制化和精細化產(chǎn)品與服務(wù)方面帶來顯著支撐,未來三年,有望在提高資產(chǎn)利用率、降低人力需求等方面獲得更顯著收益。

決策制定:人工智能為企業(yè)帶來更豐富、及時的信息,為企業(yè)決策者提供敏銳洞察,可顯著提升決策的速度和質(zhì)量,輔助企業(yè)處理復(fù)雜的不確定性,占領(lǐng)市場先機,創(chuàng)造價值。從技術(shù)的行業(yè)應(yīng)用而言,創(chuàng)新應(yīng)用場景逐步增多。除了相對成熟的應(yīng)用場景之外,物流、制造、能源、公共事業(yè)和農(nóng)業(yè)等在人工智能的應(yīng)用方面得到快速發(fā)展,創(chuàng)新應(yīng)用場景逐步增多。

算力是數(shù)字經(jīng)濟時代的核心生產(chǎn)力,以人工智能為首的新興技術(shù)應(yīng)用在數(shù)字經(jīng)濟發(fā)展中起到了重要的作用,用于支撐人工智能應(yīng)用的智能算力決定了創(chuàng)新力的實現(xiàn)。不管是新型場景還是成熟場景,對算力都提出了極大的挑戰(zhàn),率先布局智能算力的企業(yè)將在未來競爭中獲得優(yōu)勢。

來源:中國工業(yè)和信息化

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論