本文來(lái)自微信公眾號(hào)“大數(shù)據(jù)分析和應(yīng)用”,作者/于澗。
大模型是指參數(shù)量非常大的深度學(xué)習(xí)模型,通常用于處理大規(guī)模數(shù)據(jù)集,并能夠?qū)W習(xí)到數(shù)據(jù)的復(fù)雜特征。
大模型的出現(xiàn),極大地提升了人工智能的能力,并在語(yǔ)音識(shí)別、圖像處理、自然語(yǔ)言處理等領(lǐng)域取得了顯著成果。
在大模型的訓(xùn)練過(guò)程中,需要使用大量的數(shù)據(jù)和計(jì)算資源,并且需要花費(fèi)很長(zhǎng)時(shí)間來(lái)訓(xùn)練模型。因此,大模型通常需要使用高性能計(jì)算機(jī)和大規(guī)模計(jì)算集群來(lái)進(jìn)行訓(xùn)練。同時(shí),大模型也需要使用各種優(yōu)化算法和技術(shù)來(lái)加速訓(xùn)練過(guò)程和提高模型的準(zhǔn)確率。
大模型的應(yīng)用非常廣泛,例如在自然語(yǔ)言處理領(lǐng)域中,大模型可以用于機(jī)器翻譯、文本生成、對(duì)話系統(tǒng)等任務(wù);在圖像處理領(lǐng)域中,大模型可以用于圖像分類、目標(biāo)檢測(cè)、圖像生成等任務(wù);在語(yǔ)音識(shí)別領(lǐng)域中,大模型可以用于語(yǔ)音識(shí)別、語(yǔ)音合成、語(yǔ)音轉(zhuǎn)換等任務(wù)。
如今全球算力市場(chǎng)正處于結(jié)構(gòu)性調(diào)整重要階段。
與2022年相比,2023年算力產(chǎn)業(yè)突出表現(xiàn)為智能計(jì)算需求暴增,帶動(dòng)AI服務(wù)器等產(chǎn)業(yè)快速增長(zhǎng)。
這使得智能算力需求異軍突起,計(jì)算技術(shù)體系全面升級(jí)。
智能計(jì)算成為計(jì)算技術(shù)創(chuàng)新發(fā)展主線條。
因此,以大模型和大數(shù)據(jù)為代表的智能計(jì)算需求驅(qū)動(dòng)計(jì)算芯片、互聯(lián)網(wǎng)絡(luò)和內(nèi)存技術(shù)、開(kāi)發(fā)框架和軟件棧加速突破創(chuàng)新。
據(jù)信通院數(shù)據(jù)統(tǒng)計(jì),如今全球算力規(guī)??焖僭鲩L(zhǎng),智能算力占比突破60%。
2023年全球計(jì)算設(shè)備算力規(guī)模為1369EFlops,我國(guó)達(dá)450EFlops,全球占比三分之一,增速近50%。
五年來(lái)全球算力結(jié)構(gòu)發(fā)生革命性變化,智能算力占比由10%左右增長(zhǎng)至60%以上,年均增速超100%。
在算力的持續(xù)發(fā)展背景下,AI大模型能力也得到了持續(xù)躍升,構(gòu)筑了智能化新底座。
如今大模型能力飛速提升從單模態(tài)感知到多模態(tài)認(rèn)知,主要有以下三大方向:
方向一:
符合人類認(rèn)知的生成能力。
GPT-4一次性讀取300頁(yè)文本內(nèi)容實(shí)現(xiàn)圖文理解與生成,知識(shí)庫(kù)更新至23年4月,對(duì)齊人類意圖。
方向二:
突破典型通用智能任務(wù)。
谷歌Gemini首次在MMLU(多任務(wù)理解)測(cè)評(píng)基準(zhǔn)以90.0%準(zhǔn)確率超越人類專家水平89.8%
方向三:
開(kāi)放環(huán)境交互與主動(dòng)學(xué)習(xí)。
RT-2具身智能讓機(jī)器人接入大模型,零預(yù)訓(xùn)練完成復(fù)雜指令。
與此同時(shí),大模型平臺(tái)化趨勢(shì)日益凸顯,大模型應(yīng)用開(kāi)發(fā)平臺(tái)降低用戶開(kāi)發(fā)門(mén)檻,提升落地流程自動(dòng)化能力。
開(kāi)源工具也在基于LLM構(gòu)建端到端應(yīng)用的開(kāi)源框架工具。
中國(guó)信通院副院長(zhǎng)王志勤總結(jié)道:
大模型應(yīng)用生態(tài)正在形成從人機(jī)交互到智慧應(yīng)用新生態(tài)。
大模型正在以愈發(fā)豐富的應(yīng)用形態(tài)和更加易用的使用方式深入賦能生產(chǎn)生活,并正在塑造基于大模型的智慧底座新生態(tài)。
基于智算的廣闊前景,全球行業(yè)巨頭也在蜂擁智能計(jì)算賽道。
先進(jìn)計(jì)算核心企業(yè)加快智能計(jì)算產(chǎn)品端到端體系化布局,搶占產(chǎn)業(yè)生態(tài)主導(dǎo)權(quán)。
AI芯片企業(yè)向上層云、算力服務(wù)及大模型拓展,云平臺(tái)及AI企業(yè)向底層芯片滲透。