本文來(lái)自微信公眾號(hào)“IDC咨詢”。
近日OpenAI陸續(xù)發(fā)布ChatGPT,GPT-4,引發(fā)了AI界的全民狂歡,文生圖類應(yīng)用如StableDiffusion、Midjourney以及DALL·E2也開始快速流行。百度則于3月16日召開文心一言發(fā)布會(huì),展示了中國(guó)廠商的大模型以及生成式AI能力。
至此,人工智能市場(chǎng)正式開啟了全新的時(shí)代——大模型驅(qū)動(dòng)的AI時(shí)代。
大模型、ChatGPT以及AIGC的關(guān)系
IDC定義的AI應(yīng)用均是指基于機(jī)器學(xué)習(xí)算法的AI決策系統(tǒng)。大模型則是指讀取海量數(shù)據(jù)、參數(shù)規(guī)模巨大的算法模型。業(yè)界一般認(rèn)為超過(guò)千億級(jí)參數(shù)即為大模型,其訓(xùn)練過(guò)程中可能使用了上千張以上的GPU/CPU芯片。ChatGPT與AIGC均為大模型的應(yīng)用場(chǎng)景之一。ChatGPT可以類比原有的對(duì)話式AI應(yīng)用、AI賦能的搜索類應(yīng)用。AIGC則可以分為生成文本、生成圖像、生成視頻,也可以歸為大模型的應(yīng)用場(chǎng)景之一。
GPT-4為代表的大模型的變革所在
OpenAI自發(fā)布GPT1.0模型之后,一直在持續(xù)迭代,陸續(xù)發(fā)布GPT2.0、GPT3.0和GPT 3.5,本次發(fā)布GPT4.0是其持續(xù)投入AI大模型的必然階段。相比前幾個(gè)模型,GPT-4的參數(shù)量更大,模型迭代時(shí)間更長(zhǎng),也能夠給出更準(zhǔn)確的結(jié)果。IDC認(rèn)為,新版本的發(fā)布是大模型循序漸進(jìn)發(fā)展的必然成果。正如百度集團(tuán)首席執(zhí)行官李彥宏所說(shuō):“公司每一年都會(huì)發(fā)布大模型的新版本,是多年努力的自然延續(xù)”。
ChatGPT可能帶來(lái)的產(chǎn)業(yè)影響
ChatGPT實(shí)質(zhì)是對(duì)話式AI的應(yīng)用,對(duì)話式AI的落地已經(jīng)非常廣泛。根據(jù)IDC追蹤的人工智能市場(chǎng)規(guī)模數(shù)據(jù),對(duì)話式AI市場(chǎng)規(guī)模在2022年達(dá)到54.6億元人民幣,其市場(chǎng)滲透率相對(duì)已經(jīng)飽和。ChatGPT引發(fā)的浪潮促使主流廠商在其對(duì)話式AI應(yīng)用中引入大模型,將帶動(dòng)對(duì)話AI相關(guān)市場(chǎng)新一輪增長(zhǎng)。此外,在搜索、營(yíng)銷場(chǎng)景中,ChatGPT類型的應(yīng)用則可能衍生出全新的產(chǎn)品形態(tài)。
市面上可用的產(chǎn)品
關(guān)于AIGC,除了大眾所熟知的StableDiffusion,Midjourney以及DALL·E2之外,也有些商業(yè)公司對(duì)此提供云端支持。目前亞馬遜云科技通過(guò)IndustryAI以及SageMaker提供了Stable Diffusion的支持。百度的文心一言已于3月16日開啟邀測(cè),提供文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯的推算、自然語(yǔ)言理解以及多模態(tài)生成五大功能。此外,還有很多數(shù)字人的公司也采用了AIGC相關(guān)技術(shù)。從技術(shù)的角度,當(dāng)前市面上的產(chǎn)品大多只能做到文生圖,文生視頻類產(chǎn)品的發(fā)布則還需要時(shí)間,值得期待。
關(guān)于大模型,在開源社區(qū)已經(jīng)發(fā)布的大模型之外,目前提供商用的大模型包括微軟Azure上整合的GPT大模型、百度智能云以及百度飛槳支持的文心大模型、華為云盤古大模型、阿里云M6大模型。由本土廠商研發(fā)的大模型,大多支持本地化部署。
引發(fā)的AI行業(yè)變革
過(guò)去幾年部署的AI應(yīng)用,接下來(lái)幾年都有可能被基于大模型的AI所替代。升級(jí)迭代可能會(huì)從優(yōu)先具備海量數(shù)據(jù)的場(chǎng)景開始。當(dāng)大模型支撐的AI應(yīng)用成為主流,不能利用大模型能力的廠商將失去競(jìng)爭(zhēng)優(yōu)勢(shì)。
未來(lái)的工作中,AI助理將替代更多人類的工作。諸如文生圖的應(yīng)用,諸如各領(lǐng)域初級(jí)內(nèi)容的搜索,均可以借助AI生成的內(nèi)容。
可能的投資規(guī)模
目前已經(jīng)公開的大模型諸如GPT系列、Bert系列所耗費(fèi)的算力根據(jù)公開資料可以查到。而真正落地到產(chǎn)業(yè)界,具體的投資規(guī)模要視應(yīng)用場(chǎng)景決定。投資成本與所需的算力,是否部署完整的大模型,以及要推理的數(shù)據(jù)流量相關(guān)。
帶動(dòng)的市場(chǎng)機(jī)會(huì)
純AI算力市場(chǎng):在這一波AI熱潮中最先最直接受益的即AI算力提供商,包括芯片廠商、AI服務(wù)器廠商,以及支撐大模型訓(xùn)練和推理的AI算力云服務(wù)商。
大模型與算力的結(jié)合:即AIaaS+AIPaaS。為市場(chǎng)提供大模型與算力結(jié)合后高度優(yōu)化的方案,以幫助用戶降低硬件使用門檻、提高開發(fā)效率、降低整體投資成本。典型的解決方案如百度的“AI大底座”,商湯的“AI大裝置”。
大模型即服務(wù):開放大模型開發(fā)平臺(tái)供外部用戶使用。這一市場(chǎng)屬于高度創(chuàng)新的市場(chǎng),但仍存在較高的進(jìn)入壁壘。
從何處著手跟隨本次AI浪潮
大模型廠商都在著手將現(xiàn)有的AI軟件升級(jí)為大模型支撐的AI應(yīng)用??梢愿鶕?jù)應(yīng)用場(chǎng)景優(yōu)先級(jí)與合作伙伴聯(lián)系引入大模型支持的AI。而在MaaS(模型即服務(wù))產(chǎn)品層面,市場(chǎng)上可選的成熟產(chǎn)品并不多,預(yù)計(jì)今年下半年會(huì)有數(shù)十家廠商的產(chǎn)品上線??梢月氏冗x擇數(shù)據(jù)隱私要求不高的領(lǐng)域在公有云上測(cè)試大模型能力。
新一代AI需要注意的問(wèn)題
生成式AI生成內(nèi)容的版權(quán)需提前規(guī)劃。生成式AI讀取海量數(shù)據(jù)后生成的圖片等內(nèi)容有可能會(huì)引起版權(quán)問(wèn)題,需要提前從規(guī)則上加以控制。
對(duì)原有流程的改變:一方面生成式AI生成的內(nèi)容還需要人類審核才能發(fā)布,另一方面可能會(huì)要求工作流程上做出改變以適配AIGC的加入。
鑒于其仍處于技術(shù)成熟度的早期階段,在傳統(tǒng)行業(yè)應(yīng)用場(chǎng)景不十分清晰,投入產(chǎn)出比目前也難以評(píng)估。
跳出今天的AIGC看未來(lái)AI應(yīng)用
借鑒今天的文生圖、文生視頻類應(yīng)用,其實(shí)大多是基于過(guò)去幾年已有的小模型通過(guò)各種技術(shù)路線實(shí)現(xiàn)的AI應(yīng)用。類似的、各行各業(yè)的應(yīng)用場(chǎng)景,都可以基于現(xiàn)有的AI模型,以低代碼的形式拼接出人人可上手的AI應(yīng)用,甚至未來(lái)的AI應(yīng)用,都可能是輸入自然語(yǔ)言直接輸出結(jié)果的形式。
IDC中國(guó)研究總監(jiān)盧言霞表示,新一代AI熱度持續(xù)走高,然而由于其較低的技術(shù)成熟度、較高的部署成本,實(shí)際落地還需謹(jǐn)慎。但宏觀趨勢(shì)上,以大模型、生成式AI為代表的快速迭代的技術(shù)必然會(huì)催生全新的AI時(shí)代。