本文來自科技云報(bào)道。
世界是復(fù)雜的,沒有人知道未來會(huì)怎樣,但如果單純從技術(shù)的角度,我們總是能夠沿著技術(shù)發(fā)展的路徑,找到一些主導(dǎo)未來趨勢(shì)的脈絡(luò)。
從Sora到Suno,從OpenAI到Copilot、Blackwell,這些熱詞在大眾眼里或許還分不清楚,但很多人已經(jīng)用上各種“ChatGPT”,或聊天或創(chuàng)作。不知不覺間,我們已經(jīng)卷入新一輪AI浪潮中。
這輪人工智能浪潮,自ChatGPT這類生成式AI工具問世,被迅速引爆。AI大模型從研究走向應(yīng)用,復(fù)用成本大幅降低,各種應(yīng)用得以更快滲透進(jìn)各行各業(yè)。
IDC發(fā)布報(bào)告稱,2027年全球人工智能IT總投資規(guī)模有望從2022年的1324.9億美元增至2027年的5124.2億美元,年復(fù)合增長(zhǎng)率(CAGR)為31.1%。
聚焦生成式AI,IDC預(yù)測(cè),全球生成式AI市場(chǎng)年復(fù)合增長(zhǎng)率將達(dá)85.7%,到2027年全球生成式AI市場(chǎng)規(guī)模將接近1500億美元。
英偉達(dá)CEO黃仁勛表示,生成式AI已經(jīng)開啟了全新的投資周期,已經(jīng)進(jìn)入了“十年周期”(技術(shù)從出現(xiàn)、傳播到大規(guī)模應(yīng)用所需的時(shí)間)的第一年。
當(dāng)生成式AI從一個(gè)“奇點(diǎn)”到迎來“大爆炸”時(shí)刻,其將在現(xiàn)實(shí)世界發(fā)生哪些改變?又將激發(fā)怎樣的潛力?
生成式AI迎來“三個(gè)轉(zhuǎn)變”
生成式AI技術(shù)可分為四個(gè)層次,即面向消費(fèi)者應(yīng)用;大語言模型(LLM)等基礎(chǔ)技術(shù);支持服務(wù)的云基礎(chǔ)設(shè)施;以及對(duì)于開發(fā)和運(yùn)營至關(guān)重要的半導(dǎo)體。
從技術(shù)發(fā)展看,今年生成式AI將從純理論探討階段,全面進(jìn)入到業(yè)務(wù)應(yīng)用階段。過去一年,大部分企業(yè)和機(jī)構(gòu)并沒有真正打造出生成式AI系統(tǒng);而今年,生成式AI系統(tǒng)將全面進(jìn)入到生產(chǎn)當(dāng)中,企業(yè)將真正地開始使用生成式AI工具。
對(duì)于生成式AI本身,即將迎來三個(gè)方面的轉(zhuǎn)變。
首先,要把生成式AI投入到企業(yè)以及業(yè)務(wù)用例的過程中,就要從構(gòu)建訓(xùn)練基礎(chǔ)架構(gòu)轉(zhuǎn)向構(gòu)建推理基礎(chǔ)架構(gòu)。
到目前為止,大部分企業(yè)往往是通過對(duì)開源基礎(chǔ)模型進(jìn)行調(diào)優(yōu)、優(yōu)化或者是互聯(lián),來實(shí)現(xiàn)自己的某些功能和需求。
對(duì)于各個(gè)企業(yè)、各個(gè)垂直行業(yè)領(lǐng)域的企業(yè)來說,無論是GenAI還是GPT4,大語言模型的訓(xùn)練成本是高昂的。特別是對(duì)于垂直行業(yè)的企業(yè)用戶,不會(huì)在業(yè)務(wù)推進(jìn)過程中直接采用這些模型。
如果未來需要將AI能力賦予企業(yè)的業(yè)務(wù),那么企業(yè)就需要進(jìn)一步開發(fā)已有的模型,從而讓這些模型在部署到垂直行業(yè)的生產(chǎn)中時(shí),可以真正地轉(zhuǎn)化為生產(chǎn)力。
而這種轉(zhuǎn)變也對(duì)企業(yè)提出了更加明確的要求:如何更好地設(shè)計(jì)出這種推理基礎(chǔ)架構(gòu)?該把它們放在哪里?如何確保其安全?
其次,是企業(yè)的關(guān)注點(diǎn)將越來越多地將從寬泛的實(shí)驗(yàn)轉(zhuǎn)向自上而下的戰(zhàn)略推進(jìn),即挑選出少數(shù)幾個(gè)真正具有變革意義的生成式AI應(yīng)用項(xiàng)目。
去年,很多企業(yè)都在考慮采用生成式AI技術(shù)。但如今,企業(yè)已經(jīng)認(rèn)識(shí)到,要應(yīng)用生成式AI技術(shù),每個(gè)項(xiàng)目都非常龐大,需要占用大量人力、物力、財(cái)力,才能構(gòu)建和實(shí)施一個(gè)能夠投入生產(chǎn)的生成式AI系統(tǒng)。
到了今年,一方面,生成式AI領(lǐng)域?qū)?huì)有成百上千乃至上萬的潛在用例,但另一方面,由于每一個(gè)企業(yè)的資源有限,因此只能選擇其中幾個(gè)重點(diǎn)實(shí)施。
對(duì)于企業(yè)的CIO和領(lǐng)導(dǎo)者,必然會(huì)面臨一個(gè)問題:就是從幾百個(gè)AI項(xiàng)目中,優(yōu)先選擇幾個(gè)進(jìn)行實(shí)施。這其中的風(fēng)險(xiǎn)在于:一旦選對(duì)了,這些項(xiàng)目將對(duì)業(yè)務(wù)產(chǎn)生正向影響;而萬一選錯(cuò),可能就會(huì)造成大量的資源浪費(fèi)。
要想做出一個(gè)正確的選擇,各個(gè)企業(yè)必須要充分理解GenAI價(jià)值,以及生成式AI最有可能從哪些方面能夠?yàn)槠髽I(yè)提升生產(chǎn)力而賦能。
第三,是用戶對(duì)于AI投入的成本考量,從對(duì)“訓(xùn)練成本”的計(jì)算轉(zhuǎn)向?qū)?ldquo;運(yùn)營成本”的衡量。
在理論研究和訓(xùn)練階段,生成式AI的成本取決于構(gòu)建模型的復(fù)雜程度,以及架構(gòu)開發(fā)和維護(hù)人員的規(guī)模,除此之外再無其他成本可言。
但當(dāng)企業(yè)用戶開始實(shí)施部署和應(yīng)用生成式AI工具時(shí),現(xiàn)實(shí)的運(yùn)營成本就會(huì)成為企業(yè)用戶面臨的最大經(jīng)濟(jì)考量。
以戴爾科技為例,其最初開始建立自己的生成式AI系統(tǒng)時(shí),基本上會(huì)在三個(gè)月的時(shí)間里用到20臺(tái)服務(wù)器,此刻其整體運(yùn)營成本是未知的。
但當(dāng)這套系統(tǒng)開始被戴爾科技內(nèi)部的工程師應(yīng)用時(shí),6000名工程師每個(gè)月就需要大約5000萬次處理量,因此該系統(tǒng)最大的成本不是建立一個(gè)模型的成本,而是基于大規(guī)模處理而產(chǎn)生的巨額運(yùn)營成本。
這對(duì)企業(yè)用戶而言,從訓(xùn)練成本到運(yùn)營成本的考慮,將是未來必將面對(duì)的一個(gè)相當(dāng)現(xiàn)實(shí)的問題。
從本質(zhì)上說,生成式AI的轉(zhuǎn)變其實(shí)是技術(shù)從研發(fā)到應(yīng)用的商用化過程中必然要經(jīng)歷的過程。
只是由于AI自身業(yè)務(wù)形態(tài)的改變,也將帶來更多行業(yè)的改變,其中的一個(gè)影響就是會(huì)帶動(dòng)一批相關(guān)技術(shù)和應(yīng)用,成為未來的熱點(diǎn)和趨勢(shì)。
如何激發(fā)生成式AI更大潛力
僅僅一年,隨著各大資本和巨頭入場(chǎng),AI從底層大模型,到基礎(chǔ)設(shè)施,到機(jī)器學(xué)習(xí)操作(MLOps),再到消費(fèi)端應(yīng)用,生成式AI的生態(tài)已經(jīng)初步建立。
隨著今年生成式AI的進(jìn)一步訓(xùn)練和穩(wěn)定,行業(yè)發(fā)展將加速向下游移動(dòng),生成式AI將進(jìn)一步改變?nèi)藗兊纳睿酥粮淖冋麄€(gè)世界,其為企業(yè)提供了無限的想象空間,使產(chǎn)品和服務(wù)的研發(fā)過程更加高效、有趣。
面對(duì)生成式AI市場(chǎng)的巨大潛力,亞馬遜、谷歌、微軟、Meta等科技巨頭不甘示弱。去年12月,谷歌多模態(tài)大模型Gemini發(fā)布,包含三個(gè)版本:Nano、Pro和Ultra。
Pro對(duì)標(biāo)GPT-3.5,Ultra對(duì)標(biāo)GPT-4,可以處理文本之外的信息,包括圖像、視頻和音頻。同時(shí),谷歌上線文生圖模型Imagen 2、視頻生成模型VideoPoet,推出醫(yī)療人工智能大模型MedLM,將大模型與醫(yī)療保健行業(yè)緊密結(jié)合。
去年11月,微軟將集成了GPT的Bing Chat更名為Copilot,可以免費(fèi)使用GPT-4、DALL·E 3功能,并且擁有了獨(dú)立網(wǎng)站,Copilot將嵌入所有微軟旗下應(yīng)用中。微軟還推出Copilot Studio,使用者可以自定義GPT、創(chuàng)建新插件、自定義工作流。
Meta則接連發(fā)布了650億參數(shù)的開源大模型LLaMA和700億參數(shù)的LLaMA2。近日,Meta推出全新開源大模型Code Llama 70B,其準(zhǔn)確率達(dá)到了53%,超過了GPT-3.5的48.1%,是目前評(píng)分最高的開源大模型。
2023年以來,看似默默無聞的亞馬遜頻頻出擊。去年9月,亞馬遜宣布將向人工智能初創(chuàng)公司Anthropic投資40億美元,近日,其再次宣布追加投資27.5億美元,完成了對(duì)Anthropic40億美元的投資,決心可見一斑。
更為重要的是,亞馬遜云科技提出了基于生成式AI的三層技術(shù)棧。
第一層是高性能基礎(chǔ)設(shè)施,過去五年,亞馬遜云科技持續(xù)加大在自研芯片方面的投入,比如Amazon Trainium和Amazon Inferentia芯片,可以提供在云上訓(xùn)練模型和運(yùn)行推理的最低成本。
除此之外,在GPU方面,NVIDIA多款先進(jìn)算力均率先在亞馬遜云科技落地。
第二層是最廣泛的基礎(chǔ)模型選擇。亞馬遜云科技認(rèn)為“沒有一個(gè)模型可以適用于所有業(yè)務(wù)場(chǎng)景”,因此推出Amazon Bedrock,企業(yè)可以靈活選擇適合自己的模型,更容易地構(gòu)建應(yīng)用,并在保證數(shù)據(jù)安全和隱私基礎(chǔ)上,進(jìn)行定制化模型的開發(fā),還無需大量的標(biāo)注數(shù)據(jù)。
Amazon Bedrock提供各種領(lǐng)先的基礎(chǔ)模型供客戶選擇:既有知名的開源模型,如Stable Diffusion XL、Llama、Mistral 7B和Mixtral 8*7B,也有如Anthropic Claude 3、AI21labs Jurassic、Cohere Command、Amazon Titan等非開源模型。
基于Amazon Bedrock云托管服務(wù),企業(yè)可以通過API訪問從文本到圖像的一系列強(qiáng)大的基礎(chǔ)模型。
值得一提的是,亞馬遜和Anthropic在生成式AI領(lǐng)域有著廣泛的合作,Anthropic在Amazon Bedrock上提供的Claude 3系列模型是全球最領(lǐng)先的大模型之一,共包含三個(gè)模型:Haiku、Sonnet、Opus,從模型尺寸來看,可以理解為模型的中杯、大杯、超大杯。
客戶可以根據(jù)自己的商業(yè)需求,從中選擇最合適的智能、速度和價(jià)格組合。
·Haiku:是響應(yīng)速度最快的模型,也是成本最低的選項(xiàng),在大多數(shù)純文本任務(wù)上的表現(xiàn)仍然相當(dāng)出色,也同時(shí)包含多模態(tài)能力(比如視覺)。
·Sonnet:適用于需要平衡性能和成本的場(chǎng)景,它在純文本任務(wù)上的表現(xiàn)與后面的Opus相當(dāng),但在成本上更為經(jīng)濟(jì),適合于那些需要性能稍微好點(diǎn),但預(yù)算有限的企業(yè)和個(gè)人用戶。
·Opus:具有強(qiáng)大的推理、數(shù)學(xué)和編碼能力,接近人類的理解能力,適用于需要高度智能和復(fù)雜任務(wù)處理的場(chǎng)景,如企業(yè)自動(dòng)化、復(fù)雜金融預(yù)測(cè)、研究和開發(fā)等。
對(duì)于Claude 3,更有行業(yè)人士認(rèn)為其終結(jié)了GPT-4時(shí)代。Claude 3有兩大亮點(diǎn),一個(gè)是長(zhǎng)文本,二是多模態(tài)能力。
長(zhǎng)文本是Claude 3的一個(gè)顯著優(yōu)勢(shì),體現(xiàn)為在讀論文、小說等字?jǐn)?shù)更多的文本時(shí),Claude 3更擅長(zhǎng)理解和回答用戶的相關(guān)問題。
此次Claude 3大大提升了上下文對(duì)話窗口,達(dá)到200k,可以理解為單次和模型對(duì)話能夠輸入的文本。
具體而言,Claude 3 200k的對(duì)話長(zhǎng)度,相當(dāng)于能夠單次處理超過15萬英文單詞,而GPT-4 Turbo的上下文窗口為128k,大約是9.6萬個(gè)英文單詞。同時(shí),Claude 3也第一次允許圖像和文檔上傳。
和ChatGPT一樣,Claude 3能夠“認(rèn)”出來圖里的是什么東西,直接描述,回答用戶的問題。更令人印象深刻的是,Claude 3在分析一些復(fù)雜問題時(shí),已經(jīng)能夠和人一樣,先拆解問題,并且交由子模型來進(jìn)行調(diào)度。
第三層就是應(yīng)用生成式AI技術(shù)的開箱即用的云服務(wù),進(jìn)一步降低使用門檻。目前已經(jīng)推出Amazon Q這一AI助手,可以根據(jù)客戶業(yè)務(wù)進(jìn)行定制,專用于辦公場(chǎng)景需要。
還與像Amazon QuickSight,包括智能客服的產(chǎn)品Amazon Connect,面向編程開發(fā)人員的平臺(tái)Amazon CodeWhisperer,都實(shí)現(xiàn)了非常有效的結(jié)合。
可以看到,從底層基礎(chǔ)設(shè)施到上層應(yīng)用拓展,今年亞馬遜云科技在生成式AI領(lǐng)域不斷發(fā)力。不同的客戶可以根據(jù)需求選擇不同層級(jí)的產(chǎn)品,通過這三層來支持他們的業(yè)務(wù)創(chuàng)新。
此外,對(duì)于如何幫助企業(yè)快速具備生成式AI能力,亞馬遜云科技擁有豐富的專業(yè)技術(shù)支持資源,包括SA、產(chǎn)品專家、人工智能實(shí)驗(yàn)室、數(shù)據(jù)實(shí)驗(yàn)室、快速原型團(tuán)隊(duì)、專業(yè)服務(wù)團(tuán)隊(duì),幫客戶打通應(yīng)用生成式AI的“最后三公里”工程化挑戰(zhàn)。
對(duì)于作為扮演“底層架構(gòu)師”角色的亞馬遜云科技而言,大模型固然重要,但關(guān)鍵技術(shù)能力的集合才是提升企業(yè)生產(chǎn)力的根本動(dòng)力。
亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建表示,“盡管大模型非常重要,但僅靠大模型對(duì)企業(yè)的生產(chǎn)是遠(yuǎn)遠(yuǎn)不夠的。從模型能力到真正的運(yùn)營生產(chǎn)之間,企業(yè)還需要增加很多輔助能力。企業(yè)需要一系列周邊的能力來正確、合理、安全、高效地使用大模型,這就是亞馬遜云科技一系列產(chǎn)品所提供的價(jià)值所在。”
生成式AI領(lǐng)域接下來發(fā)展的最關(guān)鍵一步是什么?陳曉建表示,首先,從最底層來看,芯片性能仍然落后于需求。雖然半導(dǎo)體芯片的發(fā)展已經(jīng)非常快,但模型本身參數(shù)規(guī)模的擴(kuò)大實(shí)際上遠(yuǎn)超芯片的能力。
“以前一個(gè)幾百萬參數(shù)的模型,就覺得已經(jīng)很大了,但現(xiàn)在動(dòng)輒達(dá)到數(shù)百億的規(guī)模?;A(chǔ)服務(wù)商仍需關(guān)注如何將底層能力、業(yè)務(wù)復(fù)雜度和大模型復(fù)雜度相匹配,使硬件發(fā)展趕上軟件發(fā)展規(guī)模。”
其次,他認(rèn)為大模型能力本身還有很多發(fā)展空間,今天看到的模型可能代表了一個(gè)博士生水平,但是能不能做得更好?比如達(dá)到教授或者院士水平?
包括亞馬遜云科技在內(nèi)的諸多生成式AI供應(yīng)商需要在未來持之以恒地去做模型能力方面的工作。
在最上層與各行各業(yè)務(wù)相結(jié)合方面,陳曉建表示,相關(guān)的SaaS解決方案非常多。
從這點(diǎn)上看,將生成式AI能力與垂直場(chǎng)景的解決方案結(jié)合需要做巨大的工作。“我們需要思考大模型如何為人類社會(huì)各行各業(yè)中的應(yīng)用提供更好的模型能力、更易用的方式和更低的成本。”
無論如何,人們對(duì)未來的期許總是充滿希望。對(duì)于科技未來的走向,以AI為代表的技術(shù)進(jìn)化,正在成為一場(chǎng)考驗(yàn)人類想象力的比賽。
科技企業(yè)能做的,就是通過技術(shù)普惠,降低AI參與門檻,先把大模型打造成像電、水一樣隨取隨用的公共資源,再將生成式AI技術(shù)應(yīng)用于各行各業(yè),變成真正能夠推動(dòng)人類發(fā)展的生產(chǎn)力。