本文來自微信公眾號“科技云報到”。
在過去近一年的時間里,AI大模型從最初的框架構(gòu)建,逐步走到落地階段。
然而,隨著AI大模型深入到千行百業(yè)中,市場開始意識到通用大模型雖然功能強大,但似乎并不能完全滿足不同企業(yè)的個性化需求。
大模型技術的安全性、解釋性、易用性等綜合指標正在成為此輪AI競賽的關鍵,部分企業(yè)不再執(zhí)著于大模型的開發(fā),而把目光向普惠式AI、生成式AI+多云、大模型的私有化部署等多種商業(yè)模式。
AI與云計算迎來
大融合時代
從誕生起,云計算一直被認為是未來的發(fā)展方向、互聯(lián)網(wǎng)企業(yè)們的“第二增長曲線”。
但是,受互聯(lián)網(wǎng)增長紅利見頂以及政策監(jiān)管趨嚴的影響。從2021年開始,原本處在高速增長階段的云服務商們紛紛陷入了增速放緩的階段。從高峰時的超過50%的增速,一路跌至2022年的20%,甚至更低。
全球產(chǎn)業(yè)需求的消退,導致云計算行業(yè)增速失調(diào)。根據(jù)研究機構(gòu)TrendForce今年2月的預警,Meta、微軟、谷歌、亞馬遜這四家云廠商的服務器采購量可能從年增6.9%放緩至4.4%。
不過,拐點很快到來。在ChatGPT出現(xiàn)后,即使行業(yè)需求放緩,國內(nèi)外云服務商們也在積極將業(yè)務重心轉(zhuǎn)移至AI領域。
可見云服務商們逐漸從上半場的“求速度”轉(zhuǎn)變?yōu)槁涞赜诋a(chǎn)業(yè)深處,去尋求更高的價值增量。
隨著第一波上云的完成,企業(yè)正在進入深度用云階段。AI與云的結(jié)合不僅能夠進一步降低企業(yè)上云的門檻,還能為企業(yè)實現(xiàn)業(yè)務深度的智能化。
根據(jù)Gartner《2022年人工智能技術成熟度曲線》報告,盡早采用復合型人工智能(AI)、決策智能等AI技術將給企業(yè)機構(gòu)帶來明顯的競爭優(yōu)勢,緩解AI模型脆弱性引發(fā)的問題,有助于捕捉業(yè)務背景信息,推動價值實現(xiàn)。
今年4月中旬,阿里云智能首席商業(yè)官蔡英華對外表示,算力的飛速發(fā)展使數(shù)字化成為確定,使智能化成為可能。
未來阿里云將以云計算為基石,以AI為引擎,參與到從數(shù)字化邁向智能化的劃時代變革中。
AI走向普惠的一大步
英偉達第二財季的業(yè)績驚艷眾人,其背后是生成式AI革命中,行業(yè)對高性能算力的迫切需求,然而現(xiàn)在,昂貴的算力成本下,AI大模型似乎仍是個“富人游戲”。
面對GPU價格的暴漲與未來可能到來的“算力荒”,大公司砸錢囤卡,尚可悠然步入AI競技場,而中小企業(yè)沒有“鈔能力”,在發(fā)展AI模型、應用過程中,更容易受算力制約。
拿什么來拯救AI算力資源極度不均衡的現(xiàn)狀?如何讓更多創(chuàng)業(yè)者參與到大模型的市場競爭中?
作為全球GPU龍頭供應商、此輪AI熱潮最大的受益者,英偉達給出了破局之道——算力租賃。
今年3月,英偉達正式推出算力租賃服務方案“DGX云”,該方案由英偉達與微軟云、谷歌云、甲骨文等全球top10的云服務商共同打造,企業(yè)通過一個瀏覽器就可以按月租用英偉達DGX AI超級計算機,不需要采購與擁有服務器設備。
事實上,英偉達DGX云并非AIGC產(chǎn)業(yè)首例,但由于DGX AI超級計算機的杰出性能,DGX云將AIGC云算力產(chǎn)業(yè)推向了更高的起點,該服務推出標志著AI云算力進入新階段。云算力采用“化整為零”的方式賦能產(chǎn)業(yè)鏈各方,具備可持續(xù)性。
算力租賃,即對算力進行出租,是一種通過云計算服務提供商租用計算資源的模式。算力生產(chǎn)商與云平臺的合作由來已久,用戶可以通過阿里云、騰訊云等平臺租用英偉達的顯卡與AI處理器。
對于英偉達與云服務商來說,算力租賃是實現(xiàn)雙贏的策略。
全球第七大云服務商甲骨文是最先響應英偉達DGX云計劃的大廠,該公司于2022年10月將英偉達加速計算堆棧工具(包括GPU、系統(tǒng)、軟件)遷移到其IaaS業(yè)務的旗艦產(chǎn)品——云服務平臺OCI(Oracle Cloud infrastructure)上。
從最新的季報數(shù)據(jù)來看,這對甲骨文的業(yè)績有非常顯著的拉動作用。
2023年第四財季(自然年3月1日-5月31日),其云業(yè)務(IaaS+SaaS)營收達44億美元,同比增加54%;其中,IaaS業(yè)務營收14億美元,同比大增76%,云廠商中單季度云業(yè)務增收增速第一。
于英偉達而言,這亦是一筆回本周期短且毛利率可觀的生意。
以A100(80G)租賃服務為例,A100(80G)顯卡單價成本取10萬元,現(xiàn)假設每張卡都得到充分租用,則按照2023年8月19日國內(nèi)云算力平臺租用A100(80G)服務器的均價15.1元/小時,考慮到各大平臺競爭客戶,經(jīng)常性推出優(yōu)惠活動,則假設平均實際租金為7.6元/小時,投入10億元資金的實際回本周期為1.5-2年,按照平臺最低定價計算,毛利率至少為46.3%。
目前,英偉達正積極拓展“朋友圈”,與領先的云服務商聯(lián)合托管DGX云基礎設施,甲骨文之外,微軟Azure也已開始托管DGX云,這項服務還將在不久之后擴展到谷歌云。
基于算力租賃,用戶只要按需付費,不用承擔硬件設備的采購、維護、升級等費用,也不用擔心設備閑置或者過時造成浪費;用戶可隨時隨地通過云端訪問所需的算力資源,快速開始訓練和應用;用戶可根據(jù)需求選擇不同算力平臺和機型,也可以不受地域或者時間的限制模型、工具等資源,進行更多的嘗試和探索。
當多云遇到生成式AI
為了向大模型客戶提供高穩(wěn)定性和高性價比的AI基礎設施,生成式AI+多云的模式成為科技廠商們新的角力點。
云被看作是AI的承載,而AI也是云的核心抓手,開展大模型所需要的算法、算力和數(shù)據(jù)等能力,以及覆蓋IaaS、PaaS、MaaS的解決方案。
近期,VMware推出Intelligent Assist、Private AI架構(gòu)方案。在此之前,阿里云提出了“Model as a service”的概念,亞馬遜云科技推出了包括Amazon Bedrock和Amazon Titan模型等生成式AI新工具。
VMware CEO Raghu表示:“生成式AI與多云可謂珠聯(lián)璧合。客戶的數(shù)據(jù)無處不在,遍布其數(shù)據(jù)中心、邊緣、云等多處。
我們將與NVIDIA一同助力企業(yè)放心地在數(shù)據(jù)附近運行生成式AI工作負載,并解決其在企業(yè)數(shù)據(jù)隱私、安全和控制方面的問題。”
NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“我們能夠訓練AI模型,微調(diào)AI模型,為了跨多個GPU部署AI模型和大語言模型,特別是大語言模型,一臺計算機運行不了,必須將其分配到多機多卡上,并對其進行推理、生成token,實現(xiàn)交互,其速度可媲美人類日常交互。”
同時他表示,通過與VMware擴大合作,我們將能夠為金融服務、醫(yī)療、制造等領域的成千上萬家客戶提供其所需的全棧式軟件和計算,使其能夠使用基于自身數(shù)據(jù)定制的應用,充分挖掘生成式AI的潛力。
Private AI由一套集成式AI工具組成,能夠使企業(yè)自定義模型并運行各種生成式AI應用,如智能聊天機器人、助手、搜索和摘要等。
該平臺將作為全集成式解決方案,采用NVIDIA提供的生成式AI軟件和加速計算,基于VMware Cloud Foundation構(gòu)建,并針對AI進行了優(yōu)化。
VMware AI Labs副總裁Chris Wolf表示:“最開始,AI是由一部分數(shù)據(jù)科學家為方便其他的數(shù)據(jù)科學家而構(gòu)建和設計的。
隨著全新VMware Private AI產(chǎn)品的推出,VMware正在讓計算和AI模型的選擇更加貼近數(shù)據(jù),從而使未來的AI服務于企業(yè)中的每一個人。”
AI能拉動云服務增長嗎?
行業(yè)研究機構(gòu)IDC日前發(fā)布的2022年全球云計算追蹤數(shù)據(jù)顯示,全球云計算IaaS市場規(guī)模增長至1154.96億美元,同比去年上漲26.2%。
全球前三名云廠商依次為亞馬遜、微軟、阿里云,所占份額分別為48.9%、14.4%、6.2%,谷歌和IBM緊隨其后,所占份額分別為5.6%和2.9%。華為云、中國電信、騰訊云、中國移動和百度云位列六至十名。
與2021年相比,阿里云市場份額在減少,而亞馬遜和谷歌所占市場份額在增加。
移動互聯(lián)網(wǎng)發(fā)展見頂之后,全球云服務商收入增長都在放緩,AWS增速從40%下降到12%,微軟Azure增速從31%下降到15%,但顯然阿里云面臨的挑戰(zhàn)更大一些,增速已降至不足10%,上個季度首次出現(xiàn)負增長。
反觀緊隨其后的谷歌云仍保持近30%的增長,極有可能取代阿里云占據(jù)全球云廠商第三的位置。
2023年第二季度,阿里云的收入同比增長了4%。財報顯示,阿里云本季度收入增長主要受到存儲、網(wǎng)絡和AI計算相關產(chǎn)品驅(qū)動,部分被CDN需求正?;窒龇?/p>
從客戶分布維度,收入增長主要受到金融服務、教育、電力和汽車行業(yè)驅(qū)動,部分被主動縮減項目式收入的舉措所抵消。
AI熱潮帶來的算力和模型服務需求,正在推動云計算巨頭重回增長,那么這種增長能否長期持續(xù)?
IDC統(tǒng)計了全球主要云計算廠商的收入拆分,阿里云、AWS的收入結(jié)構(gòu)基本接近,均主要以IaaS業(yè)務為主,輔以一部分PaaS業(yè)務,而微軟Azure的PaaS和SaaS的收入占比超過60%。
實際上,云計算產(chǎn)業(yè)鏈中,從底層的IaaS,到中間層的PaaS,再到上層的SaaS,越往上產(chǎn)品差異化越大,毛利率越高。
微軟Azure正是將自身的Windows、Office、SQL Server等軟件與云服務打通,獲得了更高的毛利率。
IDC在7月6日發(fā)布的《全球公共云服務半年度跟蹤報告》顯示:2022年全球公共云服務市場收入總計為5458億美元,其中,SaaS(軟件即服務)是公共云服務收入的最主要來源,占2022年總收入的45%以上。
面對全球市場以及國內(nèi)市場激烈的IaaS競爭,阿里云發(fā)力PaaS和MaaS,微軟Aure是可以參考比較的對象。
作為OpenAI的投資方,微軟顯然更受益于生成式AI的發(fā)展。今年初,微軟宣布Azure OpenAI服務在全球Azure平臺發(fā)布,該服務旨在為開發(fā)人員提供對大型語言模型的便捷訪問,這些模型可以跨其他Azure產(chǎn)品無縫集成,以協(xié)助企業(yè)開發(fā)和部署對話式AI服務和解決方案。
此外,微軟在其全球合作伙伴大會上宣布了Microsoft 365 Copilot定價、推出Bing Chat Enterprise AI聊天機器人、和Meta聯(lián)合宣布將Llama 2開源大模型引入Azure云和Windows。
微軟2023年第四財季電話會議上,微軟首席財務官Amy Hood則表示,盡管目前對Azure AI服務的需求強勁,但目前AI服務對Azure的收入貢獻僅有約1個百分點,隨著微軟加速投資云基礎設施,AI對微軟收入帶來的影響將集中在2024財年的下半年。
張勇在財報會議上也說:“人工智能AI革命是一個增量機會,各行各業(yè),所有公司他們都會希望利用人工智能來提升他們的服務。
但是這個是離不開要利用大量高性能的算力,不僅是用于現(xiàn)階段模型的訓練,還要用于支撐以后他們提供各種的服務。因此我們認為這是非常重要的、長期的一個帶動增長的引擎。”
企業(yè)數(shù)字化、產(chǎn)業(yè)智能化是一條漫長的路,但云計算大廠們則通過不斷的技術革新、開放賦能,正助力更多企業(yè)大步快跑進產(chǎn)業(yè)智能化的升級浪潮中,大大縮短了這一升級路徑所需時間。
在人工智能技術融入萬物,技術、需求與產(chǎn)業(yè)進化永不停歇、奔涌向前的現(xiàn)實下,未來的技術框架又會進步到何種程度,讓我們拭目以待。