IBM Granite 3.0模型:為大規(guī)模企業(yè)AI應(yīng)用指明方向

IBM在企業(yè)AI領(lǐng)域做出了一系列頗為獨特的探索。藍色巨人目前正在推動全棧技術(shù)布局,以自2020年來興起的AI和混合云作為企業(yè)戰(zhàn)略領(lǐng)域的兩大基礎(chǔ)性支柱,同時借鑒了自身在其產(chǎn)品組合中積累下的優(yōu)勢。

本文來自至頂網(wǎng)(soft.zhiding.cn),來源 | 至頂網(wǎng)軟件與服務(wù)頻道。

IBM在企業(yè)AI領(lǐng)域做出了一系列頗為獨特的探索。藍色巨人目前正在推動全棧技術(shù)布局,以自2020年來興起的AI和混合云作為企業(yè)戰(zhàn)略領(lǐng)域的兩大基礎(chǔ)性支柱,同時借鑒了自身在其產(chǎn)品組合中積累下的優(yōu)勢。

更重要的是,這套方案扭轉(zhuǎn)了主要以AI概念驗證為目標的總體趨勢,轉(zhuǎn)而專注于解決高度具體的業(yè)務(wù)用例,且執(zhí)行效率更高。其通過基于內(nèi)部企業(yè)數(shù)據(jù)構(gòu)建并微調(diào)、與既定用途高度契合的AI基礎(chǔ)模型作為達成目標的依托,而非選擇由純通用領(lǐng)域公共數(shù)據(jù)訓(xùn)練而成的普適性大語言模型。

就在幾周之前,IBM正式發(fā)布了其全新Granite 3.0基礎(chǔ)模型。除了將其作為上述戰(zhàn)略規(guī)劃的基礎(chǔ),藍色巨人還在紐約舉辦了一場大型分析師活動,詳盡介紹了公司當(dāng)前探索方向以及相應(yīng)運作成果,同時配合現(xiàn)場的實際用例展示了可量化的AI功能效果。我們也借此機會與IBM公司高管進行了交流訪談,希望加深對于藍色巨人所做工作的理解。這既是對Granite 3.0模型的探究,也是對IBM整個AI戰(zhàn)略的一份年度回顧。閑言少敘,我們馬上進入主題。

運用Granite 3.0模型,在效率與性能間尋求平衡

讓我們先從Granite 3.0模型聊起。作為一套在技術(shù)意義上的基礎(chǔ)模型,這也是IBM開拓市場的方法論基礎(chǔ)。受篇幅所限,本文將專門討論該模型的業(yè)務(wù)影響力。

ligHU00H3uqXY_600.jpeg

據(jù)IBM介紹,企業(yè)數(shù)據(jù)在當(dāng)今AI基礎(chǔ)模型中的占比不足1%

新的Granite 2B與8B模型與我們從OpenAI、Meta乃至其他廠商處看到過的規(guī)模化大語言模型之間有著根本區(qū)別,后者這些擁有數(shù)千億參數(shù)的大模型是由公共數(shù)據(jù)構(gòu)建而成——也就是說,其訓(xùn)練素材為來自公共互聯(lián)網(wǎng)上搜集而來的所有數(shù)據(jù),包括用戶可能關(guān)注的體育賽事比分、食譜、度假景區(qū)等各類信息。正如IBM公司CEO Arvind Krishna所言,如果我們并不清楚要用AI來做什么、或者需要搜索某些通用信息,那么這類模型無疑最為適合。

然而,這些大型公共語言模型的普適性定位,在企業(yè)環(huán)境中卻面臨著一系列重大挑戰(zhàn)。首先,這些模型并不清楚特定公司在嘗試解決具體業(yè)務(wù)問題時的狹義背景,畢竟它們無法訪問到企業(yè)的內(nèi)部賬單信息、代碼庫或者來自供應(yīng)鏈的統(tǒng)計數(shù)據(jù)。其次,大語言模型固有的強大訓(xùn)練和推理方法需要耗費海量資源,包括電力、數(shù)據(jù)中心算力(特別是昂貴的GPU算力)以及內(nèi)存容量。

理想的作法當(dāng)然是使用能夠為更具針對性的用例提供準確答案的AI模型,并保證以經(jīng)濟高效、省時且節(jié)能的方式實現(xiàn)功能。這也正是IBM在其龐大數(shù)據(jù)平臺背景之下,為全新Granite模型設(shè)定的基本定位。

lidzEIepLVk_600.jpeg

為IBM AI戰(zhàn)略提供支持的數(shù)據(jù)平臺,借鑒了藍色巨人旗下技術(shù)組合中的多個不同領(lǐng)域

Granite模型到底有多高效?

此前版本的Granite模型已經(jīng)具有很高的執(zhí)行效率,但從各項統(tǒng)計指標來看,其性能仍未達到最高水平。但從我們親自得出的基準測試結(jié)果來看,Granite的性能完全能夠比肩(在多數(shù)情況下甚至超越)其他廠商的最佳同類模型。這也證明了IBM長期以來在研發(fā)方面投入的大量資源與心力(該公司早在兩年之前生成式AI熱潮出現(xiàn)之前,就一直致力于開發(fā)AI模型),也凸顯出這類精心設(shè)計、專門面向數(shù)據(jù)庫與ERP系統(tǒng)內(nèi)結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)的模型在特定業(yè)務(wù)場景下的卓越能力。

在本次紐約分析師活動中,IBM公司首席商務(wù)官Rob Thomas及研究主管Dario Gil帶來了更多令人眼前一亮的成績。Thomas指出,“現(xiàn)在我們在推理方面實現(xiàn)了40倍的性能提升。”Gil則補充稱,IBM的內(nèi)部數(shù)據(jù)顯示“使用定制化專用模型能夠顯著節(jié)約實現(xiàn)成本,幫助客戶以極低的投入獲得更好的用例性能。”

除此之外,這里還要補充一點。像Granite這類體量相對較小的模型,不需要匹配最先進的GPU即可順暢運行。換言之,用戶可以在性能較差的GPU甚至是CPU上運行這些模型,使得它們在支撐應(yīng)用場景時的運營成本降低至常規(guī)大模型的十分之一甚至二十分之一。

從“AI加力”到“AI優(yōu)先”

這種技術(shù)和財務(wù)層面的實用性,也支撐起Thomas介紹的整體轉(zhuǎn)變趨勢。在過去幾年里,企業(yè)已經(jīng)可以將自己希望解決的任何問題和業(yè)務(wù)流程交付給AI,運用這項新興技術(shù)成果改造自己的固有運營模式。Thomas表示,IBM意識到客戶對于AI技術(shù)的態(tài)度已經(jīng)發(fā)生根本性變化,逐步轉(zhuǎn)向所謂“AI優(yōu)先”思維。也就是說AI不僅僅是被附加在現(xiàn)有流程之上的加力因素,而是從設(shè)計初期就作為內(nèi)置部分存在。在他看來,“未來十年誰能真正實施以AI為先的戰(zhàn)略,誰就能在市場上擁有優(yōu)異的表現(xiàn)。這也將成為新的業(yè)務(wù)運營常態(tài)。”

對于IBM的客戶來說,最常規(guī)的操作流程就是先選擇一套模型(Granite或者其他第三方模型),而后使用IBM的watsonx.ai運行該模型,再配合InstructLab產(chǎn)品根據(jù)自有業(yè)務(wù)數(shù)據(jù)對模型進行微調(diào)。IBM廣泛產(chǎn)品組合帶來的一大優(yōu)勢(所有這些都經(jīng)過重新調(diào)整以支持其整體AI戰(zhàn)略),就是客戶可以根據(jù)自己的喜好運用IBM成果以滿足自身AI需求。這種成果可以是完整的IBM解決方案,也可以是由IBM Maximo Application Suite提供的資產(chǎn)管理數(shù)據(jù)等??蛻暨€可以使用紅帽提供的數(shù)據(jù)管理要素,甚至與IBM咨詢部門合作對其內(nèi)容進行拆解分析。(順帶一提,IBM咨詢部門繼續(xù)保持著驚人的AI業(yè)務(wù)發(fā)展速度——根據(jù)藍色巨人公布的最新收益報告,該部門的業(yè)務(wù)總額已經(jīng)達到25億美元。)換句話說,客戶既可以親自動手做出各種探索,也可以向IBM求助以盡可能滿足自己的AI需求。

Thomas接下來介紹了IBM通過實際觀察總結(jié)出的,企業(yè)AI能夠為客戶帶來切實回報的關(guān)鍵領(lǐng)域,主要集中在客戶體驗、員工體驗以及IT運營方面。在各種實際應(yīng)用場景之下,AI模型、AI助手以及近期快速崛起的AI智能體正在批量識別模式、解決問題、檢索相關(guān)信息、實施流程自動化改造并越來越多地采取自主行動,借此減輕員工的重復(fù)性工作量并創(chuàng)造出巨大的效率優(yōu)勢。他還列舉了許多來自客戶的特定用例,其中最令人印象深刻的數(shù)字,當(dāng)數(shù)IBM在過去兩年半中“通過實施我們的自有技術(shù)來提高生產(chǎn)力”,成功依托AI成果節(jié)約下20億美元。(IBM高管們表示,他們預(yù)計后續(xù)節(jié)約數(shù)額還將進一步增加。)這也是IBM過去幾年來,承諾在外部客戶之前先行應(yīng)用其AI產(chǎn)品所帶來的巨大回報。

寬松許可和對治理的高度關(guān)注

IBM的方法論不僅為客戶帶來實用性,同時也高度關(guān)注企業(yè)AI在法律、財務(wù)和合規(guī)等領(lǐng)域的具體問題。雖然頗為“無聊”,但沒有這些事務(wù)的加持,我們根本不可能正常開展業(yè)務(wù)。Granite模型采用極其寬松的Apache 2許可保護,與IBM對于開源議題的整體承諾相契合。Granite模型家族也同樣經(jīng)過IBM律師的嚴格審查,能夠享受到IBM承諾的全額賠償政策。

相信關(guān)注技術(shù)圈資訊的朋友都知道,近期開源社區(qū)一直在爭論某些被宣傳為開源的模型到底算不算“開放”。例如,反對者們注意到,Meta對其Llama模型的使用和微調(diào)方式就做出了不少實質(zhì)性的限制,目的當(dāng)然是為了增加其經(jīng)濟收益。相比之下,Apache 2許可在開源社區(qū)中則高度透明且廣受好評。援引IBM的評價,Apache 2堪稱“開放許可領(lǐng)域最寬松的許可協(xié)議”。

IBM在治理方面同樣具有很大優(yōu)勢。在紐約的活動當(dāng)中,Thomas表示自從IBM一年多前首次公布watsonx.governance以來,市場上就一直沒有真正能與之競爭的同類產(chǎn)品。這樣的情況著實令他感到驚訝。與此同時,同IBM保持合作的每一家全球系統(tǒng)集成商“都在全面使用watsonx.governance”。據(jù)Thomas介紹,“這是因為當(dāng)今市場上真的沒有其他方案可以幫助客戶處理……不斷變化的法規(guī)條款、如何向監(jiān)管機構(gòu)提交或認證報告內(nèi)容、如何管理數(shù)據(jù)蔓延、如何管理風(fēng)險等現(xiàn)實問題。”數(shù)據(jù)治理是IBM幾十年來始終擁有出色表現(xiàn)的中車個“無聊”領(lǐng)域,我甚至嚴重懷疑是否有其他廠商能夠在這個領(lǐng)域挑戰(zhàn)藍色巨人的傳統(tǒng)優(yōu)勢。

IBM在AI領(lǐng)域的下一步計劃

關(guān)于IBM的合作伙伴關(guān)系、AI智能體日益增長的現(xiàn)實應(yīng)用、量子計算對于AI效能的加持作用以及藍色巨人的其他未來規(guī)劃,當(dāng)然還有很多值得討論的空間。例如,公司CEO Krishna就堅定認為,GPU從根本上講無法滿足未來幾年的新增AI工作負載。在他看來,采用不同于以往的芯片設(shè)計方法有望在未來幾年內(nèi)將AI推理延遲進一步壓縮,同時將所需電力控制在當(dāng)前水平的百分之一。為了踐行這一判斷,IBM也在著手設(shè)計AI應(yīng)用領(lǐng)域的定制芯片,其NorthPole芯片將采用完全不同的12納米神經(jīng)形態(tài)模擬架構(gòu)。

更重要的是,IBM還希望以全棧、全部門覆蓋的方式推動并落地企業(yè)AI戰(zhàn)略。藍色巨人已經(jīng)拿下總額30億美元的AI訂單,其中包含大量咨詢服務(wù)需求,客戶顯然希望借鑒IBM在多年經(jīng)營之下積累得到的各種現(xiàn)實成果。

IBM還提出一個令人信服的論據(jù),用Rob Thomas的話來說,AI將成為“推動企業(yè)生產(chǎn)力發(fā)展的強勁催化劑”。由此可見,AI已經(jīng)成為藍色巨人當(dāng)前及下個階段的發(fā)力重點?,F(xiàn)在IBM需要進一步加大力度,包括增加推廣投入、擴大銷售范圍并與Adobe及SAP等伙伴開展深度合作。簡而言之,IBM當(dāng)前的首要工作,就是對其此前所取得的成就做出一次漂亮的整理和總結(jié)。而隨著Granite 3.0模型的發(fā)布,我們可以看到IBM顯然決定走上一條多角度并進、以業(yè)務(wù)針對性為核心的戰(zhàn)略路線,既涉及針對消費者優(yōu)化的模型、又涵蓋針對企業(yè)優(yōu)化的模型和配套服務(wù)??偠灾?,IBM正傾盡全力投身于企業(yè)AI應(yīng)用。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論