本文來(lái)自微信公眾號(hào)“騰訊研究院”,葛凌 牛津大學(xué)博士、騰訊公司歐洲首席代表。
2023年3月,OpenAI發(fā)布了極具開(kāi)創(chuàng)性的GPT-4模型,這是生成式人工智能歷史上的里程碑。然而,這并不是3月唯一一件吸引科技界目光的活動(dòng)。僅在兩周后,在舊金山市區(qū)舉辦了另一個(gè)被業(yè)內(nèi)稱(chēng)為“AI屆的伍德斯托克”的活動(dòng)。(注:伍德斯托克音樂(lè)節(jié)在美國(guó)紐約州北部城鎮(zhèn)伍德斯托克附近舉行,是世界上最著名的系列性搖滾音樂(lè)節(jié)之一)
這次充滿(mǎn)活力的聚會(huì),旨在慶祝開(kāi)源類(lèi)生成式AI的快速發(fā)展,以及圍繞它涌現(xiàn)出來(lái)的社群。那之后的幾個(gè)月,開(kāi)源生態(tài)系統(tǒng)中出現(xiàn)了大量新的參與者、模型和用例。在未來(lái)的某一節(jié)點(diǎn),當(dāng)人們回望AI發(fā)展的歷史,極有可能會(huì)將這個(gè)專(zhuān)有模型和開(kāi)源模型公開(kāi)競(jìng)爭(zhēng)的階段視作決定性的時(shí)刻。
在GPT-4發(fā)布和“AI屆的伍德斯托克”聚會(huì)之后的六個(gè)月里,專(zhuān)有與開(kāi)源二者競(jìng)爭(zhēng)的往來(lái)招式變得更加犀利。為方便讀者更好的理解,先贅述一些學(xué)術(shù)定義:生成式AI被歸類(lèi)為“封閉源代碼”,其中專(zhuān)有基礎(chǔ)模型通常由大型科技公司擁有,用戶(hù)每次API調(diào)用需付費(fèi);相比之下,開(kāi)源生態(tài)系統(tǒng)則推崇免費(fèi)共享和可調(diào)整AI模型參數(shù)(參與的公司通過(guò)間接方式獲得收入,例如,通過(guò)分享云服務(wù)提供商提供其模型的收入)。
目前,我們正在見(jiàn)證這兩種路徑之間的較量。開(kāi)源模型的支持者聲稱(chēng)他們的進(jìn)步是強(qiáng)大且不可阻擋的。近期,OpenAI推出了GPT-Vision,這是另一個(gè)強(qiáng)大的專(zhuān)有模型,它旨在將視覺(jué)與文本相結(jié)合。在新書(shū)《即將來(lái)臨的浪潮》中,DeepMind聯(lián)合創(chuàng)始人Mustafa Suleyman認(rèn)為,出于安全考慮,應(yīng)該禁止在AI模型背景下進(jìn)行開(kāi)源。
全球企業(yè)和消費(fèi)者主要是采用封閉源代碼的生成式AI,還是主要采用開(kāi)源生成式AI,或者兩種類(lèi)型的平衡,將是問(wèn)題的關(guān)鍵。這個(gè)結(jié)果至關(guān)重要,不僅是從確保AI以有益于人類(lèi)的方式發(fā)展的角度出發(fā),還體現(xiàn)在它將塑造商業(yè)和社會(huì)中最具變革性的AI應(yīng)用案例,以及決定誰(shuí)將收獲生成式AI的回報(bào)。
但首先我們要弄清楚,這個(gè)“AI屆的伍德斯托克”節(jié)日到底是什么,參加的是誰(shuí)?“開(kāi)源AI聚會(huì)”于三月下旬在舊金山的探索館舉行,共有超過(guò)5000名與會(huì)者。就像它名字來(lái)源的搖滾音樂(lè)節(jié)一樣,這個(gè)聚會(huì)有著強(qiáng)烈的派對(duì)氛圍,而開(kāi)源運(yùn)動(dòng)的合作精神和創(chuàng)新能量進(jìn)一步強(qiáng)化了這種氛圍。
在人群中,舉辦了這場(chǎng)聚會(huì)的AI公司Hugging Face的首席執(zhí)行官Clement Delangue身著公司恰如其分的吉祥物裝,一個(gè)看起來(lái)像“擁抱臉”的歡快黃色表情符號(hào)??。羊駝在會(huì)場(chǎng)周?chē)e逛——這是對(duì)Meta的大型語(yǔ)言模型“LLaMA”的幽默致敬。在“釋放羊駝”的標(biāo)語(yǔ)飄揚(yáng)的空氣中,各種AI名人,如Andrew Ng以及大型語(yǔ)言模型(LLM)初創(chuàng)公司Anthropic的領(lǐng)導(dǎo)者在場(chǎng)。大多數(shù)的參會(huì)者都在時(shí)代雜志最近發(fā)布的AI領(lǐng)域100位最具影響力人物名單中。
盡管與任何科技會(huì)議都不同,但在現(xiàn)場(chǎng)被分享的觀念卻具有改變游戲規(guī)則的潛力,對(duì)生成式AI的巨大潛力也充滿(mǎn)了清晰而真誠(chéng)的興奮——麥肯錫最近估計(jì),在63個(gè)應(yīng)用案例中,這種潛力每年可額外增加2.6萬(wàn)億至4.4萬(wàn)億美元的價(jià)值。
各地的科技領(lǐng)袖都對(duì)此(生成式AI)充滿(mǎn)興奮。例如,騰訊公司創(chuàng)始人兼首席執(zhí)行官馬化騰在2023年5月公司股東大會(huì)上發(fā)言時(shí)表示:“我們最初認(rèn)為AI是互聯(lián)網(wǎng)行業(yè)十年一遇的機(jī)會(huì),但我們?cè)絹?lái)越意識(shí)到,這是一個(gè)幾百年才出現(xiàn)的、與工業(yè)革命和電力利用類(lèi)似的罕見(jiàn)機(jī)會(huì)。”
問(wèn)題在于,在兩種生成式AI模型中,哪一種正在引領(lǐng)新的工業(yè)革命?
目前,專(zhuān)有類(lèi)型領(lǐng)先。這有兩個(gè)明顯的原因:專(zhuān)有模型在能力方面處于領(lǐng)先地位,而且目前被認(rèn)為更安全。
首先是性能。根據(jù)領(lǐng)先的基準(zhǔn)測(cè)試,如大規(guī)模多任務(wù)語(yǔ)言理解測(cè)試,OpenAI的GPT-4目前以顯著優(yōu)勢(shì)成為最強(qiáng)大、最有能力的大語(yǔ)言模型。盡管開(kāi)源模型的質(zhì)量正在迅速提高,但它們?nèi)匀宦浜笥陬I(lǐng)先的封閉源代碼替代品。
這背后的原因是培訓(xùn)領(lǐng)先基礎(chǔ)模型的嚴(yán)峻商業(yè)現(xiàn)實(shí)。前期成本巨大,從購(gòu)買(mǎi)價(jià)格約為30,000美元的Nvidia頂級(jí)H100 GPU芯片,到龐大的云計(jì)算費(fèi)用都被計(jì)算在其中。此外,部署先進(jìn)的訓(xùn)練技術(shù),如使用人類(lèi)反饋的強(qiáng)化學(xué)習(xí),需要專(zhuān)業(yè)知識(shí)的加持。像Cohere、Anthropic、Adept、Mistral、Aleph Alpha、AI21 Labs和Imbue這樣的初創(chuàng)公司的支出模式——僅芯片支出就占據(jù)預(yù)算的很大一部分——就說(shuō)明了這一點(diǎn)。
總的來(lái)說(shuō),專(zhuān)有模型被投入了最多資源。在OpenAI的例子中,涉及的成本規(guī)模之大看起來(lái)可以促使其從開(kāi)放轉(zhuǎn)向封閉。OpenAI由首席執(zhí)行官Sam Altman與Elon Musk等知名人士于2015年創(chuàng)立,最初是為開(kāi)源模型而打造。然而,在發(fā)布迄今為止最強(qiáng)大的大語(yǔ)言模型時(shí),該組織放棄了最初的開(kāi)源承諾。這種轉(zhuǎn)變可以部分歸因于OpenAI需要保護(hù)其巨額投資。
目前,安全性被視為另一個(gè)封閉源代碼的優(yōu)勢(shì)。OpenAI聲稱(chēng),它選擇封閉的另一個(gè)原因是與大語(yǔ)言模型相關(guān)的道德風(fēng)險(xiǎn)。這些模型有被不良行為者濫用的可能性,隨著它們變得越來(lái)越強(qiáng)大,它們被公開(kāi)訪(fǎng)問(wèn)的風(fēng)險(xiǎn)也在增加。OpenAI的首席科學(xué)家Ilya Sutskever表示:“如果你和我們一樣相信,某個(gè)時(shí)候,AI或AGI將變得非常強(qiáng)大,那么開(kāi)源它根本沒(méi)有意義。這是一個(gè)糟糕的主意。”
那么,鑒于Sutskever的觀點(diǎn)和專(zhuān)有模型在性能上的優(yōu)勢(shì),為什么開(kāi)源生成式AI運(yùn)動(dòng)會(huì)引起如此多的關(guān)注呢?全球最大的科技公司以及初創(chuàng)公司和大量開(kāi)發(fā)者都在加入其中。
其中的一個(gè)原因是,隨著時(shí)間的推移,開(kāi)源在科技界慢慢地取得了成功。現(xiàn)代云基礎(chǔ)設(shè)施主要運(yùn)行在Linux上,機(jī)器學(xué)習(xí)由諸如Python之類(lèi)的開(kāi)源許可下開(kāi)發(fā)的語(yǔ)言驅(qū)動(dòng),開(kāi)源滲透到科技領(lǐng)域的許多方面。
“AI屆的伍德斯托克”的激動(dòng)人心之處在于開(kāi)源創(chuàng)新。開(kāi)源大語(yǔ)言模型將其權(quán)重和參數(shù)公開(kāi),使全球開(kāi)發(fā)者社區(qū)能夠?qū)ζ溥M(jìn)行微調(diào)和改進(jìn),激發(fā)出比最新的專(zhuān)有模型更大的創(chuàng)新。
對(duì)于希望采用生成式AI的企業(yè)來(lái)說(shuō),輕松微調(diào)開(kāi)源模型的能力也具有極大的吸引力——它使他們能夠根據(jù)自己公司特定的數(shù)據(jù)調(diào)整這些模型,以實(shí)現(xiàn)需要這些知識(shí)的特定用例。
“AI屆的伍德斯托克”的組織者Hugging Face是開(kāi)源AI運(yùn)動(dòng)的早期先驅(qū)之一。該公司成立于2016年,其開(kāi)源產(chǎn)品之一是Transformers庫(kù)。該庫(kù)作為一個(gè)開(kāi)放的大語(yǔ)言模型存儲(chǔ)庫(kù),客戶(hù)可以訪(fǎng)問(wèn)以進(jìn)一步自行調(diào)整模型,或者通過(guò)API調(diào)用典型的大語(yǔ)言模型功能,如句子補(bǔ)全、分類(lèi)或文本生成。這個(gè)“模型即服務(wù)”平臺(tái)使各種規(guī)模的企業(yè)能夠從實(shí)驗(yàn)過(guò)渡到部署,無(wú)需過(guò)多的內(nèi)部資源。用戶(hù)可以使用托管基礎(chǔ)設(shè)施將任何模型轉(zhuǎn)換為自己的API,將開(kāi)源模型民主化AI的精神展現(xiàn)得淋漓盡致。
微軟、谷歌、Meta、英特爾和eBay等公司是Hugging Face的1萬(wàn)多名客戶(hù)中的一部分。它的“模型即服務(wù)”概念已經(jīng)發(fā)展到托管超過(guò)100萬(wàn)個(gè)模型、數(shù)據(jù)集和應(yīng)用程序。這個(gè)多樣化的生態(tài)系統(tǒng)強(qiáng)調(diào)了其開(kāi)源工具的廣泛適用性,從輝瑞和羅氏等制藥巨頭的數(shù)據(jù)安全升級(jí)專(zhuān)門(mén)的AI應(yīng)用,如彭博的財(cái)經(jīng)語(yǔ)言模型BloombergGPT,其都有涉及。
隨著AI領(lǐng)域的不斷發(fā)展,主要人物和關(guān)鍵參與者越來(lái)越傾向于支持生成式AI成為開(kāi)源。圖靈獎(jiǎng)獲得者、Meta首席AI科學(xué)家Yann LeCun闡述了他認(rèn)為我們需要開(kāi)源大語(yǔ)言模型的原因:“由于AI基礎(chǔ)模型在未來(lái)將成為基本基礎(chǔ)設(shè)施,人們和行業(yè)會(huì)要求它是開(kāi)源的。就像互聯(lián)網(wǎng)的軟件基礎(chǔ)設(shè)施一樣。”
Meta首席執(zhí)行官馬克·扎克伯格在支持開(kāi)源方面有著不同的理由。“它每天都在變得更加高效,”他評(píng)論道。“我只是覺(jué)得我們也會(huì)從整個(gè)學(xué)生、黑客、初創(chuàng)公司和不同人群使用這個(gè)模型中學(xué)到很多。”
為順應(yīng)這種精神,Meta在7月發(fā)布的LLaMa-2可以說(shuō)是迄今為止公眾可以使用的最強(qiáng)大、最高性能的開(kāi)源大語(yǔ)言模型,具有預(yù)訓(xùn)練和微調(diào)版本,擁有70億、130億和700億參數(shù)。
除了像LLaMa-2這樣的主流舉措之外,其他值得關(guān)注的項(xiàng)目也在為開(kāi)源AI生態(tài)系統(tǒng)做出貢獻(xiàn)。例如,Runway于2018年開(kāi)始專(zhuān)注于為電影制作人提供AI工具,但現(xiàn)在已轉(zhuǎn)向生成式AI。它的代表性產(chǎn)品Gen-2在根據(jù)文本提示創(chuàng)建視頻方面具有先鋒性,公司還特別推出了Runway Studios和AI電影節(jié)以擴(kuò)大其影響力。
另一方面,作為一個(gè)Python庫(kù),LangChain旨在增強(qiáng)大語(yǔ)言模型的可用性、可訪(fǎng)問(wèn)性和多功能性,使開(kāi)發(fā)者更容易將這些強(qiáng)大的工具集成到各種應(yīng)用程序中。這些項(xiàng)目都展示了開(kāi)源AI模型在不同領(lǐng)域日益多樣化和適用性的增長(zhǎng)。
開(kāi)源模型也在挑戰(zhàn)一個(gè)觀念,即在模型參數(shù)方面,更大總是更好。較小的模型可以提供成本效益、更大的靈活性,甚至在針對(duì)特定應(yīng)用進(jìn)行微調(diào)時(shí)可能優(yōu)于較大的模型。
在關(guān)于如何確保AI安全和負(fù)責(zé)任的關(guān)鍵問(wèn)題上,開(kāi)源模型一方也有很好的論據(jù)。專(zhuān)有模型的支持者認(rèn)為,讓所有人都能訪(fǎng)問(wèn)這些模型是危險(xiǎn)的。然而,開(kāi)源AI的支持者反駁說(shuō),開(kāi)源大語(yǔ)言模型既提供了透明度,又吸引了來(lái)自多元社區(qū)的審查。這有助于識(shí)別和減少偏見(jiàn),使它們更公平。此外,與一些封閉源代碼模型不同,開(kāi)源在用戶(hù)數(shù)據(jù)的使用方面提供了透明度。
未來(lái)會(huì)如何發(fā)展,哪種模型會(huì)勝出呢?總的來(lái)說(shuō),每種方法都有其優(yōu)點(diǎn)。專(zhuān)有模型(如GPT-4)具有獨(dú)特的優(yōu)勢(shì),包括個(gè)性化的定制、專(zhuān)用支持和強(qiáng)大的安全功能。另一方面,諸如效率、透明度和公平性等特點(diǎn)為開(kāi)源AI提供了有力的論據(jù)。
當(dāng)然,一個(gè)理性的策略是讓公司提供并利用這兩個(gè)模型的優(yōu)點(diǎn)。在這一方面,騰訊公司采取了雙重策略。我們推出了專(zhuān)有的基礎(chǔ)AI模型“混元”,它可被用于多種應(yīng)用方向,同時(shí)還在騰訊云上提供了“模型即服務(wù)”解決方案。該服務(wù)旨在實(shí)現(xiàn)在多個(gè)行業(yè)中高效部署開(kāi)源模型。
我們預(yù)計(jì),未來(lái)格局將是少數(shù)專(zhuān)有基礎(chǔ)模型占主導(dǎo)地位,但針對(duì)特定行業(yè)和企業(yè)應(yīng)用的開(kāi)源專(zhuān)門(mén)模型也將繁榮發(fā)展。基于非常小型模型(能夠在智能手機(jī)和筆記本電腦上的即時(shí)通訊軟件中運(yùn)行)的個(gè)人AI助手將成為我們的陪伴者。
Meta的LLaMa-2由美國(guó)云服務(wù)提供商如Microsoft Azure和Amazon AWS托管,這凸顯了這些科技公司同樣看到了支持開(kāi)源模型以及專(zhuān)有模型的價(jià)值。
我們應(yīng)該歡迎開(kāi)源和專(zhuān)有模型之間的良性競(jìng)爭(zhēng)。幸運(yùn)的是,目前似乎沒(méi)有哪種方法會(huì)占據(jù)主導(dǎo)地位的可能。過(guò)去六個(gè)月,這兩類(lèi)模型之間的質(zhì)量差距已經(jīng)縮小。開(kāi)源模型激發(fā)創(chuàng)新以及促進(jìn)責(zé)任和安全的潛力正變得越來(lái)越明顯。
牛津大學(xué)計(jì)算機(jī)科學(xué)教授、圖靈研究所基礎(chǔ)AI研究主管邁克爾·伍爾德里奇教授是AI領(lǐng)域的先驅(qū),他將在2023年皇家學(xué)會(huì)圣誕講座上演講“關(guān)于AI的真相”。他希望看到這兩種方法都能繁榮發(fā)展。他認(rèn)為:“在這個(gè)關(guān)鍵的時(shí)刻,像ChatGPT這樣的大眾市場(chǎng)、通用AI工具已經(jīng)出現(xiàn)。開(kāi)源和專(zhuān)有模型各有優(yōu)缺點(diǎn)。在我們繼續(xù)發(fā)展的過(guò)程中,保持二者的平衡以確保AI繼續(xù)成為造福更廣泛社會(huì)的工具至關(guān)重要。”