免费国产成人片精品在线观看,国产SUV精品一区二区五,亚洲国产日韩在线人成电影

走向平衡：生成式AI的開(kāi)源與專(zhuān)有模型之爭(zhēng)

2023-10-11 09:41

騰訊研究院

葛凌博士

全球企業(yè)和消費(fèi)者主要是采用封閉源代碼的生成式AI，還是主要采用開(kāi)源生成式AI，或者兩種類(lèi)型的平衡，將是問(wèn)題的關(guān)鍵。這個(gè)結(jié)果至關(guān)重要，不僅是從確保AI以有益于人類(lèi)的方式發(fā)展的角度出發(fā)，還體現(xiàn)在它將塑造商業(yè)和社會(huì)中最具變革性的AI應(yīng)用案例，以及決定誰(shuí)將收獲生成式AI的回報(bào)。

本文來(lái)自微信公眾號(hào)“騰訊研究院”，葛凌牛津大學(xué)博士、騰訊公司歐洲首席代表。

2023年3月，OpenAI發(fā)布了極具開(kāi)創(chuàng)性的GPT-4模型，這是生成式人工智能歷史上的里程碑。然而，這并不是3月唯一一件吸引科技界目光的活動(dòng)。僅在兩周后，在舊金山市區(qū)舉辦了另一個(gè)被業(yè)內(nèi)稱(chēng)為“AI屆的伍德斯托克”的活動(dòng)。（注：伍德斯托克音樂(lè)節(jié)在美國(guó)紐約州北部城鎮(zhèn)伍德斯托克附近舉行，是世界上最著名的系列性搖滾音樂(lè)節(jié)之一）

這次充滿(mǎn)活力的聚會(huì)，旨在慶祝開(kāi)源類(lèi)生成式AI的快速發(fā)展，以及圍繞它涌現(xiàn)出來(lái)的社群。那之后的幾個(gè)月，開(kāi)源生態(tài)系統(tǒng)中出現(xiàn)了大量新的參與者、模型和用例。在未來(lái)的某一節(jié)點(diǎn)，當(dāng)人們回望AI發(fā)展的歷史，極有可能會(huì)將這個(gè)專(zhuān)有模型和開(kāi)源模型公開(kāi)競(jìng)爭(zhēng)的階段視作決定性的時(shí)刻。

在GPT-4發(fā)布和“AI屆的伍德斯托克”聚會(huì)之后的六個(gè)月里，專(zhuān)有與開(kāi)源二者競(jìng)爭(zhēng)的往來(lái)招式變得更加犀利。為方便讀者更好的理解，先贅述一些學(xué)術(shù)定義：生成式AI被歸類(lèi)為“封閉源代碼”，其中專(zhuān)有基礎(chǔ)模型通常由大型科技公司擁有，用戶(hù)每次API調(diào)用需付費(fèi)；相比之下，開(kāi)源生態(tài)系統(tǒng)則推崇免費(fèi)共享和可調(diào)整AI模型參數(shù)（參與的公司通過(guò)間接方式獲得收入，例如，通過(guò)分享云服務(wù)提供商提供其模型的收入）。

目前，我們正在見(jiàn)證這兩種路徑之間的較量。開(kāi)源模型的支持者聲稱(chēng)他們的進(jìn)步是強(qiáng)大且不可阻擋的。近期，OpenAI推出了GPT-Vision，這是另一個(gè)強(qiáng)大的專(zhuān)有模型，它旨在將視覺(jué)與文本相結(jié)合。在新書(shū)《即將來(lái)臨的浪潮》中，DeepMind聯(lián)合創(chuàng)始人Mustafa Suleyman認(rèn)為，出于安全考慮，應(yīng)該禁止在AI模型背景下進(jìn)行開(kāi)源。

但首先我們要弄清楚，這個(gè)“AI屆的伍德斯托克”節(jié)日到底是什么，參加的是誰(shuí)？“開(kāi)源AI聚會(huì)”于三月下旬在舊金山的探索館舉行，共有超過(guò)5000名與會(huì)者。就像它名字來(lái)源的搖滾音樂(lè)節(jié)一樣，這個(gè)聚會(huì)有著強(qiáng)烈的派對(duì)氛圍，而開(kāi)源運(yùn)動(dòng)的合作精神和創(chuàng)新能量進(jìn)一步強(qiáng)化了這種氛圍。

在人群中，舉辦了這場(chǎng)聚會(huì)的AI公司Hugging Face的首席執(zhí)行官Clement Delangue身著公司恰如其分的吉祥物裝，一個(gè)看起來(lái)像“擁抱臉”的歡快黃色表情符號(hào)??。羊駝在會(huì)場(chǎng)周?chē)e逛——這是對(duì)Meta的大型語(yǔ)言模型“LLaMA”的幽默致敬。在“釋放羊駝”的標(biāo)語(yǔ)飄揚(yáng)的空氣中，各種AI名人，如Andrew Ng以及大型語(yǔ)言模型（LLM）初創(chuàng)公司Anthropic的領(lǐng)導(dǎo)者在場(chǎng)。大多數(shù)的參會(huì)者都在時(shí)代雜志最近發(fā)布的AI領(lǐng)域100位最具影響力人物名單中。

盡管與任何科技會(huì)議都不同，但在現(xiàn)場(chǎng)被分享的觀念卻具有改變游戲規(guī)則的潛力，對(duì)生成式AI的巨大潛力也充滿(mǎn)了清晰而真誠(chéng)的興奮——麥肯錫最近估計(jì)，在63個(gè)應(yīng)用案例中，這種潛力每年可額外增加2.6萬(wàn)億至4.4萬(wàn)億美元的價(jià)值。

各地的科技領(lǐng)袖都對(duì)此（生成式AI）充滿(mǎn)興奮。例如，騰訊公司創(chuàng)始人兼首席執(zhí)行官馬化騰在2023年5月公司股東大會(huì)上發(fā)言時(shí)表示：“我們最初認(rèn)為AI是互聯(lián)網(wǎng)行業(yè)十年一遇的機(jī)會(huì)，但我們?cè)絹?lái)越意識(shí)到，這是一個(gè)幾百年才出現(xiàn)的、與工業(yè)革命和電力利用類(lèi)似的罕見(jiàn)機(jī)會(huì)。”

問(wèn)題在于，在兩種生成式AI模型中，哪一種正在引領(lǐng)新的工業(yè)革命？

目前，專(zhuān)有類(lèi)型領(lǐng)先。這有兩個(gè)明顯的原因：專(zhuān)有模型在能力方面處于領(lǐng)先地位，而且目前被認(rèn)為更安全。

首先是性能。根據(jù)領(lǐng)先的基準(zhǔn)測(cè)試，如大規(guī)模多任務(wù)語(yǔ)言理解測(cè)試，OpenAI的GPT-4目前以顯著優(yōu)勢(shì)成為最強(qiáng)大、最有能力的大語(yǔ)言模型。盡管開(kāi)源模型的質(zhì)量正在迅速提高，但它們?nèi)匀宦浜笥陬I(lǐng)先的封閉源代碼替代品。

這背后的原因是培訓(xùn)領(lǐng)先基礎(chǔ)模型的嚴(yán)峻商業(yè)現(xiàn)實(shí)。前期成本巨大，從購(gòu)買(mǎi)價(jià)格約為30,000美元的Nvidia頂級(jí)H100 GPU芯片，到龐大的云計(jì)算費(fèi)用都被計(jì)算在其中。此外，部署先進(jìn)的訓(xùn)練技術(shù)，如使用人類(lèi)反饋的強(qiáng)化學(xué)習(xí)，需要專(zhuān)業(yè)知識(shí)的加持。像Cohere、Anthropic、Adept、Mistral、Aleph Alpha、AI21 Labs和Imbue這樣的初創(chuàng)公司的支出模式——僅芯片支出就占據(jù)預(yù)算的很大一部分——就說(shuō)明了這一點(diǎn)。

總的來(lái)說(shuō)，專(zhuān)有模型被投入了最多資源。在OpenAI的例子中，涉及的成本規(guī)模之大看起來(lái)可以促使其從開(kāi)放轉(zhuǎn)向封閉。OpenAI由首席執(zhí)行官Sam Altman與Elon Musk等知名人士于2015年創(chuàng)立，最初是為開(kāi)源模型而打造。然而，在發(fā)布迄今為止最強(qiáng)大的大語(yǔ)言模型時(shí)，該組織放棄了最初的開(kāi)源承諾。這種轉(zhuǎn)變可以部分歸因于OpenAI需要保護(hù)其巨額投資。

目前，安全性被視為另一個(gè)封閉源代碼的優(yōu)勢(shì)。OpenAI聲稱(chēng)，它選擇封閉的另一個(gè)原因是與大語(yǔ)言模型相關(guān)的道德風(fēng)險(xiǎn)。這些模型有被不良行為者濫用的可能性，隨著它們變得越來(lái)越強(qiáng)大，它們被公開(kāi)訪(fǎng)問(wèn)的風(fēng)險(xiǎn)也在增加。OpenAI的首席科學(xué)家Ilya Sutskever表示：“如果你和我們一樣相信，某個(gè)時(shí)候，AI或AGI將變得非常強(qiáng)大，那么開(kāi)源它根本沒(méi)有意義。這是一個(gè)糟糕的主意。”

那么，鑒于Sutskever的觀點(diǎn)和專(zhuān)有模型在性能上的優(yōu)勢(shì)，為什么開(kāi)源生成式AI運(yùn)動(dòng)會(huì)引起如此多的關(guān)注呢？全球最大的科技公司以及初創(chuàng)公司和大量開(kāi)發(fā)者都在加入其中。

其中的一個(gè)原因是，隨著時(shí)間的推移，開(kāi)源在科技界慢慢地取得了成功。現(xiàn)代云基礎(chǔ)設(shè)施主要運(yùn)行在Linux上，機(jī)器學(xué)習(xí)由諸如Python之類(lèi)的開(kāi)源許可下開(kāi)發(fā)的語(yǔ)言驅(qū)動(dòng)，開(kāi)源滲透到科技領(lǐng)域的許多方面。

“AI屆的伍德斯托克”的激動(dòng)人心之處在于開(kāi)源創(chuàng)新。開(kāi)源大語(yǔ)言模型將其權(quán)重和參數(shù)公開(kāi)，使全球開(kāi)發(fā)者社區(qū)能夠?qū)ζ溥M(jìn)行微調(diào)和改進(jìn)，激發(fā)出比最新的專(zhuān)有模型更大的創(chuàng)新。

對(duì)于希望采用生成式AI的企業(yè)來(lái)說(shuō)，輕松微調(diào)開(kāi)源模型的能力也具有極大的吸引力——它使他們能夠根據(jù)自己公司特定的數(shù)據(jù)調(diào)整這些模型，以實(shí)現(xiàn)需要這些知識(shí)的特定用例。

“AI屆的伍德斯托克”的組織者Hugging Face是開(kāi)源AI運(yùn)動(dòng)的早期先驅(qū)之一。該公司成立于2016年，其開(kāi)源產(chǎn)品之一是Transformers庫(kù)。該庫(kù)作為一個(gè)開(kāi)放的大語(yǔ)言模型存儲(chǔ)庫(kù)，客戶(hù)可以訪(fǎng)問(wèn)以進(jìn)一步自行調(diào)整模型，或者通過(guò)API調(diào)用典型的大語(yǔ)言模型功能，如句子補(bǔ)全、分類(lèi)或文本生成。這個(gè)“模型即服務(wù)”平臺(tái)使各種規(guī)模的企業(yè)能夠從實(shí)驗(yàn)過(guò)渡到部署，無(wú)需過(guò)多的內(nèi)部資源。用戶(hù)可以使用托管基礎(chǔ)設(shè)施將任何模型轉(zhuǎn)換為自己的API，將開(kāi)源模型民主化AI的精神展現(xiàn)得淋漓盡致。

微軟、谷歌、Meta、英特爾和eBay等公司是Hugging Face的1萬(wàn)多名客戶(hù)中的一部分。它的“模型即服務(wù)”概念已經(jīng)發(fā)展到托管超過(guò)100萬(wàn)個(gè)模型、數(shù)據(jù)集和應(yīng)用程序。這個(gè)多樣化的生態(tài)系統(tǒng)強(qiáng)調(diào)了其開(kāi)源工具的廣泛適用性，從輝瑞和羅氏等制藥巨頭的數(shù)據(jù)安全升級(jí)專(zhuān)門(mén)的AI應(yīng)用，如彭博的財(cái)經(jīng)語(yǔ)言模型BloombergGPT，其都有涉及。

隨著AI領(lǐng)域的不斷發(fā)展，主要人物和關(guān)鍵參與者越來(lái)越傾向于支持生成式AI成為開(kāi)源。圖靈獎(jiǎng)獲得者、Meta首席AI科學(xué)家Yann LeCun闡述了他認(rèn)為我們需要開(kāi)源大語(yǔ)言模型的原因：“由于AI基礎(chǔ)模型在未來(lái)將成為基本基礎(chǔ)設(shè)施，人們和行業(yè)會(huì)要求它是開(kāi)源的。就像互聯(lián)網(wǎng)的軟件基礎(chǔ)設(shè)施一樣。”

Meta首席執(zhí)行官馬克·扎克伯格在支持開(kāi)源方面有著不同的理由。“它每天都在變得更加高效，”他評(píng)論道。“我只是覺(jué)得我們也會(huì)從整個(gè)學(xué)生、黑客、初創(chuàng)公司和不同人群使用這個(gè)模型中學(xué)到很多。”

為順應(yīng)這種精神，Meta在7月發(fā)布的LLaMa-2可以說(shuō)是迄今為止公眾可以使用的最強(qiáng)大、最高性能的開(kāi)源大語(yǔ)言模型，具有預(yù)訓(xùn)練和微調(diào)版本，擁有70億、130億和700億參數(shù)。

除了像LLaMa-2這樣的主流舉措之外，其他值得關(guān)注的項(xiàng)目也在為開(kāi)源AI生態(tài)系統(tǒng)做出貢獻(xiàn)。例如，Runway于2018年開(kāi)始專(zhuān)注于為電影制作人提供AI工具，但現(xiàn)在已轉(zhuǎn)向生成式AI。它的代表性產(chǎn)品Gen-2在根據(jù)文本提示創(chuàng)建視頻方面具有先鋒性，公司還特別推出了Runway Studios和AI電影節(jié)以擴(kuò)大其影響力。

另一方面，作為一個(gè)Python庫(kù)，LangChain旨在增強(qiáng)大語(yǔ)言模型的可用性、可訪(fǎng)問(wèn)性和多功能性，使開(kāi)發(fā)者更容易將這些強(qiáng)大的工具集成到各種應(yīng)用程序中。這些項(xiàng)目都展示了開(kāi)源AI模型在不同領(lǐng)域日益多樣化和適用性的增長(zhǎng)。

開(kāi)源模型也在挑戰(zhàn)一個(gè)觀念，即在模型參數(shù)方面，更大總是更好。較小的模型可以提供成本效益、更大的靈活性，甚至在針對(duì)特定應(yīng)用進(jìn)行微調(diào)時(shí)可能優(yōu)于較大的模型。

在關(guān)于如何確保AI安全和負(fù)責(zé)任的關(guān)鍵問(wèn)題上，開(kāi)源模型一方也有很好的論據(jù)。專(zhuān)有模型的支持者認(rèn)為，讓所有人都能訪(fǎng)問(wèn)這些模型是危險(xiǎn)的。然而，開(kāi)源AI的支持者反駁說(shuō)，開(kāi)源大語(yǔ)言模型既提供了透明度，又吸引了來(lái)自多元社區(qū)的審查。這有助于識(shí)別和減少偏見(jiàn)，使它們更公平。此外，與一些封閉源代碼模型不同，開(kāi)源在用戶(hù)數(shù)據(jù)的使用方面提供了透明度。

未來(lái)會(huì)如何發(fā)展，哪種模型會(huì)勝出呢？總的來(lái)說(shuō)，每種方法都有其優(yōu)點(diǎn)。專(zhuān)有模型（如GPT-4）具有獨(dú)特的優(yōu)勢(shì)，包括個(gè)性化的定制、專(zhuān)用支持和強(qiáng)大的安全功能。另一方面，諸如效率、透明度和公平性等特點(diǎn)為開(kāi)源AI提供了有力的論據(jù)。

當(dāng)然，一個(gè)理性的策略是讓公司提供并利用這兩個(gè)模型的優(yōu)點(diǎn)。在這一方面，騰訊公司采取了雙重策略。我們推出了專(zhuān)有的基礎(chǔ)AI模型“混元”，它可被用于多種應(yīng)用方向，同時(shí)還在騰訊云上提供了“模型即服務(wù)”解決方案。該服務(wù)旨在實(shí)現(xiàn)在多個(gè)行業(yè)中高效部署開(kāi)源模型。

我們預(yù)計(jì)，未來(lái)格局將是少數(shù)專(zhuān)有基礎(chǔ)模型占主導(dǎo)地位，但針對(duì)特定行業(yè)和企業(yè)應(yīng)用的開(kāi)源專(zhuān)門(mén)模型也將繁榮發(fā)展。基于非常小型模型（能夠在智能手機(jī)和筆記本電腦上的即時(shí)通訊軟件中運(yùn)行）的個(gè)人AI助手將成為我們的陪伴者。

Meta的LLaMa-2由美國(guó)云服務(wù)提供商如Microsoft Azure和Amazon AWS托管，這凸顯了這些科技公司同樣看到了支持開(kāi)源模型以及專(zhuān)有模型的價(jià)值。

我們應(yīng)該歡迎開(kāi)源和專(zhuān)有模型之間的良性競(jìng)爭(zhēng)。幸運(yùn)的是，目前似乎沒(méi)有哪種方法會(huì)占據(jù)主導(dǎo)地位的可能。過(guò)去六個(gè)月，這兩類(lèi)模型之間的質(zhì)量差距已經(jīng)縮小。開(kāi)源模型激發(fā)創(chuàng)新以及促進(jìn)責(zé)任和安全的潛力正變得越來(lái)越明顯。

牛津大學(xué)計(jì)算機(jī)科學(xué)教授、圖靈研究所基礎(chǔ)AI研究主管邁克爾·伍爾德里奇教授是AI領(lǐng)域的先驅(qū)，他將在2023年皇家學(xué)會(huì)圣誕講座上演講“關(guān)于AI的真相”。他希望看到這兩種方法都能繁榮發(fā)展。他認(rèn)為：“在這個(gè)關(guān)鍵的時(shí)刻，像ChatGPT這樣的大眾市場(chǎng)、通用AI工具已經(jīng)出現(xiàn)。開(kāi)源和專(zhuān)有模型各有優(yōu)缺點(diǎn)。在我們繼續(xù)發(fā)展的過(guò)程中，保持二者的平衡以確保AI繼續(xù)成為造福更廣泛社會(huì)的工具至關(guān)重要。”

THEEND

免責(zé)聲明：凡注明為其它來(lái)源的信息均轉(zhuǎn)自其它平臺(tái)，由網(wǎng)友自主投稿和發(fā)布、編輯整理上傳，對(duì)此類(lèi)作品本站僅提供交流平臺(tái)，不為其版權(quán)負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。若有來(lái)源標(biāo)注錯(cuò)誤或侵犯了您的合法權(quán)益，請(qǐng)作者持權(quán)屬證明與本站聯(lián)系，我們將及時(shí)更正、刪除，謝謝。聯(lián)系郵箱：xiali@infoobs.com

本月熱門(mén)

精選文章

熱點(diǎn)資訊

2023年第三季度勒索軟件攻擊趨勢(shì)總結(jié)

走向平衡：生成式AI的開(kāi)源與專(zhuān)有模型之爭(zhēng)

2024 信息化觀察網(wǎng)

長(zhǎng)按掃描二維碼閱讀原文

走向平衡：生成式AI的開(kāi)源與專(zhuān)有模型之爭(zhēng)

最新評(píng)論（評(píng)論僅代表用戶(hù)觀點(diǎn)）

AI引領(lǐng)電商革命：重塑消費(fèi)者體驗(yàn)

5月6日起，北京換補(bǔ)發(fā)出入境證件全程網(wǎng)辦!多項(xiàng)政策有調(diào)整

基礎(chǔ)設(shè)施即代碼還是云平臺(tái)，你來(lái)定

云計(jì)算的十大好處

本月熱門(mén)

云計(jì)算的江湖，風(fēng)云再起

揭秘，IOTE國(guó)際物聯(lián)網(wǎng)展2025年巡展預(yù)告!

防勒索病毒攻擊關(guān)鍵措施

匯聚行業(yè)精英，探討前沿技術(shù) 第十九屆汽車(chē)涂裝工藝技術(shù)研討會(huì)即將啟幕!

網(wǎng)博會(huì)革新升級(jí)：“區(qū)域頻道”精準(zhǔn)選型引領(lǐng)，引領(lǐng)智能制造新風(fēng)潮

萬(wàn)億賽道!AI算力趨勢(shì)發(fā)展深度分析 2024

精選文章

2024（第七屆）信息技術(shù)應(yīng)用創(chuàng)新大會(huì)在京召開(kāi)

威剛工控發(fā)布A+ OPAL工業(yè)級(jí)數(shù)據(jù)安全軟件

第六屆數(shù)字中國(guó)建設(shè)峰會(huì) | 安勝網(wǎng)絡(luò)安全專(zhuān)家牛軍應(yīng)邀參加并做分論壇主題演講

郝軼：面向未來(lái) 有效保護(hù)的智安全架構(gòu)

QuestMobile 2023中國(guó)移動(dòng)互聯(lián)網(wǎng)秋季大報(bào)告：全網(wǎng)用戶(hù)穩(wěn)定增長(zhǎng)，三大特點(diǎn)支撐回暖，00后與60后持續(xù)增長(zhǎng)

蘋(píng)果和高通的專(zhuān)利之戰(zhàn)：誰(shuí)才是最后的贏家？

熱點(diǎn)資訊

榮耀應(yīng)用市場(chǎng)攜手?jǐn)?shù)智融合應(yīng)用伙伴共創(chuàng)綠色生態(tài)

“皇冠丹麥曲奇”勝訴 “藍(lán)罐曲奇”敗訴——市場(chǎng)競(jìng)爭(zhēng)需遵守法律底線(xiàn)

什么是 OSI 模型？OSI 模型的七層是哪些？

自動(dòng)化測(cè)試有哪些常見(jiàn)的挑戰(zhàn)和解決方案？

政策寶閃耀2024數(shù)智融合應(yīng)用論壇，榮獲“數(shù)智融合標(biāo)桿案例”

2023年第三季度勒索軟件攻擊趨勢(shì)總結(jié)

極端天氣多發(fā)，數(shù)據(jù)中心如何通過(guò)專(zhuān)業(yè)運(yùn)維與科技創(chuàng)新保障運(yùn)營(yíng)？

走向平衡：生成式AI的開(kāi)源與專(zhuān)有模型之爭(zhēng)

最新評(píng)論（評(píng)論僅代表用戶(hù)觀點(diǎn)）

欄目推薦

AI引領(lǐng)電商革命：重塑消費(fèi)者體驗(yàn)

5月6日起，北京換補(bǔ)發(fā)出入境證件全程網(wǎng)辦!多項(xiàng)政策有調(diào)整

基礎(chǔ)設(shè)施即代碼還是云平臺(tái)，你來(lái)定

云計(jì)算的十大好處

本月熱門(mén)

精選文章

熱點(diǎn)資訊

2023年第三季度勒索軟件攻擊趨勢(shì)總結(jié)

極端天氣多發(fā)，數(shù)據(jù)中心如何通過(guò)專(zhuān)業(yè)運(yùn)維與科技創(chuàng)新保障運(yùn)營(yíng)？

5月6日起，北京換補(bǔ)發(fā)出入境證件全程網(wǎng)辦!多項(xiàng)政策有調(diào)整

極端天氣多發(fā)，數(shù)據(jù)中心如何通過(guò)專(zhuān)業(yè)運(yùn)維與科技創(chuàng)新保障運(yùn)營(yíng)？