本文來(lái)自開(kāi)源云中文社區(qū)。
我們需要做一些事情來(lái)談?wù)撻_(kāi)源和開(kāi)放性。至少?gòu)?006年開(kāi)始,筆者就清楚地知道——筆者因?yàn)檎J(rèn)為谷歌和雅虎阻礙開(kāi)源而與很多人有了爭(zhēng)吵。正如Tim O'Reilly當(dāng)時(shí)寫(xiě)道的那樣,在一個(gè)開(kāi)源的云時(shí)代,“為了讓別人運(yùn)行你的程序,分享源代碼副本的必要性的動(dòng)機(jī)之一不復(fù)存在了。不僅不再需要它,對(duì)于最大的應(yīng)用程序來(lái)說(shuō),這不再可能。”
在過(guò)去的十年里,共享的不可能性攪亂了開(kāi)源的定義,正如Mike Loukides最近指出的那樣,它現(xiàn)在正在影響我們對(duì)人工智能(AI)的思考方式。在人工智能領(lǐng)域進(jìn)行合作,從來(lái)沒(méi)有比這更重要的時(shí)刻,但也從來(lái)沒(méi)有比這更困難的時(shí)刻。正如Loukides所描述的,“由于其規(guī)模,大型語(yǔ)言模型在再現(xiàn)性方面存在重大問(wèn)題。”
正如2006年的云技術(shù)一樣,在人工智能領(lǐng)域做最有趣工作的公司可能會(huì)努力以我們傳統(tǒng)預(yù)期的方式“開(kāi)源”。即便如此,這并不意味著它們不能以有意義的方式開(kāi)放。
根據(jù)Loukides的說(shuō)法,雖然許多公司可能聲稱(chēng)參與了人工智能,但實(shí)際上只有三家公司推動(dòng)了該行業(yè)的發(fā)展:Facebook、OpenAI和谷歌。他們有什么共同點(diǎn)?大規(guī)模運(yùn)行模型的能力。換句話(huà)說(shuō),他們正在以一種你我都做不到的方式做人工智能。他們不是在試圖保密;他們只是擁有基礎(chǔ)設(shè)施和如何運(yùn)行基礎(chǔ)設(shè)施的知識(shí),而你我都沒(méi)有。
“你可以下載Facebook的OPT-175B的源代碼,”Loukides承認(rèn),“但你無(wú)法在任何你可以訪(fǎng)問(wèn)的硬件上對(duì)其進(jìn)行訓(xùn)練。即使對(duì)于大學(xué)和其他研究機(jī)構(gòu)來(lái)說(shuō),它也太大了。你仍然必須相信Facebook的話(huà),它做它所說(shuō)的事情。”,盡管Facebook宣布“共享開(kāi)放式預(yù)訓(xùn)練Transformer(OPT-175B)……讓更多社區(qū)參與了解這項(xiàng)基礎(chǔ)性新技術(shù)。”
這聽(tīng)起來(lái)不錯(cuò),但正如Loukides堅(jiān)持的那樣,“即使谷歌和OpenAI擁有足夠的計(jì)算資源,也可能無(wú)法復(fù)制OPT-175B。”為什么?“OPT-175B與Facebook的基礎(chǔ)設(shè)施(包括定制硬件)聯(lián)系太緊密,無(wú)法在谷歌的基礎(chǔ)設(shè)施上復(fù)制。盡管Facebook并沒(méi)有試圖隱藏它對(duì)OPT-175B的使用。建造這樣的基礎(chǔ)設(shè)施真的很難,即使是那個(gè)些有資金和技術(shù)的人最終也會(huì)建造一些不同的東西。
這正是雅虎的Jeremy Zawodny和谷歌的Chris DiBona于2006年在OSCON上所體現(xiàn)的。當(dāng)然,他們可以開(kāi)放所有代碼的源代碼,但考慮到它是以一種在其他任何地方都無(wú)法復(fù)制的方式大規(guī)模運(yùn)行的,別人能用它做什么呢?
回到人工智能。如果我們不了解機(jī)器內(nèi)部的科學(xué),就很難相信人工智能。我們需要找到開(kāi)放基礎(chǔ)設(shè)施的方法。Loukides有一個(gè)想法,盡管它可能無(wú)法滿(mǎn)足最狂熱的自由軟件/人工智能人士:“答案是向外部研究人員和早期采用者提供免費(fèi)訪(fǎng)問(wèn)權(quán)限,以便他們可以提出自己的問(wèn)題,并查看廣泛的結(jié)果。”不,不是讓他們通過(guò)鑰匙卡訪(fǎng)問(wèn)Facebook、谷歌或OpenAI的數(shù)據(jù)中心,而是通過(guò)公共API。這是一個(gè)有趣的想法,可能會(huì)奏效。
但它并不像許多人所希望的那樣“開(kāi)源”。
另一個(gè)角度看開(kāi)放
自2006年以來(lái),谷歌在滿(mǎn)足其戰(zhàn)略需求的情況下對(duì)關(guān)鍵基礎(chǔ)設(shè)施進(jìn)行了打包和開(kāi)源。TensorFlow開(kāi)源可以稱(chēng)為入站,Kubernetes的開(kāi)源可以稱(chēng)為出站,要么是機(jī)器學(xué)習(xí)的開(kāi)源行業(yè)標(biāo)準(zhǔn),有望帶來(lái)更多谷歌云工作負(fù)載,要么是確保云之間的可移植性,給谷歌云更多贏得工作負(fù)載的機(jī)會(huì)。這是一種智能業(yè)務(wù),但在某種程度上,它不是開(kāi)源的。
在這方面,谷歌也并非孤軍奮戰(zhàn)。它只是比大多數(shù)公司更擅長(zhǎng)開(kāi)源。因?yàn)殚_(kāi)源天生自私,公司和個(gè)人總是會(huì)打開(kāi)有利于他們或他們自己的客戶(hù)的代碼。一直都是這樣,而且永遠(yuǎn)都是這樣。
對(duì)于Loukides關(guān)于如何有意義地開(kāi)放人工智能的觀點(diǎn),盡管三大人工智能巨頭與其他所有人之間存在差異,但他并沒(méi)有像我們傳統(tǒng)上在開(kāi)源定義下那樣主張開(kāi)源。為什么?因?yàn)楸M管它很神奇(事實(shí)上也是如此),但它從來(lái)沒(méi)有解決過(guò)DiBona和Zawodny在2006年OSCON提出的軟件開(kāi)發(fā)者和消費(fèi)者的云開(kāi)源難題。已經(jīng)過(guò)去十多年的時(shí)間了,但我們還沒(méi)有找到答案。
筆者認(rèn)為我們需要一種新的思考開(kāi)源許可的方式,筆者的想法可能與Loukides思考人工智能的方式?jīng)]有太大的不同。我理解他的論點(diǎn),關(guān)鍵是為研究人員提供足夠的途徑,使他們能夠重現(xiàn)特定人工智能模型工作的成功和失敗。他們不需要完全訪(fǎng)問(wèn)所有代碼和基礎(chǔ)設(shè)施來(lái)運(yùn)行這些模型,因?yàn)檎缢f(shuō)的那樣,這樣做基本上是沒(méi)有意義的。在一個(gè)開(kāi)發(fā)者可以在筆記本電腦上運(yùn)行開(kāi)源程序并進(jìn)行衍生工作的世界里,要求完全訪(fǎng)問(wèn)該代碼是有道理的。考慮到谷歌或微軟今天運(yùn)行的代碼的規(guī)模和獨(dú)特的復(fù)雜性,這已經(jīng)沒(méi)有意義了。無(wú)論如何,并不是所有大規(guī)模運(yùn)行的云代碼。
我們需要拋棄開(kāi)源的非黑即白觀點(diǎn)。它從來(lái)不是一個(gè)特別有用的視角來(lái)看待開(kāi)源世界,考慮到我們的云時(shí)代,它正變得越來(lái)越不那么有用。作為公司和個(gè)人,我們的目標(biāo)應(yīng)該是以有利于我們的客戶(hù)和第三方開(kāi)發(fā)者的方式開(kāi)放對(duì)軟件的訪(fǎng)問(wèn),以促進(jìn)訪(fǎng)問(wèn)和理解,而不是試圖將幾十年前的開(kāi)源概念改造為云。它不適用于開(kāi)源,就像它不適用于人工智能一樣。是時(shí)候換個(gè)角度思考了。