本文來自文匯網(wǎng),作者:沈湫莎,編輯:范菁。
正如人類歷史上無數(shù)次科技創(chuàng)新所展示的那樣,爆炸式創(chuàng)新、現(xiàn)象級產(chǎn)品總是突然地、從人們未曾預(yù)料的地方冒出來。2023年初最“出圈”的科技新詞非“ChatGPT”莫屬,最近一周,它的服務(wù)器訪問量始終處于滿負荷狀態(tài)(2月5日本報第三版“熱點聚焦”刊登報道《ChatGPT火熱“出圈”,我們?nèi)绾螒?yīng)對新挑戰(zhàn)》)。
有人將人工智能(AI)比喻為飛馳的列車,人們只有一秒鐘與它擦肩而過,之后它就呼嘯著離人遠去,“擦肩”寓意AI與人類的智力水平相當(dāng)之時。如今,ChatGPT的火爆程度已無需用語言描述,人們更想知道我們已經(jīng)到了與呼嘯列車“擦肩”的時刻了嗎?
“簡單粗暴”更勝一籌?
同一理論基礎(chǔ),兩條技術(shù)路線
在ChatGPT爆火之前,AI領(lǐng)域的翹楚當(dāng)屬谷歌,不僅論文發(fā)表數(shù)量最多,其對思維鏈路提示、大模型涌現(xiàn)現(xiàn)象的研究也走在前列。從技術(shù)路線看,谷歌所推出的各種大模型和OpenAI推出的ChatGPT都源自2017年AI領(lǐng)域的一篇重磅論文《一種采用自注意力機制的深度學(xué)習(xí)模型Transformer》,但在模型構(gòu)建上,兩者選擇了不同的技術(shù)路線。
中國計算機學(xué)會術(shù)語工委副主任、同濟大學(xué)特聘研究員王昊奮表示,谷歌采用的是理解與生成相結(jié)合的路線,在編碼端投入更多精力,以便讓機器理解輸入內(nèi)容的意圖和情感,也就是先理解再生成,這似乎更接近于人腦的工作模式。而OpenAI團隊則認為,“如果機器能夠輸出內(nèi)容,那么它肯定能理解這些內(nèi)容”,于是舍棄了編碼端的工作,專注于解碼,即讓機器生成人可理解的內(nèi)容。相比谷歌,OpenAI的模型顯得有些“簡單粗暴”。
從目前的結(jié)果來看,似乎是“離經(jīng)叛道”的OpenAI暫時領(lǐng)先于“名門正派”的谷歌。ChatGPT已經(jīng)成為史上用戶增速最快的消費級應(yīng)用程序,推出僅兩個月便突破了一億用戶,對于以數(shù)據(jù)和應(yīng)用驅(qū)動的AI產(chǎn)業(yè)來說,更多用戶意味著更多數(shù)據(jù)、更多應(yīng)用場景和更多訓(xùn)練。
非線性增長突變?nèi)绾伟l(fā)生?
消化全球互聯(lián)網(wǎng)2/3文本語料
王昊奮曾問過ChatGPT所依賴的大規(guī)模語言模型GPT-3這樣一個問題:“我能請猴子來裝修房子并付給它們工資嗎?”GPT-3的回答是“可以”。同樣的問題交給ChatGPT,它的回答是“不行,因為它們是動物”。王昊奮說:“基于OpenAI選擇的技術(shù)路線,我們尚無法從理論層面解釋這究竟發(fā)生了什么。”
有專家認為,ChatGPT橫空“出圈”或許是基于模型規(guī)模方面的“大力出奇跡”。復(fù)旦大學(xué)計算機科學(xué)技術(shù)學(xué)院教授邱錫鵬表示,以前人們認為語言模型的能力增長是線性的,參數(shù)規(guī)模越大,規(guī)模帶來的邊際效益會越來越??;ChatGPT則向人們展示了另一幅圖景:當(dāng)模型規(guī)模大到一定程度時,其能力突然迎來了一個非線性的增長突變。
GPT-3是一個擁有1750億參數(shù)、利用45萬億字節(jié)文本數(shù)據(jù)進行訓(xùn)練的AI算法模型。由于OpenAI關(guān)閉了接口,因此無法得知ChatGPT的規(guī)模大小。但根據(jù)它訓(xùn)練好的參數(shù)量、單詞量和使用數(shù)據(jù)源等信息反推,業(yè)內(nèi)估算,ChatGPT已經(jīng)消化了全球互聯(lián)網(wǎng)2/3的文本語料。
聊天機器人何以談顛覆?
或開啟自然語言對話界面時代
就功能而言,ChatGPT似乎并沒有多少創(chuàng)新性可言。你可以把它看成一個聊天機器人,微軟小冰、天貓精靈以及蘋果的SIRI,早已經(jīng)出現(xiàn)在我們的生活中。
但為何ChatGPT能夠一鳴驚人?王昊奮認為,ChatGPT有兩個突出特點:一是它是個全語言模型,任何人都能用母語對它提問;二是它是個全場景模型,不管是寫論文、編代碼還是單純求一碗“心靈雞湯”,它都能勝任。“過去幾乎所有的大模型都是根據(jù)有限場景去做的,ChatGPT的通用性讓大家意識到,這可能是走向通用AI的一條道路。”
ChatGPT的出現(xiàn),在產(chǎn)業(yè)界引發(fā)了一場“地震”,其競爭也日趨白熱化。谷歌已經(jīng)宣布將基于旗下LaMDA模型推出競品Bard(巴德),百度、阿里、字節(jié)跳動等國內(nèi)企業(yè)也紛紛宣布即將推出類ChatGPT產(chǎn)品或擁有類似技術(shù)積累,甚至老牌搜索企業(yè)雅虎也期望借助它重回主流視線。
全球頂尖互聯(lián)網(wǎng)企業(yè)從ChatGPT的火爆中“嗅”到了什么?王昊奮的答案是“接口”。過去,我們在不同場景中借助不同軟件與虛擬世界相連,這意味著我們還處于圖形界面用戶時代;未來,ChatGPT有望將我們帶入自然語言對話界面時代,就如鋼鐵俠擁有了AI助手賈維斯。
騰訊研究院研究員胡曉萌認為,ChatGPT的火爆并非曇花一現(xiàn),它的出現(xiàn)已致底層技術(shù)和產(chǎn)業(yè)生態(tài)形成新的格局,AI技術(shù)正從感知、理解世界躍遷到生成、創(chuàng)造世界,AI的下一個時代正在到來。
中國的機會在哪里?
豐富文本語料,完善AI飛輪
谷歌搜索顯示,目前全球討論ChatGPT最熱的地方就在中國,國產(chǎn)版本何時誕生是人們最關(guān)注的話題。這或許是因為在AI領(lǐng)域,中美是最有資格掰掰手腕的兩個國家。根據(jù)去年發(fā)布的《2021全球AI創(chuàng)新指數(shù)報告》,中美兩國處于AI領(lǐng)域的第一梯隊,中國距離美國的差距正不斷縮小。胡曉萌表示,在與ChatGPT相關(guān)的核心技術(shù)方面,我國有著前期積累,業(yè)內(nèi)統(tǒng)計我國千億參數(shù)以上的大模型占全球1/3,美國占1/2。這也就不難解釋,為何百度能如此迅速地拿出類ChatGPT產(chǎn)品。專家預(yù)計,年內(nèi)國內(nèi)至少有四五款同類產(chǎn)品即將上線。
不過,王昊奮認為,想要達到ChatGPT的水準,國產(chǎn)競品還需突破三大難點:一是要豐富文本語料的規(guī)模,中文文本數(shù)據(jù)量和質(zhì)量與英語語料之間差距較大;二是要加大數(shù)字基礎(chǔ)建設(shè),加大面向多機多GPU或類GPU的高效分布式訓(xùn)練框架的投入;三是要強化模型的持續(xù)更新和對用戶反饋的收集與利用,完善AI飛輪。
ChatGPT的驚人表現(xiàn)引發(fā)了人類被AI加速替代的恐慌,王昊奮認為對此不必過度焦慮。在他看來,ChatGPT的出現(xiàn),相當(dāng)于當(dāng)年蘋果推出了iphone或者谷歌推出了搜索引擎,“這只是一款工具”。未來,人們將在這款新工具的基礎(chǔ)上疊加各種應(yīng)用,也會產(chǎn)生各種新的工種。這意味著,一些舊的機會將會消逝,更多的未來空間將浮現(xiàn)在眼前。