本文來(lái)自千家網(wǎng)。
生成式人工智能從一個(gè)流行語(yǔ)到一個(gè)有形的現(xiàn)實(shí)是一個(gè)技術(shù)轉(zhuǎn)型的旅程。如今,生成式人工智能不僅僅是一項(xiàng)在醫(yī)療保健或廣告等各個(gè)行業(yè)占據(jù)重要地位的技術(shù),其應(yīng)用范圍也非常廣泛。本文將深入探討生成式人工智能的演變。
生成式人工智能
生成式人工智能是能夠生成一流內(nèi)容和圖像的深度學(xué)習(xí)模型。生成式人工智能是在龐大的數(shù)據(jù)集上訓(xùn)練的。人工智能(AI)致力于在識(shí)別圖像、處理自然語(yǔ)言和語(yǔ)言間翻譯等非常規(guī)計(jì)算活動(dòng)中復(fù)制人類的智慧。
生成式人工智能代表了人工智能發(fā)展的后續(xù)階段。它可以被教導(dǎo)理解人類語(yǔ)言、編碼語(yǔ)言、藝術(shù)、化學(xué)、生物或任何復(fù)雜的主題。它利用以前學(xué)到的數(shù)據(jù)來(lái)應(yīng)對(duì)新的挑戰(zhàn)。
生成式人工智能時(shí)間線:
20世紀(jì)40年代至60年代
盡管近年來(lái)備受關(guān)注,但生成式人工智能的起源可以追溯到20世紀(jì)中期人工智能的開(kāi)始。
圖靈測(cè)試
1947年,數(shù)學(xué)家AlanTuring在一份研究機(jī)器識(shí)別邏輯行為可能性的文件中首次提到了“智能機(jī)器”。
在1950年的一份文件中,他提出了圖靈測(cè)試的想法,由一個(gè)人來(lái)評(píng)估人類與被編程成模仿人類反應(yīng)的計(jì)算機(jī)之間的書(shū)面交流。如果評(píng)估員始終無(wú)法區(qū)分計(jì)算機(jī)和人,計(jì)算機(jī)將在測(cè)試中成功。
ELIZA
ELIZA聊天機(jī)器人,是英國(guó)科學(xué)家JosephWeizenbaum在1961年開(kāi)發(fā)的,是能夠產(chǎn)生響應(yīng)的人工智能最早的工作實(shí)例之一。最初的程序是通過(guò)語(yǔ)言交流模仿心理治療師的角色,允許ELIZA通過(guò)簡(jiǎn)單的文本交流與人交談。
20世紀(jì)80年代至2010年代
機(jī)器學(xué)習(xí)算法的進(jìn)步推動(dòng)了生成式人工智能的發(fā)展,使機(jī)器能夠從數(shù)據(jù)中獲取知識(shí),并隨著時(shí)間的推移增強(qiáng)其能力。
RNN和LSTM網(wǎng)絡(luò)
20世紀(jì)80年代末循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)和1997年長(zhǎng)短期記憶(LSTM)網(wǎng)絡(luò)的出現(xiàn),提高了人工智能系統(tǒng)按順序處理數(shù)據(jù)的能力。LSTM掌握順序重要性的技能,對(duì)于處理復(fù)雜問(wèn)題至關(guān)重要,如語(yǔ)音識(shí)別和機(jī)器翻譯。
生成式模型的突破
2014年生成對(duì)抗網(wǎng)絡(luò)(GAN)在生成人工智能領(lǐng)域的發(fā)展的另一個(gè)歷史事件是另一個(gè)突破。GAN是一種無(wú)監(jiān)督機(jī)器學(xué)習(xí),其中兩個(gè)神經(jīng)網(wǎng)絡(luò)相互沖突。
一個(gè)網(wǎng)絡(luò)是生成虛假內(nèi)容的生成器,另一個(gè)是鑒別器,旨在識(shí)別給定內(nèi)容是真實(shí)的還是虛假的。
通過(guò)多次迭代,生成器最終將成功地創(chuàng)建出高質(zhì)量的圖像,而鑒別器無(wú)法將其與實(shí)際圖像區(qū)分開(kāi)來(lái)。
在大約同一時(shí)期,還發(fā)現(xiàn)了其他技術(shù),其中包括VEES、擴(kuò)散模型和基于流的模型,這些技術(shù)普遍增強(qiáng)了圖像生成的算法。
變壓器架構(gòu)及GPT模型的介紹
從某種意義上說(shuō),在2017年首次發(fā)布的變壓器模型,通過(guò)識(shí)別單詞之間的相互關(guān)系,研究了自然語(yǔ)言文本中的模式。舊的機(jī)器學(xué)習(xí)系統(tǒng)一次處理一個(gè)片段,而這些變壓器同時(shí)執(zhí)行所有的片段,使其效率和能力大大提高。
變壓器的設(shè)計(jì)為L(zhǎng)M鋪平了道路,如GTPT(生成性訓(xùn)練前變壓器),最初是由OpenAI在2018年開(kāi)發(fā)的。地理信息技術(shù)是利用深層次學(xué)習(xí)結(jié)構(gòu)生成文本、與用戶交互和完成各種基于語(yǔ)言的任務(wù)的網(wǎng)絡(luò)。
個(gè)人可以使用GPT來(lái)簡(jiǎn)化和改進(jìn)諸如編程、寫(xiě)作內(nèi)容、研究復(fù)雜的學(xué)科和翻譯文本等活動(dòng)。其最大的優(yōu)勢(shì)在于其驚人的速度和處理大量數(shù)據(jù)的能力。
2020年至后
ChatGPT
OpenAI的ChatGPT于2022年11月發(fā)布,并在5天內(nèi)獲得了超過(guò)100萬(wàn)的用戶。最初配備GPT-3。ChatGPT使程序能夠與計(jì)算機(jī)進(jìn)行信息豐富的上下文對(duì)話。
其還允許用戶要求ChatGPT以所需的風(fēng)格和指定的長(zhǎng)度、格式和詳細(xì)程度生成書(shū)面文本和不同的其他材料。
Llama
Meta的Llama(大型語(yǔ)言模型MetaAI)是一套尖端的基礎(chǔ)語(yǔ)言模型,標(biāo)志著開(kāi)源人工智能技術(shù)進(jìn)步的一個(gè)重要里程碑。
雖然其基本模型比GPT-3和類似的模型更簡(jiǎn)陋,但它是準(zhǔn)確的,并且在相同的熟練程度上學(xué)習(xí),同時(shí)使用更少的能量。
PaLM和Gemini
2022年4月,Google推出了路徑語(yǔ)言模型(PaLM),該模型一直保密,直到2023年3月,該企業(yè)才通過(guò)API提供了該模型。PaLM標(biāo)志著自然語(yǔ)言處理(NLP)的重大進(jìn)步,擁有令人印象深刻的5400億個(gè)參數(shù)。
在Google的所有發(fā)明中,最新的Gemini可以被認(rèn)為是最重要的性能和選項(xiàng)之一。
其旨在同樣容易地用于各種任務(wù),并能夠有效地分析多種類型的信息,即文本、代碼、口語(yǔ)、圖片和電影。Gemini有三種不同的型號(hào),分別是Ultra、Pro和Nano。
生成式人工智能文本到圖像模型
DALL-E、Midjourney和StableDiffusion是使用書(shū)面指令生成和更改視覺(jué)內(nèi)容的尖端AI系統(tǒng)。OpenAI開(kāi)發(fā)了一款名為DALL-E的軟件,可以生成詳細(xì)逼真的圖片。
總結(jié)
總之,自誕生以來(lái),生成式人工智能經(jīng)歷了巨大的演變。這項(xiàng)技術(shù)對(duì)各行各業(yè)的創(chuàng)新產(chǎn)生了巨大的影響。