本文來(lái)自電子發(fā)燒友網(wǎng),作者/李彎彎。
近日消息,OpenAI在一篇博客中表示,ChatGPT將推出新的語(yǔ)音和圖像功能。用戶不僅可以在文本框中輸入文字提示,還可以通過(guò)語(yǔ)音或圖像與ChatGPT交流。OpenAI稱,新功能在未來(lái)兩周內(nèi)向付費(fèi)用戶推出,不久后會(huì)推廣到其他用戶。
ChatGPT是OpenAI推出的一種人工智能技術(shù)驅(qū)動(dòng)的自然語(yǔ)言處理工具,它能夠基于在預(yù)訓(xùn)練階段所見(jiàn)的模式和統(tǒng)計(jì)規(guī)律,來(lái)生成回答,還能根據(jù)聊天的上下文進(jìn)行互動(dòng),能完成撰寫(xiě)郵件、視頻腳本、文案、翻譯、代碼,寫(xiě)論文等任務(wù)。自2022年11月30日發(fā)布以來(lái),ChatGPT已經(jīng)進(jìn)行了多次功能升級(jí)。
ChatGPT現(xiàn)在能看、能聽(tīng)、能說(shuō)了
ChatGPT使用了Transformer神經(jīng)網(wǎng)絡(luò)架構(gòu),也是GPT-3.5架構(gòu),這是一種用于處理序列數(shù)據(jù)的模型,擁有語(yǔ)言理解和文本生成能力,尤其是它會(huì)通過(guò)連接大量的語(yǔ)料庫(kù)來(lái)訓(xùn)練模型,這些語(yǔ)料庫(kù)包含了真實(shí)世界中的對(duì)話,使得ChatGPT具備上知天文下知地理,還能根據(jù)聊天的上下文進(jìn)行互動(dòng)的能力,做到與真正人類(lèi)幾乎無(wú)異的聊天場(chǎng)景進(jìn)行交流。
2022年11月30日,ChatGPT剛面世就迅速在社交媒體上走紅,短短5天,注冊(cè)用戶數(shù)超過(guò)100萬(wàn)。2023年一月末,ChatGPT的月活用戶突破1億,成為史上增長(zhǎng)最快的消費(fèi)者應(yīng)用。
2023年2月2日,OpenAI發(fā)布ChatGPT試點(diǎn)訂閱計(jì)劃——ChatGPT Plus。ChatGPT Plus以每月20美元的價(jià)格提供,訂閱者可獲得比免費(fèi)版本更穩(wěn)定、更快的服務(wù),及嘗試新功能和優(yōu)化的優(yōu)先權(quán)。同日,微軟發(fā)布公告稱,旗下所有產(chǎn)品將全線整合ChatGPT。
2023年3月15日,OpenAI正式推出GPT-4。GPT-4是多模態(tài)大模型,即支持圖像和文本輸入以及文本輸出,擁有強(qiáng)大的識(shí)圖能力。GPT-4的特點(diǎn)在于:第一,它的訓(xùn)練數(shù)量更大;第二,支持多元的輸出輸入形式;第三,在專(zhuān)業(yè)領(lǐng)域的學(xué)習(xí)能力更強(qiáng)。
2023年5月18日,OpenAI官網(wǎng)宣布推出iOS版ChatGPT應(yīng)用,該應(yīng)用可免費(fèi)使用,并在不同設(shè)備間同步用戶的歷史記錄。該應(yīng)用還集成了OpenAI開(kāi)源語(yǔ)音識(shí)別系統(tǒng)Whisper,支持語(yǔ)音輸入。ChatGPT Plus付費(fèi)訂閱用戶可以獨(dú)家使用GPT-4功能。
2023年7月,OpenAI宣布推出定制指令功能,以便客戶更好地控制ChatGPT的回應(yīng)方式。此外,OpenAI還發(fā)布公告稱,給ChatGPT加了一個(gè)名為Custom instructions的新功能。2023年7月25日,OpenAI宣布,安卓版ChatGPT正式上線。
2023年9月25日,OpenAI發(fā)布《ChatGPT現(xiàn)在能看、能聽(tīng)、能說(shuō)了》的公告,宣布ChatGPT增加語(yǔ)音輸入和圖像輸入兩項(xiàng)新功能。這可以說(shuō)是ChatGPT發(fā)布以來(lái)極其重大的更新。
據(jù)介紹,語(yǔ)音輸入功能類(lèi)似于手機(jī)上的語(yǔ)音助手,用戶只需要輕輕點(diǎn)擊一個(gè)按鈕,說(shuō)出自己的問(wèn)題,ChatGPT能將這些口述的問(wèn)題轉(zhuǎn)換成文本,將其輸入至大語(yǔ)言模型中,生成答案,接著將答案轉(zhuǎn)化成語(yǔ)音,播放給用戶。
語(yǔ)音轉(zhuǎn)文本的任務(wù)由OpenAI的Whisper模型提供支持。同時(shí),該公司正在引入一款全新的文本轉(zhuǎn)語(yǔ)音的模型,據(jù)稱可以通過(guò)幾秒鐘的語(yǔ)音樣本生成與人類(lèi)相似的音頻。
圖像輸入功能類(lèi)似于Google Lens,用戶可以拍攝自己感興趣的事物,并上傳到ChatGPT中,ChatGPT會(huì)嘗試識(shí)別用戶想要詢問(wèn)的內(nèi)容,并給出相應(yīng)的回答。用戶還可以用應(yīng)用中的繪圖工具來(lái)幫助表達(dá)自己的問(wèn)題,或者配合語(yǔ)音或文本輸入來(lái)進(jìn)行交流。
用戶可以向ChatGPT展示一張或多張圖片,提問(wèn)相關(guān)的問(wèn)題。比如,發(fā)送一張壞掉的燒烤爐圖片,然后詢問(wèn)無(wú)法啟動(dòng)原因;拍攝一張冰箱中的食材,詢問(wèn)多種菜品制作方案。
OpenAI還放出了一段視頻,是和ChatGPT商量著修自行車(chē),不斷問(wèn)ChatGPT:這里是扳手嗎?是調(diào)整這里嗎?甚至還把說(shuō)明書(shū)拍照發(fā)給ChatGPT求解釋。
這正是ChatGPT獨(dú)特的特性所帶來(lái)的幫助,用戶可以與機(jī)器人進(jìn)行互動(dòng),逐步完善答案,而無(wú)需首先進(jìn)行搜索并在得到錯(cuò)誤答案后再次搜索。
ChatGPT新增語(yǔ)音和圖像功能帶來(lái)的風(fēng)險(xiǎn)
OpenAI在博客中表示,其目標(biāo)是構(gòu)建安全有益的通用人工智能(AGI)。新增的語(yǔ)音和圖像功能可能會(huì)帶來(lái)一些風(fēng)險(xiǎn),但是OpenAI正在采取措施緩解這些風(fēng)險(xiǎn)。
新的語(yǔ)音技術(shù)能夠在短短幾秒鐘的真實(shí)語(yǔ)音片段中生成逼真的合成語(yǔ)音,這一技術(shù)存在潛在風(fēng)險(xiǎn),比如,惡意行為者可能會(huì)濫用這項(xiàng)技術(shù),冒充公眾人物或?qū)嵤┢墼p。為了避免這些問(wèn)題的發(fā)生,OpenAI決定將這項(xiàng)技術(shù)應(yīng)用于特定的場(chǎng)景中,會(huì)受到嚴(yán)格的限制。
新的圖像功能也帶來(lái)一定風(fēng)險(xiǎn),在進(jìn)行更廣泛的部署之前,OpenAI測(cè)試了該模型在極端主義和科學(xué)領(lǐng)域等方面潛在的風(fēng)險(xiǎn),并對(duì)一些關(guān)鍵細(xì)節(jié)進(jìn)行了調(diào)整,來(lái)確保負(fù)責(zé)任地應(yīng)用這項(xiàng)技術(shù)。比如,在處理人物圖片時(shí),OpenAI限制了ChatGPT對(duì)人物進(jìn)行分析和直接評(píng)價(jià)的能力,這意味著上傳一個(gè)人的照片就能知道那是誰(shuí)無(wú)法實(shí)現(xiàn),這是為了隱私安全。
ChatGPT自發(fā)布以來(lái),在受到廣大用戶追捧的同時(shí),其伴隨的風(fēng)險(xiǎn)也讓各界人士表示擔(dān)憂。一是它可能在被使用的過(guò)程中造成數(shù)據(jù)信息的丟失;二是它也可能會(huì)被一些不法分子用來(lái)實(shí)施欺詐行為。在過(guò)去這大半年時(shí)間里,不少機(jī)構(gòu)也在反對(duì)ChatGPT的使用和進(jìn)一步研究。
2023年2月3日,IT行業(yè)的領(lǐng)導(dǎo)們擔(dān)心,ChatGPT已經(jīng)被黑客們用于策劃網(wǎng)絡(luò)攻擊時(shí)使用。黑莓(Black Berry)的一份報(bào)告調(diào)查了英國(guó)500名IT行業(yè)決策者對(duì)ChatGPT這項(xiàng)革命性技術(shù)的看法,發(fā)現(xiàn)超過(guò)四分之三(76%)的人認(rèn)為,外國(guó)已經(jīng)在針對(duì)其他國(guó)家的網(wǎng)絡(luò)戰(zhàn)爭(zhēng)中使用ChatGPT。近一半的人認(rèn)為,2023年,將會(huì)出現(xiàn)有人惡意使用ChatGPT成功進(jìn)行網(wǎng)絡(luò)攻擊。
2023年4月,中國(guó)支付清算協(xié)會(huì)倡議支付行業(yè)從業(yè)人員謹(jǐn)慎使用ChatGPT。4月13日,西班牙國(guó)家數(shù)據(jù)保護(hù)局和法國(guó)國(guó)家信息自由委員會(huì)分別宣布對(duì)ChatGPT展開(kāi)調(diào)查。
在各界人士對(duì)ChatGPT存在風(fēng)險(xiǎn)的質(zhì)疑聲中,OpenAI也一直在尋找解決辦法,如何讓其在增加新功能的同時(shí)而不會(huì)帶來(lái)新的問(wèn)題。從這次的功能升級(jí)來(lái)看,OpenAI試圖通過(guò)有意限制新模型的功能,來(lái)達(dá)到更進(jìn)一步提升功能和同時(shí)帶來(lái)新問(wèn)題的平衡。OpenAI表示,將不斷改進(jìn)和完善風(fēng)險(xiǎn)緩解措施,未來(lái)為大家提供更強(qiáng)大的系統(tǒng)。
總結(jié)
ChatGPT自出世以來(lái)就引起了廣泛關(guān)注,過(guò)去近一年時(shí)間,OpenAI對(duì)其底層模型和界面也進(jìn)行了多次升級(jí)。如今,ChatGPT更是進(jìn)行了一次重磅升級(jí),新增語(yǔ)音輸入和圖像輸入功能,讓ChatGPT實(shí)現(xiàn)了能看、能聽(tīng)、能說(shuō)的能力。
與此同時(shí),ChatGPT在使用中存在的風(fēng)險(xiǎn)一直以來(lái)也是各界擔(dān)心的問(wèn)題,此次增加的新功能更是可能帶來(lái)新的風(fēng)險(xiǎn)。不過(guò)在過(guò)去這段時(shí)間,OpenAI也一直致力于尋找解決辦法,就比如在這次功能升級(jí)中,OpenAI通過(guò)一些限制來(lái)在實(shí)現(xiàn)新功能的同時(shí)也避免可能帶來(lái)新風(fēng)險(xiǎn)。