亚洲综合色视频在线观看,久久香蕉国产免费听 ,久久综合99熟人妻

ChatGPT重磅升級(jí)!新語(yǔ)音和圖像輸入功能，讓ChatGPT能看、能聽(tīng)、能說(shuō)

2023-09-28 09:15

電子發(fā)燒友網(wǎng)

李彎彎

語(yǔ)音輸入功能類(lèi)似于手機(jī)上的語(yǔ)音助手，用戶只需要輕輕點(diǎn)擊一個(gè)按鈕，說(shuō)出自己的問(wèn)題，ChatGPT能將這些口述的問(wèn)題轉(zhuǎn)換成文本，將其輸入至大語(yǔ)言模型中，生成答案，接著將答案轉(zhuǎn)化成語(yǔ)音，播放給用戶。

本文來(lái)自電子發(fā)燒友網(wǎng)，作者/李彎彎。

近日消息，OpenAI在一篇博客中表示，ChatGPT將推出新的語(yǔ)音和圖像功能。用戶不僅可以在文本框中輸入文字提示，還可以通過(guò)語(yǔ)音或圖像與ChatGPT交流。OpenAI稱，新功能在未來(lái)兩周內(nèi)向付費(fèi)用戶推出，不久后會(huì)推廣到其他用戶。

ChatGPT是OpenAI推出的一種人工智能技術(shù)驅(qū)動(dòng)的自然語(yǔ)言處理工具，它能夠基于在預(yù)訓(xùn)練階段所見(jiàn)的模式和統(tǒng)計(jì)規(guī)律，來(lái)生成回答，還能根據(jù)聊天的上下文進(jìn)行互動(dòng)，能完成撰寫(xiě)郵件、視頻腳本、文案、翻譯、代碼，寫(xiě)論文等任務(wù)。自2022年11月30日發(fā)布以來(lái)，ChatGPT已經(jīng)進(jìn)行了多次功能升級(jí)。

ChatGPT現(xiàn)在能看、能聽(tīng)、能說(shuō)了

ChatGPT使用了Transformer神經(jīng)網(wǎng)絡(luò)架構(gòu)，也是GPT-3.5架構(gòu)，這是一種用于處理序列數(shù)據(jù)的模型，擁有語(yǔ)言理解和文本生成能力，尤其是它會(huì)通過(guò)連接大量的語(yǔ)料庫(kù)來(lái)訓(xùn)練模型，這些語(yǔ)料庫(kù)包含了真實(shí)世界中的對(duì)話，使得ChatGPT具備上知天文下知地理，還能根據(jù)聊天的上下文進(jìn)行互動(dòng)的能力，做到與真正人類(lèi)幾乎無(wú)異的聊天場(chǎng)景進(jìn)行交流。

2022年11月30日，ChatGPT剛面世就迅速在社交媒體上走紅，短短5天，注冊(cè)用戶數(shù)超過(guò)100萬(wàn)。2023年一月末，ChatGPT的月活用戶突破1億，成為史上增長(zhǎng)最快的消費(fèi)者應(yīng)用。

2023年2月2日，OpenAI發(fā)布ChatGPT試點(diǎn)訂閱計(jì)劃——ChatGPT Plus。ChatGPT Plus以每月20美元的價(jià)格提供，訂閱者可獲得比免費(fèi)版本更穩(wěn)定、更快的服務(wù)，及嘗試新功能和優(yōu)化的優(yōu)先權(quán)。同日，微軟發(fā)布公告稱，旗下所有產(chǎn)品將全線整合ChatGPT。

2023年3月15日，OpenAI正式推出GPT-4。GPT-4是多模態(tài)大模型，即支持圖像和文本輸入以及文本輸出，擁有強(qiáng)大的識(shí)圖能力。GPT-4的特點(diǎn)在于：第一，它的訓(xùn)練數(shù)量更大；第二，支持多元的輸出輸入形式；第三，在專(zhuān)業(yè)領(lǐng)域的學(xué)習(xí)能力更強(qiáng)。

2023年5月18日，OpenAI官網(wǎng)宣布推出iOS版ChatGPT應(yīng)用，該應(yīng)用可免費(fèi)使用，并在不同設(shè)備間同步用戶的歷史記錄。該應(yīng)用還集成了OpenAI開(kāi)源語(yǔ)音識(shí)別系統(tǒng)Whisper，支持語(yǔ)音輸入。ChatGPT Plus付費(fèi)訂閱用戶可以獨(dú)家使用GPT-4功能。

2023年7月，OpenAI宣布推出定制指令功能，以便客戶更好地控制ChatGPT的回應(yīng)方式。此外，OpenAI還發(fā)布公告稱，給ChatGPT加了一個(gè)名為Custom instructions的新功能。2023年7月25日，OpenAI宣布，安卓版ChatGPT正式上線。

2023年9月25日，OpenAI發(fā)布《ChatGPT現(xiàn)在能看、能聽(tīng)、能說(shuō)了》的公告，宣布ChatGPT增加語(yǔ)音輸入和圖像輸入兩項(xiàng)新功能。這可以說(shuō)是ChatGPT發(fā)布以來(lái)極其重大的更新。

據(jù)介紹，語(yǔ)音輸入功能類(lèi)似于手機(jī)上的語(yǔ)音助手，用戶只需要輕輕點(diǎn)擊一個(gè)按鈕，說(shuō)出自己的問(wèn)題，ChatGPT能將這些口述的問(wèn)題轉(zhuǎn)換成文本，將其輸入至大語(yǔ)言模型中，生成答案，接著將答案轉(zhuǎn)化成語(yǔ)音，播放給用戶。

語(yǔ)音轉(zhuǎn)文本的任務(wù)由OpenAI的Whisper模型提供支持。同時(shí)，該公司正在引入一款全新的文本轉(zhuǎn)語(yǔ)音的模型，據(jù)稱可以通過(guò)幾秒鐘的語(yǔ)音樣本生成與人類(lèi)相似的音頻。

圖像輸入功能類(lèi)似于Google Lens，用戶可以拍攝自己感興趣的事物，并上傳到ChatGPT中，ChatGPT會(huì)嘗試識(shí)別用戶想要詢問(wèn)的內(nèi)容，并給出相應(yīng)的回答。用戶還可以用應(yīng)用中的繪圖工具來(lái)幫助表達(dá)自己的問(wèn)題，或者配合語(yǔ)音或文本輸入來(lái)進(jìn)行交流。

用戶可以向ChatGPT展示一張或多張圖片，提問(wèn)相關(guān)的問(wèn)題。比如，發(fā)送一張壞掉的燒烤爐圖片，然后詢問(wèn)無(wú)法啟動(dòng)原因；拍攝一張冰箱中的食材，詢問(wèn)多種菜品制作方案。

OpenAI還放出了一段視頻，是和ChatGPT商量著修自行車(chē)，不斷問(wèn)ChatGPT：這里是扳手嗎？是調(diào)整這里嗎？甚至還把說(shuō)明書(shū)拍照發(fā)給ChatGPT求解釋。

這正是ChatGPT獨(dú)特的特性所帶來(lái)的幫助，用戶可以與機(jī)器人進(jìn)行互動(dòng)，逐步完善答案，而無(wú)需首先進(jìn)行搜索并在得到錯(cuò)誤答案后再次搜索。

ChatGPT新增語(yǔ)音和圖像功能帶來(lái)的風(fēng)險(xiǎn)

OpenAI在博客中表示，其目標(biāo)是構(gòu)建安全有益的通用人工智能（AGI）。新增的語(yǔ)音和圖像功能可能會(huì)帶來(lái)一些風(fēng)險(xiǎn)，但是OpenAI正在采取措施緩解這些風(fēng)險(xiǎn)。

新的語(yǔ)音技術(shù)能夠在短短幾秒鐘的真實(shí)語(yǔ)音片段中生成逼真的合成語(yǔ)音，這一技術(shù)存在潛在風(fēng)險(xiǎn)，比如，惡意行為者可能會(huì)濫用這項(xiàng)技術(shù)，冒充公眾人物或?qū)嵤┢墼p。為了避免這些問(wèn)題的發(fā)生，OpenAI決定將這項(xiàng)技術(shù)應(yīng)用于特定的場(chǎng)景中，會(huì)受到嚴(yán)格的限制。

新的圖像功能也帶來(lái)一定風(fēng)險(xiǎn)，在進(jìn)行更廣泛的部署之前，OpenAI測(cè)試了該模型在極端主義和科學(xué)領(lǐng)域等方面潛在的風(fēng)險(xiǎn)，并對(duì)一些關(guān)鍵細(xì)節(jié)進(jìn)行了調(diào)整，來(lái)確保負(fù)責(zé)任地應(yīng)用這項(xiàng)技術(shù)。比如，在處理人物圖片時(shí)，OpenAI限制了ChatGPT對(duì)人物進(jìn)行分析和直接評(píng)價(jià)的能力，這意味著上傳一個(gè)人的照片就能知道那是誰(shuí)無(wú)法實(shí)現(xiàn)，這是為了隱私安全。

ChatGPT自發(fā)布以來(lái)，在受到廣大用戶追捧的同時(shí)，其伴隨的風(fēng)險(xiǎn)也讓各界人士表示擔(dān)憂。一是它可能在被使用的過(guò)程中造成數(shù)據(jù)信息的丟失；二是它也可能會(huì)被一些不法分子用來(lái)實(shí)施欺詐行為。在過(guò)去這大半年時(shí)間里，不少機(jī)構(gòu)也在反對(duì)ChatGPT的使用和進(jìn)一步研究。

2023年2月3日，IT行業(yè)的領(lǐng)導(dǎo)們擔(dān)心，ChatGPT已經(jīng)被黑客們用于策劃網(wǎng)絡(luò)攻擊時(shí)使用。黑莓（Black Berry）的一份報(bào)告調(diào)查了英國(guó)500名IT行業(yè)決策者對(duì)ChatGPT這項(xiàng)革命性技術(shù)的看法，發(fā)現(xiàn)超過(guò)四分之三（76%）的人認(rèn)為，外國(guó)已經(jīng)在針對(duì)其他國(guó)家的網(wǎng)絡(luò)戰(zhàn)爭(zhēng)中使用ChatGPT。近一半的人認(rèn)為，2023年，將會(huì)出現(xiàn)有人惡意使用ChatGPT成功進(jìn)行網(wǎng)絡(luò)攻擊。

2023年4月，中國(guó)支付清算協(xié)會(huì)倡議支付行業(yè)從業(yè)人員謹(jǐn)慎使用ChatGPT。4月13日，西班牙國(guó)家數(shù)據(jù)保護(hù)局和法國(guó)國(guó)家信息自由委員會(huì)分別宣布對(duì)ChatGPT展開(kāi)調(diào)查。

在各界人士對(duì)ChatGPT存在風(fēng)險(xiǎn)的質(zhì)疑聲中，OpenAI也一直在尋找解決辦法，如何讓其在增加新功能的同時(shí)而不會(huì)帶來(lái)新的問(wèn)題。從這次的功能升級(jí)來(lái)看，OpenAI試圖通過(guò)有意限制新模型的功能，來(lái)達(dá)到更進(jìn)一步提升功能和同時(shí)帶來(lái)新問(wèn)題的平衡。OpenAI表示，將不斷改進(jìn)和完善風(fēng)險(xiǎn)緩解措施，未來(lái)為大家提供更強(qiáng)大的系統(tǒng)。

總結(jié)

ChatGPT自出世以來(lái)就引起了廣泛關(guān)注，過(guò)去近一年時(shí)間，OpenAI對(duì)其底層模型和界面也進(jìn)行了多次升級(jí)。如今，ChatGPT更是進(jìn)行了一次重磅升級(jí)，新增語(yǔ)音輸入和圖像輸入功能，讓ChatGPT實(shí)現(xiàn)了能看、能聽(tīng)、能說(shuō)的能力。

與此同時(shí)，ChatGPT在使用中存在的風(fēng)險(xiǎn)一直以來(lái)也是各界擔(dān)心的問(wèn)題，此次增加的新功能更是可能帶來(lái)新的風(fēng)險(xiǎn)。不過(guò)在過(guò)去這段時(shí)間，OpenAI也一直致力于尋找解決辦法，就比如在這次功能升級(jí)中，OpenAI通過(guò)一些限制來(lái)在實(shí)現(xiàn)新功能的同時(shí)也避免可能帶來(lái)新風(fēng)險(xiǎn)。

THEEND

免責(zé)聲明：凡注明為其它來(lái)源的信息均轉(zhuǎn)自其它平臺(tái)，由網(wǎng)友自主投稿和發(fā)布、編輯整理上傳，對(duì)此類(lèi)作品本站僅提供交流平臺(tái)，不為其版權(quán)負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。若有來(lái)源標(biāo)注錯(cuò)誤或侵犯了您的合法權(quán)益，請(qǐng)作者持權(quán)屬證明與本站聯(lián)系，我們將及時(shí)更正、刪除，謝謝。聯(lián)系郵箱：xiali@infoobs.com

本月熱門(mén)

精選文章

熱點(diǎn)資訊

“軟件定義汽車(chē)”漸入深水區(qū) 智能汽車(chē)時(shí)代如何直面軟件開(kāi)發(fā)挑戰(zhàn)?

ChatGPT重磅升級(jí)!新語(yǔ)音和圖像輸入功能，讓ChatGPT能看、能聽(tīng)、能說(shuō)

2024 信息化觀察網(wǎng)

長(zhǎng)按掃描二維碼閱讀原文

什么是 OSI 模型？OSI 模型的七層是哪些？

自動(dòng)化測(cè)試有哪些常見(jiàn)的挑戰(zhàn)和解決方案？

政策寶閃耀2024數(shù)智融合應(yīng)用論壇，榮獲“數(shù)智融合標(biāo)桿案例”

共筑數(shù)字未來(lái)|深度解析數(shù)字化轉(zhuǎn)型與建設(shè)的戰(zhàn)略指南

數(shù)據(jù)要素X政策寶：引領(lǐng)企業(yè)和政策數(shù)據(jù)服務(wù)的新浪潮

ChatGPT重磅升級(jí)!新語(yǔ)音和圖像輸入功能，讓ChatGPT能看、能聽(tīng)、能說(shuō)

最新評(píng)論（評(píng)論僅代表用戶觀點(diǎn)）

工信部：四方面優(yōu)勢(shì)構(gòu)成我國(guó)新能源汽車(chē)產(chǎn)業(yè)競(jìng)爭(zhēng)力

算力服務(wù)網(wǎng)絡(luò)：一場(chǎng)多元融合的系統(tǒng)革命

國(guó)務(wù)院決定取消和調(diào)整33個(gè)罰款事項(xiàng)!詳細(xì)目錄看這里

科技部等六部門(mén)關(guān)于印發(fā)《關(guān)于加快場(chǎng)景創(chuàng)新以人工智能高水平應(yīng)用促進(jìn)經(jīng)濟(jì)高質(zhì)量發(fā)展的指導(dǎo)意見(jiàn)》的通知

本月熱門(mén)

云計(jì)算的江湖，風(fēng)云再起

揭秘，IOTE國(guó)際物聯(lián)網(wǎng)展2025年巡展預(yù)告!

防勒索病毒攻擊關(guān)鍵措施

匯聚行業(yè)精英，探討前沿技術(shù) 第十九屆汽車(chē)涂裝工藝技術(shù)研討會(huì)即將啟幕!

網(wǎng)博會(huì)革新升級(jí)：“區(qū)域頻道”精準(zhǔn)選型引領(lǐng)，引領(lǐng)智能制造新風(fēng)潮

萬(wàn)億賽道!AI算力趨勢(shì)發(fā)展深度分析 2024

精選文章

樹(shù)熊數(shù)字家攜手代言人，重新定義數(shù)字家庭

強(qiáng)勢(shì)推介 “2022中國(guó)行業(yè)數(shù)字化年度風(fēng)云榜”評(píng)選活動(dòng)火熱進(jìn)行中

2020第四屆中國(guó)軟件和信息服務(wù)業(yè)年度風(fēng)云榜圓滿落幕

金雅拓：區(qū)塊鏈的企業(yè)采用率從9%飆升至19%，用于保護(hù)物聯(lián)網(wǎng)安全

房地產(chǎn)收樓及物業(yè)管理客戶體驗(yàn)管理平臺(tái)搭建

“39展貿(mào)通”首秀!四川港投助力39縣域特色好物“出川出?！?/a>

熱點(diǎn)資訊

“軟件定義汽車(chē)”漸入深水區(qū) 智能汽車(chē)時(shí)代如何直面軟件開(kāi)發(fā)挑戰(zhàn)?

物聯(lián)網(wǎng)和區(qū)塊鏈技術(shù)融合有哪些作用？

ChatGPT重磅升級(jí)!新語(yǔ)音和圖像輸入功能，讓ChatGPT能看、能聽(tīng)、能說(shuō)

最新評(píng)論（評(píng)論僅代表用戶觀點(diǎn)）

欄目推薦

工信部：四方面優(yōu)勢(shì)構(gòu)成我國(guó)新能源汽車(chē)產(chǎn)業(yè)競(jìng)爭(zhēng)力

算力服務(wù)網(wǎng)絡(luò)：一場(chǎng)多元融合的系統(tǒng)革命

國(guó)務(wù)院決定取消和調(diào)整33個(gè)罰款事項(xiàng)!詳細(xì)目錄看這里

科技部等六部門(mén)關(guān)于印發(fā)《關(guān)于加快場(chǎng)景創(chuàng)新以人工智能高水平應(yīng)用促進(jìn)經(jīng)濟(jì)高質(zhì)量發(fā)展的指導(dǎo)意見(jiàn)》的通知

本月熱門(mén)

精選文章

熱點(diǎn)資訊

“軟件定義汽車(chē)”漸入深水區(qū) 智能汽車(chē)時(shí)代如何直面軟件開(kāi)發(fā)挑戰(zhàn)?

物聯(lián)網(wǎng)和區(qū)塊鏈技術(shù)融合有哪些作用？

ChatGPT重磅升級(jí)!新語(yǔ)音和圖像輸入功能，讓ChatGPT能看、能聽(tīng)、能說(shuō)

物聯(lián)網(wǎng)和區(qū)塊鏈技術(shù)融合有哪些作用？