本文來(lái)自微信公眾號(hào)“長(zhǎng)風(fēng)實(shí)驗(yàn)室”。
隨著ChatGPT風(fēng)靡全球,其開(kāi)發(fā)商OpenAI就接連不斷地面臨著越來(lái)越多的質(zhì)疑與批評(píng)。近日,OpenAI就陷入了接連“吃官司”的狀態(tài)之中。
6月29日,有16名匿名人士向美國(guó)加利福尼亞州舊金山聯(lián)邦法院提起訴訟,稱ChatGPT在沒(méi)有充分通知用戶或獲得同意的情況下收集和泄露了他們的個(gè)人信息,據(jù)此他們要求微軟和OpenAI索賠30億美元。
訴訟中指出,盡管制定了購(gòu)買和使用個(gè)人信息的協(xié)議,但是OpenAI和微軟系統(tǒng)性地從互聯(lián)網(wǎng)中竊取了3000億個(gè)單詞,包括數(shù)百萬(wàn)未經(jīng)同意獲取的個(gè)人信息。
原告指控兩家公司通過(guò)其AI產(chǎn)品“收集、存儲(chǔ)、跟蹤、共享和披露”數(shù)百萬(wàn)人的個(gè)人信息,包括產(chǎn)品詳細(xì)信息、賬戶信息、姓名、聯(lián)系方式、登錄憑據(jù)、電子郵件、支付信息、交易記錄、瀏覽器數(shù)據(jù)、社交媒體信息、聊天日志、cookie、搜索記錄和其他在線活動(dòng)。
訴狀還稱:就個(gè)人身份信息而言,被告未能充分地將其從學(xué)習(xí)模型中過(guò)濾掉,使數(shù)百萬(wàn)人面臨著個(gè)人信息立即或以其他方式向世界各地的陌生人披露的風(fēng)險(xiǎn)。
訴訟還指控OpenAI違背了其初心,即以“最有可能造福整個(gè)人類的方式推進(jìn)人工智能”。截至目前,不論是OpenAI官方還是微軟官方都還未對(duì)該指控進(jìn)行回復(fù)。
不過(guò),該訴訟已經(jīng)在全球引起了廣泛關(guān)注,同時(shí)引發(fā)了廣大網(wǎng)友對(duì)隱私、人工智能倫理和企業(yè)處理個(gè)人信息的擔(dān)憂。
隨后,在短短的一周內(nèi),OpenAI又接到兩位作家Paul Tremblay和Mona Awad提起的訴訟,指控他們的受版權(quán)保護(hù)的著作被用來(lái)訓(xùn)練ChatGPT。
Paul Tremblay和Mona Awad稱,ChatGPT能為他們的書生成“非常準(zhǔn)確”的摘要。所以他們堅(jiān)稱,只有在ChatGPT接受了他們著作的訓(xùn)練后,才有可能出現(xiàn)這么準(zhǔn)確的摘要,而這個(gè)操作顯然違反了版權(quán)法。
起訴書中預(yù)估,OpenAI的訓(xùn)練數(shù)據(jù)中至少包含30萬(wàn)本書,其中很多來(lái)自侵權(quán)網(wǎng)站。
比如OpenAI在披露GPT-3訓(xùn)練數(shù)據(jù)情況時(shí),就表示其中包含兩個(gè)互聯(lián)網(wǎng)圖書語(yǔ)料庫(kù),大概占比為15%。起訴作者認(rèn)為這些數(shù)據(jù)就是來(lái)自影子圖書館網(wǎng)站的,比如Library Genesis、Sci-Hub等。
OpenAI已多次陷入數(shù)據(jù)風(fēng)波
雖然目前的這些指控仍是原告方的“一面之詞”。但這已經(jīng)不是這家公司第一次陷入數(shù)據(jù)安全、個(gè)人信息泄露相關(guān)的指控了。
去年6月下旬,微軟發(fā)布了一種可以自動(dòng)生成計(jì)算機(jī)代碼的新型人工智能技術(shù)。
該工具名為Copilot,旨在讓專業(yè)程序員更快地工作。當(dāng)他們工作時(shí),Copilot會(huì)給出代碼建議,程序員可以直接將copilot展示的建議的代碼塊直接添加到自己的代碼中,快速完成工作,這一工具也因此被很多媒體譽(yù)為“讓程序員早下班的工具”。
然后去年11月,這款名為Copilot的代碼助手,就被程序員們告上了法庭。
原告?zhèn)冋J(rèn)為Copilot嫌違反開(kāi)源許可,使用他們貢獻(xiàn)的代碼訓(xùn)練GitHub Copilot和OpenAI的Codex機(jī)器學(xué)習(xí)模型,侵犯了眾多原創(chuàng)代碼作者的版權(quán),同時(shí)還泄露了用戶隱私,因此向法院提起訴訟,索賠達(dá)90億美元。
這些案例無(wú)疑為隱私安全敲響了警鐘,不僅是OpenAI,全球公司都必須對(duì)數(shù)據(jù)收集和使用持有負(fù)責(zé)任的態(tài)度。
如今,人工智能技術(shù)的快速發(fā)展讓個(gè)人隱私問(wèn)題面臨著更加艱深的挑戰(zhàn),特別是在數(shù)據(jù)收集和使用方面。隨著越來(lái)越多的個(gè)人數(shù)據(jù)被用于訓(xùn)練AI模型,如何切實(shí)做到確保數(shù)據(jù)的合法和透明使用變得至關(guān)重要。
企業(yè)在保護(hù)個(gè)人隱私方面扮演著關(guān)鍵角色。因此各企業(yè)在收集和使用個(gè)人數(shù)據(jù)時(shí),都必須遵守隱私法規(guī),并提供透明的數(shù)據(jù)使用方式,以確保人工智能技術(shù)的發(fā)展與個(gè)人權(quán)益的保護(hù)相平衡。