本文來自微信公眾號(hào)“數(shù)世咨詢”,作者/陳發(fā)明。
為迎接大模型應(yīng)用的安全風(fēng)險(xiǎn)挑戰(zhàn),Cloudflare發(fā)布了一項(xiàng)“人工智能防火墻”服務(wù),該服務(wù)專門為云和安全服務(wù)商的高級(jí)企業(yè)客戶提供應(yīng)用安全服務(wù)。客戶在將來能夠“創(chuàng)建自己的定制指紋”,并且可以根據(jù)自身的需求自由選擇是否公開模型可以或者不可以提供的信息。
該服務(wù)基于其Web應(yīng)用防火墻(WAF),客戶可以在Cloudflare儀表板的WAF部分找到兩個(gè)功能高級(jí)速率限制和敏感數(shù)據(jù)檢測(cè)功能設(shè)置,為使用大型語言模型的應(yīng)用程序增加了保護(hù)功能。
第一個(gè)功能是高級(jí)速率限制允許客戶制定一種策略,該策略規(guī)定了在特定會(huì)話期間,基于單個(gè)IP地址或API密鑰的執(zhí)行請(qǐng)求限制其最大速率。這樣做是為了防止分布式拒絕服務(wù)(DDoS)攻擊等可能影響大語言模型的處理性能,從而破壞其處理合法請(qǐng)求的能力。
第二個(gè)功能是敏感數(shù)據(jù)檢測(cè),它可以防止大語言模型在響應(yīng)查詢時(shí)泄露機(jī)密數(shù)據(jù)。它還允許客戶設(shè)置WAF規(guī)則,以掃描信用卡號(hào)等金融信息和API密鑰等機(jī)密信息,以確保這些敏感細(xì)節(jié)不會(huì)出現(xiàn)在大語言模型的響應(yīng)中。
遺憾的是,目前還沒有一個(gè)防火墻規(guī)則來阻止語言模型發(fā)布不良或虛假信息。
特色功能
1、在接下來的幾個(gè)月中,Cloudflare計(jì)劃測(cè)試一個(gè)名為“提示詞驗(yàn)證”的測(cè)試版功能。該功能將有助于防止“提示注入攻擊”,用戶可以設(shè)計(jì)提示詞來防止大語言模型創(chuàng)建不適當(dāng)或者非法的內(nèi)容。
2、這項(xiàng)功能正在開發(fā)中,它會(huì)分析每一個(gè)提示詞,并對(duì)它們進(jìn)行評(píng)分,以確定它們是否可能對(duì)大語言模型構(gòu)成攻擊。此外,它也會(huì)根據(jù)預(yù)設(shè)的類別來標(biāo)記提示詞。評(píng)分范圍從1到99,數(shù)字越高表示提示詞注入攻擊的可能性越大,反之則越小。
3、客戶可以根據(jù)評(píng)分創(chuàng)建WAF規(guī)則來阻止或允許請(qǐng)求,并且可以將此評(píng)分與其他指標(biāo)(例如機(jī)器人或攻擊分?jǐn)?shù))相結(jié)合,以確定提示詞是否發(fā)送到大語言模型。
4、允許客戶在遇到被視為冒犯性、涉及宗教、性或政治等敏感話題的提示詞時(shí),阻止特定主題的內(nèi)容生成。
部署方式:防火墻可以部署在任何大語言模型之前。這包括眾所周知的公共大語言模型工具,例如OpenAI的GPT和Anthropic的Claude,以及專為內(nèi)部使用而設(shè)計(jì)的私有大語言模型。作為產(chǎn)品或服務(wù)的一部分銷售給客戶的模型也在保護(hù)范圍之內(nèi)。
Cloudflare的產(chǎn)品經(jīng)理Daniele Molteni表示,人工智能防火墻可以部署在各種大語言模型前面,無論這些模型是托管在Cloudflare Workers AI平臺(tái)上,或者是其他平臺(tái)或主機(jī)提供商。唯一的要求是,所有的請(qǐng)求和響應(yīng)都必須通過Cloudflare的代理。
Cloudflare對(duì)AI安全的關(guān)注是對(duì)一系列大語言模型錯(cuò)誤和安全問題的回應(yīng)。隨著科技巨頭推動(dòng)將大語言模型嵌入其許多產(chǎn)品和服務(wù)中,結(jié)果往往包括錯(cuò)誤和捏造,有時(shí)甚至可能涉及潛在漏洞的代碼。
為了解決這些新興的安全問題,一些開發(fā)者采取了一種針對(duì)人工智能的安全方法(Cloudflare將其稱為防御型人工智能框架),而谷歌和其他公司則擴(kuò)展了其漏洞賞金計(jì)劃,將人工智能產(chǎn)品和大語言模型攻擊納入其中。
考慮到這項(xiàng)技術(shù)本身以及保護(hù)其免受攻擊的策略都還處于初級(jí)階段,可以預(yù)見在大型廠商的旗艦會(huì)議(大型知名品牌會(huì)議)即將到來之季,人工智能和大語言模型安全領(lǐng)域?qū)?huì)出現(xiàn)更多的話題和炒作。因此,預(yù)計(jì)RSA和黑帽大會(huì)上將會(huì)圍繞這個(gè)話題展開大量討論。