2020年5月25日,全國人大常委會工作報告在“下一步主要工作安排”中指出,圍繞國家安全和社會治理,制定生物安全法、個人信息保護(hù)法、數(shù)據(jù)安全法。消息一出,迅速“登頂”兩會熱搜榜——人們期盼已久的《個人信息保護(hù)法》,終于在經(jīng)歷了從醞釀到問世的8年歷程后“千呼萬喚始出來”。
同時這也引申出了一個問題,我們的個人隱私是從什么時候開始了“裸奔”?
如若從時間軸上去追溯這個問題的答案,那么似乎當(dāng)人類從農(nóng)業(yè)社會逐漸邁入城市商業(yè)社會,從熟人社區(qū)轉(zhuǎn)向陌生人社區(qū)的時候,人類被隱私問題所困擾的歷史便開始了。特別是在以大數(shù)據(jù)應(yīng)用為重要特征的后互聯(lián)網(wǎng)時代,日漸興起的大數(shù)據(jù)、云計算、物聯(lián)網(wǎng)、人工智能、5G等新一代信息技術(shù),更使得個人數(shù)據(jù)信息、乃至生物識別信息無所遁形,哪怕細(xì)微到我們在網(wǎng)絡(luò)上的每一次搜索、聽的每一首歌、叫的每一次外賣、去的每個地方、乘坐的每一次交通工具,都可以被企業(yè)獲取,成為其數(shù)據(jù)汪洋中的點滴,在深度數(shù)據(jù)分析后轉(zhuǎn)而商用。
這一切正如英國雜志《經(jīng)濟(jì)學(xué)人》十年前預(yù)言的那樣,“數(shù)據(jù)是新時代的石油”。大數(shù)據(jù)時代,每一個人的隱私都在陽光下“裸奔”,信息一拋頭露面,就先被互聯(lián)網(wǎng)巨頭收割。并且伴隨著人工智能的不斷發(fā)展,個人隱私和數(shù)據(jù)可以被更加便利地公開、搜集、聚合、分析和使用,規(guī)模之大超出了想象,以至于至今我們?nèi)詿o法判斷這個過程對人類社會的進(jìn)程究竟產(chǎn)生了多大的影響。
大數(shù)據(jù)時代,隱私還能保護(hù)嗎
“不積小流,無以成江海”大多數(shù)時候,當(dāng)數(shù)據(jù)具備了相當(dāng)規(guī)模的量,足夠廣闊的覆蓋面和足夠精準(zhǔn)的數(shù)據(jù)源,數(shù)據(jù)就會有足夠的價值。如若從商業(yè)角度出發(fā),企業(yè)為用戶提供便捷、廉價的服務(wù),用戶則在享受服務(wù)的同時,“順便”貢獻(xiàn)出自己的數(shù)據(jù),雙方其實是各取所需、兩得其所。
這樣看似乎是一個完美的邏輯。但問題是,大數(shù)據(jù)時代,公民隱私的數(shù)字化加劇了隱私的無形化。“看不見、摸不著”,信息的存儲方式、速度、表現(xiàn)形式都發(fā)生了翻天覆地的變化,隱私在不經(jīng)意之間即被侵犯,并且互聯(lián)網(wǎng)強(qiáng)大的記憶和存儲功能讓一切在線行為被永久記錄。網(wǎng)絡(luò)空間的可搜索性和永久存儲性,有可能加重精神損害和名譽(yù)損害的后果。
與此同時,我們不得不思考依托AI等科技手段收集來的數(shù)據(jù),能像傳統(tǒng)的商業(yè)問卷調(diào)查一樣,最大程度淡化、保護(hù)用戶個人信息嗎?大數(shù)據(jù)時代,人們該如何為自己的隱私上一把“安全鎖”?如何確定企業(yè)搜集信息樣本的過程中不會精準(zhǔn)定位到個人?
《道德經(jīng)》有云“反者,道之動”。盡管大數(shù)據(jù)時代的數(shù)據(jù)安全和隱私泄露問題無處不在,盡管法學(xué)與技術(shù)仍面臨著諸多挑戰(zhàn),我們也不能因噎廢食,因為不可否認(rèn)的是大數(shù)據(jù)技術(shù)其實是人類科學(xué)發(fā)展的必然成果。于是圍繞著這類“魚和熊掌不可兼得”的問題,很多人展開了各自的探索。根據(jù)探索的方向,這些努力大致上可以分為兩類:法學(xué)的探索與科學(xué)的探索。
在法學(xué)家們看來,當(dāng)前數(shù)據(jù)的搜集和使用過程中之所以會出現(xiàn)種種問題,其關(guān)鍵就在于各種相關(guān)的法律和規(guī)范滯后了,不能適應(yīng)時代發(fā)展的需要。針對這一問題,法學(xué)領(lǐng)域幾年來一直都在積極推進(jìn)立法,努力彌補(bǔ)法律和制度上的各項不足和漏洞。2020年5月25日,我國全國人大常委會工作報告在“下一步主要工作安排”中明確指出了即將出臺《個人隱私保護(hù)法》。
與法學(xué)探索同步的是技術(shù)的探索。從技術(shù)角度上來看,數(shù)據(jù)應(yīng)用中存在的各種問題本質(zhì)上都是技術(shù)的局限問題,一旦技術(shù)進(jìn)步問題就會迎刃而解。到目前為止,技術(shù)人員已經(jīng)沿著這一方向進(jìn)行了包括安全多方計算、區(qū)塊鏈在內(nèi)的眾多新技術(shù)的探索嘗試。而最近興起的“聯(lián)邦學(xué)習(xí)”技術(shù),就是這些新技術(shù)中最令人眼前一亮的一種。
聯(lián)邦學(xué)習(xí)的崛起,破解數(shù)據(jù)信任難題
毫無疑問,AI技術(shù)是人類最偉大的科學(xué)成就之一。人工智能改變了人類社會,但如今AI技術(shù)在實際應(yīng)用落地的過程中也面臨著兩大瓶頸:一方面,多數(shù)企業(yè)擁有的“小數(shù)據(jù)”難以聚沙成塔、取長補(bǔ)短;另一方面,對數(shù)據(jù)隱私與安全的日益重視早已成為世界性趨勢。而“聯(lián)邦學(xué)習(xí)”作為加密的分布式機(jī)器學(xué)習(xí)范式,可以使得各方在不披露原始數(shù)據(jù)的情況下達(dá)到共建模型的目的,為應(yīng)對AI落地困境提供了更多可能性。
2018年伊始,微眾銀行首席人工智能官楊強(qiáng)教授就帶領(lǐng)人工智能團(tuán)隊推動構(gòu)建聯(lián)邦學(xué)習(xí)生態(tài),并且在2018年底向IEEE提交聯(lián)邦學(xué)習(xí)國際標(biāo)準(zhǔn)獲批,目前已經(jīng)有30多家企業(yè)參與其中。隨著聯(lián)邦學(xué)習(xí)理論研究的深入,微眾銀行在國內(nèi)、國際大會上聯(lián)合多家合作伙伴舉辦聯(lián)邦學(xué)習(xí)研討會,比如國際頂會IJCAI和NeurIPS,國內(nèi)計算機(jī)學(xué)會CCFTF等,吸引了更多研究者加入;基于聯(lián)邦學(xué)習(xí)開源軟件FATE(Federated AI Technology Enabler)的開源社區(qū)也漸漸吸納上百家機(jī)構(gòu)應(yīng)用和共建。在行業(yè)落地方面,微眾銀行積極推進(jìn)聯(lián)邦學(xué)習(xí)在金融領(lǐng)域更加深入的應(yīng)用,在風(fēng)控、反洗錢、智能營銷、智慧城市等領(lǐng)域的應(yīng)用均取得了很好的效果。
聯(lián)邦學(xué)習(xí)能夠充分的利用參與方的數(shù)據(jù)和計算能力,使多方可以協(xié)作構(gòu)建通用,更健壯的機(jī)器學(xué)習(xí)模型而不需要共享數(shù)據(jù),在數(shù)據(jù)監(jiān)管越來越嚴(yán)格的大環(huán)境下,聯(lián)邦學(xué)習(xí)能夠解決數(shù)據(jù)所有權(quán),數(shù)據(jù)隱私,數(shù)據(jù)訪問權(quán)以及異構(gòu)數(shù)據(jù)的訪問等關(guān)鍵問題,所以自從聯(lián)邦學(xué)習(xí)的概念已提出就獲得了人工智能行業(yè)的追捧,目前已經(jīng)在很多行業(yè)受到一定的應(yīng)用,比如國防、電信、移動服務(wù)、醫(yī)療和物聯(lián)網(wǎng)等。
從整個數(shù)據(jù)產(chǎn)業(yè)看,聯(lián)邦學(xué)習(xí)可以增加可用數(shù)據(jù)的總量,能很好的解決現(xiàn)存數(shù)據(jù)孤島的問題;對企業(yè)自身而言,使用聯(lián)邦學(xué)習(xí)能簡單、合法且低成本的獲取外部有效的數(shù)據(jù)信息,快速解決某些因數(shù)據(jù)量或數(shù)據(jù)維度不足而導(dǎo)致的困擾,而且也不會造成合作企業(yè)間數(shù)據(jù)或商業(yè)機(jī)密的泄露。
聯(lián)邦學(xué)習(xí)成了解決數(shù)據(jù)難題的“金鑰匙”。它是解決數(shù)據(jù)孤島問題的重要技術(shù),尤其是在當(dāng)下數(shù)字化轉(zhuǎn)型趨勢日益明顯時,聯(lián)邦學(xué)習(xí)可為各行業(yè)的智能化升級提供更高效的模型應(yīng)用,同時也是建設(shè)聯(lián)邦智能生態(tài)的重要組成部分。
微眾銀行AI團(tuán)隊發(fā)布人工智能教科書《聯(lián)邦學(xué)習(xí)》 打破數(shù)據(jù)孤島
聯(lián)邦學(xué)習(xí)作為新興的技術(shù)范式,能夠在數(shù)據(jù)不出本地的前提下,實現(xiàn)安全數(shù)據(jù)模型共建與AI協(xié)作。“數(shù)據(jù)不出本地”這一特性可以保證數(shù)據(jù)隱私保護(hù),而AI聯(lián)合建模則可以最大程度挖掘數(shù)據(jù)價值,也因此,聯(lián)邦學(xué)習(xí)技術(shù)近兩年來市場呼聲極高。但隨著技術(shù)研究不斷深入與行業(yè)應(yīng)用范圍日益擴(kuò)大,市場亟需一本專業(yè)性及實用性兼?zhèn)涞?ldquo;重量級專著”,來幫助機(jī)構(gòu)及從業(yè)者快速與系統(tǒng)化地了解聯(lián)邦學(xué)習(xí)技術(shù)及其相關(guān)應(yīng)用。
因此,《聯(lián)邦學(xué)習(xí)》中文版應(yīng)運而生,該書由電子工業(yè)出版社出版,微眾銀行首席人工智能官楊強(qiáng)教授及人工智能部劉洋、程勇、康焱、陳天健、于涵等多位人工智能領(lǐng)域頂級專家歷時兩年,共同撰寫而成。該書凝聚了楊強(qiáng)教授團(tuán)隊的多年學(xué)術(shù)成果和工程經(jīng)驗,是國際首部全面、系統(tǒng)論述聯(lián)邦學(xué)習(xí)的中文著作,剖析了了面向數(shù)據(jù)安全和隱私保護(hù)機(jī)器學(xué)習(xí)學(xué)術(shù)成果和應(yīng)用案例,數(shù)據(jù)孤島和數(shù)據(jù)保護(hù)難題破解之法。一方面對聯(lián)邦學(xué)習(xí)的整體構(gòu)架、技術(shù)原理、重要價值進(jìn)行了系統(tǒng)化介紹,另一方面也全面分享了微眾銀行在聯(lián)邦學(xué)習(xí)領(lǐng)域的深厚積累。
我們相信這本書的順利問世,既標(biāo)志著由微眾銀行AI團(tuán)隊帶領(lǐng)構(gòu)建的聯(lián)邦學(xué)習(xí)生態(tài)影響力正進(jìn)一步擴(kuò)大,也預(yù)示著聯(lián)邦學(xué)習(xí)這一技術(shù)在走向成熟,未來勢必將出現(xiàn)一個全領(lǐng)域合作的聯(lián)邦生態(tài),建立起安全有效的“數(shù)據(jù)聯(lián)盟”,釋放數(shù)據(jù)無限價值,在保護(hù)用戶個人隱私的同時,實現(xiàn)全社會的智慧變革。正如《聯(lián)邦學(xué)習(xí)》中文版的作者之一,聯(lián)邦學(xué)習(xí)技術(shù)最早的布道者,國際人工智能界領(lǐng)軍人物楊強(qiáng)教授說的那樣:“聯(lián)邦學(xué)習(xí)作為下一代人工智能大規(guī)模協(xié)作的基礎(chǔ),迎合了技術(shù)和社會的需求,將承擔(dān)起人工智能在發(fā)展和應(yīng)用中的重任。”