近日,由清華-伯克利深圳學(xué)院(TBSI)與 華揚(yáng)聯(lián)眾 聯(lián)合主辦的“2019數(shù)據(jù)科學(xué)研究與商業(yè)應(yīng)用國際研討會(huì)”在清華大學(xué)深圳國際研究生院隆重舉行,華揚(yáng)聯(lián)眾研發(fā)副總裁李響博士受邀擔(dān)任研討會(huì)主席,并以《具有用戶隱私意識(shí)的機(jī)器學(xué)習(xí)框架》為題發(fā)表演講,就用戶數(shù)據(jù)隱私,大數(shù)據(jù)機(jī)器學(xué)習(xí)等當(dāng)下熱門話題展開討論。
華揚(yáng)聯(lián)眾研發(fā)副總裁李響博士
當(dāng)下大數(shù)據(jù)的特征
李響博士在演講中表示,現(xiàn)如今互聯(lián)網(wǎng)技術(shù)不斷發(fā)展,數(shù)據(jù)的收集與傳輸速度也在不斷提升;與此同時(shí)各種網(wǎng)站、APP如雨后春筍般涌現(xiàn),它們的分類愈發(fā)細(xì)化,并在運(yùn)營中不斷產(chǎn)生大量數(shù)據(jù),因此當(dāng)下的大數(shù)據(jù)領(lǐng)域正呈現(xiàn)出:數(shù)量大、速度快、多樣性等特征。
大數(shù)據(jù)帶來的責(zé)任
數(shù)據(jù)科學(xué)的不斷發(fā)展為人們生活提供的便利不可忽視,但由于互聯(lián)網(wǎng)的開放性,數(shù)據(jù)庫中累積的數(shù)據(jù)會(huì)不斷與不同的服務(wù)器、運(yùn)營商進(jìn)行連接與交換,這也勢必會(huì)帶來信息泄露的風(fēng)險(xiǎn)。近來大型用戶數(shù)據(jù)泄露事件層出不窮,消費(fèi)者對(duì)互聯(lián)網(wǎng)數(shù)據(jù)安全的信任度跌至低谷,針對(duì)這一現(xiàn)狀,我們確實(shí)需要思考如何在數(shù)據(jù)交換的過程中保障用戶隱私,提升公眾對(duì)數(shù)據(jù)科學(xué)的信任度與安全感。
保障用戶的數(shù)據(jù)隱私
在法律層面,不同的國家及地區(qū)正在做出各自的嘗試——在歐洲,通過設(shè)立GDPR(General Data Protection Regulation)個(gè)人隱私保護(hù)法,以較為苛刻的條款嚴(yán)格保護(hù)用戶的數(shù)據(jù)信息,但這種嚴(yán)格的規(guī)定客觀上也一定程度地導(dǎo)致了歐洲地區(qū)在數(shù)據(jù)科學(xué)領(lǐng)域發(fā)展的相對(duì)滯后;美國的做法則相對(duì)寬松,他們提出的D4GX(Data For Good Exchange)更傾向于規(guī)范數(shù)據(jù)的使用和管理,以及保證用戶的知情權(quán)。
除了完善的法律制度外,技術(shù)領(lǐng)域近年來也出現(xiàn)了很多的工具和方法——數(shù)據(jù)加密(data encryption)、數(shù)據(jù)匿名化(data anonymization)、微分隱私(differential privacy)等,幫助解決數(shù)據(jù)挖掘和應(yīng)用過程中對(duì)個(gè)人隱私的保護(hù)問題。華揚(yáng)聯(lián)眾在數(shù)據(jù)開發(fā)和使用過程中,也在不斷為保護(hù)個(gè)人信息安全做出新的嘗試,探索出一套基于用戶隱私保護(hù)的機(jī)器學(xué)習(xí)流程和框架——從數(shù)據(jù)的鍵值和標(biāo)簽分別著手,綜合運(yùn)用數(shù)據(jù)加密技術(shù),對(duì)數(shù)據(jù)清洗、加工和流轉(zhuǎn)各個(gè)環(huán)節(jié)中的個(gè)人數(shù)據(jù)信息進(jìn)行保護(hù),并且通過數(shù)據(jù)匿名化技術(shù),限制了數(shù)據(jù)信息的應(yīng)用范圍,避免了一直困擾業(yè)界的未經(jīng)授權(quán)數(shù)據(jù)二次使用問題。在演講中,李響博士也通過具體實(shí)例,展示了如何在保護(hù)用戶數(shù)據(jù)隱私的同時(shí),保證機(jī)器學(xué)習(xí)模型的性能、實(shí)現(xiàn)數(shù)據(jù)隱私和應(yīng)用效果的平衡。
最后,李響博士表示當(dāng)下一些數(shù)據(jù)使用失當(dāng)?shù)男袨槭勾蟊妼?duì)數(shù)據(jù)科學(xué)的信任度大幅度降低,保護(hù)用戶隱私安全是未來大數(shù)據(jù)領(lǐng)域研究的重點(diǎn);在技術(shù)升級(jí)、完善的同時(shí),我們也要通過數(shù)據(jù)科學(xué)的普及教育,提升大眾在這一領(lǐng)域的認(rèn)知,使消費(fèi)者們相信合理規(guī)范的數(shù)據(jù)挖掘、使用行為,完全可以實(shí)現(xiàn)用戶隱私保護(hù)和提供生活便利之間的平衡。
李響博士自2016年加入華揚(yáng)聯(lián)眾,負(fù)責(zé)華揚(yáng)聯(lián)眾數(shù)字營銷平臺(tái)的規(guī)劃和研發(fā),致力于利用數(shù)據(jù)科技的手段提升華揚(yáng)聯(lián)眾的營銷服務(wù)水平和產(chǎn)品競爭力;同時(shí)他也帶領(lǐng)華揚(yáng)聯(lián)眾HDTC團(tuán)隊(duì)整合華揚(yáng)聯(lián)眾核心數(shù)據(jù)與技術(shù)資源,開發(fā)出HY-MADE(華揚(yáng)聯(lián)眾營銷數(shù)據(jù)分析引擎)、GRAPHy(華揚(yáng)聯(lián)眾圖分析綜合數(shù)據(jù)服務(wù)平臺(tái)),為客戶與合作方帶來更高效、更具競爭優(yōu)勢的數(shù)字營銷,實(shí)現(xiàn)“數(shù)據(jù)思維創(chuàng)造的行動(dòng)力”。