在大數(shù)據(jù)的時(shí)代,我們每天的一個(gè)任務(wù)就是為互聯(lián)網(wǎng)巨頭們制造數(shù)據(jù):在網(wǎng)店瀏覽購(gòu)物的時(shí)候會(huì)留下消費(fèi)數(shù)據(jù),把美食發(fā)到微博或朋友圈會(huì)留下生活數(shù)據(jù),就連在最私密的日記文檔里打字,輸入的數(shù)據(jù)多半也會(huì)被輸入法軟件上傳上網(wǎng)。這些數(shù)據(jù)除了被好事的黑客盜用、被人才招聘公司拿去做背景調(diào)查之外,對(duì)我們自己來說到底有什么用?
首先說個(gè)好消息:2018年5月,歐盟通過了“史上最嚴(yán)格的消費(fèi)者數(shù)據(jù)隱私保護(hù)法”——“通用數(shù)據(jù)保護(hù)法案(簡(jiǎn)稱GDPR)”。一般認(rèn)為,這個(gè)法案強(qiáng)制美國(guó)蘋果、谷歌、微軟等互聯(lián)網(wǎng)巨頭公司提高對(duì)消費(fèi)者隱私的保護(hù),不得未經(jīng)用戶允許收集個(gè)人數(shù)據(jù)(中國(guó)小米生態(tài)鏈公司的智能燈具Yeelight當(dāng)時(shí)就因違反規(guī)定被禁止在歐盟銷售)。但是很多人不了解的是,這個(gè)法案還有另一方面的要求:互聯(lián)網(wǎng)公司必須讓用戶能夠便利地訪問獲取它們收集存儲(chǔ)的個(gè)人數(shù)據(jù)。這意味著我們可以非常方便地從谷歌、臉書(Facebook)之類的網(wǎng)站導(dǎo)出自己歷年搜索、發(fā)帖的痕跡。但還是那句話:對(duì)于不太精通技術(shù)的普通用戶,拿到這些數(shù)據(jù)又能做什么?
最近有一家美國(guó)創(chuàng)業(yè)公司Hey.ai看準(zhǔn)了這個(gè)市場(chǎng),他們開辟了一項(xiàng)業(yè)務(wù),用人工智能為大家分析互聯(lián)網(wǎng)巨頭公司給我們存儲(chǔ)的個(gè)人數(shù)據(jù),追蹤自己的網(wǎng)絡(luò)足跡。
說來好笑,Hey.ai的創(chuàng)始團(tuán)隊(duì)就是一群前谷歌(Google)員工,他們的CEO Hari Rajagopalan原先在谷歌的創(chuàng)業(yè)孵化器Area120工作,有了這個(gè)背景,相比對(duì)用戶數(shù)據(jù)的分析和研究別有心得。
Hey.ai公司目前主要針對(duì)各類英語互聯(lián)網(wǎng)平臺(tái)向客戶提供收費(fèi)服務(wù),他們的服務(wù)主要解決三方面問題:
首先,是拿不到數(shù)據(jù)。雖然歐盟的GDPR法案要求數(shù)據(jù)向個(gè)人公開,但是由于技術(shù)門檻的客觀存在,大部分消費(fèi)者都不知道他們可以拿到這些數(shù)據(jù);即使知道,真正找到操作入口也不容易。更何況,數(shù)據(jù)量還相當(dāng)大:Hey.ai在測(cè)試期間發(fā)現(xiàn),用戶平均在Facebook有擁有超過500MB的未壓縮數(shù)據(jù),在Google則有超過10GB的未壓縮數(shù)據(jù)。完成這么大規(guī)模數(shù)據(jù)的下載和打開就相當(dāng)困難——10GB的數(shù)據(jù)文件,一般配置的電腦恐怕都打不開。針對(duì)這個(gè)情況,Hey.ai建立了專門的分析平臺(tái),讓用戶可以在線分析自己的數(shù)據(jù)。他們的服務(wù)目前主要面向Facebook,Google,YouTube和Instagram這幾個(gè)平臺(tái),用戶再也不必慌亂地四處檢索數(shù)據(jù)入口、再狼狽地下載大數(shù)據(jù),只要在Hey.ai的界面上操作,就可以完成自己數(shù)據(jù)的導(dǎo)入和分析。
其次,是看不懂?dāng)?shù)據(jù)。大數(shù)據(jù)往往以JSON、CSV、HTML之類的格式保存。對(duì)于普通人來說,這些格式無異于天書。Hey.ai把這些古怪的字符轉(zhuǎn)換成我們易懂的表述和圖表:我們這些年都在社交媒體上發(fā)了哪些帖、做了哪些事?讓我們用一個(gè)不同的眼光重新審視這些“生活事件”,對(duì)個(gè)人用戶無疑有特別重要的意義。
第三,則是基于人工智能的分析應(yīng)用。單單拿到、看懂?dāng)?shù)據(jù)還不夠。Hey.ai平臺(tái)推出了一些特別有針對(duì)性的數(shù)據(jù)使用方式。就拿當(dāng)前流行的數(shù)字健康話題來講,通過分析用戶在多個(gè)網(wǎng)絡(luò)平臺(tái)上留下的各類交互信息,人工智能系統(tǒng)能夠分析出用戶個(gè)人的作息、起居、飲食、運(yùn)動(dòng)習(xí)慣模式,并提出基于第一手?jǐn)?shù)據(jù)的有價(jià)值建議。此外,我們自己或我們的親朋好友或許很久之前網(wǎng)上發(fā)表過不當(dāng)言論,這很可能對(duì)未來的求職、升遷造成負(fù)面影響。人工智能系統(tǒng)會(huì)從平臺(tái)數(shù)據(jù)中耐心地爬梳出這些言論,提醒我們注意相關(guān)風(fēng)險(xiǎn)、及時(shí)刪改。
分析家評(píng)論說,每次新的立法出臺(tái)都會(huì)伴隨突破性的產(chǎn)業(yè)創(chuàng)新。歐盟的GDPR法案就是這樣一種開創(chuàng)全新互聯(lián)網(wǎng)范式的立法;hey.ai推出的服務(wù)第一個(gè)響應(yīng)了產(chǎn)業(yè)的變化和發(fā)展,今后肯定還會(huì)有更多公司在這個(gè)領(lǐng)域做出更多創(chuàng)新。