當抗疫戰(zhàn)場上的好消息不斷傳來,關于“城市免疫力”的話題也不斷升溫。除了公共醫(yī)療與我們自身健康上的免疫能力,一座城市如何提高自己的免疫能力,更好應對相關危險,成為了公共話語討論的焦點。
我們在相關討論中,看到了預警機制建設、供應鏈體系完善、城市數(shù)字化升級、信息透明制度等等的話題,可以說益處良多。在這里我們從自身視角出發(fā),貢獻一點話題:城市免疫力的提高,還與一些新銳技術的應用息息相關。
比如說,在AI領域這幾年有一個“明星技術”,被各種頂會熱捧,被無數(shù)開發(fā)者關注,它叫做聯(lián)邦學習。而這個大眾可能依舊陌生的技術,其實就與城市免疫力話題息息相關。
從這次抗疫過程里,不難看出城市各領域、各部門之間的數(shù)據(jù)不打通、不協(xié)同是一個巨大問題。比如說,基層人員要把寶貴時間浪費在無窮無盡的填表上;居民進出小區(qū)、醫(yī)院、車站等公共場所,要一處一掃碼一處一填表;相關部門想要獲悉和應用其他領域的最新動態(tài)數(shù)據(jù),更是難上加難。
這個顯著暴露的問題,被稱為“城市數(shù)據(jù)孤島現(xiàn)象”。每個部門都可能建設一套自己的系統(tǒng)和數(shù)據(jù),沿用不同的數(shù)據(jù)表現(xiàn)形式,積累下來就會造成層層疊疊的孤立數(shù)據(jù)。然而要實現(xiàn)城市數(shù)據(jù)的全面打通,全面共享,雖然理論上聽起來簡單,但實際操作又是不可能的。每個部門的日常工作方式、數(shù)據(jù)需求和數(shù)據(jù)保密等級不同,徹底打通既缺乏操作性,也不利于真實工作的開展。
那么有沒有既尊重城市數(shù)據(jù)歸屬權,又能讓AI來全盤洞察城市數(shù)據(jù)的方案呢?
聯(lián)邦學習就是一種有效的方案。比如,北京經(jīng)濟技術開發(fā)區(qū)上線了數(shù)字化防疫系統(tǒng)——戰(zhàn)疫金盾,能夠實時監(jiān)控返城人員流向分布,還能動態(tài)掌握園區(qū)企業(yè)運行情況,幫助地方政府科學決策。業(yè)內(nèi)首創(chuàng)異步聯(lián)邦學習的京東數(shù)科,就參與了戰(zhàn)疫金盾的開發(fā),很可能聯(lián)邦學習技術也在其中發(fā)揮了作用。
聯(lián)邦學習的火爆,原因在于它并不致力于改變機器學習和數(shù)據(jù)存儲的基本實現(xiàn)方式,而是改變了不同AI模型之間的協(xié)作模式。
在聯(lián)邦學習模式下,數(shù)據(jù)依舊保存在“島“中,但AI模型可以跨越島嶼來架起橋梁,實現(xiàn)特定需求和整體智能的機器學習目標。這種模式被產(chǎn)學研各界認為是未來數(shù)據(jù)協(xié)同和智能協(xié)同的基本實現(xiàn)方式,聯(lián)邦學習也成為了AI技術發(fā)展到今天的幾大主要趨勢之一。
給城市免疫力注入一支“AI營養(yǎng)液”——聯(lián)邦學習的進化,也許在未來某天將成為新的城市之盾。
聯(lián)邦學習:打破數(shù)據(jù)孤島的AI明星
2016年,谷歌團隊提出了聯(lián)邦學習的概念,隨后引起了整個AI學術界的共同關注。
聯(lián)邦學習為過往AI技術邏輯帶來的最大改變在于,它的數(shù)據(jù)結構可以在參與各方不披露底層數(shù)據(jù)的前提下,完成共建模型的搭建,之后利用整個數(shù)據(jù)聯(lián)邦內(nèi)的數(shù)據(jù)資源進行訓練,使每個參與方都將獲得能力提升。
而聯(lián)邦學習最大的價值,就是改變了AI時代每個數(shù)據(jù)擁有方單打獨斗的“常識”,將數(shù)據(jù)資源以可行的方式聯(lián)合在了一起。將聯(lián)邦學習投向產(chǎn)業(yè)應用,最直接的目標是可以改變重度數(shù)據(jù)安全領域,尤其是金融產(chǎn)業(yè)的智能化效率;向長遠看,聯(lián)邦學習可能改變每一家企業(yè)獲取AI、打造自身AI體系的方式與門檻,對智能社會有著舉足輕重的價值。
肩負著打破數(shù)據(jù)孤島的重任,聯(lián)邦學習很快成為了AI世界中的未來之星。在歐美流行的AI民主化議題里,聯(lián)邦學習今天占據(jù)著舉足輕重的地位。
但在從理論架構向現(xiàn)實產(chǎn)業(yè)進化的過程里,聯(lián)邦學習可能還有很長的路要走。而從它保護數(shù)據(jù)隱私,確保數(shù)據(jù)安全的基本能力上來看,科技金融毫無疑問是聯(lián)邦學習落地的第一站。
在中國,聯(lián)邦學習走向產(chǎn)業(yè)應用的步伐正在逐步加快。京東數(shù)科、微眾銀行等企業(yè)對聯(lián)邦學習,從技術向產(chǎn)業(yè)的一系列探索,正在向各行業(yè)展現(xiàn)這一技術滲透到現(xiàn)實的種種可能。
異步計算與產(chǎn)業(yè)化:京東數(shù)科破解的“聯(lián)邦學習密碼”
聯(lián)邦學習走向產(chǎn)業(yè)化,是近兩年全球AI產(chǎn)學各界普遍關注的議題。在歐美,聯(lián)邦學習的提出者谷歌,以及亞馬遜、IBM等公司都大力發(fā)展聯(lián)邦學習技術。而在國內(nèi)BAT、華為等科技公司也都在參與聯(lián)邦學習的產(chǎn)業(yè)化過程。
同時,聯(lián)邦學習也在成為AI頂會的熱門話題。比如去年12月舉行的NeurIPS 2019中,就有大量論文集中討論聯(lián)邦學習的產(chǎn)業(yè)應用與行業(yè)標準化。剛剛召開的AAAI 2020中,由微眾銀行、新加坡南洋理工大學、極視角合著的論文《FedVision: An Online Visual Object Detection Platform powered by Federated Learning》被授予“人工智能創(chuàng)新應用獎”。
同時,聯(lián)邦學習的產(chǎn)業(yè)標準化進程也在推進當中。2018年,IEEE聯(lián)邦學習標準項目宣布成立,這是國際首個針對AI協(xié)同技術框架訂立標準的IEEE項目,至2019年已經(jīng)舉行了第三次會議。
而在更具體的產(chǎn)業(yè)化落地進程里,不能不提到京東數(shù)科。有媒體認為,在金融科技產(chǎn)業(yè)中,微眾銀行由聯(lián)邦學習的學術探索而廣為人知,京東數(shù)科則將聯(lián)邦學習的產(chǎn)業(yè)應用做到了更前沿的維度。
比如說,聯(lián)邦學習走向產(chǎn)業(yè)應用最大的問題之一,在于最早提出的聯(lián)邦學習模型,學習進程都是同步的。但在現(xiàn)實中,不同企業(yè)和機構所處的計算環(huán)境、網(wǎng)絡環(huán)境、數(shù)據(jù)環(huán)境各不相同。同步計算的聯(lián)邦學習,在很多情況下無法應用于產(chǎn)業(yè)化的多方聯(lián)合建模。
京東數(shù)科發(fā)現(xiàn),破解這一問題的關鍵在于異步計算能力,于是率先提出了異步聯(lián)邦學習技術,在底層技術邏輯上改變了聯(lián)邦學習的工作方式,讓它更好進化到產(chǎn)業(yè)級需求當中。
以異步聯(lián)邦學習為基礎,京東數(shù)科已經(jīng)打造了一系列聯(lián)邦學習走向開放和應用的技術基礎設施。比如基于聯(lián)邦學習推出 AI開放平臺;積極參與推進IEEE聯(lián)邦學習標準,助力建立行業(yè)標準規(guī)范;基于自研聯(lián)邦學習算法,保證聯(lián)邦森林算法的模型效果的一致性;借助京東數(shù)科的多種技術優(yōu)勢,將聯(lián)邦學習與安全加密、多方安全計算和同態(tài)加密等多項技術并用,構建完善的聯(lián)邦學習產(chǎn)業(yè)體系。
從平臺化、產(chǎn)業(yè)標準、產(chǎn)業(yè)一致性,到技術融合,京東數(shù)科圍繞聯(lián)邦學習的產(chǎn)業(yè)化,完成了從基礎技術到技術應用的多層次進化,將聯(lián)邦學習的技術原點與產(chǎn)業(yè)需求進行對接,通過異步聯(lián)邦學習構筑了完善的數(shù)據(jù)協(xié)同產(chǎn)業(yè)應用生態(tài),實現(xiàn)了聯(lián)邦學習領域的多項領先。
基于異步聯(lián)邦學習的技術優(yōu)勢,以及多種安全加密技術的融合,京東數(shù)科推出了聯(lián)邦數(shù)字網(wǎng)關。聯(lián)邦數(shù)字網(wǎng)關保證了數(shù)據(jù)不需要離開儲存位置也能夠實現(xiàn)數(shù)據(jù)的融合利用,在不同機構之間搭建起安全、智能、高效的連接,并保證數(shù)據(jù)接入安全、建模安全、數(shù)據(jù)交互安全,最終形成數(shù)據(jù)聯(lián)盟,實現(xiàn)合作共贏的目標。
基于這一系列聯(lián)邦學習的產(chǎn)業(yè)實踐,京東數(shù)科在聯(lián)邦學習領域,實現(xiàn)了商業(yè)化和應用場景落地方面的領先。而其領先探索也為我們展示了這樣一副圖畫:未來,聯(lián)邦學習究竟如何影響和改變我們的生活。
金融風控與城市智能:聯(lián)邦學習的應用進化紀
在聯(lián)邦學習的綜合場景應用中,金融科技領域毫無疑問是落地第一站。因為金融智能和智能風控領域,涉及大量的數(shù)據(jù)智能化和數(shù)據(jù)學習,但同時數(shù)據(jù)的保密等級高、安全要求嚴格。而聯(lián)邦學習技術剛好同時滿足了這兩種需求,在金融數(shù)據(jù)安全與金融產(chǎn)業(yè)智能化升級之間取得了重要平衡。
京東數(shù)科的聯(lián)邦學習技術,已經(jīng)在金融風控領域基于聯(lián)邦學習進行了持續(xù)落地。通過聯(lián)邦算法、安全加密算法,在個人信用評分、企業(yè)信用評分、精準營銷、精準放貸、精準風控、地塊洞察和醫(yī)療診斷等場景下實現(xiàn)了跨域學習聯(lián)合建模和安全可靠的知識共享服務。
而在金融產(chǎn)業(yè)之外,下一個最有聯(lián)邦學習技術應用潛力和落地需求的場景,是近兩年如火如荼發(fā)展中的智慧城市。
一座城市,是由無數(shù)個政務、企業(yè)、公共服務系統(tǒng)所構成的。隨著數(shù)字化城市升級的加快,各個系統(tǒng)都在構建自己的數(shù)據(jù)體系與智能化系統(tǒng)。然而這些系統(tǒng)大多數(shù)時候都是獨立存在的,交通不知道物流,水利不了解氣象。這就導致城市的整體智能化很難發(fā)展起來,智慧城市變成了千百根聳立的數(shù)據(jù)煙筒。
然而各系統(tǒng)之間數(shù)據(jù)保密性、數(shù)據(jù)權責等客觀需求,又讓數(shù)據(jù)打通并不那么現(xiàn)實。這種情況下,聯(lián)邦學習體系可以成為關鍵的破解方案,在確保數(shù)據(jù)各有的同時,構建城市整體智能進化方案。京東數(shù)科的智能城市體系中,已經(jīng)大量應用了聯(lián)邦學習技術與聯(lián)邦數(shù)字網(wǎng)關,構成了京東數(shù)科在智慧城市領域的明星技術。
而從金融風控到城市智能化,可以看到聯(lián)邦學習技術在大量差異化行業(yè)場景中,都有著基礎應用價值。各行各業(yè)都將可能自聯(lián)邦學習模式中獲益,實現(xiàn)智能協(xié)同、消弭數(shù)據(jù)壁壘。
聯(lián)邦學習帶來的改變將是社會化和底層化的,而從理論架構到產(chǎn)業(yè)實踐、商業(yè)落地這關鍵一步,已經(jīng)被京東數(shù)科探索出了扎實的可能。
一座數(shù)據(jù)與智能之間、無數(shù)數(shù)據(jù)架構之間、智能社會之間的橋梁正在建設進行時。