數(shù)牘科技宋一民:守護“數(shù)據(jù)池塘”的新創(chuàng)客

李遼/彭飛
隱私計算,其實是多種技術的組合,其中包含安全多方計算、聯(lián)邦學習和差分隱私等,它的目標是在保護數(shù)據(jù)安全和用戶隱私的前提下,為不同機構(gòu)提供多方數(shù)據(jù)的分布式數(shù)據(jù)融合、聯(lián)合建模和數(shù)據(jù)使用。

格子襯衫、框架眼鏡、牛仔褲、運動鞋,一眼便可識別的程序員打扮,談到計算機與網(wǎng)絡,眼神活泛,滔滔不絕……宋一民身上涌動著扎克伯格般“極客”的神采。但身為年輕一代的創(chuàng)業(yè)家,在他這份清秀和干凈的少年感之下,卻又蘊藏著一種溫文爾雅、張弛有度的穩(wěn)重。

10cc1ff9abd24c50ba6b4889bf9e4457(1).jpg

▲數(shù)牘科技創(chuàng)始人宋一民資料圖片

2019年初春,決意作別美國的親友回國創(chuàng)業(yè)時,宋一民正在美國Facebook從事隱私工程相關工作。這樣的決定意味著,他要與高額的年薪、前沿的科技環(huán)境、逐年增長的股權(quán)激勵作出割舍。對于剛剛33歲的宋一民而言,作出這一決定“其實并不糾結(jié),也不痛苦”。想出來創(chuàng)業(yè)的想法由來已久,而多方安全計算理論上的突破使其在工業(yè)界落地成為了可能,加之全球?qū)﹄[私合規(guī)的重視加劇以及對數(shù)據(jù)流通價值的理解加深,宋一民覺得,時機到了。

他的合伙人、同為Facebook員工的蔡超超似乎“代價”更大。彼時蔡超超剛剛獲得公司百萬美金級的最高獎金,且剛剛升職。盡管在蔡超超看來,宋一民的這個決定相當大膽,但他仍然愿意一同回國創(chuàng)業(yè)。

宋一民與蔡超超決意要做的隱私計算技術方向,之前曾在2017年年初由宋一民在Facebook廣告部門提起,并做了一些嘗試。這項技術旨在實現(xiàn)“數(shù)據(jù)可用而不可見”的愿景,宋一民在國內(nèi)做過調(diào)研,當時尚無這樣的技術落地,他預見這項技術必將能填補國內(nèi)該領域的空白,“簡單來講,有多個相互獨立的數(shù)據(jù)池塘,在確保不讓魚出池塘的情況下,通過這項技術,精確了解到關于魚的各項匯總數(shù)據(jù)。在過去,可能需要把各個池塘的魚混在一起,才能精確計算出這些數(shù)據(jù),但這樣做不僅池塘主不愿意,監(jiān)管也不允許。”

2019年8月,數(shù)牘科技正式在北京創(chuàng)立,宋一民任CEO,蔡超超任CTO。公司拿到了紅杉資本中國基金的數(shù)千萬元投資。憑借著隱私計算領域的技術優(yōu)勢,短短不足兩年時間,數(shù)牘科技迅速與中國聯(lián)通、多個國有銀行等達成戰(zhàn)略合作,業(yè)務量逐漸攀升。

近期,成立不足兩年時間的數(shù)牘科技即將迎來新一輪融資,宋一民透露,這一輪的估值已經(jīng)超過1億美金。

隱私保護危機引發(fā)的決定

360截圖16410119186063.png

▲數(shù)牘科技辦公室資料圖片

在數(shù)牘科技的大開間辦公室中,宋一民的工位在進門第一排的靠邊位置,在整個團隊中并不顯眼。

創(chuàng)業(yè)之前,北京人宋一民的生活似乎“波瀾不驚”,初高中就讀的北京八中,以寬松的教學環(huán)境在國內(nèi)教育圈聞名。去南京郵電大學讀計算機專業(yè)之前,他的生活圈幾乎沒出過北京市西城區(qū)。大學畢業(yè)后,他去了美國得克薩斯繼續(xù)攻讀計算機專業(yè)研究生。當時金融危機剛結(jié)束,就業(yè)形勢嚴峻,與繼續(xù)深造相比,很多畢業(yè)生會優(yōu)先選擇工作,宋一民因科研能力突出畢業(yè)后被微軟錄取,之后又在激烈的競爭中脫穎而出,來到了Facebook。

在美國,計算機專業(yè)的學生畢業(yè)后被微軟、Facebook這樣的互聯(lián)網(wǎng)企業(yè)核心業(yè)務部門選中,基本意味著生活無憂。但宋一民一直有自己出來創(chuàng)業(yè)的想法,且一直在等待機會,“我做決策時非常謹慎,回國創(chuàng)辦數(shù)牘科技已經(jīng)是我人生中做的最大決定了。”

在2016年,在Facebook廣告的用戶數(shù)據(jù)部門工作的宋一民開始負責一些對外數(shù)據(jù)合作項目,他所在的部門要與各類數(shù)據(jù)提供者展開密切合作,但同時又要確保數(shù)據(jù)不被泄露。美國對侵犯用戶隱私的行為懲罰非常重,該部門在處理數(shù)據(jù)業(yè)務時都高度謹慎。2017年開始,作為技術主管,他負責過Instagram和Universal Ads等大型廣告服務項目的開展,還從0到1主導了Facebook和500強企業(yè)的基于隱私保護的數(shù)據(jù)協(xié)作項目。

隱私計算,其實是多種技術的組合,其中包含安全多方計算、聯(lián)邦學習和差分隱私等,它的目標是在保護數(shù)據(jù)安全和用戶隱私的前提下,為不同機構(gòu)提供多方數(shù)據(jù)的分布式數(shù)據(jù)融合、聯(lián)合建模和數(shù)據(jù)使用。近些年,數(shù)據(jù)信息安全事件頻發(fā),隱私保護和數(shù)據(jù)流動之間的矛盾日益凸顯,隱私計算或?qū)⒊蔀榻鉀Q這一矛盾的絕佳途徑。

在幫助Facebook解決廣告業(yè)務中的用戶隱私保護問題時,宋一民時常拉著蔡超超一起頭腦風暴,“隱私計算本質(zhì)上是要打破數(shù)據(jù)綁架,與Facebook的占據(jù)流量入口和成為數(shù)據(jù)匯聚點的戰(zhàn)略是相左的,在Facebook內(nèi)部推這個項目很有阻力。所以,這個技術特別適合成立一個獨立的第三方公司來做。”

蔡超超在Facebook作為技術領軍人物主導了多個項目,獲得了Facebook授予的Distinguished Equity(卓越獎),在機器學習、聯(lián)邦學習等領域擁有30多項美國國家專利。由于業(yè)務往來的需要,兩人一直有著十分緊密的合作關系。“那時,全世界做同類業(yè)務的公司不到10家,而且絕大多數(shù)公司只是做做樣子。”蔡超超表示。

幾乎所有的互聯(lián)網(wǎng)公司都是盡可能地把別人的數(shù)據(jù)拿過來,而不把自己的數(shù)據(jù)給出去。重大轉(zhuǎn)折出現(xiàn)在2017年,谷歌AI在《聯(lián)合學習:協(xié)作機器學習沒有集中訓練數(shù)據(jù)》的博客文章中首次引入了“聯(lián)邦學習”的概念。不久后,中國國內(nèi)首家民營銀行和互聯(lián)網(wǎng)銀行——微眾銀行,由于迫切的風控技術需要,將這一概念率先引入到國內(nèi)。但應用在落地時,推進得并不那么迅速。

2018年年底,IDC《數(shù)據(jù)時代2025》白皮書中預測,2025年全球產(chǎn)生的數(shù)據(jù)將高達175ZB,相當于每天平均產(chǎn)生491EB的數(shù)據(jù)。其中,相較于歐洲、中東、非洲、美國、亞太(不含中國)以及全球其他區(qū)域,在未來5年,中國的數(shù)據(jù)量平均增長率達到26%,預計到2022年將擁有全球最大的數(shù)據(jù)圈。

大數(shù)據(jù)飛速增長隨之引發(fā)的問題接踵而至,全球出現(xiàn)了多個用戶隱私信息泄露事件。僅2018年,F(xiàn)acebook 5000萬用戶的信息被泄露,圓通10億條用戶信息數(shù)據(jù)被出售,前程無憂195萬條個人求職簡歷泄露,萬豪喜達屋5億客戶的用戶信息被泄露,順豐3億條用戶信息數(shù)據(jù)被出售,AcFun 900萬條用戶數(shù)據(jù)被泄露……隱私泄露事件頻發(fā)導致信任鴻溝,傳統(tǒng)數(shù)據(jù)交易無法確權(quán)定價,傳統(tǒng)數(shù)據(jù)融合方式存在著極大的安全問題和高昂的管理成本。

此時的中國,既有將來全球最大的數(shù)據(jù)圈作為基礎,又有隱私泄露的各種危機事件發(fā)生,而數(shù)據(jù)作為生產(chǎn)要素,要產(chǎn)生經(jīng)濟價值,合規(guī)使用客戶隱私一定是發(fā)展的必然。“國外對使用用戶數(shù)據(jù)的監(jiān)管很嚴,但中國還存在一些灰色市場,具備良好的隱私計算技術的應用發(fā)展場景,能激發(fā)新的應用。”宋一民表示,“在國內(nèi),如果一個技術沒有從市場角度去反推,這個技術就很難落地,公司也很難存活。但國內(nèi)市場接納度非常高,市場滲透速度很快。”

多方共享數(shù)據(jù)卻無需交換數(shù)據(jù)

宋一民斷斷續(xù)續(xù)在國內(nèi)做了一些市場調(diào)研,2019年年初帶著創(chuàng)辦一家隱私計算技術服務公司的想法回國融資。他說:“我與一些投資機構(gòu)進行了交流,但他們大多對這個方向沒有概念,當時也沒有相應的市場需求。但好在我們的商業(yè)計劃書在機構(gòu)圈逐漸擴散開來,中國頂尖投資機構(gòu)的負責人找到我,他們說一直看好這個方向,但觀望了很久,沒有找到合適的項目。”

2019年4月,宋一民獲得了紅杉中國種子基金的天使輪投資,他覺得回國創(chuàng)業(yè)基本具備了天時地利人和的條件。幾乎沒有太久耽擱,宋一民火速拉攏到了一幫初創(chuàng)團隊一起回國,其中幾位是宋一民在Facebook的同事。

“在Facebook,和我們類似資歷的人幾乎沒有人會選擇出來創(chuàng)業(yè)。”宋一民稱,從這里離開,就等于要從安逸的美國生活中抽身出來。

早期團隊的成員姚雪潔,是宋一民北京八中的高中同學。決定和他一起回國時,她是某知名電商公司的國際化產(chǎn)品負責人,已經(jīng)在美國定居。數(shù)牘科技所要解決的問題,正是姚雪潔過去在投放廣告中經(jīng)常遇到的痛點,“如果能把廣告投放主的數(shù)據(jù)給到廣告推廣方,廣告投放的精準度和效果將顯著提高,但同時,如果把數(shù)據(jù)給到推廣方,數(shù)據(jù)將會被后者留存,破壞了用戶的隱私安全,這是矛盾的地方。”所以當宋一民提出隱私計算技術時,同為計算機專業(yè)的姚雪潔很快捕捉到了這項技術的前景。

數(shù)牘科技很快交出了答卷。2019年10月,第一版隱私計算產(chǎn)品出爐,正式完成了基于分布式的聯(lián)合建模,實現(xiàn)了之前向投資人承諾的“多方共享數(shù)據(jù)但又無需匯集或交換各方原始數(shù)據(jù)”的效果。這意味著,大數(shù)據(jù)實現(xiàn)了真正的共享,為“多方數(shù)據(jù)價值變現(xiàn)”找到了可行之路。

“數(shù)據(jù)隱私問題存在于數(shù)據(jù)存儲、數(shù)據(jù)交換和數(shù)據(jù)計算三方面。數(shù)牘科技解決了在數(shù)據(jù)計算層面的隱私保護和數(shù)據(jù)安全,為雙方用戶在原始數(shù)據(jù)無需暴露的前提下進行聯(lián)合建模及計算,平臺不參與計算,不觸碰數(shù)據(jù),不運營數(shù)據(jù)。”宋一民介紹,數(shù)牘的隱私計算平臺,可以讓數(shù)據(jù)使用方得到數(shù)據(jù)計算結(jié)果,但無法看到加密數(shù)據(jù)內(nèi)容,對于用戶來說,數(shù)據(jù)全程加密,充分保護用戶隱私,還能保證原始數(shù)據(jù)隱私安全。

很快,合作伙伴紛至沓來。2020年上半年,數(shù)牘科技成為聯(lián)通數(shù)科隱私計算技術提供商,同時獲得了招商局創(chuàng)投、紅杉中國及紅點資本的Pre A輪億元投資;同年6—7月,與中國移動、招商金科、招商銀行、浦發(fā)銀行共同開展了多個隱私計算試點工程項目;11月,與信通院、阿里安全共同發(fā)布國內(nèi)首個隱私計算技術研究報告;同時,近兩年來,數(shù)牘科技還參與了工信部信通院、中國電子標準化研究院、北京大數(shù)據(jù)中心等多個機構(gòu)的多項隱私計算、數(shù)據(jù)安全、數(shù)據(jù)流通分級分類的相關標準或指南。

數(shù)據(jù)需要在場景中發(fā)揮價值,因此隱私計算要天然貼近業(yè)務場景。數(shù)牘在實踐中積累了包括銀行、保險、汽車廠商、電信運營商、政府等多領域的業(yè)務場景。同時,實現(xiàn)了高安全性和高計算性能的雙重突破,已達工業(yè)落地可用狀態(tài)。

在金融板塊,銀行原有的風控模型受限于數(shù)據(jù)不夠豐富,在風控能力和獲客成本等方面面臨較大挑戰(zhàn),因此,數(shù)牘科技與一些頭部銀行及頭部保險公司在車險定價、信貸風控、智慧零售、小微企業(yè)貸款、反洗錢、智能投顧等方面進行了深度合作;在政務領域,數(shù)牘的主要客戶為“十四五”規(guī)劃中區(qū)域數(shù)字經(jīng)濟一體化的標桿省份客戶,如京津冀、粵港澳、長三角地區(qū)的用戶;在電信領域,基于電信數(shù)據(jù)能力、對外開放服務平臺,數(shù)牘打通了全行業(yè)互聯(lián)互通數(shù)據(jù)服務平臺,同時針對電信詐騙場景正樣本獲取難、數(shù)量少、模型能力不足的難點,協(xié)助移動和電信運用聯(lián)邦學習技術,在數(shù)據(jù)安全的前提下,融合雙方數(shù)據(jù)及模型經(jīng)驗,提升詐騙賬號識別能力,將電信反欺詐場景落地;在互聯(lián)網(wǎng)領域,數(shù)牘與大型互聯(lián)網(wǎng)廣告平臺及廣告主合作,基于隱私保護的廣告及營銷協(xié)作場景等。

創(chuàng)業(yè)之后的“甜蜜負擔”

技術靠場景打磨。一個技術能發(fā)展出多個方向,而具體要選擇哪個方向要看市場的反饋。“美國許多科技公司和國內(nèi)的一些早期的實踐者,在探索類似技術時還沒有機會在真正的大環(huán)境中落地,沒有辦法提煉出研發(fā)技術的關鍵邊界,也不清楚如何去判斷提升的優(yōu)先級。但中國有培育這個技術天然的市場,數(shù)牘科技在幾大運營商和頭部企業(yè)的場景中通過實際的業(yè)務落地也在快速地落實相關的積累。”宋一民強調(diào),“這一類場景,F(xiàn)acebook應該都沒有機會去實踐。”

“從2019年年底到2020年年中,某數(shù)據(jù)爬蟲隱私泄漏事件的出現(xiàn),讓大家意識到個人隱私保護的重要性,數(shù)據(jù)監(jiān)管政策收緊,市場突然有了迅猛的發(fā)展。”據(jù)悉,中國目前有100多家企業(yè)都在做類似業(yè)務,有高??蒲袌F隊,有社會企業(yè),因為很多企業(yè)都意識到了這塊技術在未來的發(fā)展。

“2020年,在疫情的影響下,數(shù)牘科技全年營收達千萬級人民幣。”宋一民稱,2020年的上半年,公司幾乎沒有簽任何合同,但從10月開始的3個月內(nèi),合作方陸續(xù)找來,一舉反超了“年營收力爭達到800萬元”的年初計劃。

成績很明顯,但宋一民也有了“甜蜜的負擔”。他笑言,因為自己的很多行為會被看作代表數(shù)牘科技,如今自己說話做事少了很多自由灑脫,他的朋友圈幾乎沒有任何文字和圖片的分享。但實際上,他使用微信十分頻繁,“每天早上醒來,微信里的未讀消息都有幾百條。”他拿出手機看了看數(shù)字,“現(xiàn)在是523條。”

從一個全球頂尖互聯(lián)網(wǎng)企業(yè)的技術負責人轉(zhuǎn)變?yōu)閯?chuàng)業(yè)團隊創(chuàng)始人,宋一民現(xiàn)在必須要為自己一手創(chuàng)辦的數(shù)牘科技負責到底。他說:“我每天都在面臨各種類型的隨機挑戰(zhàn),這些挑戰(zhàn)可能是我以前從未經(jīng)歷過的。”

末了,宋一民笑言,“這么看起來,創(chuàng)業(yè)仿佛不是一個性價比很高的決定。”但在隱私愈發(fā)受到尊重的當下,在隱私計算這個全新的賽道,擅長宏觀戰(zhàn)略思考和方向判斷的宋一民一定是一個優(yōu)秀青年創(chuàng)業(yè)家的典型樣本,沒有理由也不會選擇輕松的、“性價比很高”的人生。他注定會和數(shù)牘科技這匹黑馬一同,隨時代浪潮奔涌向前,讓數(shù)據(jù)的控制權(quán)回歸到擁有者手中。這個理想的實現(xiàn)也許路途艱辛,但一定不會漫長……

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論