數(shù)據(jù)流通的重要性
隨著數(shù)據(jù)經(jīng)濟不斷發(fā)展和大數(shù)據(jù)技術(shù)深度應(yīng)用,數(shù)據(jù)日益成為數(shù)據(jù)經(jīng)濟時代下新的重要戰(zhàn)略資源和生產(chǎn)要素。數(shù)據(jù)天性就是流通的,在安全條件下的開放、共享和利用,能夠極大地提高資本、技術(shù)、知識等其他生產(chǎn)要素的利用效率和結(jié)合對接,有效地推動管理、組織、制度和技術(shù)的不斷創(chuàng)新。而數(shù)據(jù)泄露的風險是阻滯數(shù)據(jù)流通最主要的障礙之一,其所造成的后果導致各方對數(shù)據(jù)的上傳流通采取過于保守的態(tài)度,因噎廢食。
2015年8月,中國國務(wù)院發(fā)布的《促進大數(shù)據(jù)發(fā)展行動綱要》明確表示,要“引導培育大數(shù)據(jù)交易市場,開展面向應(yīng)用的數(shù)據(jù)交易市場試點,探索開展大數(shù)據(jù)衍生產(chǎn)品交易,鼓勵產(chǎn)業(yè)鏈各環(huán)節(jié)市場主體進行數(shù)據(jù)交換和交易,促進數(shù)據(jù)資源流通,建立健全數(shù)據(jù)資源交易機制和定價機制,規(guī)范交易行為”。
政府鼓勵數(shù)據(jù)資源的流通和交易,是在確保數(shù)據(jù)安全下進行的。因此,建立一個安全、可靠、合規(guī)、高效的數(shù)據(jù)流通機制,是我國數(shù)據(jù)經(jīng)濟發(fā)展新形勢下的迫切需求。
1數(shù)據(jù)流通的常見場景
1.1單數(shù)據(jù)源對外開放模式
以單個公司、組織為主體,向數(shù)據(jù)需求方單向開放自身的數(shù)據(jù)。數(shù)據(jù)類型主要是營銷數(shù)據(jù)、互聯(lián)網(wǎng)數(shù)據(jù)和政務(wù)數(shù)據(jù)。需要指出的是,數(shù)據(jù)對外開放需要做的工作很多,如數(shù)據(jù)的脫敏和去標識化,合規(guī)支持,對用戶的認證,算法和結(jié)果分析,監(jiān)管接口等等。單一數(shù)據(jù)源對外開放的成本和技術(shù)難度都很高,導致很多數(shù)據(jù)源止步于此。
1.2組織內(nèi)多部門數(shù)據(jù)共享模式
主要是大型集團公司、組織機構(gòu)內(nèi)部的數(shù)據(jù)共享,包括總部與分部、決策層和執(zhí)行部門、各部門之間和公司與單個具體員工等。組織內(nèi)部之間的數(shù)據(jù)流通能夠有效提高業(yè)務(wù)效率,但是在實踐中會面臨諸多障礙,諸如員工跳槽或者以各種動機私自帶出數(shù)據(jù);部門管理以業(yè)務(wù)為導向、架構(gòu)獨立,會出現(xiàn)各部門推諉扯皮、不愿承擔風險現(xiàn)象;跨國公司內(nèi)部的數(shù)據(jù)流動涉及不同國家地區(qū)的數(shù)據(jù)跨境法律政策。
1.3不同組織間共享數(shù)據(jù)的模式
不同機構(gòu)、組織進行短期的項目合作,需要對各個成員單位進行數(shù)據(jù)共享。這種第三方外包服務(wù)通常需要對方的核心業(yè)務(wù)數(shù)據(jù),這就使得各方之間普遍存在數(shù)據(jù)泄露的風險。
1.4數(shù)據(jù)開放的要求
在上述或者任何其他數(shù)據(jù)流動的場景中,本質(zhì)問題是數(shù)據(jù)開放缺乏相互的信任基礎(chǔ)和機制以及違約懲罰,建立各方能夠信任的數(shù)據(jù)安全流通平臺,才能從根本上解決數(shù)據(jù)共享的信任問題。目前,傳統(tǒng)企業(yè)對數(shù)據(jù)開放的訴求主要有幾點:數(shù)據(jù)安全,即在開放數(shù)據(jù)時能夠有效保證數(shù)據(jù)安全,避免數(shù)據(jù)泄露;應(yīng)用場景,數(shù)字經(jīng)濟下的海量數(shù)據(jù)在開放和流通中不斷積累,如何能夠在更多的場景下對數(shù)據(jù)實現(xiàn)更有效地利用;數(shù)據(jù)定價,基于網(wǎng)絡(luò)空間的虛擬數(shù)據(jù),結(jié)構(gòu)復雜類型多樣,如何衡量其安全、商業(yè)、社會價值并建立規(guī)范的數(shù)據(jù)定價體系;算力支持,對于數(shù)據(jù)的接受、判斷、分析和處理需要足夠的技術(shù)儲備和安全的技術(shù)環(huán)境。
2云際數(shù)據(jù)交易平臺
基于此,我們提出了具備原始數(shù)據(jù)不可見、良好的加密和追溯機制、安全數(shù)據(jù)沙箱和可不斷迭代更新的云際數(shù)據(jù)交易平臺。云際數(shù)據(jù)交易平臺的原型源于云際合作模型,是一種不同架構(gòu)云服務(wù)之間的協(xié)作框架,這種模型框架應(yīng)用到數(shù)據(jù)開發(fā)服務(wù)中就是云際數(shù)據(jù)交易所,通過各方達成的共同協(xié)議和行為規(guī)則,實現(xiàn)不同機構(gòu)之間的協(xié)作和數(shù)據(jù)開放共享的(見圖1)。
圖1云際數(shù)據(jù)交易平臺示意圖
平臺建構(gòu)在多個數(shù)據(jù)源所提供的數(shù)據(jù)節(jié)點上,數(shù)據(jù)需求方提供自己需求算法支持,在平臺上安全合規(guī)、便捷自由地處理數(shù)據(jù)提供方的原始數(shù)據(jù),并得到算法結(jié)果。這是平臺最重要核心的概念,即“數(shù)據(jù)所有權(quán)和使用權(quán)的分離”,數(shù)據(jù)源在開放數(shù)據(jù)時開放的是使用權(quán),而不是所有權(quán)。整個過程中數(shù)據(jù)的所有權(quán)都不會發(fā)生轉(zhuǎn)變,但是用戶通過平臺獲得了在某種特定時間內(nèi),在特定場景下的某種數(shù)據(jù)的使用權(quán)。
平臺的功能從底層到上層主要劃分為基礎(chǔ)設(shè)施層、數(shù)據(jù)資源層、數(shù)據(jù)加工層和結(jié)果應(yīng)用層(圖2)。合法合規(guī)且安全便利的數(shù)據(jù)流通平臺必須為數(shù)據(jù)流通和數(shù)據(jù)在線使用提供技術(shù)環(huán)境和機制支持。通過構(gòu)建云服務(wù),使得用戶在云端使用數(shù)據(jù)而不是下載數(shù)據(jù),能夠有效地避免數(shù)據(jù)泄露。
圖2云際數(shù)據(jù)交易所功能模塊示意圖
2.1云際數(shù)據(jù)交易平臺主要特點
平臺化。通過平臺匯集數(shù)據(jù)提供方、數(shù)據(jù)需求方、算法方和渠道方等各方,使得數(shù)據(jù)的采集、清洗、計算、使用全部在云端平臺打通匯集。平臺通過大量的數(shù)據(jù)集聚和分類處理,能夠使得用戶能夠便利地尋找到需求數(shù)據(jù),或者明確哪些是需求以及如何利用。同時,大量的數(shù)據(jù)集聚能夠使得不同數(shù)據(jù)源之間能夠形成優(yōu)勢互補,發(fā)揮數(shù)據(jù)的集聚效應(yīng),彌補同類數(shù)據(jù)源數(shù)據(jù)過于單一的缺陷和不足,形成參與方各取所需的數(shù)據(jù)流通生態(tài)閉環(huán)。
合規(guī)化。平臺在構(gòu)建時就嚴格遵循了《網(wǎng)絡(luò)安全法》《信息安全技術(shù)個人信息安全規(guī)范》以及與數(shù)據(jù)安全相關(guān)的法律法規(guī),確保平臺全流程合規(guī)合法。
線上化??蛻羧叹€上自主化使用數(shù)據(jù),無需線下人工對接和資質(zhì)審核,并通過全方位的云安全技術(shù)和流程設(shè)計作為安全保障,確保數(shù)據(jù)源的原始數(shù)據(jù)不泄露,實現(xiàn)數(shù)據(jù)處理的脫敏、加密和匿名化,數(shù)據(jù)的使用得到所有者的充分授權(quán)等。
在產(chǎn)品功能上,實現(xiàn)數(shù)據(jù)資源融合。包括利用數(shù)據(jù)字典或數(shù)據(jù)名片對第三方數(shù)據(jù)源進行展示,通過加密機制對自有數(shù)據(jù)和第三方上傳數(shù)據(jù)實現(xiàn)融合;建立完善的審核機制,主要通過數(shù)據(jù)授權(quán)、算法及結(jié)果審核保障數(shù)據(jù)安全流通;確保數(shù)據(jù)來源穩(wěn)定可靠,數(shù)據(jù)使用情況可追溯、查看;算法建模良好兼容,創(chuàng)建算法時可隨時查看可用數(shù)據(jù)表,并支持多種語言編譯。
2.2云際數(shù)據(jù)交易平臺安全措施及流程
云際數(shù)據(jù)交易平臺主要采取五種方式滿足數(shù)據(jù)源和數(shù)據(jù)需求方的安全保障需求。首先是數(shù)據(jù)安全融合,通過分布式AI和分布式建模在不泄露原始數(shù)據(jù)的前提下實現(xiàn)不同數(shù)據(jù)源之間的數(shù)據(jù)融合;二是加密機制,利用秘鑰生成器的抗干擾性、分布式等特點,實現(xiàn)加密,并確保密鑰獨立生成和源代碼公開;三是數(shù)據(jù)沙箱,為用戶提供封閉、安全、自由的計算環(huán)境,保證數(shù)據(jù)可用但不可下載;四是區(qū)塊鏈審計,利用區(qū)塊鏈本身不可篡改的特點,對數(shù)據(jù)交易、處理的各個環(huán)節(jié)進行記錄,確保整個過程合法合規(guī)、可被追蹤和溯源;最后是多租戶隔離,明確用戶權(quán)限,保證數(shù)據(jù)需求方在使用數(shù)據(jù)進行計算或者建模的時候完全獨立,不會受到其他租戶的影響。
基于平臺的數(shù)據(jù)流動流程包括數(shù)據(jù)源、平臺方和數(shù)據(jù)需求方(見圖3),整個過程類似于電商的服務(wù)流程,但全部過程都是在線上進行,而且服務(wù)內(nèi)容是數(shù)據(jù),并不是物理商品。具體而言,數(shù)據(jù)提供方需要發(fā)布數(shù)據(jù)時,將原始數(shù)據(jù)經(jīng)過必要的匿名化、去標準化或者分布式記賬等操作后,上傳到平臺并在平臺確認后生成數(shù)據(jù)名片,呈現(xiàn)給需求方。提供方還要負責對
數(shù)據(jù)進行日常的編輯、維護和更新。
對于需求方而言,則需要上傳參與算法運行的自有數(shù)據(jù),并在數(shù)據(jù)目錄中申請需要的數(shù)據(jù)授權(quán),并選擇相應(yīng)的算法,查看最后運算結(jié)果并確認之后,可以在線上直接使用。
通過云際數(shù)據(jù)交易平臺,可以確保在數(shù)據(jù)安全方面做到五個不能。數(shù)據(jù)不能看,即在流程上做到數(shù)據(jù)的所有權(quán)和使用權(quán)分離,數(shù)據(jù)可用但不可見;數(shù)據(jù)不能拿,數(shù)據(jù)可用但不能下載,結(jié)果不能出庫,直接在線上的體系內(nèi)完成閉環(huán);數(shù)據(jù)不能用,平臺擁有一套基于數(shù)據(jù)脫敏的加密安全機制,就算發(fā)生泄漏,數(shù)據(jù)也毫無價值,全防護體系,記錄所有日志,確保所有的數(shù)據(jù)流動都可被追查;數(shù)據(jù)不想看,平臺方保持中立性,保證平臺不會私下利用上傳數(shù)據(jù)。