大數(shù)據(jù)的數(shù)據(jù)開放與共享

博誠經(jīng)緯
隨著大數(shù)據(jù)技術(shù)的不斷發(fā)展以及對大數(shù)據(jù)價值的深入挖掘,大數(shù)據(jù)作為一種資源受到人們越來越多的關(guān)注,數(shù)據(jù)呈現(xiàn)出戰(zhàn)略化、資產(chǎn)化、社會化等特征。

隨著大數(shù)據(jù)技術(shù)的不斷發(fā)展以及對大數(shù)據(jù)價值的深入挖掘,大數(shù)據(jù)作為一種資源受到人們越來越多的關(guān)注,數(shù)據(jù)呈現(xiàn)出戰(zhàn)略化、資產(chǎn)化、社會化等特征。

大數(shù)據(jù)的真正價值在于如何合法的充分應(yīng)用,數(shù)據(jù)開放和數(shù)據(jù)共享成為大數(shù)據(jù)的關(guān)鍵因數(shù)。《開放數(shù)據(jù)憲章》將開放數(shù)據(jù)定義為具備必要的技術(shù)和法律特性,從而能被任何人在任何時間和任何地點進行自由使用、再利用和分發(fā)的電子數(shù)據(jù)。其定義突出強調(diào)了開放數(shù)據(jù)的兩個核心因數(shù),一是數(shù)據(jù),是指原始的、未經(jīng)處理并允許個人和企業(yè)自由利用的數(shù)據(jù),在科學(xué)研究領(lǐng)域它也指代原始的、未經(jīng)處理的科學(xué)數(shù)據(jù)。二是開放,開放一般來說可以從兩個層面上來定義,即技術(shù)上的開放和法律上的開放。

近些年來,全球各國紛紛將數(shù)據(jù)開放納入到國家發(fā)展戰(zhàn)略。美國政府最先對大數(shù)據(jù)革命做出戰(zhàn)略反應(yīng)的。2009年,美國聯(lián)邦政府發(fā)布《開放政府指令》,作為大數(shù)據(jù)的前奏推出了“Data.gov”公共數(shù)據(jù)開放網(wǎng)站。2012年3月,美國聯(lián)邦政府發(fā)布了《大數(shù)據(jù)研究和發(fā)展計劃》,正式啟動了“大數(shù)據(jù)發(fā)展計劃”,宣布將投入超過2億美元在大數(shù)據(jù)研究上;同年5月,聯(lián)邦政府發(fā)布《數(shù)字政府戰(zhàn)略》(Digital Government Strategy),致力于為公眾提供更好的“數(shù)字化”服務(wù),圍繞數(shù)據(jù)進行的一系列措施在美國政府全面推進,大數(shù)據(jù)對美國政府的影響逐步顯現(xiàn)。我國于2004年發(fā)布了《2004-2010國家科技基礎(chǔ)條件平臺建設(shè)綱要》,啟動了國家科技基礎(chǔ)條件平臺建設(shè)專項,完成基礎(chǔ)資源的整合。以資源共享為核心,開展科技資源的開放共享和利用。2009年我國的科學(xué)技術(shù)網(wǎng)站——中國科技資源共享網(wǎng)正式開通。

2007年12月,在蒂姆·奧萊理的召集下,創(chuàng)建TrackGov.us的陶伯拉和其他29名開放公共數(shù)據(jù)的推動者共聚奧萊理出版社的加州總部。通過兩天的會議,他們制定發(fā)布了開放公共數(shù)據(jù)的8條標準和原則。

1.數(shù)據(jù)必須是完整的。除非涉及國家安全、商業(yè)機密、個人隱私或者其它特別限制,所有數(shù)據(jù)都應(yīng)開放。

2.數(shù)據(jù)必須是原始的。即是從數(shù)據(jù)源頭采集的原始數(shù)據(jù),而不是被加工修改過的數(shù)據(jù)。

3.數(shù)據(jù)必須是及時的。應(yīng)當在第一時間更新數(shù)據(jù)。

4.數(shù)據(jù)必須是可讀取的。即數(shù)據(jù)可被讀取,并盡可能地擴大用戶范圍和利用種類。

5.數(shù)據(jù)必須是機器可處理的。

6.數(shù)據(jù)的獲取必須是無歧視的。數(shù)據(jù)對所有人平等開放,不需要特別的手續(xù)。

7.數(shù)據(jù)格式必須是通用非專有的。即數(shù)據(jù)格式不能獨家控制,不得排除他人對數(shù)據(jù)的使用權(quán)。

8.數(shù)據(jù)必須是不需要許可證的。即除非特定,數(shù)據(jù)使用不受約束。

奧萊理在會上感嘆說:“我們正在進入一個新的世界,在這里,數(shù)據(jù)可能比軟件還要重要。”

我國也將政府數(shù)據(jù)開放提升到“國家戰(zhàn)略”地位,在《促進大數(shù)據(jù)發(fā)展行動綱要》中明確提出“推動政府數(shù)據(jù)開放共享”整體要求,明確政務(wù)信息應(yīng)“以共享為原則,不共享為例外”,將“形成公共數(shù)據(jù)資源合理適度開放共享的法規(guī)制度和政策體系”作為中長期目標。《政府數(shù)據(jù)開放準備度報告》從政策法規(guī)保障度、政策宣傳引導(dǎo)度、學(xué)術(shù)理論支持度、數(shù)據(jù)人才輸送度、社會輿論沸騰度、公眾認知敏銳度等六個維度來評價當前政府數(shù)據(jù)開放的“基礎(chǔ)土壤”。目前有31省份至2014年至今出臺231份提及“政府數(shù)據(jù)開放”的政策文件。2018年之后,數(shù)據(jù)開放政策整體走向精細化,個別地區(qū)針對政府數(shù)據(jù)開放已制定詳細的目標規(guī)劃。截止2019上半年,已有上海、浙江等十余個升級政府數(shù)據(jù)開放平臺搭建完成。

數(shù)據(jù)開放與共享的實施既是一個技術(shù)過程又是一個管理過程。技術(shù)過程是指采集用什么數(shù)據(jù)格式來發(fā)布,如何定義數(shù)據(jù)訪問接口和跟新策略等涉及數(shù)據(jù)處理方面的問題。而管理過程則是指發(fā)布什么樣的數(shù)據(jù),采用什么樣的開放許可協(xié)議等等。因此,一般建議數(shù)據(jù)的發(fā)布者應(yīng)該遵循數(shù)據(jù)開放與共享原則和標準,按照平臺的具體要求,進行數(shù)據(jù)的發(fā)布和開放共享。目前一般來說,數(shù)據(jù)開放與共享實施涉及三個主要的步驟,既數(shù)據(jù)集選擇、開放許可協(xié)議和數(shù)據(jù)集的發(fā)現(xiàn)與獲取。

數(shù)據(jù)集選擇

選取將要開放的數(shù)據(jù)集是數(shù)據(jù)開放與共享的第一步,但在數(shù)據(jù)開放與共享實施過程中確實工作量最大的一步。如果涉及到政府數(shù)據(jù)或者個人數(shù)據(jù),需要數(shù)據(jù)的發(fā)布者事先制定數(shù)據(jù)開放的標準以及對數(shù)據(jù)進行分級處理。

開放許可協(xié)議

在全球的各個國家法律體系下,知識產(chǎn)權(quán)法通常都限制第三方在沒有被許可授權(quán)的情況下對數(shù)據(jù)進行使用加工。因此,在選擇好待發(fā)布的數(shù)據(jù)集后,應(yīng)該考慮對這些數(shù)據(jù)集應(yīng)用什么樣的許可協(xié)議。

數(shù)據(jù)發(fā)現(xiàn)與獲取

選擇好數(shù)據(jù)開放協(xié)議后,數(shù)據(jù)發(fā)布者可將數(shù)據(jù)集發(fā)布到相應(yīng)的數(shù)據(jù)開放與共享平臺。數(shù)據(jù)開放的目的是數(shù)據(jù)的再利用,因此數(shù)據(jù)發(fā)布者應(yīng)當保證數(shù)據(jù)是可訪問可獲取的,且能提供機器能夠訪問的文件格式。

作為科研活動的基礎(chǔ)性戰(zhàn)略資源,科學(xué)數(shù)據(jù)開放共享意義重大??茖W(xué)數(shù)據(jù)“多跑路”,科研人員就能“少跑腿”,提升科技創(chuàng)新效率和水平。近年來,我國科學(xué)數(shù)據(jù)呈現(xiàn)井噴式增長。作為基礎(chǔ)性戰(zhàn)略資源,科研活動離不開數(shù)據(jù),要提升數(shù)據(jù)使用價值,開放與共享尤為重要。同時也要注意到,開放共享的前提是充分保障數(shù)據(jù)的安全,特別是對于涉及國家安全和秘密的科學(xué)數(shù)據(jù),更要把握好開放與保密的關(guān)系,要重視強化國家關(guān)鍵數(shù)據(jù)資源保護能力,增強數(shù)據(jù)安全預(yù)警和溯源能力。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論