近日,中國科學院A類戰(zhàn)略性先導科技專項“地球大數(shù)據(jù)科學工程”正式啟動。該專項以建成具有全球影響力的國際地球大數(shù)據(jù)科學中心為目標,聚焦基于空間技術(shù)生成的海量對地觀測數(shù)據(jù),致力于推動并實現(xiàn)地球大數(shù)據(jù)創(chuàng)新、重大科學發(fā)現(xiàn)和一站式全方位宏觀決策支持。
地球大數(shù)據(jù)將如何改變科研與生活?為什么地球大數(shù)據(jù)離不開空間技術(shù)支持?用好地球大數(shù)據(jù),還有哪些瓶頸亟待突破?
地球科學發(fā)展需要大數(shù)據(jù)助力
許多人都曾有過這樣的經(jīng)歷:打開購物網(wǎng)站,瀏覽“貨架”,輕點鼠標將心儀的商品添加進購物車,結(jié)算時,總能在頁面下方發(fā)現(xiàn)其他“你可能還喜歡”的產(chǎn)品信息,再次撩撥起那顆控制不住想要“買買買”的心。
網(wǎng)站為何能輕松“猜”中你的喜好?這就是大數(shù)據(jù)分析得出的結(jié)果。
“并非所有海量龐雜的信息都有資格被稱為大數(shù)據(jù)。”河北地質(zhì)大學大數(shù)據(jù)研究方向教授李文斌說,通俗點講,大數(shù)據(jù)一般具有“5V”特點,即大量(Volume)、高速(Velocity)、多樣(Variety)、低價值密度(Value)和真實性(Veracity),“就像我校有史以來全部學生的課業(yè)成績,雖然體量較大,但過于單一、缺少聯(lián)系,不具備大數(shù)據(jù)的特點,并不能算作大數(shù)據(jù)。”
大數(shù)據(jù)“入侵”我們生活的速度有多快?
19世紀70年代以來,隨著第二次工業(yè)革命的爆發(fā),各種新技術(shù)、新發(fā)明層出不窮,以文字為載體的數(shù)據(jù)量大約每10年翻一番;從工業(yè)化時代進入到信息化時代后,信息技術(shù)革命以前所未有的方式對社會、科技、經(jīng)濟變革的發(fā)展起著決定作用,數(shù)據(jù)量以每3年翻一番的速度持續(xù)增長;近十幾年來,隨著計算機技術(shù)、物聯(lián)網(wǎng)、云計算被廣泛應用,更使得數(shù)據(jù)存儲量、規(guī)模、種類等飛速增長。
“曾有媒體報道稱,在整個人類文明所獲得的全部數(shù)據(jù)中,有90%是過去幾年內(nèi)產(chǎn)生的。”李文斌說,目前,全球數(shù)據(jù)總量每年都在倍增,預計到2025年將達到163ZB,屆時,我國的數(shù)據(jù)量將約占全球數(shù)據(jù)總量的20%,“可以說,我們已經(jīng)進入了大數(shù)據(jù)時代。”
身處這樣的時代,大數(shù)據(jù)在深刻影響人們生活的同時,也在改變著人們認識和研究世界的方法。如今,大數(shù)據(jù)技術(shù)與應用已成為繼實驗、觀測、理論和計算模式后,數(shù)據(jù)密集型科學范式的典型代表,正在帶來科研方法論的創(chuàng)新。
對地球科學來說,這一改變帶來的影響尤為深刻。
“地球科學,通俗點講,就是研究地球的一切科學。它范圍很廣,可以涵蓋地質(zhì)學、海洋學、氣象學、天文學等諸多領域。”李文斌說,盡管名字很高大上,地球科學距離我們的生活卻并不遠,“比如氣候變化、自然災害、資源短缺、生態(tài)退化、水土污染、大氣霧霾等,既是時下影響經(jīng)濟社會發(fā)展的重大問題,也是地球科學領域的熱門話題。”
過去在這一領域,人們所關注的數(shù)據(jù)要么是數(shù)據(jù)來源區(qū)域化、要么是數(shù)據(jù)形式單一化,而且數(shù)據(jù)體量也較小。現(xiàn)在,人們正在逐步實現(xiàn)“將地球裝進計算機”。
以青藏高原研究為例,涉及多個科學領域,比如地球內(nèi)部結(jié)構(gòu)、地球物理邊界場響應、地質(zhì)構(gòu)造格局、地球化學與巖漿巖涌現(xiàn)、地理與地貌、動物與植物、冰川與土壤、資源與能源、火山與地震災害、大氣環(huán)流與氣候變化,以及人文、經(jīng)濟、民族和社會變遷等。
“對這些領域的研究中不斷產(chǎn)生的數(shù)據(jù)是交叉的、海量的,如果能有效建立起化探、物探、遙感等各種地球空間數(shù)據(jù)間的聯(lián)系,我們就能用計算機模擬出一個真實的青藏高原,那么,關于它的‘昨天’和‘明天’就能清晰地呈現(xiàn)在我們眼前,從而帶來全新的研究對象、手段和結(jié)果。”李文斌說,曾經(jīng),孤立使用單一特定領域的已有挖掘分析理論和方法,已經(jīng)很難有效推動大的科學發(fā)現(xiàn);如今,通過多學科深度交叉聯(lián)合,開展系統(tǒng)性和綜合性研究,大數(shù)據(jù)能提供新的技術(shù)手段、創(chuàng)新視角,促進新的科研范式的形成。
地球大數(shù)據(jù)離不開空間技術(shù)支持
按計劃,此次中國科學院啟動的“地球大數(shù)據(jù)科學工程”專項為期5年(一期建設期),共設置地球大數(shù)據(jù)科學工程總體、地球科學小衛(wèi)星、大數(shù)據(jù)云平臺、數(shù)字“一帶一路”、全景美麗中國、生物多樣性與生態(tài)安全、三維信息海洋、時空三極環(huán)境、數(shù)字地球科學平臺9個項目。
“數(shù)字‘一帶一路’的研究內(nèi)容非常豐富,涉及的領域包括環(huán)境變化、自然災害、世界遺產(chǎn)、水資源、農(nóng)業(yè)與糧食安全、海洋與海岸帶等,通過國際間數(shù)據(jù)共享,建立地球大數(shù)據(jù)平臺,進而通過調(diào)動國內(nèi)外數(shù)據(jù),就可以為政府提供決策支持。”李文斌說,比如實施一些基礎設施建設時,地球大數(shù)據(jù)平臺就能為選址、施工等方面提供決策支撐,“有的大工程動輒幾十億、甚至上百上千億元的投資,如果工程地質(zhì)條件不佳,存在嚴重威脅工程建筑安全的地質(zhì)問題,損失就可能是巨大的。”
怎樣為“地球大數(shù)據(jù)科學工程”保駕護航?“地球大數(shù)據(jù)科學工程”專項負責人、中科院遙感與數(shù)字地球研究所郭華東院士曾舉過這樣一個例子:
當我們只需要一所學校的地塊信息數(shù)據(jù)時,騎個自行車就可以測量完成了。如果需要掌握北京市的區(qū)域信息數(shù)據(jù),通常情況下駕車也能調(diào)查完成。甚至是河北省的面積監(jiān)測,有架飛機就能實現(xiàn)。但要做“一帶一路”沿線幾十個國家的資源環(huán)境調(diào)查呢?恐怕這些手段就都不夠用了。
那么,什么樣的手段才能滿足大面積數(shù)據(jù)監(jiān)測的需求呢?
“答案就是衛(wèi)星。在幾百千米高空的軌道上,衛(wèi)星可以不斷地對地球進行成像,所獲取的地球大數(shù)據(jù)就能為我們應對土地退化、氣候變化、水旱災害等提供決策上的支持依據(jù)。”李文斌說,因此,我們才說“地球大數(shù)據(jù)科學工程”的順利實施,必須要基于空間技術(shù)生成的海量對地觀測數(shù)據(jù)。
在郭華東看來,地球科學是以地球為一個巨型系統(tǒng)研究,需要空間地球觀測數(shù)據(jù)的參與,從而降低系統(tǒng)復雜度,使建模和求解成為可能。他認為,在地球科學長期發(fā)展的基礎上,半個世紀以來從空間觀測地球的新視野新方法,不斷加深著對地球的理解特別是宏觀認識。而隨著遙感、導航定位、地球物理等衛(wèi)星數(shù)量和其他平臺的不斷增加,以及觀測儀器類型的多樣化,空間地球大數(shù)據(jù)正在匯入大數(shù)據(jù)研究的主流,為地球科學研究帶來新機遇。
“我國空間對地觀測技術(shù)經(jīng)過40年的發(fā)展,自主衛(wèi)星遙感技術(shù)、北斗導航衛(wèi)星技術(shù)等數(shù)據(jù)獲取技術(shù)得到長足的發(fā)展。”李文斌說,聚焦基于空間技術(shù)生成的海量對地觀測數(shù)據(jù),地球?qū)⒆兊迷絹碓?ldquo;透明”,并大大推動包括數(shù)字地球、全球變化、未來地球、災害科學等領域的研究及空間地球信息科學的學科發(fā)展。
用好地球大數(shù)據(jù)還需闖過共享關
當前,越來越多的國家已經(jīng)認識到,地球大數(shù)據(jù)蘊藏著巨大價值和潛力,是與礦產(chǎn)資源、水利資源一樣重要的戰(zhàn)略資源。然而,數(shù)據(jù)海量、碎片分散、應用低效仍是當前面臨的嚴峻問題。
分析其中的原因,主觀、客觀因素并存。
“一直以來,科研數(shù)據(jù)的開放共享,都是學界的‘老大難’問題。”李文斌說,客觀來說,這和科學數(shù)據(jù)的特殊性有關,一方面,這些數(shù)據(jù)許多都屬于科研成果的一部分,另一方面,部分數(shù)據(jù)還因涉及國家安全或國家秘密等確實不宜公開,“但也的確存在有的科研人員或機構(gòu)還未形成將自己辛苦得來的基礎數(shù)據(jù)拿來共享的意識。”
對此,郭華東表示,“地球大數(shù)據(jù)科學工程”專項除了突破一系列技術(shù)瓶頸問題之外,最重要的就是要做好數(shù)據(jù)共享。實現(xiàn)高水平的數(shù)據(jù)共享,不僅能避免數(shù)據(jù)采集和生產(chǎn)等大量重復性勞動和經(jīng)費投入,更重要的是保障了數(shù)據(jù)的規(guī)范性和科學性,讓科研人員的精力更高效地投入到數(shù)據(jù)的分析、應用和科學發(fā)現(xiàn)中。在他看來:“數(shù)據(jù)共享做得好不好,很大程度上決定了本專項的成效。”
郭華東坦言,目前這方面仍較難推動。“今后專項一定要在數(shù)據(jù)共享的機制體制上下功夫,研究提出科學、合理、可行的數(shù)據(jù)共享制度與政策,要充分考慮數(shù)據(jù)提供者的利益,調(diào)動大家共享數(shù)據(jù)的主動性和積極性,從而保障該科學工程的活力與生命力。”