歷史研究的基礎是收集資料,有資料才有可能出貨,沒有資料便不出貨。司馬遷能夠撰寫彪炳千古的《史記》,“天下遺文古事靡不畢集太史公”便是其堅實的資料前提。資料收集之難,非親歷者莫敢知。李延壽撰《南史》《北史》,在史館“私為抄錄,一十六年”,沒有超乎尋常的毅力絕難成就其事??墒?,有了充分的資料積累,在實際研究與撰述時如何迅捷地找到所需史料,又成為令史學家頭疼的另一道難題。資料積累想“富”,資料查找想“速”,兩者之間存在難以彌合的矛盾。但在大數據時代,信息技術的發(fā)展徹底解決了這一難題。海量的數據存儲,同時還具有以秒來計算的查找速率,可謂既“富”且“速”。無怪乎大數據概念與相關技術一出,就立刻在史學界尤其是中青年史學工作者中引起強烈反響。
海量存儲和快捷檢索是大數據的兩個重要技術特征,其外在表現(xiàn)形態(tài)就是各種各樣的數據庫。正因為如此,加強數據庫建設成為當前史學界利用大數據來推動歷史研究的焦點。大數據離不開數據庫,但大數據卻不是簡單地等同于數據庫。如果我們利用當代信息技術把有限的歷史資料數據庫化就稱之為利用大數據開展歷史研究,那么,所謂大數據的新瓶里裝的還是傳統(tǒng)思維的舊酒。事實上,大數據時代的到來正在推動一場影響深遠的思維革命。大數據之“大”,已不再是有限之大,而是無限之大。因此,它將人類思維從有限的因果關系中解放出來。在大數據時代,史學家面臨的將是如何突破數據無限的難題。舍恩伯格在《刪除:大數據取舍之道》一書中指出,隨著信息采錄電子化技術的普及和飛速進步,記憶成為常態(tài),每個人都在進行信息的持續(xù)記錄,從而留下無法估算的包含著豐富細節(jié)的數字化歷史資料。即使是前大數據時代留下來的史料,也會隨著各類大型數據庫的建設及數據庫之間的聯(lián)網,使細節(jié)內容越來越凸顯。在這種資料條件下,一方面,微觀史學研究將更趨廣泛和深入;另一方面,歷史研究的碎片化問題也將更趨嚴重。一旦史學家陷入史料的無限之境而又無技突出重圍,就極有可能失去從整體上描述歷史的能力。這恰恰是大數據時代歷史研究需要高度關注的問題。
作為極其古老的認識活動,史學一直是人類實現(xiàn)自我認知、達致群體認同的重要途徑。在文字尚未發(fā)明的原始社會末期,隨著部族聯(lián)合體及早期民族的出現(xiàn),大型史詩隨之創(chuàng)生并廣泛傳誦,與神話一道建構群體內部的認同,從而維系了較大規(guī)模人類社會組織的存在與發(fā)展,并最終促成文明時代的到來。進入文明時代之后,史學更是在促成民族認同、價值認同、文化認同等方面發(fā)揮著積極的社會作用。司馬遷在《史記》中建構了以黃帝為中華民族共同祖先的起源話語體系,這一話語體系影響深遠,其后拓跋鮮卑建立北魏,述其遠祖即溯至黃帝之子昌意。班固在《漢書》中建構了一個五行相生、封閉循環(huán)的時間話語體系,將自太昊以來所有的正統(tǒng)帝王都納入系譜之中。這一時間話語體系同樣影響深遠,之后的蒙元和滿清,雖為少數民族所建王朝,但都自覺繼承了為前朝修史的文化傳統(tǒng),其動因之一就是為了確立本王朝在這一時間體系中的位置。中華民族歷經數千年風雨而能長盛不衰,發(fā)展成為當今世界規(guī)模最為龐大的民族共同體,離不開傳統(tǒng)史學在推動群體認同方面所發(fā)揮的重大作用。顯然,沒有規(guī)模宏大的歷史敘事,史學的社會價值便無從體現(xiàn)。喬·古爾迪和大衛(wèi)·阿米蒂奇在《歷史學宣言》中呼吁史學家們擺脫微觀史學的狹隘局限,運用長時段思維,為人類思考現(xiàn)在及建設未來發(fā)揮獨特的重要作用。這可以說是當下史學界的深刻覺醒,對于正在大數據時代走入史料無限之境的史學來說無疑是一次十分及時的提醒。
大敘事需要宏大的形式和時空,但這兩者都非其本質。大敘事之“大”,主要體現(xiàn)在史學家的人文情懷上。希羅多德撰寫《歷史》,兼記希臘人和異邦人的豐功偉績,藉此頌揚乃至炫耀人類作為一個整體曾經煥發(fā)出的勇氣和榮光。司馬遷撰寫《史記》,更有著“究天人之際,通古今之變”的宏大抱負。經典之為經典,除其事實詳核外,更在于其文字之中處處滲透著對于人類命運的悲憫和關懷。中西兩大歷史學之父早在兩千多年前,就為史學家樹立了偉大的人文情懷標桿。大數據時代,凡一切能夠量化的學術技能,都有可能由信息技術全部或部分代勞,唯有人文情懷是人類主體性的最后營壘,技術無法染指。作為一門思考人類自身的人文學科,史學必須警惕信息技術的廣泛運用所導致的工具性話語霸權。如果不想失去在本學科領域的話語權,史學家就必須借助大敘事高揚人文情懷。唯大情懷者才能駕馭好大數據、利用好大數據,書寫出真正關注人類過去、現(xiàn)在與未來的偉大敘事。