2019年1月,習近平總書記在致中國歷史研究院成立的賀信中強調,歷史學研究要“立足中國、放眼世界,立時代之潮頭,通古今之變化,發(fā)思想之先聲”。誠然,中國的史學研究必須扎根本國土壤,在此基礎上勇攀國際高峰,才能真正產出貫通中西、跨越國界、具有世界影響的成果;而作為史學研究的基礎,在大數(shù)據和數(shù)字人文大潮下,歷史資料的收集、整理與呈現(xiàn)更應充分挖掘國內外海量資源,秉持開放獲取的理念,實現(xiàn)公開、公益、共享。
國家社科基金抗日戰(zhàn)爭研究專項工程“抗日戰(zhàn)爭與近代中日文獻數(shù)據平臺”(以下簡稱“抗戰(zhàn)文獻平臺”,網址:www.modernhistory.org.cn)目前已正式上線?箲(zhàn)文獻平臺收錄1949年以前各類數(shù)字化近代文獻近1500萬頁,包含檔案、圖書、期刊、報紙、照片、音視頻等多種形式,平均保持每月100萬頁的增長速度,向海內外用戶永久公益開放。
數(shù)字人文與北美東亞圖書館協(xié)會年會
2019年3月,抗戰(zhàn)文獻平臺項目組成員受邀參加在美國召開的北美東亞圖書館協(xié)會年會,并在大會上作主題報告,首次在海外宣講抗戰(zhàn)文獻平臺成果與理念,與北美學者面對面交流。北美東亞圖書館協(xié)會是北美亞洲研究協(xié)會下屬的主要委員會之一,自1958年成立以來,一直致力于促進北美地區(qū)東亞圖書館館員間的交流與協(xié)作,以增進各東亞館的信息互通與館藏建設。近年來,北美東亞圖書館協(xié)會更加注重與東亞地區(qū)各綜合性、研究性圖書館的學術往來。此次年會有多位來自中日韓等地的學者、圖書館員、出版界人士參加,算得上是全世界東亞資料館藏界的盛會。
與一般外界想象不同的是,如今圖書館界會議的重點,已不再是討論紙本圖書報刊的采集與整理,而更多直擊數(shù)字時代的數(shù)字館藏。從20世紀90年代起,北美東亞圖書館協(xié)會年會便逐年增加數(shù)字資源的討論比重,而此次年會主題更是清一色的“數(shù)字流”:“數(shù)字學術時代下東亞圖書館與館員面臨的機遇與挑戰(zhàn)”“數(shù)字人文、中國研究與資源的版權保護”“數(shù)字學術時代的中國研究中圖書館員的角色”等。數(shù)字、數(shù)字化、數(shù)字人文、數(shù)字學術等語匯成為會議關鍵詞,凸顯了“數(shù)字”一詞對傳統(tǒng)紙本收藏機構的重要意義。而相較于傳統(tǒng)紙本資料可移動性差、保存時間有限的缺點,讀者可以享受到技術進步帶來的便利,隨時隨地、超越時空地讀取“數(shù)字”資料。
中國數(shù)字人文發(fā)展的優(yōu)勢與短板
在中國哲學社會科學界,“數(shù)字學術”“數(shù)字人文”的概念興起較晚,但近幾年隨著國內信息技術與通信行業(yè)的飛速發(fā)展,數(shù)字人文與數(shù)字人文的重要載體——研究型數(shù)據庫建設獲得重要突破。與歷史學相關的研究型數(shù)據庫相繼涌現(xiàn),不僅數(shù)據體量頗大,個別數(shù)據庫還突破了儲存與檢索的單一功用,正朝著提供問題導向的結構化數(shù)據的方向發(fā)展。更為重要的是,在參與抗戰(zhàn)文獻平臺建設過程中,我們親身體會到在中國特色社會主義條件下,數(shù)字學術發(fā)展的獨特優(yōu)勢與后發(fā)之力。根據輕重緩急與數(shù)據資源的保存情況,我們國家可以同時牽頭多家學術機構,集中力量辦大事,而不是在保守各自資源的情況下單打獨斗,重復建設,造成資源的浪費?箲(zhàn)文獻平臺由中國社會科學院與國家檔案館、國家圖書館合作建設,并與國內外多所高校達成近代中國資料共享互通協(xié)議,大大提高了數(shù)據采集與錄入效率。而北美數(shù)字人文由于起步較早,精細化、特色化的數(shù)字人文實踐已經形成某種固定模式,加之市場化環(huán)境主導與信息技術應用成本高居不下,目前仍鮮有大規(guī)模數(shù)據平臺供學者使用。
當然,北美數(shù)字人文畢竟已是一套集學術機構、數(shù)據庫公司、營銷團隊與用戶群體為一體的成熟產業(yè)鏈,與之相較,國內人文學科的數(shù)據庫建設仍有不少差距。以抗戰(zhàn)文獻平臺為例,首先,在規(guī)模性數(shù)據的標引與運算上需要重點突破。數(shù)據的結構化處理是數(shù)字人文產品走向精尖的必經之路,這一方面考驗數(shù)據標引的技術能力與跨學科知識,另一方面,前期需要投入大量經費,投入與產出之間又有延遲與性價比的問題。如何在提高技術的同時做到投入產出比最大化,是大批國內數(shù)據庫團隊面臨的重要課題。其次,應用模式亟待拓展?箲(zhàn)文獻平臺目前鼓勵用戶免費注冊,以下載高清圖像,這符合國內用戶的使用習慣。但在海外市場,IP控制下的機構訂閱使用仍是最佳選擇。通過服務器架設與IP設定,抗戰(zhàn)文獻平臺便可以給海外各高校提供更加穩(wěn)定的訪問體驗與個性化服務。再者,學術顧問團隊與技術團隊的深度合作模式有待加強。只有在深度合作情境下,數(shù)據庫才能兼顧學術前沿價值與技術革新能力,做到學術資源與技術呈現(xiàn)的無縫接軌。數(shù)字人文的高速發(fā)展能否持續(xù),關鍵在于解決這一問題,而其基礎又是學科界限的打破與復合型人才的培養(yǎng)。
數(shù)字人文時代的史料共享與講好中國故事
此次年會的另一個重要主題是“開放共享”。在互聯(lián)網與移動通訊時代,信息的傳播與獲取基本已不再受地域與時效的影響;同樣,人文學科領域數(shù)字化資源的開放獲取也是不可阻擋的趨勢!皵(shù)字人文”的出現(xiàn)本身帶有兩層期許:一是資料的“結構化”處理,例如搜索、排列乃至高級的邏輯分析,皆是“結構化”的表現(xiàn);二是資料不限地域快速獲取,假如投入大量成本建設的數(shù)據庫只供“閉門”使用,或需要支付高昂使用費才能“一睹芳容”,這不僅不符合“數(shù)字人文”的理念,更是一種巨大的資源浪費?箲(zhàn)文獻平臺在籌備階段便確定了公開、公益、共享的理念,整合大量抗戰(zhàn)與近代中日關系相關史料,讓社會大眾近距離了解歷史、學習歷史,讓學者更便捷地獲取資料、促進研究。在此次年會上,抗戰(zhàn)文獻平臺的開放共享理念與不懈實踐獲得了在場聽眾的贊許。一些北美的中國研究者表示,如果沒有開放便捷、內容豐富的數(shù)據庫,他們可能需要耗費精力申請高額資助才能遠涉重洋到中國查閱資料,而學術資助本身是“不平等”的,有多種因素的制約。對不少國外研究者而言,平等開放抗戰(zhàn)文獻平臺不啻為一項“福利”。還有學者興奮地告訴項目組,他研究北京城市史多年,一直未能找尋到的北京地方小報,輾轉在抗戰(zhàn)文獻平臺上尋獲,且能免費下載,這不僅節(jié)省了大量時間與金錢,也便于讓世界了解中國。
進一步言之,任何共享都是雙向的行為,數(shù)字人文共享也不例外。數(shù)字人文時代數(shù)據資源的“共享”不僅意味著資源獲取方(感興趣的社會公眾、目的性更明確的研究者)單方面實現(xiàn)更加便捷的獲取,更含有資源提供方(數(shù)據平臺的整合者、提供者)向前者提供知識服務、汲取資源價值的優(yōu)勢?箲(zhàn)文獻平臺立項伊始,便旨在向用戶提供最優(yōu)質的史學知識服務。如今面向海外用戶,抗日戰(zhàn)爭與近代中日關系相關史料整合與上線的過程,便是使封存在“史籍”中的文字、故事和精神“活起來”“走出去”的過程。通過多元整合、高質多量史料的數(shù)字呈現(xiàn)與跨越國界的共享,抗戰(zhàn)文獻平臺有信心向世界講好中國故事。
2019年,中美建交已屆40周年。這段時間,美國挑起的貿易戰(zhàn),使中美兩國互利互贏的合作前景蒙上了陰影。但是,全球化趨勢不可逆轉,人類命運共同體的愿景也不可阻擋。其中,跨越國界的史料共享不僅是這一趨勢的體現(xiàn),更有助于互相理解各自的民族歷史與記憶,尊重彼此自主選擇的社會制度和發(fā)展道路,從而在文化充分交流的基礎上,實現(xiàn)國與國之間平等互惠、和平友好的交往。為此,抗戰(zhàn)文獻平臺愿在數(shù)字人文、開放共享的時代浪潮下,貢獻綿薄之力。
(作者系國家社科基金抗日戰(zhàn)爭研究專項工程項目“抗日戰(zhàn)爭與近代中日關系文獻數(shù)據平臺建設”課題組成員,中國歷史研究院研究員、助理研究員)