核心閱讀
計算機(jī)可以幫助學(xué)者在紛繁龐雜的信息中快速發(fā)現(xiàn)和定位議題,在宏觀的學(xué)科脈絡(luò)中把握關(guān)鍵問題;學(xué)者又可以發(fā)揮個人學(xué)養(yǎng)所長,深刻探究問題所在,解釋背后的義理與規(guī)律
新興數(shù)字技術(shù)正在加速數(shù)字中國的構(gòu)建進(jìn)程,以數(shù)字媒介和人工智能為基礎(chǔ)的新興文化形態(tài)和知識生產(chǎn)體系正日見雛形,數(shù)字人文正在積極引領(lǐng)文化時空的數(shù)字化轉(zhuǎn)換,并展現(xiàn)出廣闊的發(fā)展前景
數(shù)字人文是一種將計算機(jī)方法與技術(shù)融入人文研究,進(jìn)而提出并回答人文問題的新范式。在傳統(tǒng)人文研究中,研究過程多表現(xiàn)為一種書齋式的、針對典籍文獻(xiàn)的細(xì)讀和考據(jù)。隨著計算機(jī)和電子文本的發(fā)展,研究者開始利用數(shù)據(jù)庫查找資料,并借助地理信息系統(tǒng)、機(jī)器學(xué)習(xí)、信息可視化等多種計算分析工具,開展認(rèn)知計算、文本挖掘、情感分析、圖像識別、視覺分析、社會網(wǎng)絡(luò)分析、數(shù)字記憶構(gòu)建等研究。在此過程中,一些新型研究方法,如遠(yuǎn)讀、文本計量、文化分析等陸續(xù)浮現(xiàn),并在文學(xué)、史學(xué)、文化研究等領(lǐng)域得到創(chuàng)新性應(yīng)用。
為人文研究提供顯微鏡和望遠(yuǎn)鏡
數(shù)字人文為人文研究開啟三種新維度,分別是快讀、遠(yuǎn)讀、共讀。
快讀,指的是借助計算機(jī)技術(shù),大大加快閱讀和利用文獻(xiàn)資料的速度。隨著圖書文獻(xiàn)的數(shù)字化轉(zhuǎn)換,高校、科研院所、圖書館等機(jī)構(gòu)建設(shè)了大量數(shù)字資源。如果用傳統(tǒng)研究方式,以個人之力“窮盡”所有文獻(xiàn)資源,根本不可能。如何從海量數(shù)字資源中發(fā)現(xiàn)并獲取所需文獻(xiàn),完成研究任務(wù),這就需要元數(shù)據(jù)、關(guān)聯(lián)數(shù)據(jù)、知識圖譜等數(shù)字技術(shù)支撐研究者實現(xiàn)“快讀”的需求。比如《紅樓夢》中姓名稱謂有730多個,想要從70多萬字的文本中找到這些人名,需要花費大量時間。清華大學(xué)統(tǒng)計學(xué)研究中心團(tuán)隊利用數(shù)據(jù)科學(xué)方法,在不到1分鐘的時間內(nèi),得到按照詞頻排列的各類詞,其中出現(xiàn)兩次以上的人名抓取準(zhǔn)確率達(dá)93%以上。這極大縮短了研究者的搜索查詢時間,同時還減少了手工篩選過程中的失誤。再比如中國歷代人物傳記資料庫,共收錄超過42萬條人物傳記資料,記錄了各方面的詳細(xì)數(shù)據(jù),這些數(shù)據(jù)可以為各領(lǐng)域的人物關(guān)系和歷史事件研究提供基礎(chǔ)數(shù)據(jù)支撐,檢索技術(shù)可以幫助研究者快速獲取所需數(shù)據(jù)。
遠(yuǎn)讀具有兩重含義,第一重含義是指傳統(tǒng)的細(xì)讀方法導(dǎo)致大量文學(xué)作品從未被研究者閱讀,如果要理解整個世界文學(xué)體系,就必須采取遠(yuǎn)讀方法,聚焦“比文本小很多或大很多的單位:手法、主題、修辭或文類和體系”。在該理論影響下,研究者開始運用計算方法研究文學(xué)作品。也有學(xué)者將社會網(wǎng)絡(luò)分析方法和信息可視化技術(shù)相結(jié)合,描繪小說的敘事結(jié)構(gòu)、情節(jié)發(fā)展和人物關(guān)系。這些嘗試都為文學(xué)文本提供了一種新的解讀視角與研究路徑,凸顯了一種更為“宏大”的敘事邏輯。
遠(yuǎn)讀的第二重含義是指時間跨度上較大或素材數(shù)量較多的研究,這在近年來數(shù)字文化遺產(chǎn)和數(shù)字博物館建設(shè)中體現(xiàn)得較為充分。在我國,敦煌研究院和上海博物館率先引入數(shù)字人文理念,并借助“數(shù)字敦煌”和“董其昌數(shù)字人文”書畫專題展覽,為文化遺產(chǎn)知識與數(shù)字資源的關(guān)聯(lián)性可視化呈現(xiàn)提供了示范。以“數(shù)字敦煌”為例,敦煌研究院在已經(jīng)完成的敦煌石窟數(shù)字化基礎(chǔ)上進(jìn)行敦煌知識圖譜建設(shè),借助更細(xì)粒度的敦煌壁畫圖像語義標(biāo)注,可以實現(xiàn)圖像片段的全球發(fā)布和鏈接,研究者和大眾在看到特定主題圖像的同時,也能看到全球其他博物館中相同主題的圖像片段。這為圖像學(xué)、考古學(xué)以及文化研究學(xué)者提供了巨大的“閱讀”便利,也為公眾親近人類豐富的歷史文化遺產(chǎn)提供了更多可能。
共讀則強(qiáng)調(diào)合作。盡管我們強(qiáng)調(diào)數(shù)字人文在人文研究方面的“快”與“遠(yuǎn)”,但并不意味著數(shù)字人文就以機(jī)器閱讀代替了人工閱讀。數(shù)字人文強(qiáng)調(diào)人與機(jī)器的合作,遠(yuǎn)讀與細(xì)讀的結(jié)合。計算機(jī)可以幫助學(xué)者在紛繁龐雜的信息中快速發(fā)現(xiàn)和定位議題,在宏觀的學(xué)科脈絡(luò)中把握關(guān)鍵問題;學(xué)者又可以發(fā)揮個人學(xué)養(yǎng)所長,深刻探究問題所在,解釋背后的義理與規(guī)律。比如有研究者在對中國近代“美”的觀念進(jìn)行概念史研究時,借助大規(guī)模數(shù)據(jù)庫的文本資料,以一億兩千萬字的文本為研究范圍,對中國近代“美”觀念的發(fā)展軌跡進(jìn)行遠(yuǎn)讀式描繪,為傳統(tǒng)細(xì)讀研究提供了頗為有效的實證支撐。
除了人與機(jī)器的合作,共讀還意味著將多種閱讀模式結(jié)合,獲得全新知識圖景。其中值得關(guān)注的是電子文本與數(shù)字地圖相結(jié)合形成的時空交互閱讀框架。比如中南民族大學(xué)研究團(tuán)隊就“唐宋詩人行旅路線”建立“唐宋文學(xué)編年地圖”,以地理信息系統(tǒng)為基礎(chǔ)架構(gòu),在數(shù)字地圖上呈現(xiàn)唐宋著名詩人詞人的行旅蹤跡,為讀者理解唐宋詩詞打開新視角。時空交互閱讀框架不僅以時空架構(gòu)直觀展示時間、地點、人物、事件、作品間的網(wǎng)絡(luò)關(guān)系,還為深入解讀文本內(nèi)涵提供可能。
此外,共讀還強(qiáng)調(diào)眾包協(xié)同。借助開放眾包技術(shù),上海圖書館開發(fā)“中國家譜知識服務(wù)平臺”,允許用戶上傳和編輯自己家族的家譜。中華書局建立的古籍整理平臺,也采取眾包模式,組織高校學(xué)生、出版社編輯、圖書館館員等社會力量進(jìn)行底本校對,日均工作量達(dá)100萬字,大大提升了古籍電子文本的審校速度。
引領(lǐng)文化時空數(shù)字化轉(zhuǎn)換
進(jìn)入新世紀(jì)以來,以大數(shù)據(jù)、人工智能等為代表的新興數(shù)字技術(shù)正在加速數(shù)字中國的構(gòu)建進(jìn)程,以數(shù)字媒介和人工智能為基礎(chǔ)的新興文化形態(tài)和知識生產(chǎn)體系正日見雛形。作為新一代人文學(xué)者認(rèn)知世界和傳播文化的路徑,數(shù)字人文正在積極引領(lǐng)文化時空的數(shù)字化轉(zhuǎn)換,并展現(xiàn)出廣闊的發(fā)展前景。
數(shù)字人文可成為推動人文學(xué)術(shù)創(chuàng)新的重要力量。與自然科學(xué)和社會科學(xué)相比,人文學(xué)者對數(shù)字技術(shù)的采納相對滯后,甚至有一定誤解。比如有人認(rèn)為,“將文學(xué)當(dāng)作數(shù)據(jù)會失去文學(xué)本身豐富的意蘊”,這種觀點是對數(shù)據(jù)功能與意義的誤讀。事實上,凡是計算機(jī)可以處理的電子文本都可稱為數(shù)據(jù)。隨著數(shù)字社會的發(fā)展,文本的主體形態(tài)早已轉(zhuǎn)換成計算思維下的數(shù)據(jù),文學(xué)對“人本”和“文本”意義的追求并不會因其形態(tài)而改變,所以說文學(xué)與數(shù)據(jù)的關(guān)系是“道”與“器”的統(tǒng)一,而非對立。在利用新技術(shù)解決傳統(tǒng)人文問題的同時,數(shù)字人文也應(yīng)更加關(guān)注新興人文議題,比如新聞推薦算法和人工智能模型的倫理約束等。數(shù)字人文在強(qiáng)調(diào)知識生產(chǎn)、表現(xiàn)、教學(xué)、傳播數(shù)字化轉(zhuǎn)型的同時,應(yīng)更加積極對接開放科學(xué)行動框架,支持科研領(lǐng)域的開放獲取、開放數(shù)據(jù)、開放創(chuàng)新,并在學(xué)術(shù)活動中推動協(xié)同、眾包、互聯(lián)、交互、跨學(xué)科、跨國界、跨專業(yè)合作等學(xué)術(shù)理念的普及與范式創(chuàng)新。
數(shù)字人文可為優(yōu)秀傳統(tǒng)文化傳承發(fā)揮積極作用。目前,數(shù)字人文正在引領(lǐng)文化生產(chǎn)體系的數(shù)字轉(zhuǎn)向,已經(jīng)成為一個語言學(xué)、文學(xué)、史學(xué)、哲學(xué)、藝術(shù)學(xué)等傳統(tǒng)人文學(xué)科與圖書情報學(xué)、計算機(jī)科學(xué)、人工智能等信息科學(xué)共同關(guān)注的新興跨學(xué)科領(lǐng)域。數(shù)字人文不僅推動了大學(xué)與其傳統(tǒng)科研學(xué)科體系加速適應(yīng)社會的數(shù)字化轉(zhuǎn)型,還在公共文化機(jī)構(gòu)中推動了人文知識向更大范圍的公眾開放,使得普通人能夠更加便捷有效地學(xué)習(xí)傳承中華優(yōu)秀傳統(tǒng)文化。敦煌研究院、上海圖書館、中華書局等單位推出的一系列數(shù)字人文項目和成果,在推動優(yōu)秀傳統(tǒng)文化傳承和傳播方面具有很強(qiáng)的示范意義。
數(shù)字人文應(yīng)致力促進(jìn)科技與人文的互動與融合。過去幾年里,人工智能不僅是科技界熱點,同時也是人文研究及藝術(shù)界熱點。對人文學(xué)者來說,人工智能不僅是一種工具技術(shù),也是一種人類文明活動的參與主體,由此帶來的文本生產(chǎn)問題、情感經(jīng)驗問題以及審美問題等都是難以回避的新興人文學(xué)術(shù)課題。對于人工智能專家來說,人文思考和倫理關(guān)懷也是研究過程必須引入的維度。在此背景下,數(shù)字人文研究應(yīng)以更加積極的姿態(tài)為科技與人文、機(jī)器與文藝互動融合提供試驗場和方向標(biāo),面向未來打開文化新視野。
(作者分別為武漢大學(xué)教授、南京大學(xué)副教授)
《 人民日報 》( 2020年02月25日 20 版)