一、研究進展情況
(一)研究計劃總體執(zhí)行情況及各子課題進展情況
自2016年11月立項后,本項目按照投標書中的以“藏文典籍歷史發(fā)展” 為縱向、以“藏文典籍數(shù)字化”為橫向的研究思路,以開題為界分兩階段完成了如下工作:
1、2016年11月-2017年5月,項目開題階段。根據(jù)立項評審意見,對項目總體框架相關(guān)內(nèi)容進行了深入調(diào)研并優(yōu)化:面對浩如煙海的藏文古籍,精煉了藏文典籍整理的范圍,且輔以對傳統(tǒng)的、現(xiàn)代的寫本、刻本文獻的整理、出版等成果、相關(guān)理論和方法做出分析和評價;藏文典籍數(shù)字化確定為以建設(shè)藏文典籍文獻之全文數(shù)據(jù)庫和數(shù)字化平臺為目標。 依據(jù)深入的調(diào)研和具體的實施方案,本項目于2017年5月29日順利開題,精簡典籍整理范圍和爭取項目外經(jīng)費支持獲得與會專家的充分認可。
2、2017年6月-2018年7月,項目實施初期。項目組織協(xié)調(diào)了子課題之一、二、三、四的典籍文獻整理和專題選編,組織協(xié)調(diào)子課題五的基礎(chǔ)平臺搭建、相關(guān)規(guī)范和底層技術(shù)的研究。目前,項目研究進度符合計劃。各子課題進展具體情況如下:
(1)子課題之一“苯教系屬文獻整理與全文數(shù)字化研究”
該子課題具體路徑分為四步,第一步是選擇苯教文獻搜集的區(qū)域,按照區(qū)域?qū)嵭形墨I搜集;第二步在全面搜集文獻的基礎(chǔ)上,對不同苯教經(jīng)書進行詳細?,然后對內(nèi)容進行文字錄入;第三步是對搜集的文本中,選擇最優(yōu)的苯教經(jīng)文版本進行翻譯,完整呈現(xiàn)出一部系統(tǒng)的苯教文獻;第四步是對苯教文獻內(nèi)容進行相關(guān)研究。
目前,該課題已整理了藏區(qū)民間苯教文獻共2000種,對藏區(qū)各地散落的古藏文苯教文獻進行系統(tǒng)的內(nèi)容提要的寫作和文獻整理工作,完成藏文目錄編制和內(nèi)容提要寫作。且對目前苯教文獻中關(guān)于甄選,排版、分類不確切甚至是錯誤的部分,提出了訂正意見;編寫了《苯教典籍文獻概說》(約2萬字)一書部分初稿,主要介紹了苯教大藏經(jīng)的發(fā)展過程,以及目錄、版本、?、刻板、傳承等問題。
(2)子課題之二“敦煌吐蕃古藏文文獻整理與數(shù)字化研究”
該子課題考慮到國內(nèi)學術(shù)界對法國收藏的敦煌吐蕃文獻研究已經(jīng)走在前面的現(xiàn)實,故提出以整理、研究英國收藏的敦煌、西域吐蕃文獻為主線,借鑒國內(nèi)外研究敦煌吐蕃文獻的成果和經(jīng)驗,推進實施,成功完成整理、研究英國收藏的敦煌、西域吐蕃文獻的目標。
目前,該子課題已編撰出《新疆、青海出土藏文簡牘整理與數(shù)字化研究》(約10萬字)一書部分初稿,對出自新疆和青海而今藏于英國國家圖書館、新疆自治區(qū)博物館、青海省博物館的500余枚吐蕃簡牘,按地域分類,逐一進行說明介紹,包括序號、題名、編號、形制、尺寸、內(nèi)容提要、著錄狀況等,同時收錄了日本學者武內(nèi)紹人等人有關(guān)吐蕃簡牘的論文等。
(3)子課題之三“佛教系屬藏文刻本文獻整理與全文數(shù)字化研究”
該子課題以佛教藏文古代刻本文獻、現(xiàn)代活字打印出版文獻、刻本全文數(shù)字化文獻等三種文獻整理為研究對象,以刻本文獻產(chǎn)生發(fā)展的歷史、刻本文獻分類、刻本文獻整理的特點、活字文獻整理出版的原則、刻本文獻整理中的爭議問題、刻本文獻全文數(shù)字化狀況等為視角,就佛教刻本文獻整理與數(shù)字化問題進行分析研究。
目前,該子課題已赴俄羅斯圣彼得堡東方手稿研究所尋訪黑水城發(fā)現(xiàn)的藏文刻本文獻;已搜集了佛教藏文刻本文獻,包括藏文《大藏經(jīng)》8種刻本,對佛教藏文刻本文獻起始、范圍、分布(刻本印經(jīng)院)等進行研究;根據(jù)藏文刻本文獻特點,提出了整理規(guī)范,并結(jié)合文本TEI國際通用語言,提出了《信息處理用藏文文獻文本信息標記規(guī)范》,已于2017年5月在蘭州召開最后審定會,提交國家信標委,并于2018年6月批準發(fā)布;研究了藏文刻本文獻全文數(shù)字化的架構(gòu)體系。
(4)子課題之四“佛教系屬藏文寫本文獻整理與全文數(shù)字化研究”
該子課題以苯教、佛教、其他內(nèi)容寫本文獻在以藏區(qū)為中心的各地傳播、影響和藏族典籍文化最初形成、寫本文獻的貢獻與不同時期發(fā)展為主線,在比較全面掌握材料的基礎(chǔ)上,按照歷史發(fā)展脈絡(luò),分象雄、吐蕃、中世紀、近代、現(xiàn)代等五個階段,分別研究藏文寫本文獻與刻本文獻、活字版、數(shù)字化族等文獻關(guān)系的歷史發(fā)展,考辨史實,闡釋重要藏族文化事件和主要代表人物的思想,突出其意義和貢獻。
目前,該子課題已整理編輯了西藏民族大學館藏藏文古籍中的大藏經(jīng)、叢書、文集、史志類、明處類、顯乘撰述類、密乘撰述類及其它類等大類目,并對這些大類目內(nèi)容進行具體分類整理編目;收集了177幅藏傳木刻版畫資料,內(nèi)容包括《羅漢圖》、《釋迦牟尼神變圖》、《佛陀十二宏化圖》、《蓮花生八相圖》、《藏傳佛教之八大傳承》、《薩迦俄爾派壇城圖》、《十六羅漢圖》、《掘藏師傳承圖》、《六長壽圖》等。
(5)子課題之五“藏文文獻全文數(shù)字化研究”
該子課題通過設(shè)計或選擇統(tǒng)一的元數(shù)據(jù)格式和系統(tǒng)架構(gòu),在自建新增的基礎(chǔ)上,吸納已有數(shù)據(jù)庫資源,建設(shè)具有一定規(guī)模的藏文典籍文獻全文數(shù)據(jù)庫;然后,遵循現(xiàn)有文檔圖像檢索領(lǐng)域新興的詞定位技術(shù)基本框架,研究藏文典籍文獻字符圖像特征,并在此基礎(chǔ)上深入和擴展,引入并融合文獻學信息,探索藏文典籍文獻的全信息檢索技術(shù),在藏文典籍文獻全文數(shù)據(jù)庫的基礎(chǔ)上試建全信息檢索功能。
目前,該子課題在總項目的組織協(xié)調(diào)下借助項目外經(jīng)費支持已初步完成藏文文獻全文數(shù)字化硬件平臺的搭建;已整理完成約50萬頁的藏文典籍數(shù)字圖像,完成元數(shù)據(jù)格式和軟件系統(tǒng)架構(gòu)設(shè)計,初步搭建了藏文文獻全文數(shù)據(jù)庫;選取了以德格木刻版的《宗喀巴文集》為代表的約2萬頁的測試圖像,搭建了符合藏文文獻全文數(shù)字化平臺底層技術(shù)驗證所需的藏文古籍圖像測試庫;在底層技術(shù)研究上,已取得了系列進展,解決了復(fù)雜條件下的藏文木刻版文檔圖像幾何校正問題,尋找到并驗證清楚了適合藏文古籍全文檢索技術(shù)的藏文古籍文字圖像特征的提取方法和匹配算法,研發(fā)了藏文古籍全文檢索仿真驗證系統(tǒng)。
(二)調(diào)查研究及學術(shù)交流情況
項目開展調(diào)查研究及學術(shù)交流情況如下:
1.2016年11月,項目組召開2次小型會議,以根據(jù)立項評審意見優(yōu)化項目總體框架為主要目標,統(tǒng)一思路,落實開題前調(diào)研工作任務(wù)。其中,項目責任單位西藏民族大學、西南民族大學、西北民族大學在西藏民族大學,商議和落實立項評審意見中的文獻整理范圍和全文數(shù)字化方式;項目責任單位西北民族中國民族信息技術(shù)處理研究院、西南民族大學藏文文獻館在西南民族大學就藏文古籍文獻整理和全文數(shù)字化做了深入的交流。
2.2016年12月至2017年5月,項目組在已有調(diào)研基礎(chǔ)上分3批次赴北京和深入藏區(qū),對藏文古籍文獻整理范圍和文獻數(shù)字化新技術(shù)進行了確認,完成了開題準備工作。
3.2017年6月至今,項目進入具體實施階段,各子課題在總結(jié)前期工作的基礎(chǔ)上,進一步深入文獻和田野調(diào)查,確認和落實未完成的調(diào)研工作,進行補充調(diào)查或繼續(xù)深入調(diào)查,并全面開展學術(shù)交流活動:
(1)項目組成員參加了2017年9月在烏魯木齊召開的“歷史上的新疆與西藏關(guān)系學術(shù)研討會”、2017年7月在四川南充舉辦的“中國敦煌吐魯番學會年會暨學術(shù)研討會”、2018年6月在蘭州舉辦的“中國民族史年會暨會員學術(shù)研討會”等學術(shù)會議。
(2)2017年9月,項目組成員赴俄羅斯圣彼得堡東方手稿研究所尋訪黑水城發(fā)現(xiàn)的藏文刻本文獻。
(3)2017年7月,項目組成員參加了在杭州召開的“Intelligent Human-Machine Systems and Cybernetics”國際學術(shù)會議,對文獻數(shù)字化前沿問題進行了交流。
(4)項目組成員與國際著名學者、日本大谷大學康嘎次赤木教授建立了師徒關(guān)系,這為項目開展國際合作交流提供了幫助。
(5)邀請多名國內(nèi)專家學者,對與藏文典籍文獻、大藏經(jīng)版本、文獻數(shù)字化等方面進行了深入交流,如:2017年6月,邀請西藏圖書館副研究員朗錯作了“藏文大藏經(jīng)版本”方面的專題報告;2017年6月邀請四川大學教授、博士生導(dǎo)師張澤洪教授作了“西南少數(shù)民族宗教”的專題報告;日本大谷大學康嘎次赤木教授繼2016年6月應(yīng)邀到西南民大講學一個月后,又于2017年5月、2018年6月到西南民大講學《藏文古籍文獻研究方法》、《傳統(tǒng)與現(xiàn)代藏文文獻研究方法》、《國外藏學文獻研究現(xiàn)狀》等專門知識。
(三)成果宣傳推介情況
1、2017年5月29日,本項目舉行了開題論證會。來自中國藏學研究中心、西南民族大學、蘭州大學、西北民族大學、陜西師范大學、西藏大學、西藏民族大學等高校與科研機構(gòu)的專家、課題組成員20余人參加了會議。西藏民族大學黨委副書記、副校長劉凱參加會議并發(fā)表了熱情洋溢的致辭,對課題的重大意義給予了充分肯定,并對課題的開展提出了真知灼見。項目首席專家劉勇教授介紹了項目的基本情況。本次開題論證會取得了良好效果,為課題盡快展開研究提供了思路和框架!段鞑孛褡宕髮W學報》等媒體進行了專門報道,西藏民族大學網(wǎng)及各大網(wǎng)站等對活動綜述也進行了轉(zhuǎn)載。
2、2017年5月在蘭州召開藏文信息最后審定會上,子課題項目負責人多拉結(jié)合文本TEI國際通用語言,提出《信息處理用藏文文獻文本信息標記規(guī)范》,且此規(guī)范提交國家信標委,并于2018年6月批準發(fā)布。
(四)研究中存在的主要問題、改進措施,研究心得、意見建議
下面從藏文典籍文獻的整理和全文數(shù)字化兩方面來談:
1、藏文典籍文獻的整理方面的困難
應(yīng)評審專家意見中的“藏文文獻量大,覆蓋面也非常大”、“工作量大”、“應(yīng)適當改變或縮小”,本項目就藏文典籍整理范圍做了深入調(diào)研并取得了專家們認可的成果,但隨著研究的深入,文獻收集整理仍然面臨如下困難:
(1)文獻收集難度較大,例如:民間苯教文獻中對苯教經(jīng)書的識別和分類有難度;文獻分布范圍較廣,這些苯教文獻分布在藏區(qū)各地,做田野調(diào)查有一定的難度;基于苯教宗教信仰的原因,絕大多數(shù)苯教藏文寫本文獻秘不示眾,平日供奉高閣,節(jié)慶祭祀時才能取出,難得一見,因此,收集文獻時受宗教信仰因素制約較大,需對群眾做認真細致的工作。
(2)經(jīng)書名目繁多,從而造成了分類和?钡睦щy,例如:經(jīng)文中不僅出現(xiàn)了苯教特有的符號,而且夾雜一些方言,甚至通篇使用縮寫字,加之文本流傳年代久遠,其中所記錄的部分儀軌業(yè)已失傳,這些經(jīng)文幾乎成為“天書”;翻譯是一種再創(chuàng)作,無論是對原文的理解還是譯文的表達,翻譯古代苯教經(jīng)文難度都比較大,要達到忠實于原文,翻譯用語即是關(guān)鍵點,也是難點。
2、藏文典籍全文數(shù)字化方面的心得
應(yīng)評審專家意見中的“藏文所有典籍文獻浩如煙海,要實現(xiàn)其全部的全文數(shù)字化,按國家社科重大課題批復(fù)的八十萬元經(jīng)費難以完成”,本項目采取了如下兩方面措施:
(1)采取了爭取項目外經(jīng)費支持的措施。目前已獲取西南民族大學逾一百萬資金專用于藏文典籍全文數(shù)字化硬件平臺的建設(shè)和優(yōu)化,這證明了“以重大項目為牽引,帶動相關(guān)建設(shè)”已取得成效。
(2)堅持長期發(fā)展策略,采取以系統(tǒng)研發(fā)為先,以文獻掃描、信息著錄等耗費人力的事項為后的措施。目前已聚焦完成元數(shù)據(jù)格式和軟件系統(tǒng)架構(gòu)設(shè)計,并驗證了一些關(guān)鍵前沿技術(shù),且已搭建了約50萬頁藏文典籍數(shù)字圖像的數(shù)據(jù)庫,該措施不僅可以規(guī)避經(jīng)費風險,而且有利于浩瀚藏文典籍全文數(shù)字化的長遠健康發(fā)展。
二、研究成果情況
(一)代表性成果簡介
1、《敦煌吐蕃文<寺院施入疏>考釋》論文:本文漢譯和考釋了收藏于英國國家圖書館的兩件吐蕃文書(編號IOL Tib J 575、IOL Tib J 1357),初步判定這兩件寫本可以綴合成一件寺院施入疏,反映的是吐蕃統(tǒng)治敦煌時期,阿骨薩千戶下左三將的百姓需要向寺院繳納供養(yǎng),或者是部落入籍戶向官府舉辦的“千人齋”、“萬人齋”交納貢物的名單。
2、《<后藏乃寧寺志>及其價值研究》論文:乃寧寺是西藏近代史上一座較有影響的寺院,關(guān)于對乃寧寺的歷史考證,目前除了《后藏志》中有少量記載之外,《后藏乃寧寺志》是現(xiàn)今唯一的一部對其進行全面系統(tǒng)介紹的歷史著作,也是研究乃寧寺不可多得的一部重要的藏文文獻!逗蟛啬藢幩轮尽穬(nèi)容涵蓋印度佛教和藏族歷史、圣地乃寧寺的形成及其歷任堪布、乃寧寺的重要歷史、有關(guān)《噶陀司徒衛(wèi)藏志》中的《后藏乃寧寺志》等,全書采用自由式的敘事風格和記敘方式,以人物為中心對佛教相關(guān)史事進行詳細記載,使后人能夠?qū)谭▊鞒屑捌渲匾臍v史地位有較為清晰的認識。此外,《后藏乃寧寺志》還對歷史上與乃寧寺相關(guān)的重大歷史事件有諸多記載,反映了整個后藏的歷史、文化和社會經(jīng)濟等?傊逗蟛啬藢幩隆凡粌H是一部研究佛教歷史人物及其相關(guān)宗教活動的重要歷史文獻,而且對藏族文化的傳承與發(fā)展具有一定的意義。
3、《苯教典籍文獻概說》報告:苯教在長期的發(fā)展過程中積累了卷帙浩繁的經(jīng)籍書文,其內(nèi)容包羅萬象,不僅記錄了苯教的教理教義、教規(guī)教戒,還保留了藏族古代哲學、文學、醫(yī)藥學、音樂、地理等多種學科的珍貴資料,是藏族傳統(tǒng)文化的一個寶庫。苯教文獻的主要由苯教甘珠爾、甘丹、民間苯教文獻(藏外苯教文獻)三個部分組成。文章主要介紹了苯教大藏經(jīng)的發(fā)展過程,以及目錄、版本、?、刻板、傳承等問題。目前藏學界重視寺院所藏經(jīng)典的研究,對民間的苯教經(jīng)典關(guān)注很少。作者重點對白龍江流域的民間苯教經(jīng)典進行實地調(diào)查,把大量的民間苯教經(jīng)典根據(jù)苯教傳統(tǒng)的分類法為基礎(chǔ), 重新分類編目,進行了初步的探討和研究。并總結(jié)經(jīng)典中折射的文化信息,對研究民間苯教和藏族文化意義重大。
4、《Effect on convergence from different particle swarms with a unified and simplified formula for position updating》論文:在實現(xiàn)藏文古籍全文檢索時為了滿足時效和準確性需求,采用了對藏文古籍文字圖像進行二級匹配的策略,即先進行特征級粗匹配,后進行像素級精匹配。在采用原PSO算法的實踐中,本項目發(fā)現(xiàn)原算法對于藏文古籍文字圖像的匹配具有計算量仍然過大、收斂性難于控制的缺陷,于是對PSO算法的核心——位置更新方程進行了分析和簡化,把多階隨機差分方程簡化為一階隨機差分方程,把多個參數(shù)減少到一個參數(shù),在理論上使得算法收斂性分析和控制更為容易。實踐證明,這種改進的、簡化的PSO算法不僅減少了藏文古籍文字圖像匹配的計算量,而且提高了匹配的準確性。該論文研究分析了位置更新方程中的歷史最優(yōu)位置對收斂性的影響。
5、《The convergence of particle swarm with unified and simplified formula for position updating》論文:在上一論文的基礎(chǔ)上,進一步研究了對收斂性影響的參數(shù)設(shè)置問題。該論文和上一論文所呈現(xiàn)的算法不僅是本項目成功進行藏文古籍文字圖像像素級精匹配以實現(xiàn)藏文古籍全文檢索的重點,也能為后續(xù)的藏文古籍全信息檢索奠定算法基礎(chǔ)。
6、電腦軟件成果(藏文古籍全文檢索仿真驗證系統(tǒng)):該系統(tǒng)是以研究為目的而搭建的,具有算法驗證、效果演示功能的軟件系統(tǒng)。該系統(tǒng)基于Matlab環(huán)境而研發(fā),由如下兩大類模塊組成:一是圖像處理通過模塊類,包括圖像數(shù)據(jù)讀取、圖像縮放、灰度圖像轉(zhuǎn)換、二值化等模塊。該類模塊主要基于本項目應(yīng)用需求而選用matlab自帶函數(shù)或現(xiàn)有開源庫而完成。二是藏文典籍圖像處理及全文檢索專用模塊類,包括粗畸形校正、細畸形校正、去邊框、行分割、圖像特征提取、特征級圖像匹配、像素級圖像匹配、檢索結(jié)果顯示等模塊。這些模塊所組成的軟件系統(tǒng),集成式地展示了藏文古籍全文檢索技術(shù)中眾算法之間的流程關(guān)系,而且其中部分算法具有創(chuàng)造性的改進。該系統(tǒng)不僅為項目的后續(xù)開展提供了深入驗證的平臺,而且,無論從單獨算法改進上,還是從系統(tǒng)集成經(jīng)驗上,也為研究者們提供非常有益的參考。
(二)階段性成果清單
序號 成果名稱 作者 成果形式(著作、論文等) 出版社或刊物名 出版或刊發(fā)時間 字數(shù)(萬字) 轉(zhuǎn)載、引用獲獎等情況
1 敦煌吐蕃文<寺院施入疏>考釋 楊銘 論文 《西北民族論叢》 2018.2 2
2 “后藏乃寧寺志” 羊毛措 論文 西藏大學學報(人文社科版) 2018.2 0.6 CSSCI
3 苯教典籍文獻概說 阿旺嘉措 報告 2018.3 2
4 Effect on convergence from different particle swarms with a unified and simplified formula for position updating 胡建 論文 2017 9th International Conference on Intelligent Human-Machine Systems and Cybernetics 2017.7 0.3
(單詞) EI、CPCI-S收錄
5 The convergence of particle swarm with unified and simplified formula for position updating 胡建 論文 2017 9th International Conference on Intelligent Human-Machine Systems and Cybernetics 2017.7 0.4
(單詞) EI、CPCI-S收錄
6 藏文古籍全文檢索仿真驗證系統(tǒng) 項目組 軟件 2018.6 50萬頁藏文圖像
三、下一步研究計劃
各課題根據(jù)總課題研究方案,現(xiàn)將下一步研究計劃如下:
1、子課題“藏族民間苯教經(jīng)書“萊塢四典四部廣經(jīng)”的分類整理及研究”計劃于2017年7月-2019年10月期間課題組整理提供所有相關(guān)研究資料,包括調(diào)查所得文獻資料、田野調(diào)查訪談問卷、各類錄音錄像資料。課題組分類整理,編輯成冊。同時,課題組調(diào)查成果情況,總結(jié)經(jīng)驗,針對不足,即行補充調(diào)查; 2020年初補充和完善研究成果,已完成課題基本工作; 2020年底進行課題研究總結(jié),并做準備課題結(jié)項。
2、子課題 “藏文文獻全文數(shù)字化研究”一方面,進一步完善底層技術(shù),包括:擴大全文檢索技術(shù)的適應(yīng)范圍和檢索效率,引入文獻學檢索信息。采取的技術(shù)方案為,充分驗證和提升復(fù)雜背景(字跡褪色、背景污損、版面殘缺、字符粘連和遮擋、字體多變等干擾)下算法的魯棒性,并在元數(shù)據(jù)中增設(shè)文獻學信息;另一方面,優(yōu)化軟件系統(tǒng),包括:對數(shù)據(jù)庫管理軟件、著錄軟件進行適應(yīng)性更新,使之為全文檢索和文獻學信息檢索提供更優(yōu)的底層效率支撐。采取的技術(shù)方案為,把已有的原生XML數(shù)據(jù)庫更換為大型關(guān)系數(shù)據(jù)庫,并對著錄軟件適時增加文獻學信息內(nèi)容。此外,擴大藏文典籍圖像掃描、整理和數(shù)據(jù)著錄規(guī)模,充實藏文文獻全文數(shù)據(jù)庫,力爭結(jié)題時達到200萬頁規(guī)模。此項基本為人力密集型事務(wù),增設(shè)人力即可。
3、子課題“新疆、青海出土古藏文簡牘的整理與數(shù)字化研究”計劃于2019年初完成本書上編《新疆、青海出土古藏文簡牘敘錄》余下的約十萬字的工作;2020年初完成本書下編《古藏文簡牘研究與數(shù)字化文獻匯編》的收集與整理工作; 2020年底完成附錄部分的編寫工作,包括《引用和參考文獻》《古藏文簡牘出土號、索引號和本書題名、頁碼號對照表》《藏漢對照譯名對照表》等,并做準備課題結(jié)項。
4、子課題“佛教系屬藏文寫本文獻整理與全文數(shù)字化研究”計劃于2018-2020年基本完成館藏藏文古籍文獻目錄整理編輯工作和館藏藏傳木刻版畫資料的研究工作;2020年底爭取編輯完成《館藏藏傳木刻版畫集》,并做準備課題結(jié)項。
(課題組供稿)