一、 研究進(jìn)展情況
1、課題開題與子課題進(jìn)展情況
自2016年3月開題以來(lái),至2017年7月,課題組已經(jīng)基本搭建起較為完整的數(shù)據(jù)庫(kù)架構(gòu),完成了總?cè)萘考s為8個(gè)G(一個(gè)G為1024M)的清末民國(guó)社會(huì)調(diào)查數(shù)據(jù)庫(kù)。現(xiàn)在數(shù)據(jù)庫(kù)中已經(jīng)有約2000萬(wàn)字全文數(shù)據(jù)庫(kù)、300萬(wàn)字原始文獻(xiàn)庫(kù)。另外,課題組還完成了約50萬(wàn)字的文獻(xiàn)目錄索引,以及“婚姻家庭”專題數(shù)據(jù)庫(kù)的表格錄入工作?傮w完成進(jìn)度已經(jīng)接近項(xiàng)目預(yù)計(jì)工作量的一半,項(xiàng)目進(jìn)展順利。
子課題1已經(jīng)對(duì)清末民國(guó)社會(huì)調(diào)查中調(diào)查的概念、調(diào)查活動(dòng)的背景、調(diào)查的性質(zhì)進(jìn)行了深入分析。在此基礎(chǔ)上,已經(jīng)根據(jù)調(diào)查報(bào)告的特點(diǎn)以及歷史學(xué)和其他社會(huì)科學(xué)學(xué)者的需求,設(shè)計(jì)出了數(shù)據(jù)庫(kù)的總體結(jié)構(gòu)和功能;并對(duì)數(shù)據(jù)庫(kù)的建立制定了可行性方案和具體操作方案。在此基礎(chǔ)上,已經(jīng)初步搭建好數(shù)據(jù)庫(kù)的基礎(chǔ)架構(gòu)。
子課題2依據(jù)子課題3編制的文獻(xiàn)目錄索引提供的信息,查找、復(fù)制了原始社會(huì)調(diào)查文獻(xiàn),已經(jīng)建立了規(guī)模為300萬(wàn)字的原始文獻(xiàn)庫(kù)。上述原始文獻(xiàn)已經(jīng)被掃描并轉(zhuǎn)變?yōu)閜df格式,同時(shí)已經(jīng)導(dǎo)入到原始文獻(xiàn)庫(kù)中與全文數(shù)據(jù)庫(kù)一一對(duì)應(yīng)。
子課題3已經(jīng)完成約50萬(wàn)字的原始社會(huì)調(diào)查文獻(xiàn)目錄索引的編制,包括調(diào)查文獻(xiàn)的名稱、類型、調(diào)查時(shí)間、調(diào)查地點(diǎn)、調(diào)查主體、調(diào)查內(nèi)容以及出版機(jī)構(gòu)、出版時(shí)間以及文獻(xiàn)來(lái)源等各類信息。該索引根據(jù)社會(huì)調(diào)查的內(nèi)容,將社會(huì)調(diào)查分為“綜合”、“環(huán)境”、“政治”、“經(jīng)濟(jì)”、“軍事”、“法律”、“社會(huì)”、“宗教”、“文化”、“教育”、“民族”、“華僑”、“社會(huì)調(diào)查理論與方法”十三大類,每大類又根據(jù)文獻(xiàn)條目之多少逐級(jí)細(xì)分,且不論分成幾個(gè)層級(jí),其最后一級(jí)分類所在條目,均按著作或刊布時(shí)間依序排列。有些類別條目較多,但涉及不同地區(qū),則一般以地域予以分類。其中“綜合類”調(diào)查,主要指對(duì)某一特定地區(qū)的綜合性調(diào)查,涉及自然環(huán)境、政治、經(jīng)濟(jì)、社會(huì)、文化等諸多方面,不論這一地域,是一個(gè)村莊,市鎮(zhèn),還是省縣行政區(qū),或是港口、鐵路沿線等地。為便于檢索,據(jù)其調(diào)查范圍之大小,分為“全國(guó)及跨省區(qū)”、“省域”、“縣域”、“城鎮(zhèn)”、“村落”、以及包括“鐵路沿線”等其他小類!碍h(huán)境”類調(diào)查,主要包括“環(huán)境概況”、“資源”、“災(zāi)害”等幾個(gè)方面。其中“資源”包括“氣象與氣候”、“地質(zhì)”、“礦產(chǎn)”、“土壤與水資源”、“生物”(含森林植被、動(dòng)物等)、“物產(chǎn)”等;“災(zāi)害”指的是水、旱、蝗、震以及傳染性疾病等各類災(zāi)害。其他各類情況,概述如下:政治——政治概況、國(guó)家行政、地方行政、基層自治、對(duì)外關(guān)系等;經(jīng)濟(jì)——經(jīng)濟(jì)概況、農(nóng)業(yè)、手工業(yè)及工業(yè)、商業(yè)、財(cái)政、金融與經(jīng)濟(jì)關(guān)系、經(jīng)濟(jì)組織等;軍事——軍事概況、武裝力量、戰(zhàn)爭(zhēng)、后勤;法律——法律概況、司法體制、司法行為、民商事習(xí)慣;社會(huì)——社會(huì)概況、人口、婚姻與家庭、社會(huì)階層、社會(huì)組織、社會(huì)問題與社會(huì)運(yùn)動(dòng)、風(fēng)俗習(xí)慣、醫(yī)療衛(wèi)生、社會(huì)保障等;宗教——宗教概況、佛教、道教、基督教、伊斯蘭教、民間宗教;文化——文化概況、新聞、出版、文藝、體育、文博、其他;教育——教育概況、各類教育、教育管理、教學(xué)內(nèi)容與方法、師資隊(duì)伍、學(xué)生學(xué)習(xí)與生活等;民族——民族概況、族別;華僑——華僑概況、國(guó)內(nèi)華僑、海外華僑。
子課題4已經(jīng)建立了約2000萬(wàn)字的全文檢索庫(kù),通過將數(shù)據(jù)輸入、校核與處理,通過將原始文獻(xiàn)轉(zhuǎn)換為word格式,從而建立了完整的全文數(shù)據(jù)庫(kù)。已經(jīng)完成項(xiàng)目規(guī)劃4000萬(wàn)字的50%。上述內(nèi)容已經(jīng)全部導(dǎo)入到數(shù)據(jù)庫(kù)之中,目前,數(shù)據(jù)庫(kù)已經(jīng)能夠基本實(shí)現(xiàn)項(xiàng)目規(guī)劃的絕大部分功能。
子課題4同時(shí)也已經(jīng)完成了婚姻家庭專題應(yīng)用庫(kù)的表格錄入工作,后期將對(duì)社會(huì)調(diào)查中的數(shù)據(jù)進(jìn)行編碼和重組,然后進(jìn)行統(tǒng)計(jì)分析或繪制地圖,實(shí)現(xiàn)可視化和量化分析。
2、調(diào)查研究及學(xué)術(shù)交流情況
1、開題報(bào)告會(huì)
2016年3月27日上午9時(shí),課題開題報(bào)告會(huì)在人民大學(xué)召開。來(lái)自中國(guó)人民大學(xué)、中國(guó)社會(huì)科學(xué)院、國(guó)家圖書館、北京大學(xué)、清華大學(xué)、北京師范大學(xué)、南開大學(xué)、福建教育出版社、上海精靈天下數(shù)字技術(shù)有限公司、中央民族大學(xué)、山西大學(xué)等單位的近30位專家學(xué)者以及課題組成員出席了會(huì)議。
北京師范大學(xué)朱漢國(guó)教授、中國(guó)社會(huì)科學(xué)院經(jīng)濟(jì)所封越健教授、中國(guó)社會(huì)科學(xué)院近代史所金以林教授、北京師范大學(xué)歷史學(xué)院李志英教授、南開大學(xué)歷史學(xué)院李金錚教授以及清華大學(xué)社科科學(xué)學(xué)院經(jīng)濟(jì)研究所龍登高教授擔(dān)任此次會(huì)議的評(píng)審專家。
人民大學(xué)洪大用副校長(zhǎng)在致辭中表示,“清末民國(guó)社會(huì)調(diào)查數(shù)據(jù)庫(kù)建設(shè)”意義重大,它涉及社會(huì)學(xué)、經(jīng)濟(jì)學(xué)、統(tǒng)計(jì)學(xué)、歷史學(xué)等多個(gè)學(xué)科,不僅有助于拓展史料、促進(jìn)計(jì)量史學(xué)的發(fā)展,還有助于推動(dòng)跨學(xué)科、跨學(xué)校的交流與合作。
2、課題組落實(shí)評(píng)審專家意見會(huì)議
為了落實(shí)開題報(bào)告會(huì)各位評(píng)審專家的意見和建議,課題組全體成員于2016年3月27日下午2:00-4:00在中國(guó)人民大學(xué)清史研究所會(huì)議室召開了項(xiàng)目組討論會(huì),在黃興濤教授、夏明方教授的主持下,曹新宇、伍婷婷、林展、陳鵬、韓祥等課題組成員針對(duì)評(píng)審專家的意見,深入討論了數(shù)據(jù)庫(kù)設(shè)計(jì)中的屬性表及多維分類表問題,對(duì)原有的設(shè)計(jì)計(jì)劃、課題組的工作進(jìn)度及子課題的成員分工做出了相應(yīng)的調(diào)整,并具體部署了近期的有關(guān)工作。
3、屬性表錄入分工會(huì)議
2016年6月29日上午9時(shí),由中國(guó)人民大學(xué)歷史學(xué)院黃興濤教授主持的國(guó)家社科基金重大項(xiàng)目“清末民國(guó)社會(huì)調(diào)查數(shù)據(jù)庫(kù)建設(shè)”屬性表分工會(huì)議,在中國(guó)人民大學(xué)清史所400會(huì)議室召開。上海精靈天下數(shù)字技術(shù)有限公司及課題組成員夏明方教授、邱志紅、李章鵬、伍婷婷、林展、陳鵬、杜佩紅等課題組成員參加了會(huì)議。會(huì)議由中國(guó)人民大學(xué)歷史學(xué)院林展講師主持,主要討論了數(shù)據(jù)庫(kù)建設(shè)屬性表錄入的分工及填寫要求。
4、數(shù)據(jù)庫(kù)建設(shè)進(jìn)展報(bào)告會(huì)
2016年10月26日上午9時(shí),由黃興濤教授主持的國(guó)家社科基金重大項(xiàng)目“清末民國(guó)社會(huì)調(diào)查數(shù)據(jù)庫(kù)建設(shè)”的數(shù)據(jù)庫(kù)建設(shè)進(jìn)展報(bào)告會(huì),在中國(guó)人民大學(xué)清史所400會(huì)議室召開。國(guó)家圖書館專家、上海精靈天下數(shù)字技術(shù)有限公司代表及課題組成員出席了本次會(huì)議。
5、屬性表填寫進(jìn)展情況匯報(bào)會(huì)議
2016年11月7日下午14時(shí),由中國(guó)人民大學(xué)歷史學(xué)院黃興濤教授主持的國(guó)家社科基金重大項(xiàng)目“清末民國(guó)社會(huì)調(diào)查數(shù)據(jù)庫(kù)建設(shè)”屬性表分工會(huì)議,在中國(guó)人民大學(xué)清史所400會(huì)議室召開。課題組錄入成員邱志紅、李章鵬、伍婷婷、林展、陳鵬、韓祥、杜佩紅參加了會(huì)議。會(huì)議由中國(guó)人民大學(xué)歷史學(xué)院林展講師主持,議題包括屬性表錄入的進(jìn)展情況匯報(bào)及數(shù)據(jù)錄入中的問題。
6、“數(shù)字人文”與清史研究學(xué)術(shù)會(huì)議
2016年5月28-29日,課題組與中國(guó)人民大學(xué)《清史研究》編輯部在北京合作舉辦了“數(shù)字人文與清史研究”學(xué)術(shù)會(huì)議。來(lái)自北京大學(xué)、中國(guó)人民大學(xué)、中國(guó)社科院、北京師范大學(xué)、復(fù)旦大學(xué)、陜西師范大學(xué)、上海交通大學(xué)、河南大學(xué)、蘇州大學(xué)、南京師范大學(xué)以及香港科技大學(xué)、耶魯大學(xué)、哈佛大學(xué)、臺(tái)北“中研院”等海內(nèi)外14家學(xué)術(shù)單位的30余位專家學(xué)者參加了本次工作坊。
課題組首席專家黃興濤教授在工作坊上指出,數(shù)字人文發(fā)展在目前史學(xué)研究中所代表的開創(chuàng)意義,在某種程度上構(gòu)成了梁?jiǎn)⒊倌昵八岢觥靶率穼W(xué)”新的起點(diǎn)。歷史學(xué)者應(yīng)該積極發(fā)揮作用,做出一些具有示范性的、典型的數(shù)據(jù)庫(kù)。數(shù)據(jù)庫(kù)的建設(shè)使史學(xué)站在了一個(gè)新的高點(diǎn),其資料、視野的廣闊性有助于克服目前史學(xué)研究中“碎片化”的傾向。大家要緊緊抓住史學(xué)的本質(zhì),即“反思性的再現(xiàn)過去和反思過去”的基礎(chǔ)上做出高質(zhì)量的數(shù)據(jù)庫(kù),推進(jìn)史學(xué)的進(jìn)一步發(fā)展。
課題組成員林展向與會(huì)專家介紹了本課題的總體規(guī)劃和設(shè)計(jì),得到與會(huì)專家的指導(dǎo)和好評(píng)。
3、學(xué)術(shù)會(huì)議與學(xué)術(shù)交流活動(dòng)
除了上述會(huì)議外,課題組與上海精靈天下數(shù)字技術(shù)有限公司就數(shù)據(jù)庫(kù)建設(shè)相關(guān)的問題就行了12次溝通會(huì)議。
另外,項(xiàng)目組成員林展兩次被中國(guó)社會(huì)科學(xué)院近代史研究所邀請(qǐng),介紹本課題的進(jìn)展和相關(guān)經(jīng)驗(yàn)。
4、成果宣傳推介情況
本項(xiàng)目在推進(jìn)過程中,通過中國(guó)人民大學(xué)科研處共計(jì)上報(bào)兩期工作簡(jiǎn)報(bào):
2016年4月《工作簡(jiǎn)報(bào)》第1期
2017年1月《工作簡(jiǎn)報(bào)》第2期
二、 研究成果情況
1、黃興濤、李章鵬:《現(xiàn)代統(tǒng)計(jì)知識(shí)和觀念的傳入與清末新史學(xué)》,《史學(xué)史研究》2016年第3期。
本文對(duì)于現(xiàn)代統(tǒng)計(jì)知識(shí)和觀念傳入中國(guó)的過程進(jìn)行了系統(tǒng)梳理。為“清末民國(guó)社會(huì)調(diào)查數(shù)據(jù)庫(kù)”結(jié)構(gòu)的搭建提供了重要的背景知識(shí)和理論支撐。
文章發(fā)現(xiàn),在1897年之前,以具體統(tǒng)計(jì)事例為載體的西方統(tǒng)計(jì)知識(shí)和統(tǒng)計(jì)觀念已經(jīng)傳入中國(guó),1897年后,經(jīng)日本消化吸收的社會(huì)統(tǒng)計(jì)學(xué)理論開始系統(tǒng)地引入,這對(duì)清末和民國(guó)統(tǒng)計(jì)的影響廣泛而深遠(yuǎn)。清末時(shí),梁?jiǎn)⒊热税呀y(tǒng)計(jì)材料匯編為歷史,陳黻宸等人明確主張以統(tǒng)計(jì)法來(lái)研究和表述歷史,他們固然受到西方史學(xué)理論的影響,但現(xiàn)代統(tǒng)計(jì)知識(shí)、觀念和外來(lái)成果所施予的直接刺激也不容忽視。
清末時(shí)已有人在史書編纂、地方志纂修和具體歷史問題研究方面,嘗試使用統(tǒng)計(jì)分析法,這構(gòu)成為清末中國(guó)新史學(xué)有機(jī)的組成部分?梢哉f,“歷史統(tǒng)計(jì)學(xué)”的有關(guān)意識(shí)和實(shí)踐,在當(dāng)時(shí)已經(jīng)悄然醞釀、生發(fā)。只不過,清末尚沒有人明確提出“歷史統(tǒng)計(jì)學(xué)”的概念。這一任務(wù)直到20世紀(jì)20年代才由梁?jiǎn)⒊⒍∥慕热舜篌w完成。清末學(xué)人在使用統(tǒng)計(jì)圖表分析歷史問題時(shí),絕大多數(shù)都還沒有真正重視起數(shù)字,更沒有產(chǎn)生如何以精確的數(shù)字科學(xué)有效地分析和表述歷史的普遍觀念和系統(tǒng)見解。這是其明顯不足。實(shí)際上,清末民初時(shí)的中國(guó)史學(xué),還遠(yuǎn)不具備重視量化統(tǒng)計(jì)分析的社會(huì)文化基礎(chǔ)。甚至迄今,我們的史學(xué)在這方面仍有很多的課要補(bǔ)、很長(zhǎng)的路要走。
2、林展:《新世紀(jì)中國(guó)的史料整理與人文社會(huì)科學(xué)研究 ——以<民國(guó)時(shí)期社會(huì)調(diào)查叢編>為例》,《光明日?qǐng)?bào)》2016年4月6日第14版。
本文以《民國(guó)時(shí)期社會(huì)調(diào)查叢編》為例,討論了新世紀(jì)史料整理的重要性,以及建立“清末民國(guó)社會(huì)調(diào)查”數(shù)據(jù)庫(kù)的必要性。
文章認(rèn)為,史料不僅是史學(xué)研究的基礎(chǔ),也是眾多人文社會(huì)科學(xué)研究的重要基礎(chǔ)。20世紀(jì)初梁?jiǎn)⒊珜?dǎo)的新史學(xué),如果脫離了史料的發(fā)掘整理,將是難以想象的。新世紀(jì)以來(lái)我國(guó)的史料整理工作,雖然借助于計(jì)算機(jī)與網(wǎng)絡(luò)技術(shù),呈現(xiàn)出異乎尋常的突飛猛進(jìn)態(tài)勢(shì),但總體來(lái)說,并不盡如人意。一個(gè)突出的特點(diǎn)是,影印出版的史料大幅度增長(zhǎng),而經(jīng)過歷史學(xué)者核對(duì)、比勘、系統(tǒng)分類的史料整理相對(duì)減少。這一現(xiàn)象對(duì)歷史學(xué)乃至整個(gè)人文社會(huì)科學(xué)可能產(chǎn)生的負(fù)面影響,迄今也沒有得到足夠重視。
難能可貴的是,盡管現(xiàn)行科研評(píng)價(jià)體制對(duì)史料整理工作并沒有給予足夠的重視和支持,但仍有少數(shù)富有遠(yuǎn)見、不畏艱難的學(xué)者,基于對(duì)學(xué)術(shù)研究規(guī)律的信念,投身到大規(guī)模史料的系統(tǒng)整理工作之中,并對(duì)歷史學(xué)研究乃至其他人文社會(huì)學(xué)科帶來(lái)積極的影響。《民國(guó)時(shí)期社會(huì)調(diào)查叢編》(以下簡(jiǎn)稱《叢編》)系列就是其中的一個(gè)顯例。
我們發(fā)現(xiàn),《叢編》在他引方面呈現(xiàn)下面的特征。其一是總體引用次數(shù)比較高,據(jù)不完全統(tǒng)計(jì),從2005年至2014年,累計(jì)引用數(shù)量接近1000次。其二,引用次數(shù)呈現(xiàn)逐年升高的趨勢(shì)。其三,影響的范圍廣,除中國(guó)大陸地區(qū)外,中國(guó)臺(tái)灣地區(qū)、日本、美國(guó)、澳大利亞等地都有學(xué)術(shù)著作引用,涉及學(xué)科包括歷史學(xué)、社會(huì)學(xué)、政治學(xué)、教育學(xué)、經(jīng)濟(jì)學(xué)、心理學(xué)等。就期刊而論,自2005年至2014年,引用《叢編》的期刊論文一共有289篇,分布在199種期刊上。
這表明,以《叢編》為代表的專業(yè)化史料整理工作,具有重要的學(xué)術(shù)價(jià)值。當(dāng)然,現(xiàn)有的專業(yè)化史料整理工作也存在局限性,比如出版成本高、周期長(zhǎng)、容量有限、難以進(jìn)行原文對(duì)照、無(wú)法進(jìn)行全文檢索等。有鑒于此,專業(yè)化史料整理工作需要在歷史學(xué)者專業(yè)知識(shí)的基礎(chǔ)上,充分利用計(jì)算機(jī)技術(shù),建設(shè)大規(guī)模集成式的歷史數(shù)據(jù)庫(kù),從而為國(guó)內(nèi)外同行搭建一個(gè)重要的基礎(chǔ)性資料平臺(tái)。
課題組供稿