《清末民國社會(huì)調(diào)查數(shù)據(jù)庫建設(shè)》自2016年4月開題后,到2016年12月底,共召開了三次較大的會(huì)議:分別是兩次關(guān)于屬性表的討論會(huì)(第一次為2016年6月29日的“屬性表錄入分工會(huì)議及填寫說明”,第二次為2016年11月7日的“屬性表填寫的進(jìn)展情況匯報(bào)”),一次關(guān)于數(shù)據(jù)庫建設(shè)的進(jìn)展報(bào)告會(huì)(2016年10月26日)。
在項(xiàng)目首席專家黃興濤教授的帶領(lǐng)下,課題組團(tuán)隊(duì)緊密合作,積極推進(jìn)相關(guān)工作,目前數(shù)據(jù)庫各子課題已經(jīng)取得的進(jìn)展如下:
子課題一:清末民國社會(huì)調(diào)查總體研究與數(shù)據(jù)庫設(shè)計(jì)。負(fù)責(zé)人:黃興濤
經(jīng)過課題組與上海精靈天下數(shù)字技術(shù)有限公司8次開會(huì)討論溝通,數(shù)據(jù)庫的總體架構(gòu)已經(jīng)搭建完成,數(shù)據(jù)庫平臺(tái)建設(shè)預(yù)計(jì)在2017年1月底完成。
對(duì)清末民國社會(huì)調(diào)查的總體研究也已經(jīng)開展,課題組成員討論“清末民國社會(huì)調(diào)查數(shù)據(jù)庫建設(shè)價(jià)值”的論文“新世紀(jì)中國的史料整理與人文社會(huì)科學(xué)研究”已發(fā)表在《光明日?qǐng)?bào)》理論版,受到學(xué)界關(guān)注。
另外,課題組也參與舉辦了“數(shù)字人文與清史研究”學(xué)術(shù)工作坊。黃興濤教授在工作坊上指出,數(shù)字人文發(fā)展在目前史學(xué)研究中所代表的開創(chuàng)意義,在某種程度上構(gòu)成了梁?jiǎn)⒊倌昵八岢觥靶率穼W(xué)”新的起點(diǎn)。歷史學(xué)者應(yīng)該積極發(fā)揮作用,做出一些具有示范性的、典型的數(shù)據(jù)庫。數(shù)據(jù)庫的建設(shè)使史學(xué)站在了一個(gè)新的高點(diǎn),其資料、視野的廣闊性有助于克服目前史學(xué)研究中“碎片化”的傾向。大家要緊緊抓住史學(xué)的本質(zhì),即“反思性的再現(xiàn)過去和反思過去”的基礎(chǔ)上做出高質(zhì)量的數(shù)據(jù)庫,推進(jìn)史學(xué)的進(jìn)一步發(fā)展。
課題組成員林展向與會(huì)專家介紹了本課題的總體規(guī)劃和設(shè)計(jì),得到與會(huì)專家的指導(dǎo)和好評(píng)。
子課題二:清末民國社會(huì)調(diào)查文獻(xiàn)收集整理與原始文獻(xiàn)庫建設(shè)。負(fù)責(zé)人:汪永紅
課題組依托中國人民大學(xué)圖書館資源,在兄弟院校圖書館和資料室的幫助下,目前已經(jīng)收集到原始PDF文檔約2500萬字,所有收集到的原始文檔已經(jīng)交到數(shù)據(jù)庫公司進(jìn)行數(shù)據(jù)庫入庫之前的轉(zhuǎn)檔處理,目前大約已完成該子課題預(yù)定目標(biāo)的50%。
子課題三:清末民國社會(huì)調(diào)查數(shù)據(jù)庫索引編制與多維分類。負(fù)責(zé)人:夏明方
清末民國社會(huì)調(diào)查數(shù)據(jù)庫索引編制已經(jīng)取得較大進(jìn)展,目前已經(jīng)完成了近50萬字的文獻(xiàn)索引編制工作,已經(jīng)完成預(yù)定計(jì)劃的50%。
另外,經(jīng)過多次討論和修改,數(shù)據(jù)庫索引和多維分類的表格已經(jīng)設(shè)計(jì)好并填寫完畢。
子課題四:清末民國社會(huì)調(diào)查全文檢索庫與專題應(yīng)用庫建設(shè)。負(fù)責(zé)人:陳志武
全文檢索庫所需要的word文檔已經(jīng)由數(shù)據(jù)庫公司實(shí)現(xiàn)轉(zhuǎn)檔,已經(jīng)完成近2000萬字,已經(jīng)完成子課題預(yù)定目標(biāo)的40%。專題應(yīng)用庫也已經(jīng)收集到所需的調(diào)查報(bào)告,下一步將進(jìn)行數(shù)據(jù)的錄入和整理工作。
綜上所述,本課題已經(jīng)完成課題總體規(guī)劃目標(biāo)的近50%,工作進(jìn)展達(dá)到并超過約定目標(biāo)。
下面對(duì)過去半年多幾次較大規(guī)模的課題組會(huì)議進(jìn)行介紹。
一、關(guān)于屬性表錄入的兩次會(huì)議
1、分工會(huì)議
2016年6月29日上午9時(shí),由中國人民大學(xué)歷史學(xué)院黃興濤教授主持的國家社科基金重大項(xiàng)目“清末民國社會(huì)調(diào)查數(shù)據(jù)庫建設(shè)”屬性表分工會(huì)議,在中國人民大學(xué)清史所400會(huì)議室召開。上海精靈天下數(shù)字技術(shù)有限公司及課題組成員夏明方教授、邱志紅、李章鵬、伍婷婷、林展、陳鵬、杜佩紅等課題組成員參加了會(huì)議。會(huì)議由中國人民大學(xué)歷史學(xué)院林展講師主持,主要討論了數(shù)據(jù)庫建設(shè)屬性表錄入的分工及填寫要求。
項(xiàng)目負(fù)責(zé)人黃興濤教授介紹了數(shù)據(jù)庫建設(shè)的工作規(guī)劃,要求項(xiàng)目組成員的屬性表填寫在三個(gè)月內(nèi)完成,第一個(gè)月先交一份錄入表,時(shí)間暫定為7月20號(hào),如有任何問題再行調(diào)整。
經(jīng)過項(xiàng)目組的內(nèi)部討論,決定先以《民國時(shí)期社會(huì)調(diào)查叢編》為基礎(chǔ),進(jìn)行第一次數(shù)據(jù)庫的錄入工作,之后再以《民國時(shí)期社會(huì)調(diào)查叢編》(二編)為基礎(chǔ)進(jìn)行錄入。中國人民大學(xué)清史所夏明方教授對(duì)屬性表的錄入進(jìn)行了具體的分工,并表示:“屬性表是數(shù)據(jù)庫建設(shè)的基礎(chǔ)。將調(diào)查報(bào)告的內(nèi)容進(jìn)行屬性分類,對(duì)每一條數(shù)據(jù)進(jìn)行屬性提取,再整理入庫,是十分關(guān)鍵的工作,希望每一位成員能認(rèn)真完成”。錄入成員主要分工如下:
姓名 負(fù)責(zé)卷類
伍婷婷 少數(shù)民族
邱志紅 宗教民俗、法政
李章鵬 城市(勞工)生活、華僑
韓祥 鄉(xiāng)村經(jīng)濟(jì)、鄉(xiāng)村社會(huì)
林展 婚姻家庭、人口、底邊社會(huì)
陳鵬 社會(huì)保障、社會(huì)組織、醫(yī)療衛(wèi)生與社會(huì)保障
杜佩紅 文教事業(yè)
為了實(shí)現(xiàn)全文檢索,在多維分類表確立后,需要設(shè)置關(guān)鍵詞,進(jìn)行錄入工作。上海精靈天下數(shù)字有限公司負(fù)責(zé)人高寶龍先生介紹了數(shù)據(jù)庫屬性表錄入要求:
(1)錄入編號(hào)命名規(guī)則:編號(hào)為12位數(shù),前面4位為著錄者編號(hào)。錄入者編號(hào)為(邱志紅1001;伍婷婷1002;韓祥1003;陳鵬1004;李章鵬1005;杜佩紅1006;林展1007。中間三位表示《叢編》的卷號(hào):一編為鄉(xiāng)村社會(huì)101,底邊社會(huì)102,城市(勞工)生活103,文教事業(yè)104,婚姻家庭105,宗教民俗106,少數(shù)民族107,人口108,社會(huì)組織109,社會(huì)保障110。二編為鄉(xiāng)村社會(huì)201,鄉(xiāng)村經(jīng)濟(jì)202,城市(勞工)生活203,近代工業(yè)204,文教事業(yè)205,法政206,宗教民俗207,少數(shù)民族208,人口209,社會(huì)組織210,醫(yī)療衛(wèi)生與社會(huì)保障211,華僑212。后面5位為調(diào)查編號(hào)。調(diào)查編號(hào)統(tǒng)一都從00001開始。
(2)調(diào)查形式分為兩部分:主要調(diào)查形式、調(diào)查形式。調(diào)查形式的分類為:?jiǎn)柧、?shí)地調(diào)查、通訊、訪談、其他。
(3)時(shí)間格式:調(diào)查時(shí)間若有多個(gè)時(shí)間都要列出來,中間用英文分號(hào)隔開。
(4)調(diào)查地點(diǎn)分為:國、省、市、縣、縣以下。
(5)在“館藏地”一欄下增加“版本說明”。
(6)“備注”一項(xiàng)下移,原“備注”一項(xiàng)改為“該調(diào)查是否有表格”。
2、屬性表填寫的進(jìn)展情況匯報(bào)
(1)進(jìn)展
2016年11月7日下午14時(shí),由中國人民大學(xué)歷史學(xué)院黃興濤教授主持的國家社科基金重大項(xiàng)目“清末民國社會(huì)調(diào)查數(shù)據(jù)庫建設(shè)”屬性表分工會(huì)議,在中國人民大學(xué)清史所400會(huì)議室召開。課題組錄入成員邱志紅、李章鵬、伍婷婷、林展、陳鵬、韓祥、杜佩紅參加了會(huì)議。會(huì)議由中國人民大學(xué)歷史學(xué)院林展講師主持,議題包括屬性表錄入的進(jìn)展情況匯報(bào)及數(shù)據(jù)錄入中的問題。
會(huì)議首先由黃興濤教授介紹了數(shù)據(jù)庫建設(shè)總體要求和項(xiàng)目進(jìn)度,對(duì)課題組成員前期的錄入工作予以了肯定。他講道:“目前我們數(shù)據(jù)庫建設(shè)正有條不紊的進(jìn)行中。數(shù)據(jù)庫建設(shè)最重要的是將基礎(chǔ)做牢做扎實(shí),屬性表便是其中關(guān)鍵一環(huán)。現(xiàn)階段以《民國時(shí)期社會(huì)調(diào)查叢編》、《民國時(shí)期社會(huì)調(diào)查叢編》(二編)為基礎(chǔ)的屬性表已經(jīng)錄入完畢,很感謝大家能按時(shí)完成”。
各成員錄入完成情況表
姓名 負(fù)責(zé)卷類 卷編號(hào) 完成條數(shù)
伍婷婷 少數(shù)民族 01 13
邱志紅 宗教民俗、法政 02、03 94
李章鵬 城市(勞工)生活、華僑 04、05 45
韓祥 鄉(xiāng)村經(jīng)濟(jì)、鄉(xiāng)村社會(huì) 06、07 40
林展 婚姻家庭、人口、底邊社會(huì) 08、09、10 76
陳鵬 社會(huì)保障、社會(huì)組織、醫(yī)療衛(wèi)生與社會(huì)保障 11、12、13 176
杜佩紅 文教事業(yè) 14 177
(2)問題及修改意見
接下來,林展講師介紹了屬性表錄入成員的錄入情況及錄入中出現(xiàn)的問題。課題組成員在錄入中,主要存在以下兩個(gè)問題:
一是個(gè)別信息如期刊數(shù)、頁碼、調(diào)查機(jī)構(gòu)等缺漏,這些問題可能由于大家在錄入時(shí)查找不到相關(guān)信息或者漏填。針對(duì)這一問題,本項(xiàng)目第二子課題收集完原始的調(diào)查版本后,根據(jù)這些原始的PDF版文檔再進(jìn)行補(bǔ)充修正。
二是每份調(diào)查的編號(hào),由于數(shù)字太長(zhǎng),大家在錄入時(shí),沒有進(jìn)行文本格式轉(zhuǎn)換,因此再重新修訂時(shí),成員們需要將其設(shè)置為文本格式。
二、數(shù)據(jù)庫建設(shè)進(jìn)展報(bào)告會(huì)
2016年10月26日上午9時(shí),由黃興濤教授主持的國家社科基金重大項(xiàng)目“清末民國社會(huì)調(diào)查數(shù)據(jù)庫建設(shè)”的數(shù)據(jù)庫建設(shè)進(jìn)展報(bào)告會(huì),在中國人民大學(xué)清史所400會(huì)議室召開。國家圖書館專家、上海精靈天下數(shù)字技術(shù)有限公司代表及課題組成員出席了本次會(huì)議。
會(huì)議由黃興濤教授主持,上海精靈天下數(shù)字有限公司的高寶龍先生介紹數(shù)據(jù)庫建設(shè)的總體情況,國家圖書館民國影印編輯室的李強(qiáng)主任及王濤助理擔(dān)任此次會(huì)議的評(píng)審專家。
會(huì)議首先由夏明方教授介紹了數(shù)據(jù)庫建設(shè)的總體要求和項(xiàng)目進(jìn)度情況,夏明方教授明確了“數(shù)據(jù)庫建設(shè)預(yù)計(jì)在2016年年底完成一個(gè)基本雛形,2017年將數(shù)據(jù)庫中的調(diào)查全部錄入到數(shù)據(jù)庫中”。
(一)數(shù)據(jù)庫建設(shè)進(jìn)展
隨后,上海精靈天下數(shù)字技術(shù)有限公司的高寶龍先生從數(shù)據(jù)庫的封面、檢索界面、閱讀器界面、專題閱讀界面進(jìn)行了全方位展示。
(二)問題及意見
國家圖書館民國影印編輯室的李強(qiáng)主任、王濤助理及中國人民大學(xué)清史所夏明方教授對(duì)數(shù)據(jù)庫建設(shè)情況針對(duì)數(shù)據(jù)庫的建設(shè)情況進(jìn)行了評(píng)議,指出了數(shù)據(jù)庫建設(shè)中存在的一些問題及修改意見:
1. 閱讀器:
(1)原稿圖片與文字的風(fēng)格太接近,容易讓人混淆,需要把文字的字體進(jìn)行調(diào)整,以示區(qū)分。
(2)閱讀器左邊固定為原稿圖,右邊固定為文本抄錄(如遇抄錄一頁顯示不夠,則增加橫向滾動(dòng)條)。單擊按鈕,全書應(yīng)該只顯示抄錄文本不顯示原稿圖;雙擊按鈕,則全書應(yīng)該只顯示原稿圖不顯示抄錄文字;再點(diǎn)擊按鈕,則顯示圖文對(duì)照。
(3)閱讀器中,“反饋”改為“糾錯(cuò)”。
2.檢索頁面:
(1)目前檢索頁面每一個(gè)篇章下面都是屬性標(biāo)簽,不能夠顯示內(nèi)容的這部分,需要去掉“檢索結(jié)果標(biāo)簽”,在該處增加內(nèi)容展示。
(2)結(jié)果標(biāo)簽應(yīng)改為:第一行:篇章名(顏色加深,現(xiàn)有顏色太淺)+作者;第二行:結(jié)果標(biāo)簽+進(jìn)入閱讀等4個(gè)按鈕;第三、四行不變,顯示內(nèi)容標(biāo)簽。行距可調(diào)小,盡量顯示更多的內(nèi)容。
(3)希望能夠?qū)ⅰ案呒?jí)檢索”中的“下拉條件限定框”放到首頁的全文檢索框前面,減少用戶的二次操作。
(4)全文檢索框內(nèi),默認(rèn)淺色顯示的字應(yīng)由“輸入需要查找的調(diào)查名稱”改為“輸入需要查找的內(nèi)容”。
(5)每一個(gè)篇章下面的標(biāo)簽數(shù)據(jù),希望可以點(diǎn)擊,單擊搜索出整庫所有跟這條數(shù)據(jù)有關(guān)的篇章。
3、專題閱覽:
(1)目前“主題”、“專題”兩個(gè)詞混淆,希望數(shù)據(jù)庫能夠在“專題閱覽”頁,顯示專題導(dǎo)航。例如:XX主題>XX專題XX專題XX專題。
(2)目前專題頁下的篇章顯示方式,跟外部不一樣,應(yīng)該是所有篇章顯示要統(tǒng)一,篇章不應(yīng)有圖片。
4、前臺(tái)設(shè)置:
(1)目前前臺(tái)系統(tǒng)字體不統(tǒng)一,繁簡(jiǎn)混合。希望能將默認(rèn)屬性改為全部顯示簡(jiǎn)體,點(diǎn)擊上面按鈕,則整庫切換成繁體。
(2)前臺(tái)的“篇章”改為“題名”,或者每條數(shù)據(jù)前面不顯示“篇章”兩字。
(3)前臺(tái)首頁圖片過于簡(jiǎn)單,體現(xiàn)不出“社會(huì)調(diào)查”的內(nèi)涵,希望圖片背景設(shè)置為社會(huì)調(diào)查者田野調(diào)查活動(dòng)圖。頁面下一排為民國時(shí)期社會(huì)調(diào)查幾個(gè)重要人物的滾動(dòng)頭像。
(課題組供稿)