舊版網(wǎng)站入口

站內(nèi)搜索

漢語(yǔ)方言自然口語(yǔ)有聲基礎(chǔ)語(yǔ)料庫(kù)建設(shè)中期檢測(cè)報(bào)告

2016年12月05日15:07來(lái)源:全國(guó)哲學(xué)社會(huì)科學(xué)工作辦公室

一、研究進(jìn)展情況

一、研究計(jì)劃總體執(zhí)行情況

本項(xiàng)目2012年10月中標(biāo)。2013年1月13日舉行開(kāi)題論證會(huì),開(kāi)題至今(2016年7月)已有三年半。項(xiàng)目按計(jì)劃推進(jìn),總體順利。

本項(xiàng)目分前期(2013)、中期(2014-2016)、后期(2017)三個(gè)階段。前期的理論研究與語(yǔ)料庫(kù)設(shè)計(jì)已如期完成,2014年至今(2016)為中期,有兩項(xiàng)主要任務(wù):(1)語(yǔ)料采制;(2)軟件研究(語(yǔ)料轉(zhuǎn)寫(xiě)核對(duì)軟件與語(yǔ)料庫(kù)管理軟件)。這兩項(xiàng)是本項(xiàng)目的中心工作。以下逐項(xiàng)匯報(bào)。

1.1 語(yǔ)料采制(2014年7月-2016年7月)

語(yǔ)料采制分采錄(調(diào)查錄制)與轉(zhuǎn)寫(xiě)(研究標(biāo)注)兩項(xiàng)工作。兩年來(lái),分屬三個(gè)方言子課題的20個(gè)方言子項(xiàng)目按照《漢語(yǔ)方言語(yǔ)料采制手冊(cè)》的規(guī)范與要求工作,現(xiàn)有17方言點(diǎn)已完成語(yǔ)料采錄,開(kāi)始轉(zhuǎn)寫(xiě);另3方言因故略延,正在籌備語(yǔ)料采錄。以下就方言布點(diǎn)、語(yǔ)料內(nèi)容、研究進(jìn)展與項(xiàng)目管理逐一匯報(bào)。

1.1.1 方言布點(diǎn):兼顧方言與文化選擇20方言點(diǎn)

依據(jù)投標(biāo)書(shū)設(shè)定的“兼顧方言與文化”的布點(diǎn)原則,選了20個(gè)方言點(diǎn),覆蓋全國(guó)九個(gè)一級(jí)方言區(qū)和官話的八個(gè)二級(jí)分區(qū)(《中國(guó)語(yǔ)言地圖集》)。這20方言點(diǎn)均為當(dāng)?shù)亟?jīng)濟(jì)文化中心(或?yàn)楣懦牵哂蟹窖耘c地域文化的雙重代表。

1.1.2 語(yǔ)料內(nèi)容:基礎(chǔ)語(yǔ)料與語(yǔ)篇語(yǔ)料數(shù)量大

每方言點(diǎn)有4位發(fā)音人:老年男女、青年男女,分別錄制基礎(chǔ)語(yǔ)料字、詞、句和語(yǔ)篇語(yǔ)料;A(chǔ)語(yǔ)料以老男為主,同時(shí)錄制另三人音系基礎(chǔ)字。語(yǔ)篇語(yǔ)料4人均錄。為方便多人對(duì)話,專設(shè)一引話人(方言地道、清楚本項(xiàng)目任務(wù))參與雙口語(yǔ)篇與三口語(yǔ)篇錄制。語(yǔ)篇分話本語(yǔ)篇、話題語(yǔ)篇與自話語(yǔ)篇,三類語(yǔ)篇的口語(yǔ)自然度依序遞增。每方言點(diǎn)共錄制6105字,約5600詞(核心詞200、基礎(chǔ)詞5260、特征詞100-200),100語(yǔ)法例句,900分鐘語(yǔ)篇(見(jiàn)下頁(yè)表1)。語(yǔ)料數(shù)量大于一般方言調(diào)查和一些在研方言數(shù)據(jù)庫(kù)。

表1 本項(xiàng)目單方言點(diǎn)語(yǔ)料結(jié)構(gòu)表

注:6105字含老男4002同音字和1092雙字調(diào)式字,老女、青男、青女各337音系例字。

1.1.3 研究進(jìn)展:已完成17方言點(diǎn)的語(yǔ)料采錄

2014年上半年完成南京語(yǔ)料的試點(diǎn)采錄、修訂完善了語(yǔ)料采制大綱《漢語(yǔ)方言語(yǔ)料采制手冊(cè)》后,即籌備路途最遠(yuǎn)的新疆哈密方言的采錄。7月,新疆大學(xué)哈密方言子項(xiàng)目完成采錄的前期準(zhǔn)備:擬定當(dāng)?shù)鬲?dú)有方言文化采錄底本(特征詞、熟語(yǔ)、傳說(shuō)、故事、軼事、歌謠、非遺曲藝),為4位發(fā)音人分?jǐn)M獨(dú)用的語(yǔ)料底本,選定合適的發(fā)音人,擬定采錄工作日程,勘查預(yù)定錄音錄像場(chǎng)地等。8月,5人團(tuán)隊(duì)赴哈密,全天調(diào)查并錄制。首席專家劉俐李教授率隊(duì),哈密方言研究專家新疆大學(xué)張洋教授同步監(jiān)聽(tīng)發(fā)音質(zhì)量,發(fā)現(xiàn)問(wèn)題隨即質(zhì)疑、討論、重錄,子項(xiàng)目負(fù)責(zé)人新疆大學(xué)楊洪建副教授與研究生卜元彬負(fù)責(zé)檢查、復(fù)核、剪輯與整理音檔,發(fā)現(xiàn)不合格的音檔隨即補(bǔ)錄,項(xiàng)目組侯超實(shí)驗(yàn)師負(fù)責(zé)錄音與錄像,確保各技術(shù)參數(shù)達(dá)標(biāo)。5人團(tuán)隊(duì)白天錄制,晚上總結(jié)整理,各司其職、相互配合,緊張而有序地按計(jì)劃完成了哈密語(yǔ)料采錄。

2014年10月上旬,經(jīng)費(fèi)撥至各方言,各子項(xiàng)目陸續(xù)開(kāi)始語(yǔ)料采錄。10月,北京官話首先啟動(dòng),12月,蘭州、銀川兩方言啟動(dòng)。2015年1月,徽語(yǔ)、東北官話、晉語(yǔ)、粵語(yǔ)、溫州吳語(yǔ)啟動(dòng)。2015年暑假前后,閩語(yǔ)、常熟吳語(yǔ)、湘語(yǔ)、膠遼官話啟動(dòng)。目前這12方言點(diǎn)均已完成語(yǔ)料采錄,開(kāi)始語(yǔ)料轉(zhuǎn)寫(xiě)。2016年上半年完成客家話、西南官話、黃岡江淮官話的語(yǔ)料采錄。截止2016年7月,共有17個(gè)方言點(diǎn)完成語(yǔ)料采錄。

首席專家參與了5個(gè)方言點(diǎn)的語(yǔ)料采錄,其余由各方言責(zé)任人負(fù)責(zé):蘭州城市學(xué)院莫超、張建軍兩教授,暨南大學(xué)陳曉錦、浙江師范大學(xué)王洪鐘、山西大學(xué)史秀菊、山東女子學(xué)院王淑霞教授,哈爾濱師范大學(xué)梁曉玲、新疆大學(xué)楊洪建、安徽大學(xué)栗華益、常熟理工學(xué)院顧勁松、鹽城師范學(xué)院馮青青等副教授,南京師范大學(xué)侯超實(shí)驗(yàn)師。博士研究生唐志強(qiáng)、付康,碩士研究生施小梅、漆盈、郭文娟、張敏怡、卜元彬等參加調(diào)查采錄。

1.1.4 項(xiàng)目管理

依據(jù)開(kāi)題研討會(huì)專家的意見(jiàn),各方言語(yǔ)料的采制聘請(qǐng)當(dāng)?shù)赜性煸劦姆窖詫W(xué)者承擔(dān)!爱(dāng)?shù)胤窖詫W(xué)者”一指本籍方言學(xué)者,二指雖非本籍但工作于當(dāng)?shù)夭⒂诋?dāng)?shù)胤窖杂性煸務(wù)摺?0個(gè)方言點(diǎn)有20位責(zé)任人,人多力大,但需要規(guī)范與統(tǒng)一,這是保質(zhì)、如期完成語(yǔ)料研制的前提。

項(xiàng)目組以《漢語(yǔ)方言語(yǔ)料采制手冊(cè)》為法規(guī),規(guī)約并統(tǒng)一20方言點(diǎn)的語(yǔ)料研究,采用兩級(jí)責(zé)任制管束并推進(jìn)各方言點(diǎn)的工作。啟用法規(guī)手冊(cè)與兩級(jí)責(zé)任制的實(shí)質(zhì)是協(xié)助與推動(dòng)各子項(xiàng)目的工作,以保證任務(wù)的完成。

(1)用《漢語(yǔ)方言語(yǔ)料采制手冊(cè)》規(guī)約并統(tǒng)一研究

該手冊(cè)由首席專家牽頭、項(xiàng)目組核心成員集體研究(2013),經(jīng)南京方言試點(diǎn)檢驗(yàn)后修訂完善(2014上半年)。手冊(cè)有上下兩編。上編是“語(yǔ)料采制規(guī)范”,規(guī)范并約定各方言點(diǎn)的采錄內(nèi)容、采錄對(duì)象以及錄音、錄像、攝像等技術(shù)指標(biāo),規(guī)范音頻與視頻的剪輯整理、語(yǔ)料標(biāo)注、漢字與國(guó)際音標(biāo)的使用、語(yǔ)料入庫(kù)路徑,提供快捷轉(zhuǎn)寫(xiě)語(yǔ)料的方法與相應(yīng)軟件,提供語(yǔ)料庫(kù)結(jié)構(gòu)模型,提供音頻、視頻、標(biāo)注、文本等入庫(kù)語(yǔ)料的電子安放模板“××方言語(yǔ)料包”。下編是“語(yǔ)料采制底本”,提供各方言通用的字、詞、句、語(yǔ)篇的采錄底本。

(2)用兩級(jí)責(zé)任制管束并推進(jìn)研究

項(xiàng)目組下設(shè)子課題,子課題下設(shè)子項(xiàng)目,子項(xiàng)目對(duì)子課題負(fù)責(zé)、子課題對(duì)項(xiàng)目組負(fù)責(zé)。每一方言為一子項(xiàng)目,20方言點(diǎn)隸屬三個(gè)子課題:西部北部方言組(北京、東北、中原、蘭銀、膠遼、西南、冀魯官話,晉語(yǔ)),由蘭州城市學(xué)院、華東師范大學(xué)博導(dǎo)莫超教授主持;中部東部方言組(吳語(yǔ)、江淮官話、徽語(yǔ)、湘語(yǔ)),由浙江師范大學(xué)王洪鐘教授主持;南部方言組(粵語(yǔ)、閩語(yǔ)、客家話、贛語(yǔ)),由暨南大學(xué)陳曉錦教授主持。子項(xiàng)目承擔(dān)各方言點(diǎn)語(yǔ)料的研制,包括人員組織、經(jīng)費(fèi)使用、研究進(jìn)度、結(jié)項(xiàng)成果等,與項(xiàng)目組簽有協(xié)議書(shū)。

(3)用協(xié)助與監(jiān)管來(lái)保證各子項(xiàng)目完成任務(wù)

項(xiàng)目組采用通訊(電子郵件、QQ群、電話)、視頻課件、會(huì)議、派員等方式,在各方言語(yǔ)料研究的不同階段實(shí)施協(xié)助與監(jiān)管,以保證各子項(xiàng)目按設(shè)計(jì)要求不走彎路順利完成任務(wù)。

◇語(yǔ)料采錄前:審核采錄底本與發(fā)音人選,提供語(yǔ)料包與語(yǔ)料研究軟件包。

采錄底本與發(fā)音人選是采錄語(yǔ)料的關(guān)鍵,各方言在錄制前要報(bào)首席專家審核批準(zhǔn)。

各方言的采錄底本分全國(guó)通用與本地特有兩類。通用語(yǔ)料集中于字、詞、句等基礎(chǔ)語(yǔ)料,特有語(yǔ)料集中于語(yǔ)篇。通用語(yǔ)料取自《漢語(yǔ)方言語(yǔ)料采制手冊(cè)》,各方言相同,但要將每條語(yǔ)料的編碼改為本方言的唯一碼。特有語(yǔ)料由各方言自擬,有方言特征詞、當(dāng)?shù)厥煺Z(yǔ)、傳說(shuō)、故事、軼事、歌謠、非遺曲藝、名產(chǎn)、名物等。特有語(yǔ)料底本由各子項(xiàng)目自擬、報(bào)首席專家審批,然后將通用底本與特有底本合成本方言采錄底本。再拆分成4位發(fā)音人專用的分角色底本,經(jīng)首席專家審批后再使用。

2015年1月,在語(yǔ)料采錄普遍啟動(dòng)時(shí),項(xiàng)目組將語(yǔ)料包與軟件包下發(fā)各子項(xiàng)目。語(yǔ)料包是語(yǔ)料研究與語(yǔ)料入庫(kù)的電子模板,可使各方言在研究伊始就清楚結(jié)項(xiàng)要求,避免走彎路,同時(shí)也規(guī)約并統(tǒng)一各方言的語(yǔ)料采制。軟件包提供6種語(yǔ)料研究軟件,以方便并統(tǒng)一各方言語(yǔ)料采錄。有(1)音頻處理軟件、(2)文件更名軟件、(3)國(guó)際音標(biāo)軟件、(4)語(yǔ)篇處理軟件、(5)語(yǔ)音分析軟件、(6)同音類記法與文件更名操作視頻。(6)是培訓(xùn)視頻,講授字表快速記音的“同音類記法”與批量更換文件名的“拖把更名器”的使用方法。

◇語(yǔ)料采錄中

有些方言點(diǎn)技術(shù)力量不足,項(xiàng)目組派員并攜帶設(shè)備協(xié)助,例如哈密、長(zhǎng)沙、北京。有些方言點(diǎn)在錄制中遇到問(wèn)題,項(xiàng)目組則通過(guò)電話、短信、電子郵件等協(xié)助解決,例如平遙、廣州、銀川、蘭州、北京、長(zhǎng)沙、黟縣、溫州等。

◇語(yǔ)料采錄后

項(xiàng)目組逐一檢查各方言報(bào)送的原始語(yǔ)料,及時(shí)通告所發(fā)現(xiàn)的問(wèn)題。

提供語(yǔ)料轉(zhuǎn)寫(xiě)軟件。語(yǔ)料轉(zhuǎn)寫(xiě)耗時(shí)費(fèi)力,是語(yǔ)料研究的難點(diǎn)與重點(diǎn)。子課題“方言口語(yǔ)庫(kù)的數(shù)字化新技術(shù)研究”(簡(jiǎn)稱軟件組)設(shè)兩個(gè)分組,專項(xiàng)研究開(kāi)發(fā)輔助4個(gè)子庫(kù)轉(zhuǎn)寫(xiě)語(yǔ)料的軟件與方法。在開(kāi)始語(yǔ)料轉(zhuǎn)寫(xiě)前,將這些軟件和方法提供給各方言。

培訓(xùn)專用語(yǔ)料轉(zhuǎn)寫(xiě)軟件的使用。

2015年11月,軟件組完成了兩款專用軟件和兩種快速記音法的研制,部分方言點(diǎn)完成了語(yǔ)料采錄,即將開(kāi)始語(yǔ)料轉(zhuǎn)寫(xiě)。11月7日,項(xiàng)目組召開(kāi)中期研討會(huì),邀請(qǐng)各方言負(fù)責(zé)人和骨干成員參加,議程之一是培訓(xùn)以下4款軟件的使用:

1)詞表標(biāo)音軟件的使用與實(shí)習(xí)(鮑培明副教授講授)

2)聲調(diào)分析軟件VoiceSort的使用與實(shí)習(xí)(宋益丹講師講授)

3)字表同音類記法的使用與實(shí)習(xí)(侯超實(shí)驗(yàn)師講授)

4)詞表快速標(biāo)音法說(shuō)明與實(shí)習(xí)(劉俐李教授講授)

1)和2)是自行研制的軟件,3)和4)是綜合已有軟件、excel表以及方言學(xué)知識(shí)研制的字表、詞表快捷標(biāo)音方法。這4種軟件與方法以及后來(lái)研制的句表標(biāo)音系統(tǒng)有效提高了語(yǔ)料的標(biāo)音效率。

下圖1是課題組成員學(xué)習(xí)詞表標(biāo)音軟件的場(chǎng)景一角。

圖1 學(xué)習(xí)詞表標(biāo)音軟件

下圖2是課題組成員學(xué)習(xí)聲調(diào)分析軟件VoiceSort的場(chǎng)景一角。后排三人是軟件組成員,彎腰站立者是軟件組的鮑培明副教授,她根據(jù)與會(huì)者提出的意見(jiàn)正指導(dǎo)團(tuán)隊(duì)現(xiàn)場(chǎng)修改詞表標(biāo)音軟件的程序。

圖2 學(xué)習(xí)聲調(diào)分析軟件VoiceSort

1.2 軟件研究

2014年7月至今(2016年7月)的兩年里,軟件組研制了兩類軟件。 一是語(yǔ)料庫(kù)管理軟件,二是語(yǔ)料轉(zhuǎn)寫(xiě)軟件。語(yǔ)料庫(kù)管理軟件體現(xiàn)語(yǔ)料庫(kù)的信息化構(gòu)架并保障其運(yùn)行,適用于本庫(kù);語(yǔ)料轉(zhuǎn)寫(xiě)軟件針對(duì)語(yǔ)料個(gè)體,既可用于本庫(kù)語(yǔ)料也可用于其他語(yǔ)料,具有一定通用性。語(yǔ)料轉(zhuǎn)寫(xiě)軟件是方言研究的數(shù)字化工具。

2014年7月3日,首席專家劉俐李教授召集計(jì)算機(jī)科學(xué)、地理信息系統(tǒng)、實(shí)驗(yàn)方言學(xué)三領(lǐng)域的項(xiàng)目成員,專題研討語(yǔ)料庫(kù)管理軟件及語(yǔ)料轉(zhuǎn)寫(xiě)軟件的研制。9月中旬,劉俐李教授與軟件組負(fù)責(zé)人曲維光教授再次商討,確定了具體研究方案。

1.2.1 字庫(kù)與詞庫(kù)管理軟件初步完成

由熟悉方言語(yǔ)料庫(kù)的計(jì)算機(jī)學(xué)者鮑培明副教授具體執(zhí)行語(yǔ)料庫(kù)管理軟件的研究。本項(xiàng)目所建語(yǔ)料庫(kù)有字、詞、句、篇4個(gè)子庫(kù),各庫(kù)數(shù)據(jù)結(jié)構(gòu)不同,4子庫(kù)每條數(shù)據(jù)分別為52、137、38、30字段,管理軟件需要分別設(shè)計(jì)與研制。

2014年11月,完成語(yǔ)料庫(kù)整體設(shè)計(jì)。2015年5月,首先研制出字段最多的字庫(kù)與詞庫(kù)管理軟件。6月,首席專家與實(shí)驗(yàn)方言學(xué)者查看字庫(kù)與詞庫(kù)的管理界面,提出修改意見(jiàn)。2015年10月完成修訂,11月7日,在項(xiàng)目中期研討會(huì)上演示,全體與會(huì)者審閱并提出修改意見(jiàn)。軟件組當(dāng)即研究并修改。會(huì)后建立了項(xiàng)目組專用QQ群,交流討論問(wèn)題。目前已完成修訂,字庫(kù)與詞庫(kù)的界面已可使用。

句庫(kù)與篇庫(kù)管理軟件在研制中。

1.2.2 標(biāo)音軟件“語(yǔ)料庫(kù)標(biāo)音系統(tǒng)”初步完成

2015年7月完成詞庫(kù)標(biāo)音系統(tǒng),經(jīng)方言組試用,提出修改意見(jiàn),修改后再試用,再修改。2015年 11月7日培訓(xùn)骨干成員學(xué)習(xí)使用,聽(tīng)取意見(jiàn),現(xiàn)場(chǎng)修改。在詞庫(kù)標(biāo)音系統(tǒng)的基礎(chǔ)上,11月中旬完成句庫(kù)自動(dòng)標(biāo)音系統(tǒng),并將詞庫(kù)與句庫(kù)標(biāo)音系統(tǒng)合為語(yǔ)料庫(kù)標(biāo)音系統(tǒng)。

句庫(kù)標(biāo)音系統(tǒng)也可用于語(yǔ)篇標(biāo)音:將語(yǔ)篇拆分為句,即可應(yīng)用從而實(shí)現(xiàn)篇庫(kù)的快速標(biāo)音,而拆篇為句也是語(yǔ)篇標(biāo)注的要求。由是,語(yǔ)料庫(kù)標(biāo)音系統(tǒng)可實(shí)現(xiàn)詞、句、篇3個(gè)子庫(kù)的快速標(biāo)音。

1.2.3 初步完成聲調(diào)分析軟件VoiceSort的研究

聲調(diào)是方言記音中的難題,本項(xiàng)目多采用聲學(xué)語(yǔ)音實(shí)驗(yàn)來(lái)完成。聲調(diào)實(shí)驗(yàn)

數(shù)據(jù)的處理是語(yǔ)音學(xué)與方言音系學(xué)的接口,工作量大,處理尺度不易把握,是聲調(diào)實(shí)驗(yàn)研究的難點(diǎn)。本項(xiàng)目研制的聲調(diào)分析軟件VoiceSort可緩解這一難題。

1.2.4 創(chuàng)建字表快速標(biāo)音的“同音類記法”

2015年1月,侯超實(shí)驗(yàn)師與首席專家歸納整理出“同音類記法”。其原理是同音聚類與批量標(biāo)音,作用是給字表快速標(biāo)音。首先要完成方言音系聲韻調(diào)例字的標(biāo)音,然后利用字表中的古音信息聚類,再應(yīng)用EXCEL表的批量處理功能就可快速標(biāo)音。

二、各子課題進(jìn)展情況

本項(xiàng)目有五個(gè)子課題。子課題一是軟件組,研制建庫(kù)系列軟件;子課題二、三、四是方言組,負(fù)責(zé)方言語(yǔ)料的研究;子課題五研究方言韻律。五個(gè)子課題基本依照計(jì)劃完成任務(wù)。

2.1 子課題一:軟件組

負(fù)責(zé)研究語(yǔ)料庫(kù)管理軟件和語(yǔ)料轉(zhuǎn)寫(xiě)軟件,使語(yǔ)料的處理軟件化或半軟件化。設(shè)兩個(gè)分組。第一組由南京師范大學(xué)計(jì)算機(jī)學(xué)院曲維光教授牽頭、鮑培明副教授負(fù)責(zé)。第二組由首席專家劉俐李教授負(fù)責(zé),文學(xué)院宋益丹講師、侯超實(shí)驗(yàn)師實(shí)施。

第一分組已完成四項(xiàng)工作:

(1)語(yǔ)料庫(kù)管理軟件的總體設(shè)計(jì);

(2)字庫(kù)和詞庫(kù)管理軟件的研制,界面已可使用;

(3)詞庫(kù)與句庫(kù)標(biāo)音軟件“語(yǔ)料庫(kù)標(biāo)音系統(tǒng)”的編程,已提交各方言語(yǔ)料研究小組使用,普遍反映良好;

(4)完成項(xiàng)目組前期成果“現(xiàn)代漢語(yǔ)有聲詞匯庫(kù)”的上網(wǎng)改造,并獲得國(guó)家專利。

第二分組已完成兩項(xiàng)工作:

(1) 聲調(diào)分析軟件VoiceSort;

(2) 字表快速標(biāo)音的“同音類記法”。

聲調(diào)分析軟件與同音類記法各方言已使用,反映良好。

該組成員同時(shí)進(jìn)行語(yǔ)言處理及計(jì)算語(yǔ)言學(xué)的相關(guān)研究,發(fā)表論文2篇,獲得專利1項(xiàng)。

2.2 子課題二:西部北部方言語(yǔ)料研究

負(fù)責(zé)北方官話二級(jí)分區(qū)及晉語(yǔ)的9個(gè)方言點(diǎn)的語(yǔ)料研究。負(fù)責(zé)人蘭州城市學(xué)院莫超教授。2014年7月至今(2016年7月),完成了7個(gè)方言點(diǎn)的語(yǔ)料采錄,開(kāi)始語(yǔ)料轉(zhuǎn)寫(xiě)。另2個(gè)方言點(diǎn)預(yù)計(jì)2016年12月前完成采錄。

該組成員同時(shí)進(jìn)行本方言的相關(guān)研究,出版專著2部,發(fā)表論文21篇,完成3.3萬(wàn)字的調(diào)研報(bào)告1份,該報(bào)告獲市社科聯(lián)科研二等獎(jiǎng)。

自2014年至今,該組成員獲得國(guó)家社科基金課題2項(xiàng):語(yǔ)言接觸視閾下的河州方言形成與演變研究(2015),黑龍江省漢語(yǔ)方言地圖集(2016);獲得國(guó)家語(yǔ)委、教育部“中國(guó)語(yǔ)言資源保護(hù)工程專項(xiàng)任務(wù)”5項(xiàng)(山西平遙,黑龍江哈爾濱、肇東,甘肅蘭州、文縣);獲得教育部社科項(xiàng)目1項(xiàng):絲綢之路經(jīng)濟(jì)帶甘肅段語(yǔ)言文字使用狀況研究(2015)。

2.3 子課題三:中部東部方言語(yǔ)料研究

負(fù)責(zé)吳語(yǔ)、徽語(yǔ)、湘語(yǔ)、江淮官話共6個(gè)方言點(diǎn)的語(yǔ)料研究。負(fù)責(zé)人浙江師范大學(xué)王洪鐘教授。

2014年7月至今,6個(gè)方言點(diǎn)全部完成語(yǔ)料錄制,已開(kāi)始語(yǔ)料轉(zhuǎn)寫(xiě)。

該組成員同時(shí)進(jìn)行本方言的相關(guān)研究,出版著作1部,發(fā)表論文18篇。

自2014年至今,該組成員獲得國(guó)家社科基金課題2項(xiàng):蘇北江淮官話的地理語(yǔ)言學(xué)研究(2015)、南部吳語(yǔ)發(fā)聲類型多維特征參數(shù)實(shí)驗(yàn)研究(2015);教育部人文社科基金課題1項(xiàng):吳語(yǔ)特殊發(fā)聲類型研究(2014);國(guó)家語(yǔ)委、教育部“中國(guó)語(yǔ)言資源保護(hù)工程專項(xiàng)任務(wù)”3項(xiàng)(浙江江山方言、江山文化、衢州);中國(guó)博士后基金課題2項(xiàng):蘇北方言語(yǔ)音的現(xiàn)狀及歷史演變研究(2014),石臼湖流域方言的地理語(yǔ)言學(xué)研究(2015);省教育廳課題2項(xiàng):安徽宣州吳語(yǔ)語(yǔ)言資源調(diào)查(2014),湘語(yǔ)與贛語(yǔ)共同特征的歷史比較研究(2014)。

2.4 子課題四:南部方言語(yǔ)料研究

負(fù)責(zé)粵語(yǔ)、閩語(yǔ)、客家話、贛語(yǔ)4個(gè)方言點(diǎn)的語(yǔ)料研究,負(fù)責(zé)人暨南大學(xué)陳曉錦教授。2014年7月至今(2016年7月),該組完成3方言點(diǎn)語(yǔ)料的錄制,開(kāi)始語(yǔ)料轉(zhuǎn)寫(xiě)。剩余的1個(gè)方言點(diǎn)預(yù)計(jì)2016年12月前完成采錄。

該組成員同時(shí)進(jìn)行本方言的相關(guān)研究,發(fā)表論文10篇。

2014年該組成員獲得國(guó)家社科基金課題2項(xiàng)(重大與重點(diǎn)各一):海外華人社區(qū)漢語(yǔ)方言與文化研究(重大)、美國(guó)華人社區(qū)漢語(yǔ)方言與文化研究(重點(diǎn))。

2.5 子課題五:方言口語(yǔ)韻律研究

負(fù)責(zé)人南京師范大學(xué)顧文濤教授。根據(jù)開(kāi)題評(píng)審專家“收縮任務(wù)”“研究韻律詞變調(diào)”的意見(jiàn),本組研究任務(wù)有所調(diào)整。

該組目前已完成的研究:

(1) 南京、徐州、蘇州、常州方言句焦點(diǎn)重音的韻律編碼方法的對(duì)比研究;

(2) 基于聲調(diào)格局的“邊緣吳語(yǔ)”概念研究;

(3) 仙居話內(nèi)爆音發(fā)聲態(tài)研究。

正在進(jìn)行的研究:

(1)江淮官話和吳語(yǔ)的發(fā)聲態(tài)研究;

(2)方言區(qū)的情感語(yǔ)音特征研究。

該組成員同時(shí)進(jìn)行韻律及方言的相關(guān)研究,發(fā)表論文6篇。

三、調(diào)查研究

有文獻(xiàn)調(diào)查和實(shí)地語(yǔ)料調(diào)查研究?jī)深悺?/p>

3.1 文獻(xiàn)調(diào)查

文獻(xiàn)調(diào)查的主要目的是擬制各方言語(yǔ)料采制底本,其次是梳理各方言音系的已有研究。已完成采錄的17方言在2014年7月前已完成文獻(xiàn)調(diào)查,F(xiàn)有3個(gè)方言點(diǎn)正在調(diào)查研究相關(guān)文獻(xiàn)。

3方言之一的贛語(yǔ)已完成語(yǔ)料采制底本的擬制,正在查閱梳理音系研究文獻(xiàn)。冀魯官話與中原官話正在調(diào)查研究本方言特有文化與特征詞的相關(guān)文獻(xiàn),查閱梳理本方言音系研究的相關(guān)文獻(xiàn),然后撰寫(xiě)本方言特有語(yǔ)料采制底本與音系研究綜述,預(yù)計(jì)于8月底完成并提交審核。

3.2 實(shí)地調(diào)研

已完成的17方言點(diǎn)的語(yǔ)料均在方言當(dāng)?shù)卣{(diào)查與錄制。有些方言點(diǎn)調(diào)查與錄制分?jǐn)?shù)次完成(多在上課期間),有的集中時(shí)間一次完成(多在假期)。另3個(gè)方言點(diǎn)將于2016年9月至12月赴當(dāng)?shù)卣{(diào)查。

四、舉辦學(xué)術(shù)會(huì)議

2015-2016年舉辦了三次學(xué)術(shù)會(huì)議:

(1) 本項(xiàng)目中期研討會(huì)(項(xiàng)目組全體骨干成員會(huì)議,南京,2015)

(2) 2015實(shí)驗(yàn)方言學(xué)論壇(全國(guó)性學(xué)術(shù)會(huì)議,南京,2015)

(3) 第五屆海外漢語(yǔ)方言國(guó)際學(xué)術(shù)研討會(huì)(國(guó)際學(xué)術(shù)會(huì)議,美國(guó)舊金山,2016)

4.1本項(xiàng)目中期研討會(huì)2015年11月在南京召開(kāi)

11月6日?qǐng)?bào)到,11月7日召開(kāi)。項(xiàng)目組全體骨干成員從全國(guó)各地赴會(huì)(有兩人請(qǐng)假,派員參會(huì))。下圖3為與會(huì)者合影。

  

圖3 項(xiàng)目中期研討會(huì)合影

會(huì)議有三項(xiàng)議程:(1)匯報(bào)課題進(jìn)展與問(wèn)題:(2)審議語(yǔ)料庫(kù)管理軟件;(3)培訓(xùn)4款語(yǔ)料轉(zhuǎn)寫(xiě)軟件(方法)。

表2 “漢語(yǔ)方言自然口語(yǔ)有聲基礎(chǔ)語(yǔ)料庫(kù)建設(shè)”中期研討會(huì)日程

會(huì)議按照以上日程順利進(jìn)行。聚焦點(diǎn)是鮑培明副教授演示的語(yǔ)料庫(kù)網(wǎng)頁(yè)設(shè)計(jì),與會(huì)者提出了各種建設(shè)性意見(jiàn)。其次是各方言點(diǎn)語(yǔ)料采制工作,全體成員具體探討了語(yǔ)料采錄、整理及語(yǔ)料轉(zhuǎn)寫(xiě)的各類問(wèn)題。

4款語(yǔ)料轉(zhuǎn)寫(xiě)軟件(方法)的培訓(xùn)采用講解與現(xiàn)場(chǎng)實(shí)習(xí)模式,講解后隨即試用并提出修改意見(jiàn),講者與聽(tīng)者均有收益。

4.2 舉辦“2015實(shí)驗(yàn)方言學(xué)論壇”(南京,11月)

這是第二屆實(shí)驗(yàn)方言學(xué)論壇。由中國(guó)語(yǔ)言學(xué)會(huì)語(yǔ)音學(xué)分會(huì)主辦、本項(xiàng)目所屬南京師范大學(xué)文學(xué)院與南京師范大學(xué)綜合語(yǔ)音實(shí)驗(yàn)室承辦。五十余名國(guó)內(nèi)外著名實(shí)驗(yàn)語(yǔ)音學(xué)家、方言學(xué)家及青年學(xué)者出席會(huì)議,本項(xiàng)目中期會(huì)議與會(huì)者均出席。下圖是合影。會(huì)議的主旨之一是推動(dòng)方言研究數(shù)字化,這是本項(xiàng)目建設(shè)的兩項(xiàng)目標(biāo)之一。項(xiàng)目組發(fā)布了前期電子成果“現(xiàn)代漢語(yǔ)方言有聲詞匯庫(kù)”。

應(yīng)《方言》雜志主編麥耘教授約稿,“2015實(shí)驗(yàn)方言學(xué)論壇”的會(huì)訊發(fā)布于《方言》2016年第1期。

圖4 項(xiàng)目組舉辦的全國(guó)性學(xué)術(shù)會(huì)議的

4.3 舉辦“第五屆海外漢語(yǔ)方言國(guó)際研討會(huì)學(xué)術(shù)”(2016,美國(guó)舊金山)

7月15-17日在美國(guó)舊金山召開(kāi)。由美國(guó)舊金山大學(xué)與中國(guó)暨南大學(xué)聯(lián)合主辦,本項(xiàng)目子課題負(fù)責(zé)人陳曉錦教授是中方主辦人,本項(xiàng)目首席專家與另一位方言子課題負(fù)責(zé)人出席。這是漢語(yǔ)方言學(xué)術(shù)會(huì)議第一次走出國(guó)門,與陳曉錦教授2014年中標(biāo)的國(guó)家社科基金重大項(xiàng)目“海外華人社區(qū)漢語(yǔ)方言與文化研究”(14ZDB107)相呼應(yīng)。國(guó)際國(guó)內(nèi)50余名方言學(xué)者出席會(huì)議,中心議題除海外漢語(yǔ)方言與文化的研究外,還包括方言研究的數(shù)字化。

五、學(xué)術(shù)交流

5.1 出席學(xué)術(shù)會(huì)議

2014年7月至2016年7月,項(xiàng)目組成員出席國(guó)際、國(guó)內(nèi)重要學(xué)術(shù)會(huì)議50人次。

除由項(xiàng)目組舉辦的“第五屆海外漢語(yǔ)方言國(guó)際研討會(huì)學(xué)術(shù)”“(2016年7月,美國(guó)舊金山)和“2015實(shí)驗(yàn)方言學(xué)論壇”(2015年11月,南京)外,其他重要會(huì)議還有:“第十二屆全國(guó)語(yǔ)音學(xué)學(xué)術(shù)會(huì)議”(2016年7月,通遼),“漢語(yǔ)方言國(guó)際學(xué)術(shù)高端論壇”(2015年9月,成都),“首屆亞太語(yǔ)言文化生態(tài)國(guó)際會(huì)議”(2015年6月,廣州),“中國(guó)語(yǔ)言學(xué)會(huì)第十七屆學(xué)術(shù)年會(huì)” ( 2014年9月,北京),“he 3rd CCF Conference on Natural Language Processing & Chinese Computing(NLPCC 2014)”(2014年12月,深圳),“‘動(dòng)態(tài)普通話:變異與規(guī)范’首屆學(xué)術(shù)研討會(huì)”(2014年11月,澳門),“第47屆國(guó)際漢藏語(yǔ)言暨語(yǔ)言學(xué)會(huì)議”(2014年10月,昆明),“第十三屆全國(guó)計(jì)算語(yǔ)言學(xué)學(xué)術(shù)會(huì)議(CCL2014)”(2014年10月,武漢),“第十一屆中國(guó)語(yǔ)音學(xué)學(xué)術(shù)會(huì)議”(2014年8月,烏魯木齊),“Australian International Speech Science and Technology Conference 2014”(2014年12月,新西蘭Christchurch),等。

5.2學(xué)術(shù)講座

2014年7月至2016年7月,項(xiàng)目組成員應(yīng)邀在國(guó)內(nèi)外講座11人次。

2016年4月,劉俐李教授應(yīng)邀在南京曉莊學(xué)院做“漢語(yǔ)方言地理信息系統(tǒng)”講座。

2016年4月,顧文濤教授應(yīng)邀在日本東京大學(xué)做“Speech prosody of Chinese languages(漢語(yǔ)演講的韻律)”講座。

2015年11月,顧文濤教授應(yīng)邀在意大利那不勒斯東方大學(xué)做“Quantitative analysis of L1 and L2 Mandarin speech prosody(L1和L2普通話韻律的定量分析)”講座。

2015年9月,顧文濤教授應(yīng)邀在德國(guó)基爾大學(xué)做“From function to form in the study of Mandarin speech prosody(漢語(yǔ)韻律的功能與形式研究)”講座。

2015年7月,劉俐李教授應(yīng)全國(guó)漢語(yǔ)方言學(xué)會(huì)邀請(qǐng)?jiān)凇皾h語(yǔ)方言田野調(diào)查高級(jí)研修班”(上海交通大學(xué))做“方言研究數(shù)字化”講座。

2015年4月,劉俐李教授應(yīng)邀在湖南科技大學(xué)做“漢語(yǔ)方言地理信息系統(tǒng)”講座。

2015年3月,莫超教授應(yīng)邀在隴南市政府做“‘氐羌來(lái)賓’:遠(yuǎn)古走來(lái)的白馬藏人”。

2014年12月,顧文濤教授應(yīng)邀在澳大利亞麥考瑞大學(xué)做“Stress, tone and intonation in L2 Mandarin speech by English and Cantonese learners”講座。

2014年11月,劉俐李教授應(yīng)邀在澳門大學(xué)講學(xué)一周,有兩個(gè)專題:(1)現(xiàn)代語(yǔ)音學(xué)研究與應(yīng)用;(2)方言音系(聲韻調(diào))的系列實(shí)驗(yàn)研究。

2014年8月,劉俐李教授應(yīng)全國(guó)漢語(yǔ)方言學(xué)會(huì)邀請(qǐng)?jiān)凇?014田野調(diào)查語(yǔ)音學(xué)研修班”(珠海)講授“方言音系實(shí)驗(yàn)”。

六、成果宣傳推介情況

成果推介。項(xiàng)目組在“2015實(shí)驗(yàn)方言學(xué)論壇”宣傳并推介前期電子成果“現(xiàn)代漢語(yǔ)方言有聲詞匯庫(kù)”。

2014年7月至今(2016年7月),項(xiàng)目組在《中國(guó)社會(huì)科學(xué)報(bào)》發(fā)表4篇文章介紹本項(xiàng)目學(xué)術(shù)思想與研究成果:“數(shù)字化推動(dòng)特色方言口語(yǔ)庫(kù)建設(shè)”(2014/8/11),“漢語(yǔ)河州話的形成及其語(yǔ)言性質(zhì)”(2015/9/10),“從西北方言文獻(xiàn)角度考察文化變遷”(2016/2/25),“氐羌來(lái)賓”:遠(yuǎn)古走來(lái)的白馬藏人”(2015/4/15)。

本項(xiàng)目倡導(dǎo)并實(shí)踐的“方言研究數(shù)字化”已為國(guó)家社科規(guī)劃辦采納,列為2014年度國(guó)家社會(huì)科學(xué)基金項(xiàng)目語(yǔ)言學(xué)課題指南的第12號(hào)“方言研究數(shù)字化基礎(chǔ)建設(shè)研究”(首席專家劉俐李教授2011年將“方言研究數(shù)字化基礎(chǔ)建設(shè)”上報(bào)“國(guó)家哲學(xué)社會(huì)科學(xué)重大基礎(chǔ)理論研究選題建議”)。

工作簡(jiǎn)報(bào)。2014年7月呈報(bào)中期評(píng)估報(bào)告(1.76萬(wàn)字),2015年7月撰寫(xiě)了中期評(píng)估報(bào)告(2.37萬(wàn)字,上報(bào)未收),12月呈報(bào)《工作簡(jiǎn)報(bào)》(0.8萬(wàn)字)。

七、研究中存在的主要問(wèn)題和改進(jìn)措施

因經(jīng)費(fèi)少、工作量大而造成一些操作性困難。開(kāi)題時(shí)項(xiàng)目組根據(jù)下?lián)芙?jīng)費(fèi)情況收縮了任務(wù),但方言布點(diǎn)與語(yǔ)料庫(kù)結(jié)構(gòu)只能微調(diào)無(wú)法大減,否則會(huì)傷及項(xiàng)目的基礎(chǔ)設(shè)計(jì)。項(xiàng)目組想方設(shè)法應(yīng)對(duì)這一困難,主管單位也盡力協(xié)助。

7.1 因任務(wù)重經(jīng)費(fèi)少有6方言負(fù)責(zé)人請(qǐng)辭

方言子項(xiàng)目負(fù)責(zé)人先后有6人請(qǐng)辭(贛語(yǔ)、閩語(yǔ)(2)、客家話、冀魯官話與西南官話)。

不少方言點(diǎn)負(fù)責(zé)人同時(shí)承擔(dān)國(guó)家語(yǔ)委、教育部的“中國(guó)語(yǔ)言資源保護(hù)工程專項(xiàng)任務(wù)”。該項(xiàng)目每方言點(diǎn)撥經(jīng)費(fèi)8萬(wàn)(方言語(yǔ)料)和15萬(wàn)(文化語(yǔ)料),本項(xiàng)目只有2萬(wàn)。以8萬(wàn)計(jì),為本項(xiàng)目的4倍,而本項(xiàng)目工作量為其4倍多(見(jiàn)表3數(shù)據(jù))。負(fù)責(zé)人請(qǐng)辭也是事出有因。

表3 兩項(xiàng)目單方言點(diǎn)語(yǔ)料量及經(jīng)費(fèi)對(duì)比

解決辦法:改由項(xiàng)目組承擔(dān)此6方言的語(yǔ)料研制。

項(xiàng)目組曾多方設(shè)法另找方言點(diǎn)負(fù)責(zé)人,但無(wú)合適者:或本人愿意但與課題要求不符,或雖符合課題要求而本人得知任務(wù)后又打退堂鼓。

問(wèn)題雖已解決,但此6方言進(jìn)度后延,影響到項(xiàng)目的整體進(jìn)度。原計(jì)劃2016年12月完成全部語(yǔ)料研制,2017年試運(yùn)行語(yǔ)料庫(kù)并完善語(yǔ)料庫(kù)管理軟件。但此6方言的語(yǔ)料研制預(yù)計(jì)分別于2017年與2018年完成,原定2017年的工作只得順延。

二、研究成果情況

一、代表性成果

以下所列5項(xiàng)成果均與方言研究的革新和數(shù)字化有關(guān),方言研究數(shù)字化是本項(xiàng)目的建設(shè)目標(biāo)之一。

國(guó)家社科重大項(xiàng)目除完成所設(shè)定的研究任務(wù)外,還應(yīng)有益于學(xué)科建設(shè)。漢語(yǔ)方言學(xué)從20世紀(jì)20年代誕生至今已近一個(gè)世紀(jì),碩果累累。但需要發(fā)展。我們認(rèn)為,漢語(yǔ)方言學(xué)承繼先賢智慧與碩果,對(duì)語(yǔ)言靜態(tài)基礎(chǔ)單位字、詞的研究已達(dá)極致,儲(chǔ)備了足夠的發(fā)展勢(shì)能。探索語(yǔ)言動(dòng)態(tài)運(yùn)作基本單位語(yǔ)篇,應(yīng)是本世紀(jì)漢語(yǔ)方言學(xué)發(fā)展的重要方向,因?yàn)檎Z(yǔ)篇的動(dòng)態(tài)研究更能揭示語(yǔ)言本質(zhì),故此,國(guó)際語(yǔ)言學(xué)界近年推崇立足于語(yǔ)篇研究的功能語(yǔ)言學(xué)。但研究語(yǔ)篇的工作量遠(yuǎn)大于字詞,傳統(tǒng)的作坊式手工勞動(dòng)已不能勝任,與之匹配的應(yīng)是方言研究的數(shù)字化,包括①采錄語(yǔ)料數(shù)字化,②確定語(yǔ)料音質(zhì)實(shí)驗(yàn)數(shù)據(jù)化,③轉(zhuǎn)寫(xiě)標(biāo)注語(yǔ)料軟件化,④匯集語(yǔ)料數(shù)據(jù)庫(kù)化,⑤繪制方言地圖平臺(tái)化,⑥刊布成果自控化(《中國(guó)社會(huì)科學(xué)報(bào)》2014年8月11日)。所報(bào)5項(xiàng)成果與上述①至④有關(guān)。這5項(xiàng)成果都很稚嫩,但這是我們邁出的第一步,祈望能拋磚引玉,推動(dòng)方言研究的數(shù)字化發(fā)展。

1.1《漢語(yǔ)方言語(yǔ)料采制手冊(cè)》(16.6萬(wàn)字)

這是本項(xiàng)目工作的法規(guī)性文件。2013年完成初稿,2014年試用后修訂,2015年再試用再修訂,同年11月在項(xiàng)目中期研討會(huì)印發(fā)紙質(zhì)本。該手冊(cè)分上下兩編。

如上所述,轉(zhuǎn)型語(yǔ)篇研究是本世紀(jì)漢語(yǔ)方言學(xué)發(fā)展的重要方向,本手冊(cè)下編為方言學(xué)轉(zhuǎn)型提供了語(yǔ)料采集的初本。與方言語(yǔ)篇研究匹配的研究方式是方言研究的數(shù)字化,本手冊(cè)上編提供了語(yǔ)料采集數(shù)字化初案。

上編有梳理資料、采錄語(yǔ)料與整理語(yǔ)料三項(xiàng)規(guī)范。

(1)資料規(guī)范:有擬制文化語(yǔ)料及特征詞規(guī)范,確定音系規(guī)范。

(2)采錄規(guī)范:有采錄對(duì)象、采錄內(nèi)容、音頻采錄與處理、視頻采錄與處理、拍照等五項(xiàng)規(guī)范。同時(shí)提供具體操作指導(dǎo)。

(3)語(yǔ)料整理規(guī)范:有音頻與視頻剪輯、轉(zhuǎn)寫(xiě)漢字、標(biāo)注國(guó)際音標(biāo)、字詞標(biāo)注及復(fù)核、例句標(biāo)注及復(fù)核、語(yǔ)篇標(biāo)注、數(shù)據(jù)模板、入庫(kù)數(shù)據(jù)語(yǔ)料包等八項(xiàng)操作規(guī)范。同時(shí)寫(xiě)明各類軟件的使用方法、操作步驟與具體要求。

下編有語(yǔ)料概覽、基礎(chǔ)語(yǔ)料與語(yǔ)篇語(yǔ)料三部分。

(1)語(yǔ)料概覽:用6張表列出采錄底本的結(jié)構(gòu)、語(yǔ)料種類、數(shù)量,各類語(yǔ)料錄制時(shí)長(zhǎng)、錄制方式,不同角色發(fā)音人的具體任務(wù)。

(2)基礎(chǔ)語(yǔ)料:有單字4002個(gè),雙音節(jié)韻律詞546組(研究變調(diào)用),詞匯約5600(核心詞200、基礎(chǔ)詞29類5260詞、特征詞100-300),語(yǔ)法例句100。

(3)語(yǔ)篇語(yǔ)料:有話本、話題、自話三類。話本語(yǔ)篇有六類,分所有方言通用與各方言特用。話題語(yǔ)篇有四類:?jiǎn)慰跀⑹鲂、多口交互型、儀式型、藝術(shù)型,每類提供話題及引導(dǎo)詞。自話語(yǔ)篇有自然場(chǎng)景與特定場(chǎng)景兩種。

上編集中闡述采制方言語(yǔ)料的數(shù)字化方式與技術(shù)手段。下編是以語(yǔ)篇為核心的自成體系的語(yǔ)篇采錄大綱。就我們目力所及,語(yǔ)篇調(diào)查大綱在漢語(yǔ)方言學(xué)界尚未見(jiàn),本手冊(cè)應(yīng)是首次。

1.2 現(xiàn)代漢語(yǔ)方言有聲詞匯庫(kù)V1.0(網(wǎng)址:fych.njnu.edu.cn,4.94G)

語(yǔ)料庫(kù)是儲(chǔ)存語(yǔ)料的數(shù)字化方式!艾F(xiàn)代漢語(yǔ)方言有聲詞匯庫(kù)”是本項(xiàng)目的前期成果,可在網(wǎng)上查詢使用,是一個(gè)兼顧語(yǔ)音的方言有聲詞匯庫(kù)。2016年取得國(guó)家計(jì)算機(jī)軟件著作權(quán)(登記號(hào)2016SR157089)。由兩期211重點(diǎn)學(xué)科建設(shè)項(xiàng)目資助建設(shè),10年中約40名碩士生、博士生參與研究。2008年建成單機(jī)光盤版,2012年改造成網(wǎng)絡(luò)版。經(jīng)多次語(yǔ)料復(fù)核后2015年11月上網(wǎng),更名為“現(xiàn)代漢語(yǔ)方言有聲數(shù)據(jù)庫(kù)”(該庫(kù)還有二期建設(shè)的其他語(yǔ)料,但未完成復(fù)核,未上網(wǎng),該庫(kù)目前只有詞匯)。下圖是其首頁(yè)。

圖8 “現(xiàn)代漢語(yǔ)方言有聲詞匯庫(kù)”首頁(yè)

該庫(kù)所選方言點(diǎn)分布于全國(guó)10大方言區(qū),覆蓋官話的8個(gè)二級(jí)區(qū),以及湘、閩、吳語(yǔ)的部分二級(jí)區(qū)。每方言點(diǎn)錄制詞匯3600~4000條。每條數(shù)據(jù)有26字段,分5類:詞項(xiàng),詞屬,詞音,詞義,詞性。詞項(xiàng)是綱,統(tǒng)領(lǐng)各方言詞義;“詞屬”標(biāo)明每一詞條的詞匯大類(基礎(chǔ)詞、核心詞、特征詞);“詞音、詞義、詞性”

描寫(xiě)詞條的內(nèi)部構(gòu)造。詞音與詞義并注,聲音與文本同現(xiàn),集中反映方言詞匯的共性和個(gè)性?蓮姆窖浴⒃~項(xiàng)、詞屬、詞音、詞義、詞性等不同角度檢索詞匯,還可進(jìn)行聲母、韻母、韻尾、調(diào)類、調(diào)值、音節(jié)數(shù)等單項(xiàng)或多項(xiàng)語(yǔ)音檢索?蛇x擇單點(diǎn)或多點(diǎn)方言組合檢索。可在檢索結(jié)果中進(jìn)行10次再檢索。每種檢索同時(shí)匹配文本與聲音,并有計(jì)數(shù)。可用于語(yǔ)音、詞匯的專項(xiàng)研究,也可用作教學(xué)演示,如方言課、語(yǔ)音課,中小學(xué)語(yǔ)文課,文化課等,也可供社會(huì)使用。

本項(xiàng)目所建語(yǔ)料庫(kù)與此詞匯庫(kù)不同:(1)本項(xiàng)目所建庫(kù)有字庫(kù)、詞庫(kù)、句庫(kù)和語(yǔ)篇庫(kù),該庫(kù)只是兼顧語(yǔ)音的詞匯庫(kù);(2)本項(xiàng)目詞庫(kù)每方言有5600詞,該庫(kù)是3600~4000詞;(3)本項(xiàng)目詞庫(kù)數(shù)據(jù)有137字段,該庫(kù)為26字段;(4)兩庫(kù)的方言布點(diǎn)與發(fā)音人皆有不同。

1.3 語(yǔ)料庫(kù)標(biāo)音系統(tǒng)

這是一個(gè)給方言詞和方言句子自動(dòng)標(biāo)注國(guó)際音標(biāo)的軟件。由鮑培明副教授團(tuán)隊(duì)研制。軟件自身占用空間6兆。無(wú)需安裝,直接復(fù)制即可使用。該標(biāo)音系統(tǒng)附有使用說(shuō)明,有文有圖,按圖索驥便可操作。使用前將要標(biāo)音的詞表、句表與已標(biāo)好音的字表復(fù)制到軟件指定位置。然后運(yùn)行程序,即可自動(dòng)完成詞表與句表的標(biāo)音。漢字標(biāo)音后需要手動(dòng)標(biāo)注詞匯中的音變,如變調(diào)、變聲與變韻。

本項(xiàng)目各方言已使用,普遍反映提高了標(biāo)音效率。其他方言也可使用,前提是按照本項(xiàng)目字表、詞表與句表的格式輸入數(shù)據(jù)。

1.4 同音類記法

是一種快速記音法,基本原理是聚類同音字、批量記音,而不必一字一記。按照同音聚類原理,利用EXCEL表的批量處理功能,即可實(shí)現(xiàn)字表的快速記音。關(guān)鍵步驟是聚類同音字、批量記音與校音。記音的第一步是給方言音系的聲韻調(diào)例字標(biāo)注方音;第二步利用方音與古音的對(duì)應(yīng)關(guān)系聚類同音字;第三步用EXCEL表的批量處理功能記錄字音;第四步關(guān)聯(lián)漢字音檔與標(biāo)音,運(yùn)用同音校對(duì)法核對(duì)標(biāo)記的字音,校正與古音不對(duì)應(yīng)的字音。

該方法由侯超實(shí)驗(yàn)師與劉俐李教授歸納整理。

1.5方言聲調(diào)分析軟件VoiceSort

這是一款用于分析和歸納方言聲調(diào)的軟件。由宋益丹講師研制。

軟件的設(shè)計(jì)思路是對(duì)接praat基頻提取腳本,實(shí)現(xiàn)方言聲調(diào)五度值轉(zhuǎn)換的批量處理,提升方言聲調(diào)系統(tǒng)歸納的效率。VoiceSort分析和歸納方言聲調(diào)系統(tǒng)的

優(yōu)勢(shì):

(1)根據(jù)五度值曲線進(jìn)行調(diào)類歸納,不受主觀因素干擾,聲調(diào)系統(tǒng)的歸納過(guò)程更具科學(xué)性,并有助于發(fā)現(xiàn)聲調(diào)系統(tǒng)的動(dòng)態(tài)變化;

(2)批量處理多個(gè)文件(如老男、老女、青男、青女),無(wú)需分次打開(kāi),大大提高聲調(diào)歸納的效率;

(3)所有樣本的作圖自動(dòng)完成,一步到位;數(shù)據(jù)與圖表直接以excel表形式輸出,便于數(shù)據(jù)匯總和結(jié)果呈現(xiàn)。

目前已完成單字調(diào)的分析部分,預(yù)計(jì)于2017年1月完成雙字調(diào)系統(tǒng)的自動(dòng)化處理,實(shí)現(xiàn)軟件的全部功能。

同音類記法、語(yǔ)料庫(kù)標(biāo)音系統(tǒng)與方言聲調(diào)分析軟件VoiceSort,是針對(duì)本項(xiàng)目字表、詞表、句表的標(biāo)音以及聲調(diào)研究的數(shù)據(jù)處理工具,覆蓋了本項(xiàng)目4個(gè)子庫(kù)的語(yǔ)料標(biāo)音(語(yǔ)篇可拆分成句應(yīng)用標(biāo)音系統(tǒng))。這套方言研究的系列數(shù)字化工具有效緩解了本項(xiàng)目語(yǔ)料標(biāo)注的難題,同樣也應(yīng)有助于其他同類研究。

2014年至2016年,項(xiàng)目組成員獲立國(guó)家社科基金課題6項(xiàng),其中重大項(xiàng)目1項(xiàng),重點(diǎn)課題1項(xiàng)。

二、成果清單 見(jiàn)下頁(yè)。

成果清單

課題組供稿

(責(zé)編:沈王一)
黄浦区| 夏河县| 苏尼特左旗| 沙坪坝区| 沾化县| 桦川县| 乌什县| 高尔夫| 津市市| 武山县| 伊春市| 巨鹿县| 海淀区| 从江县| 彭州市| 三穗县| 福贡县| 沅江市| 岫岩| 海淀区| 峡江县| 阜康市| 永吉县| 梁山县| 萨嘎县| 县级市| 措勤县| 库尔勒市| 荣成市| 长子县| 张家港市| 东阿县| 荔波县| 子长县| 偃师市| 永州市| 长沙市| 清河县| 台州市| 吴川市|