舊版網(wǎng)站入口

站內搜索

“中國少數(shù)民族語言語音聲學參數(shù)統(tǒng)一平臺建設研究”中期檢查情況

2015年07月30日10:51來源:全國哲學社會科學工作辦公室

一、研究進展情況

一、 研究計劃總執(zhí)行情況

本項目總體上按照原計劃實施。到目前為止共完成了蒙古語、維吾爾語、鄂溫克語、土族語、東部裕固語、哈薩克語、錫伯語、鄂倫春語和東鄉(xiāng)語等9種語言的索引庫、聲樣庫、音段標注庫和聲學參數(shù)標注庫,已建立了蒙古、維吾爾、鄂溫克、哈薩克、東部裕固和土族等6種語言的“語音聲學參數(shù)數(shù)據(jù)庫”(其中,蒙古、維吾爾、鄂溫克等三種語言的參數(shù)庫為熟參數(shù)庫),正在研制錫伯語、鄂倫春語和東鄉(xiāng)語的語音參數(shù)庫。聲學參數(shù)自動標注/提。簽樘岣吖ぷ餍剩2013年1月份開始我們課題組開始考慮聲學參數(shù)自動標注和采集問題。在課題組成員的不懈努力下,目前我們已經(jīng)實現(xiàn)了聲學參數(shù)標注和采集的自動化目標。初步搭建了基于蒙古、維吾爾和鄂溫克等三種語言的“語音聲學參數(shù)統(tǒng)一平臺”的框架。

二、 子課題進行情況

蒙古語族語言語音聲學參數(shù)庫(共4種語言)

(1)索引庫:完成了蒙古、土族、東部裕固、東鄉(xiāng)等4種語言的索引庫。

(2)聲樣庫:完成了蒙古、土族、東部裕固、東鄉(xiāng)等4種語言的聲樣庫。

(3)音段標注庫:完成了蒙古、土族、東部裕固、東鄉(xiāng)等4種語言的音段標注庫。

(4)聲學參數(shù)標注庫:完成了蒙古、土族、東部裕固等3種語言的參數(shù)標注庫。

(5)聲學參數(shù)庫:研制了蒙古、土族、東部裕固等3種語言的參數(shù)庫。其中,土族、東部裕固等2種語言的參數(shù)庫為“半熟庫”。

突厥語族語言語音聲學參數(shù)庫(共2種語言)

(1)索引庫:完成了維吾爾、哈薩克等2種語言的索引庫。

(2)聲樣庫:完成了維吾爾、哈薩克等2種語言的聲樣庫。

(3)音段標注庫:完成了維吾爾、哈薩克等2種語言的音段標注庫。

(4)聲學參數(shù)標注庫:完成了維吾爾、哈薩克等2種語言的參數(shù)標注庫。

(5)聲學參數(shù)庫:研制了維吾爾、哈薩克等2種語言的參數(shù)庫。其中,哈薩克語的參數(shù)庫為“半熟庫”。

滿通語族語言語音聲學參數(shù)庫(共3種語言)

(1)索引庫:完成了鄂溫克、錫伯和鄂倫春等3種語言的索引庫。

(2)聲樣庫:完成了鄂溫克、錫伯和鄂倫春等3種語言的聲樣庫。

(3)音段標注庫:完成了鄂溫克、錫伯和鄂倫春等3種語言的音段標注庫。

(4)聲學參數(shù)標注庫:完成了鄂溫克、錫伯和鄂倫春等3種語言的參數(shù)標注庫。

(5)聲學參數(shù)庫:研制了鄂溫克、錫伯和鄂倫春等3種語言的參數(shù)庫。其中,錫伯語和鄂倫春語的參數(shù)庫為“半熟庫”。

統(tǒng)一平臺建設

研制了以下幾個工具

(1)生成三層標注文件格式工具

(2)生成八層標注文件格式工具

(3)自動修改文件名工具

(4)自動加五層標注層加詞邊界工具

(5)自動反轉前三層并加五層工具

標準、特征集和管理程序

(6)確定統(tǒng)一的詞表編寫方法和標準

(7)確定統(tǒng)一的語音信號采集方法和標準

(8)確定統(tǒng)一的特征集

(9)確定統(tǒng)一的語音標注方法和標準

(10)編寫聲學參數(shù)自動標注軟件(1.0版-3.3版)

(11)編寫聲學參數(shù)自動提取軟件(1.0版-3.5版)

(12)研制統(tǒng)一的語音聲學參數(shù)管理平臺

三、 調查研究及學術交流情況

調查研究:自2013年7月開始,我們課題組前后赴內蒙古自治區(qū)正藍旗、鄂溫克族自治旗、鄂倫春族自治旗、新疆維吾爾自治區(qū)伊犁州、甘肅省肅南裕固族自治縣、青;ブ磷遄灾慰h等地進行語言調查和語音信號采集工作,采集了蒙古語、土族語、東鄉(xiāng)語、東部裕固語、保安語、維吾爾語、哈薩克語、錫伯語、鄂溫克語、鄂倫春語近三十個人,40多小時的十幾個G的聲樣。發(fā)音人均來自上述地區(qū)的熟練使用本民族語言的教師、民間藝人和民族語言播音員。他們的發(fā)音純正,能夠代表本民族語言的語音特征,沒有嗓音方面的疾;錄音地點:在當?shù)貜V播電臺標準錄音棚或安靜的住所;儀器設備:配有索尼指向性話筒 SONY ECM 44B和Creative錄音軟件的IBM R系列筆記本電腦。采樣率為22kHz, 16bits,單聲道,S/N 不低于45dB。

學術交流

[ 1 ] Huhe, A Preliminary Study on Relationship Among Altaic Languages Based on Acoustic Patterns, The International Scientific Conference “World of Central Asia”, Sep. 2012, Ulan-Ude, Russia.

[ 2 ] 呼和,哈斯呼,東部裕固語帶擦元音初探,第十屆中國語音學學術會議(PCC2012)會議,2012年5月,上海。

[ 3 ] 包桂蘭,白音門德,呼和,蒙古語鼻音[n]的實驗研究,第十屆中國語音學學術會議(PCC2012)會議,2012年5月,上海。

[ 4 ] 胡紅彥,呼和,哈斯其木格,蒙古語標準音/s/輔音聲學分析,第十屆中國語音學學術會議(PCC2012)會議,2012年5月,上海。

[ 5 ] 韓國君,呼和,土族語短元音聲學分析,第十屆中國語音學學術會議(PCC2012)會議,2012年5月,上海。

[ 6 ] 烏日格喜樂圖,呼和,論鄂溫克語前高元音,第十屆中國語音學學術會議(PCC2012)會議,2012年5月,上海。

[ 7 ] 呼和,語音聲學模型對語言親屬關系研究中的作用和意義,“蒙古語族語言與地域文化研究”國際學術會議,內蒙古阿爾山,2012年8月18-21日。1萬字。

[ 8 ] 呼和,蒙古語言文字信息處理目前所面臨的幾個問題,全國第四屆蒙古語應用研究學術研討會,呼和浩特,2013年11月。0.2萬字。

[ 9 ] 呼和,語音聲學模型與語言之間的親屬關系問題,International Conference on Phonetics of the Languages in China(ICPLC), 香港,2013年12月。1.5萬字。

[ 10 ] 周學文,元音歸一化的對數(shù)商模型,全國人機通訊學術會議NCMMSC 2013,論文,0.45萬字,貴州貴陽,2013年8月。

[ 11 ] 周學文,Varying or Unvarying-Logarithmic Quotient Model of Vowel Formants, IALP 2013 國際會議,0.5萬字,烏魯木齊,2013年8月。

四、 本項目所培養(yǎng)的研究生情況

[ 1 ] 烏云那生,蒙古語阿拉善土語語音聲學研究,中央民族大學博士學位論文,2013年5月。

[ 2 ] 韓國君,基于語音聲學參數(shù)庫的土族語元音研究,內蒙古大學碩士學位論文,2013年6月。

[ 3 ] 哈斯呼,基于語音聲學參數(shù)庫的東部裕固語語音研究,內蒙古大學博士學位論文,2014年6月。

五、 國際合作

自2012年7—9月期間,本項目承擔著呼和研究員在俄羅斯科學院西伯利亞分院訪問期間與俄羅斯布里亞特聯(lián)邦共和國國立大學東方學系JARGAL 博士合作,開展了“布里亞特語語音聲學參數(shù)數(shù)據(jù)庫”的研制工作。目前該項目進展順利,已完成了索引庫、聲樣庫的研制工作,正在進行語音標注。

六、 研究中存在的主要問題

因所涉及的語言較多,有些是瀕危語言等原因加大了研究難度,可能不能按照原計劃所預計的時間完成研究任務,退后結項時間。但我們團隊會爭取按時結項。

七、 需要說明的問題

? 因突厥語族語言子項目負責人西北民族大學信息學院的阿里木博士赴成都進修(1年)等原因,更換艾則孜為該子項目負責人。

? 因研究工作需要增加“東鄉(xiāng)語和保安語”子項目并聘請西北民族大學蒙古語言文化研究院巴圖格日勒教授為該子項目負責人。

二、研究成果情況

代表作(一)

“基于語音聲學模型的阿爾泰語系語言親屬關系初探”(呼和,民族語文,2013年第3期)

基本內容和主要觀點:本文提出用語音聲學模型檢驗和判斷語言發(fā)生學關系和類型學相似性的思路和方法,并以阿爾泰語系蒙古、維吾爾和鄂溫克等三種語言的音段和超音段聲學模型進行驗證。音段聲學模型,特別是三個極端元音聲學模型的穩(wěn)定性相對好。它不以語言或方言時間和空間的變化而發(fā)生較大改變,能夠反映和代表語言或方言古老、深層的靜態(tài)特點。與音段聲學模型相比,超音段聲學模型,特別是單詞層面與詞重音相關的音高、音長和音強等聲學模型的穩(wěn)定性相對差,它所反映的是語言或方言近代、表面的動態(tài)特點。從蒙古、鄂溫克和維吾爾等三種語言三個極端元音聲學模型的相似度(蒙古語與鄂溫克語之間的相似度為0.91, 蒙古語與維吾爾語之間的相似度為0.74),可以得出蒙古語與鄂溫克語之間的關系比蒙古語與維吾爾語之間的關系相對近的初步結論;但從三種語言在單詞韻律層面上所呈現(xiàn)的相似性(“右短”、“右高”和“右強”)和差異性,卻難以判斷它們之間的親近度;從蒙古、達斡爾和土族等三種語言三個極端元音聲學模型的相似度(蒙古語與達斡爾語之間的相似度為0.93, 蒙古語與土族語之間的相似度為0.91),可以得出蒙古、達斡爾兩種語言之間的關系比蒙古語與土族語之間的關系相對近的結論。

學術價值和社會影響:阿爾泰學研究經(jīng)過近三個世紀的發(fā)展,達到了一定的水平。但是,尚未像印歐語系那樣已經(jīng)得到理論上的肯定,還有不少學者懷疑或反對阿爾泰學理論。主要意見有:(1)突厥語對蒙古語有過強烈的影響,而蒙古語又對通古斯語有過較大的影響。上述三個語族語言之間存在的相似性,可能是由于原有的結構相似加上相互接觸和影響所造成的結果;(2)目前對“阿爾泰諸語言”在語源上是否存在親緣關系的問題做肯定的回答還為時過早。有的則既不肯定阿爾泰諸語言間存在發(fā)生學上的關系,又不排除存在同源關系的可能性,提倡做更多的研究之后再下結論;(3)把阿爾泰諸語言間的共同成分看做是互借或相互影響的結果,從而認為突厥語、蒙古語和滿洲一通古斯語等語言之間不存在發(fā)生學上的同源關系,只存在類型學上的相似性。他們的一個重要根據(jù)就是蒙古語和突厥語等語言之間不存在數(shù)詞的共同性和一些基本詞匯的同源性。

要打破阿爾泰學多年的僵持和發(fā)展緩慢等現(xiàn)狀,需要理論和方法的創(chuàng)新,即必須擺脫原來的理論和方法框架,拓展思路,尋找新的方法和手段。通過多年的語音實驗研究和描寫研究實踐,我們對語音聲學、生理特征有了新的認識,積累了測量和采集聲學、生理特征參數(shù)和利用這些參數(shù)描寫特定語言音系系統(tǒng)的豐富經(jīng)驗。為了使語音實驗研究更好地與歷史比較語言學相結合,解決一些用傳統(tǒng)方法無法解決的疑難問題,提升實驗語音學在語言學研究中的地位和作用,本文提出用“語音聲學模型相似度”來檢驗和判斷語言之間親屬關系親近度的思路和方法,并通過比較蒙古、維吾爾、鄂溫克、達斡爾、土族和東部裕固等語言聲學模型之間的相似度,探討它們之間親屬關系的親近度,即語言之間的同源關系和類型學上的相似性等問題。

“從語音聲學模型之間的相似度檢驗和判斷語言之間親屬關系的親近度”(語言之間的同源關系和類型學上的相似性)是一個創(chuàng)新思路和方法,是一項新的課題。目的是把語言之間親屬關系研究基于語音科學實驗之上,以便推動比較語言學研究。當然,我們的研究和分析,僅僅是學術上的一種嘗試,我們的結論,也僅僅是基于現(xiàn)代蒙古語、維吾爾語和鄂溫克語語音部分聲學模型上的一家之見,有關阿爾泰語系假設的驗證,仍需不同學科之間長期協(xié)同努力。

代表作(二)“彝語輔音譜特征分析”(周學文,中國語音學報第四輯,2013年)

基本內容和主要觀點:本文采用“譜重心”(COG,Center of Gravity)、“離散度”(Dispersion)和傾斜度(SKEW表示低于譜重心的譜與平均頻率以上的譜的差)等三個譜參數(shù)探討了涼山彝語輔音特點。主要觀點是:f的譜參數(shù)變化大,?最穩(wěn)定,擦音s、?也比較穩(wěn)定。Dispersion值從大到小排序為:s、?、?;f比?的Dispersion高;s比?的Dispersion和COG都大,特別是Dispersion差別明顯。就清擦音的COG和Dispersion兩個參數(shù)而言,Dispersion是更穩(wěn)定、更容易區(qū)別單個清擦音的參數(shù)。

學術價值和社會影響:輔音聲學分析,特別是清擦輔音聲學描寫研究一直是大家討論和關心的問題。其中,采用哪個聲學參數(shù)描寫這些清擦音是問題的焦點。相對于元音的四個穩(wěn)定而直觀的特征(音長,音強,音色,音高),由于發(fā)音方法和發(fā)音部位的不同,輔音區(qū)別特征的定義就要復雜得多,而且缺乏直觀的、穩(wěn)定的、易于量化的區(qū)別特征。對于塞音/塞擦音而言,一般采用GAP(閉塞時間)、VOT(濁音開始時間,Voice Onset Time)、輔音長度等在語譜圖上比較直觀且容易提取的參數(shù)作為它們的區(qū)別特征,大量研究成果證實,GAP和VOT對塞音/塞擦音有明確的區(qū)別意義;對于濁音類的濁擦音、鼻音、邊音等輔音,則可以提取其共振峰參數(shù),但是他們的共振峰也不像元音共振峰那樣穩(wěn)定而明顯,而且鼻音還經(jīng)常受到反共振的干擾,在語譜圖上難以分辨;對于由噪聲源激勵產(chǎn)生的清擦音,它們的頻譜上經(jīng)常表現(xiàn)為多個模糊的區(qū)域和亂紋,這些模糊的區(qū)域又稱為能量集中區(qū)、強頻集中區(qū)等,與元音共振峰類似,它們實際上也是聲波在特定的頻率域產(chǎn)生共振引起的,在語圖上肉眼只能大概看出各個區(qū)域的邊界,很難給出一個量化的指標描述這些區(qū)域,那么是否存在區(qū)分這些輔音的有效的、穩(wěn)定的譜特征參數(shù)呢?本文在前人研究的基礎上,提出了用“譜重心”、“離散度”和傾斜度等三個參數(shù)描寫輔音聲學特征的方法。這是語音聲學分析中的一次創(chuàng)新,一次飛躍,將會有效推動輔音聲學描寫研究。

注:2010年立項的重大項目主要填寫2012年6月以來的研究成果情況。

序號

成果名稱

作者

成果

形式

刊物名或出版社、刊發(fā)或出版時間

字數(shù)

轉載、引用、獲獎等情況

 

1

蒙古語邊音/l/的聲學和生理研究

哈斯其木格

呼和

論文

民族語文

2012年第2期

0.8

 

 

2

蒙古語阿拉善話短元音聲學分析

烏云那生

呼和

論文

西北民族大學學報

2012年第4期

1.3

 

 

3

基于PAS的蒙古語標準話輔音氣流研究

呼和

周學文

論文

中央民族大學學報

2013年第2期

1.2

 

 

4

基于語音聲學模型的阿爾泰語系語言親屬關系初探

呼和

論文

民族語文,2013年第3期

1

 

 

5

土族語詞首音節(jié)元音聲學分析

韓國君

呼和

論文

新疆語言與翻譯

(蒙文版)2013年第3期

1.3

 

 

6

蒙古語標準音

輔音音姿

哈斯其木格

論文

中央民族大學學報(哲社版)2013年第5期

0.8

 

 

7

基于“語音聲學參數(shù)數(shù)據(jù)庫”的鄂溫克語

輔音研究

烏日格

喜樂圖

論文

實驗語言學(日本)

2013年第3期

0.6

 

 

8

涼山彝語松-緊喉元音的聲學特征

周學文

論文

民族語文,2013年第2期

0.5

 

 

9

彝語輔音譜特征分析

周學文

論文

中國語音學報

2013年第四輯

0.4

 

 

10

鄂溫克語

清塞音實驗研究

烏日格

喜樂圖

論文

中國社科院民族所青年學術論壇論文集,社會科學文獻出版社,2013。

0.5

 

 

11

蒙古語陳巴爾虎土語復合元音

哈斯其木格

論文

中國社科院民族所青年學術論壇論文集,社會科學文獻出版社,2013。

0.5

 

課題組供稿
(責編:實習生、張文卓(實習生))
泽普县| 吴江市| 宁波市| 天长市| 江川县| 冷水江市| 高邑县| 扶风县| 武冈市| 仪征市| 永泰县| 碌曲县| 绥中县| 武安市| 雅安市| 西乌珠穆沁旗| 商都县| 苏尼特右旗| 锦州市| 桓仁| 武功县| 合水县| 宜春市| 广丰县| 定南县| 余干县| 鄯善县| 昌邑市| 麦盖提县| 唐河县| 广河县| 葵青区| 民丰县| 松原市| 陕西省| 韶关市| 阿尔山市| 平度市| 西贡区| 囊谦县|