站內(nèi)搜索        項目查詢   專家查詢   網(wǎng)站地圖   重大項目要覽   管理規(guī)章   
加入收藏 加入收藏     設(shè)為首頁 設(shè)為首頁   

成果選介>>項目動態(tài)

“自然語言信息處理的邏輯語義學(xué)研究”初獲成果

  2012年01月16日10:58  來源:全國哲學(xué)社會科學(xué)工作辦公室

  2011年是國家社科基金重大招標(biāo)課題“自然語言信息處理的邏輯語義學(xué)研究”(批準(zhǔn)號:10ZD073)啟動研究的第一個年頭,主要在研究資料的收集整理和研究思路的構(gòu)想梳理方面做了大量工作。
  今年課題組發(fā)表的高質(zhì)量論文有三篇。課題組首席專家中國社科院的鄒崇理研究員、合肥師范學(xué)院的李可勝副教授與張璐合作撰寫的“The Categorial Logic of Vacuous Components in Natural Language”探討了自然語言中的虛化問題。課題組成員北京師范大學(xué)琚鳳魁博士與清華大學(xué)的劉奮榮教授合作發(fā)表的論文“Update semantics for imperatives with priorities”討論了祈使句的語義問題。上述兩篇英文論文發(fā)表在邏輯學(xué)專業(yè)期刊Logic, Rationality and Interaction 2011年刊上,已由國際著名數(shù)據(jù)庫Springer收錄。另外,課題組成員中國社科院的杜國平研究員在CSSCI收錄的核心期刊《浙江社會科學(xué)》發(fā)表了關(guān)于條件句邏輯的論文《“即使p,也q”句式的邏輯分析》。
  除了初步的研究成果,本年度課題組還積極與語言學(xué)界、計算機(jī)學(xué)界進(jìn)行溝通交流,共組織包括開題會在內(nèi)的課題小組研討、專家面對面論壇五次。前后邀請到微軟亞洲研究院前主任研究員、中國計算機(jī)自然語言處理領(lǐng)域的“趟路人”黃昌寧教授,我國計算機(jī)信息處理領(lǐng)域資深專家、教育部語言文字應(yīng)用研究所馮志偉研究員,清華大學(xué)計算機(jī)系的周強(qiáng)教授,國際著名語言學(xué)家、臺灣國立交通大學(xué)的林若望教授,介紹雙方研究動向、聽取計算機(jī)科學(xué)界和語言學(xué)領(lǐng)域的需求,共同就大家目前所關(guān)注的邏輯語義學(xué)問題展開了深入的探討和交流。這些工作無疑有助于課題小組在原有研究設(shè)想的基礎(chǔ)上,結(jié)合目前計算和語言兩界的實際需求來厘清研究思路,為下一步研究的全面展開打下良好的基礎(chǔ)。
  經(jīng)過這一年的探索和探討,2012年課題的研究重點將放在“邏輯語義學(xué)的綜合研究”上。從與計算機(jī)界及語言學(xué)界的交流中我們認(rèn)識到,目前國內(nèi)在面向自然語言的信息處理上所存在的問題是,計算機(jī)領(lǐng)域面向漢語等自然語言的處理以統(tǒng)計方法為主,真正針對自然語言特點設(shè)計的程序和算法還很難達(dá)到滿意地處理一整套自然語言(這里指漢語)的能力。造成這一現(xiàn)象有句法和語義兩方面原因。在句法上,很多現(xiàn)象,包括簡單的和復(fù)雜的現(xiàn)象,如語詞之間的依存關(guān)系、漢語中的連謂、兼語等現(xiàn)象的謂詞論元關(guān)系,在語言學(xué)上還尚無定論,所以在信息處理過程中也難以給出確鑿的刻畫方案;在語義上,如何讓計算機(jī)“聽懂”、或者說“理解”人的語言,仍為目前計算語言學(xué)繼續(xù)向前發(fā)展的瓶頸,迫切需要邏輯語義學(xué)提供一套、甚至幾套形式化方案,不但能夠刻畫自然語言所具有的比較特殊的一些現(xiàn)象,(如右節(jié)點提升、代詞回指等不連續(xù)現(xiàn)象),還能夠構(gòu)造出可以全面刻畫現(xiàn)代漢語書面語的邏輯語義學(xué)的句法語義系統(tǒng)。幸運(yùn)的是,在邏輯語義學(xué)諸理論中,最近二十多年發(fā)展起來的組合范疇語法CCG是成功滿足這一需求的語法系統(tǒng),在西方學(xué)界已引起計算語言學(xué)家廣泛關(guān)注。
  本課題預(yù)期在2012年完成以下幾個方面的任務(wù):
  1、與清華大學(xué)計算機(jī)系、微軟亞洲研究院加強(qiáng)聯(lián)系,深入了解清華樹庫到漢語CCG庫轉(zhuǎn)換過程中所遇到的、轉(zhuǎn)換結(jié)果中預(yù)留的語言學(xué)及邏輯形式刻畫問題,提出解決方案。
  2、基于課題組前期利用類型邏輯語法針對漢語照應(yīng)省略現(xiàn)象提出的范疇邏輯系統(tǒng)LLCW?和針對漢語虛化成分給出的LMP系統(tǒng),給出CCG框架下相應(yīng)的組合規(guī)則及其添加模態(tài)下標(biāo)的算子,并在此基礎(chǔ)上構(gòu)造混合的范疇邏輯多模態(tài)系統(tǒng),證明混合系統(tǒng)的元邏輯性質(zhì)。以此推廣刻畫漢語中更多的相似現(xiàn)象。
  3、漢語特殊性的思考。盡管CCG取得了豐碩的信息處理成果,對漢語CCG樹庫的轉(zhuǎn)換也有初步嘗試,但尚無對漢語自身特點及其在CCG下處理方案的思考。幸運(yùn)的是,我們在已有探討中可以找到與漢語在不同程度上的共性,如與英語相比,漢語在基本語序上也是主謂賓結(jié)構(gòu),但對主謂賓的順序要求不如英語嚴(yán)格;與土耳其語相比,漢語也允許語詞上的混序現(xiàn)象,但是混序的實際環(huán)境不同。我們將分別對比漢語與各種已討論語言的共性與特性,為利用CCG進(jìn)行面向漢語的信息處理做好充分的準(zhǔn)備。

(責(zé)編:秦華)


點擊返回首頁

點擊返回頂部
临海市| 浮山县| 乐陵市| 秦皇岛市| 彝良县| 宁波市| 龙泉市| 城固县| 江陵县| 荔波县| 海晏县| 永德县| 皮山县| 荣昌县| 博野县| 同仁县| 思茅市| 宜兴市| 宣汉县| 三门县| 咸丰县| 庆安县| 定西市| 三河市| 平邑县| 伊春市| 瑞昌市| 昌图县| 科尔| 泽库县| 建水县| 叶城县| 赤水市| 绥化市| 准格尔旗| 义马市| 丰镇市| 沁源县| 西藏| 绵竹市|