舊版網(wǎng)站入口

站內(nèi)搜索

11&ZD189 蕭國(guó)政、姬東鴻:項(xiàng)目簡(jiǎn)報(bào)-第12期--2017

2017年12月14日10:58來(lái)源:全國(guó)哲學(xué)社會(huì)科學(xué)工作辦公室

基于本體演化和事件結(jié)構(gòu)的語(yǔ)義網(wǎng)模型研究

——子課題“面向事件的本體結(jié)構(gòu)資源建設(shè)”新的階段性成果

以武漢大學(xué)蕭國(guó)政、姬東鴻為首席專家的國(guó)家社會(huì)科學(xué)基金重大招標(biāo)項(xiàng)目《基于本體演化和事件結(jié)構(gòu)的語(yǔ)義網(wǎng)模型研究》(項(xiàng)目批準(zhǔn)號(hào):11&ZD189),2017年第一季度主要抓了三件事:1、進(jìn)一步系統(tǒng)梳理和總結(jié)現(xiàn)有成果(包括數(shù)據(jù)等),組織部分力量和精力結(jié)集出版和組織發(fā)表成果; 2、部分子課題側(cè)重升級(jí)和應(yīng)用拓展;3、在學(xué)科交叉、學(xué)科前沿和社會(huì)服務(wù)方面做新的探索。由于本課題涉及學(xué)校多、人員多,發(fā)揮首席專家和子課題組的共同作用,是本項(xiàng)目扎實(shí)推進(jìn),保持前沿、高端、重大的主要措施之一。本期簡(jiǎn)報(bào)著重報(bào)告第一子課題組舊年的基礎(chǔ)和新的進(jìn)展,以便領(lǐng)導(dǎo)和專家掌握我們的工作狀況。

子課題一的目標(biāo)是:建立涵蓋實(shí)體(屬性、屬性值)、事件及其上下位關(guān)系的基礎(chǔ)本體結(jié)構(gòu),建立涵蓋事件和事件鏈的語(yǔ)義標(biāo)注資源,通過(guò)在本體結(jié)構(gòu)中增加事件和事件鏈的描述,豐富本體結(jié)構(gòu)的內(nèi)涵,為文本的深度語(yǔ)義標(biāo)注、上下文理解和語(yǔ)義查詢及推理奠定基礎(chǔ)。前期的研究工作已完成了對(duì)“事件”內(nèi)涵的界定,簡(jiǎn)單事件結(jié)構(gòu)描寫(xiě)以及外延事件類別描寫(xiě)。近半年來(lái),在首席專家的指導(dǎo)和參與下,該子課題在事件本體建構(gòu)及其應(yīng)用研究方面取得的階段性新成果匯報(bào)如下。

在理論探索上,主要有三個(gè)方面的進(jìn)展:

一是關(guān)于事件研究的價(jià)值,課題組突破了語(yǔ)句形式的局限,以事件作為語(yǔ)義研究對(duì)象和觀察視角,對(duì)事件元素、事件框架、事件關(guān)系、事件本體與篇章事件結(jié)構(gòu)進(jìn)行分析和本體建構(gòu),探索篇章的語(yǔ)義分析、語(yǔ)義理解,以服務(wù)于大規(guī)模的語(yǔ)義計(jì)算。

二是關(guān)于事件的性質(zhì)和特點(diǎn)。研究發(fā)現(xiàn)作為語(yǔ)義研究對(duì)象的事件,具有以下五個(gè)基本特點(diǎn):1)事件是一種基本語(yǔ)言單位,詞、短語(yǔ)、句子各個(gè)不同層級(jí)的語(yǔ)言單位中都存在事件;2)事件遵循統(tǒng)一的結(jié)構(gòu)規(guī)則,同類事件具有統(tǒng)一的內(nèi)部結(jié)構(gòu)規(guī)則;3)事件的跨語(yǔ)法實(shí)體的嵌套性和遞歸性,復(fù)雜事件由多個(gè)簡(jiǎn)單事件構(gòu)成,事件組合構(gòu)成具有因果、條件、目的等語(yǔ)義關(guān)系的遞歸結(jié)構(gòu);4)篇章中的事件演化,沿著一定的拓?fù)浣Y(jié)構(gòu)推進(jìn),主要有向心結(jié)構(gòu)、離心結(jié)構(gòu)、三角形結(jié)構(gòu)、菱形結(jié)構(gòu)和蝶形結(jié)構(gòu);5)事件具有全息結(jié)構(gòu)?傊瑥囊嘏c整體、靜態(tài)構(gòu)成和動(dòng)態(tài)組合多個(gè)方面對(duì)“事件”進(jìn)行了全方位的理論思考。

三、關(guān)于事件關(guān)系和事件運(yùn)算,發(fā)現(xiàn)以事件知識(shí)為基本內(nèi)容的語(yǔ)義分析和語(yǔ)義推理研究,還需要定義一些基本的事件本體公理,而這些描寫(xiě)為運(yùn)算規(guī)則的事件公理可以直接用于事件語(yǔ)義分析和推理。在事件類屬關(guān)系方面,對(duì)事件之間的領(lǐng)屬關(guān)系和聚合關(guān)系進(jìn)行了邏輯運(yùn)算規(guī)則的描寫(xiě)。在事件鏈方面,運(yùn)用邏輯運(yùn)算規(guī)則對(duì)事件的原因關(guān)系、結(jié)果關(guān)系、條件關(guān)系和時(shí)序關(guān)系進(jìn)行了描寫(xiě)。在事件拓?fù)浣Y(jié)構(gòu)方面,分別對(duì)構(gòu)成離心拓?fù)浣Y(jié)構(gòu)、向心拓?fù)浣Y(jié)構(gòu)、三角形拓?fù)浣Y(jié)構(gòu)和菱形拓?fù)浣Y(jié)構(gòu)的事件進(jìn)行了邏輯運(yùn)算規(guī)則的描寫(xiě)。

在事件語(yǔ)義資源建設(shè)上,在定義事件由六元組(即E (B, P, T, Sp, N, S))構(gòu)成的基礎(chǔ)上,基于特定領(lǐng)域的真實(shí)文本建立了部分領(lǐng)域的事件本體知識(shí)庫(kù),目前主要完成了物流、軍事、刑事訴訟三個(gè)領(lǐng)域的事件本體構(gòu)建的第一期工作。

以物流領(lǐng)域?yàn)槔,事件本體知識(shí)建構(gòu)的語(yǔ)言材料主要來(lái)源于物流領(lǐng)域的相關(guān)文獻(xiàn)、標(biāo)準(zhǔn)規(guī)定、專業(yè)教材和物流專業(yè)詞典,具體方法是先從文檔信息中篩選事件詞條,然后通過(guò)同義詞詞林?jǐn)U展詞條,最終得到了一個(gè)包含960條詞條,95個(gè)概念節(jié)點(diǎn)的物流事件概念集。以物流活動(dòng)的相關(guān)流程和時(shí)空特征為主要線索,對(duì)該概念集中的事件概念進(jìn)行分析歸類,得到了六個(gè)事件概念類別,分別是:倉(cāng)儲(chǔ)事件、裝卸事件、運(yùn)輸事件、審核和貨損事件、包裝事件、綜合事件。同理,以各大軍事網(wǎng)站、同義詞詞林、軍事新聞報(bào)道為語(yǔ)料來(lái)源,構(gòu)建了總詞數(shù)為2749個(gè)的軍事領(lǐng)域事件本體,以中國(guó)刑法法典、各種刑事司法參考書(shū)、刑事案件新聞報(bào)道、中國(guó)裁判文書(shū)網(wǎng)為語(yǔ)料來(lái)源,構(gòu)建了總詞數(shù)接近1000的刑事訴訟領(lǐng)域事件本體。

基于事件的理論探索和本體資源建構(gòu),是語(yǔ)義網(wǎng)和語(yǔ)言信息處理智能化的重要基礎(chǔ),應(yīng)用前景廣闊,同時(shí)對(duì)于詞典編撰、語(yǔ)言教學(xué)系統(tǒng)開(kāi)發(fā)、深度機(jī)器學(xué)習(xí)、智能人機(jī)交互以及情報(bào)分析等都有著令人期待的應(yīng)用價(jià)值。

(課題組供稿)

(責(zé)編:王瑤)
邢台县| 塔河县| 晋江市| 虎林市| 沭阳县| 永吉县| 金山区| 石河子市| 仙居县| 淳化县| 五寨县| 阳信县| 卫辉市| 阳东县| 衡东县| 永兴县| 金阳县| 吴川市| 朝阳市| 沙坪坝区| 襄汾县| 沁阳市| 红河县| 迭部县| 芦山县| 彭泽县| 仙游县| 常熟市| 偏关县| 米泉市| 利津县| 米易县| 通州区| 镇赉县| 三门峡市| 天全县| 淮滨县| 全椒县| 德昌县| 阳曲县|