舊版網(wǎng)站入口

站內(nèi)搜索

主題圖的語義相關(guān)度評價方法研究

——《主題圖的語義相關(guān)度評價方法研究》成果簡介

2011年05月15日16:54

  大連理工大學(xué)裘江南副教授主持完成的國家社會科學(xué)基金項目《主題圖的語義相關(guān)度評價方法研究》(項目批準(zhǔn)號為07CTQ006),最終成果為同名研究報告和論文集。課題組成員有:王寧、葉鑫、曲剛、李麗冬、王帶弟、羅志成。

  當(dāng)前,由于信息與知識類型的多樣性、存在方式各異、對知識整合與檢索需求的提高等因素,導(dǎo)致知識組織的理論和方法日益復(fù)雜化,傳統(tǒng)的知識組織技術(shù)的缺陷也逐漸顯露,而有效的知識組織方法需要調(diào)和日益豐富的語義內(nèi)涵與易于計算機進(jìn)行信息處理兩者之間的矛盾。

  作為一種新興的數(shù)字化本體類知識組織技術(shù),主題圖是一種語義中度的概念關(guān)聯(lián)類知識組織方法,它的語義適度性既確保了組織知識的語義特征,又提供了易于計算機理解的表示方式,有效調(diào)和了知識組織中的兩個矛盾,因此對主題圖等概念關(guān)聯(lián)類知識組織體系的研究與應(yīng)用成為新的焦點,但主題圖的技術(shù)存在下列局限:一是主題圖技術(shù)框架中雖然可定義主題之間的各種關(guān)聯(lián),但并沒有給出主題間、主題和資源間的相關(guān)度評價方法,特別是缺乏主題間的語義相關(guān)度評價研究。二是現(xiàn)有的主題間關(guān)聯(lián)只局限在彼此有直接關(guān)聯(lián)的主題之間,并沒有定義間接關(guān)聯(lián),即對非直接關(guān)聯(lián)的主題之間的語義相關(guān)性傳遞問題缺乏系統(tǒng)研究。三是引文分析中采用“關(guān)鍵詞共現(xiàn)方法”也可用來評價主題間的相關(guān)程度,但該方法的準(zhǔn)確程度有賴于語境的質(zhì)量及文獻(xiàn)樣本的數(shù)量,具有一定的局限性。綜上所述,有必要通過對主題圖語義元素、語義結(jié)構(gòu)及語義傳遞的基礎(chǔ)研究工作,探討基于計算語言學(xué)的方法來評價主題圖的語義相關(guān)度。成果的基本思路和主要內(nèi)容如下:

  研究目的和意義

  研究目的有以下幾個方面:一是構(gòu)造主題圖中主題間及主題與資源間的語義相關(guān)度評價方法,實現(xiàn)主題圖中主題間及主題與資源間的關(guān)聯(lián)量化;二是發(fā)現(xiàn)主題圖中間接關(guān)聯(lián)主題間的語義傳遞規(guī)律,并構(gòu)建語義傳遞體系,實現(xiàn)語義傳遞的計算機模擬,并將其嵌入語義相關(guān)度評價方法;三是采用主題圖的語義相關(guān)度評價方法成果研究基于關(guān)聯(lián)量化的主題圖知識組織方法,將其應(yīng)用于知識導(dǎo)航系統(tǒng)并對評價方法進(jìn)行完善。

  研究的意義在于:一是通過系統(tǒng)分析主題圖的語義結(jié)構(gòu)和主題間的關(guān)系類型的基礎(chǔ)上,建立各種類型關(guān)系的語義相關(guān)度評價算法。這種基于主題圖語義結(jié)構(gòu)的評價方法,能夠依據(jù)主題圖的結(jié)構(gòu)快速對主題間的語義關(guān)聯(lián)進(jìn)行量化。同時,也可克服關(guān)鍵詞共現(xiàn)方法的準(zhǔn)確程度有賴于語境的質(zhì)量及文獻(xiàn)樣本的數(shù)量的缺點;二是通過分析主題圖中各種關(guān)系類型的語義傳遞特性,建立非直接關(guān)聯(lián)的主題間的語義相關(guān)度評價方法,有利于揭示主題圖中語義傳遞的變化規(guī)律;三是為主題圖引入量化的語義相關(guān)度評價方法,完善基于主題圖的概念關(guān)聯(lián)類知識組織的方法和技術(shù),并有利于更清晰地理解主題圖和相應(yīng)資源實體的語義結(jié)構(gòu),進(jìn)而提高知識檢索和導(dǎo)航的精確程度。

  成果的主要內(nèi)容

  研究中,首先,對現(xiàn)有的基于本體的語義相關(guān)度算法進(jìn)行了系統(tǒng)分析和比較。從各種語義相關(guān)度算法的實驗測試結(jié)果中可以觀察到:語義相關(guān)度評價方法中考慮的關(guān)鍵要素越多,效果越好;在各種語義相關(guān)度評價方法中Jiang&Conrath評價方法的效果最好。在研究中選擇Jiang&Conrath方法作為項目組提出的主題圖語義相關(guān)度評價方法的比較標(biāo)準(zhǔn)。

  其次,對主題圖的語義元素及語義結(jié)構(gòu)進(jìn)行了系統(tǒng)分析,研究總結(jié)了主題圖的語義元素特點,給出了語義元素的形式化定義,并對語義關(guān)系的屬性和性質(zhì)進(jìn)行了深入分析,歸納出主題圖中六大類經(jīng)典型語義關(guān)系的屬性和性質(zhì)。同時以主題圖構(gòu)成及其包含的關(guān)系類型特點為基礎(chǔ),分析了主題圖語義結(jié)構(gòu),進(jìn)而指出其具有兩層、連通及類樹狀特征,并給出了主題圖中主題圖樹提取方法。

  再則,針對主題圖中間接關(guān)聯(lián)主題之間的傳遞相關(guān)性問題,首次研究了主題圖語義傳遞規(guī)律,并構(gòu)建了主題圖中的語義傳遞規(guī)則。具體包括語義傳遞符號定義、影響因素及判斷過程等三個基本方面,以及運用關(guān)系性質(zhì)的研究成果和因子匹配理論等方法得出語義關(guān)系的傳遞規(guī)則,并通過人工認(rèn)知實驗進(jìn)行了語義傳遞規(guī)則的認(rèn)知度測試,驗證其有效性,從而實現(xiàn)了語義傳遞判斷的計算機模擬。進(jìn)而,對主題圖的語義相關(guān)度評價方法進(jìn)行系統(tǒng)研究,提出了主題間的語義相關(guān)度評價方法、主題與資源間的語義相關(guān)度評價方法。其中,通過對主題圖語義元素、語義結(jié)構(gòu)及語義傳遞的分析,同時參照語義相關(guān)度已有研究基礎(chǔ),提出了考慮主題節(jié)點密度、深度、語義關(guān)系類型、路徑及語義傳遞因素的主題間語義相關(guān)度評價方法,進(jìn)而以《知網(wǎng)》本體資源作為實驗環(huán)境,以人工判斷為基準(zhǔn),通過與Jiang&Conrath方法進(jìn)行了對比分析進(jìn)一步改進(jìn)該評價方法。實驗結(jié)果也表明語義傳遞要素引入可以提高語義相關(guān)度算法的精度,并最終實現(xiàn)了基于語義關(guān)系的主題間語義相關(guān)度算法。此外,對主題與資源間的語義相關(guān)度評價方法進(jìn)行研究。根據(jù)主題圖語義結(jié)構(gòu)及其資源特點,分析了主題與資源間的語義相關(guān)度影響因素,提出了基于多相關(guān)主題的主題與資源相關(guān)度算法。該算法引入主題間語義相關(guān)度值及多相關(guān)主題IFIDF 詞頻權(quán)重法,并與傳統(tǒng)文本資源排序方法作對比分析,驗證了主題與資源間語義相關(guān)度評價方法的優(yōu)勢。

  最后,系統(tǒng)研究了基于關(guān)聯(lián)量化的主題圖知識組織方法。以臺風(fēng)應(yīng)急管理為背景,設(shè)計并實現(xiàn)了嵌入主題圖語義相關(guān)度評價方法的臺風(fēng)知識導(dǎo)航原型系統(tǒng)。通過構(gòu)建臺風(fēng)知識主題圖,在導(dǎo)航機制設(shè)計中嵌入主題圖關(guān)聯(lián)量化機制,克服了傳統(tǒng)導(dǎo)航查全率和差準(zhǔn)率低的問題,實現(xiàn)了基于關(guān)聯(lián)量化的主題圖知識組織方法的應(yīng)用研究。

  成果的重要觀點

  充分利用語義相關(guān)性的已有研究成果,以主題圖語義元素及語義結(jié)構(gòu)等為基礎(chǔ),對主題圖的語義相關(guān)度評價方法進(jìn)行了研究,研究的重要觀點如下:一是首次提出了主題圖的主題間、主題和資源間的定量化的相關(guān)度評價方法。完善了基于主題圖的概念關(guān)聯(lián)類知識組織的方法和技術(shù),并有利于更清晰地理解主題圖和相應(yīng)資源實體的語義結(jié)構(gòu),進(jìn)而提高知識檢索和導(dǎo)航的精確程度;二是提出了主題圖的主要關(guān)系類型的語義相關(guān)度評價算法。能夠依據(jù)主題圖的結(jié)構(gòu)快速建立量化的語義相關(guān)度,可彌補關(guān)鍵詞共現(xiàn)類方法的準(zhǔn)確程度有賴于語境的質(zhì)量及文獻(xiàn)樣本的數(shù)量的不足;三是發(fā)現(xiàn)了主題圖中間接關(guān)聯(lián)主題間的語義傳遞規(guī)律,并構(gòu)建了語義傳遞體系,實現(xiàn)了語義傳遞的計算機模擬,并將其嵌入語義相關(guān)度評價方法;四是提出了基于多相關(guān)主題的主題與資源相關(guān)度算法。該算法引入主題間語義相關(guān)度值及多相關(guān)主題IFIDF 詞頻權(quán)重法,并在相關(guān)算例實驗過程中,獲得了較好的計算結(jié)果。

  成果的學(xué)術(shù)價值和社會價值

  成果的學(xué)術(shù)價值在于:系統(tǒng)分析了主題圖的語義元素和語義結(jié)構(gòu),發(fā)現(xiàn)了語義傳遞規(guī)律,并建立了語義傳遞模型。這些研究結(jié)果一方面為主題圖語義相關(guān)度的評價方法研究提供了理論基礎(chǔ),另一方面豐富了主題圖的語義結(jié)構(gòu)的理論研究,并對語義傳遞領(lǐng)域進(jìn)行了拓展研究;同時本研究重點設(shè)計了主題圖的語義相關(guān)度評價方法,解決了主題圖關(guān)聯(lián)量化的問題,這些成果一方面完善了主題圖的概念關(guān)聯(lián)類知識組織的方法和技術(shù)理論體系,另一方面有利于更深刻揭示主題圖與資源實體間的語義結(jié)構(gòu)。

  成果的社會價值在于:研究提出的主題間、主題與資源間的語義相關(guān)度評價方法,可以用來指導(dǎo)信息和知識資源的組織系統(tǒng)的分析與設(shè)計。將提出的評價方法可應(yīng)用于信息或知識組織與檢索系統(tǒng),能夠提高信息與知識組織的質(zhì)量、檢索的查準(zhǔn)率和查準(zhǔn)率,大大提高了人們獲取信息的質(zhì)量與效率,具有較大的社會效益。
(責(zé)編:陳葉軍)
武平县| 大理市| 聂荣县| 新闻| 宣化县| 台北县| 利川市| 恭城| 天津市| 读书| 临江市| 汉川市| 怀集县| 富民县| 利辛县| 霍城县| 新邵县| 珲春市| 常州市| 岳阳市| 武乡县| 平邑县| 阜康市| 阳东县| 新宁县| 长武县| 繁昌县| 隆化县| 靖边县| 观塘区| 东至县| 新兴县| 江安县| 斗六市| 松桃| 汝城县| 余姚市| 老河口市| 五原县| 嘉善县|