中國人民大學(xué)繼續(xù)教育學(xué)院顧宗連教授主持完成的國家社會科學(xué)基金項(xiàng)目《基于語義網(wǎng)的遠(yuǎn)程教學(xué)資源管理及個性化知識服務(wù)模型研究》(項(xiàng)目批準(zhǔn)號為06BTQ016),最終成果為研究報告、軟件:基于語義網(wǎng)的遠(yuǎn)程教學(xué)資源管理及個性化知識服務(wù)模型研究報告;基于web的本體構(gòu)建和管理平臺;社會化本體構(gòu)建系統(tǒng)平臺;語義網(wǎng)本體的遠(yuǎn)程教育個性化教學(xué)系統(tǒng)。課題組成員有:宋繼華、繆代文、馮霞、孫新、張媛等
一、研究價值和研究背景
廣義上,語義網(wǎng)可以認(rèn)為是能將當(dāng)前的網(wǎng)絡(luò)信息理解為一種帶有語法、句法的網(wǎng)。狹義上,語義網(wǎng)更接近本體含義,理論上被認(rèn)為是一種能對知識進(jìn)行描述的網(wǎng),因而能最完善地解決計算機(jī)信息,特別是知識類信息智能化問題的方法。因此,語義網(wǎng)研究的蓬勃發(fā)展為我國知識資源服務(wù)系統(tǒng),特別是數(shù)字化圖書館知識整合、智能化服務(wù)和知識共享等的發(fā)展帶來了新的機(jī)遇。這項(xiàng)成果研究目的就是探索網(wǎng)絡(luò)信息時代知識型數(shù)字圖書館的語義網(wǎng)知識資源服務(wù)體系的構(gòu)成和創(chuàng)建模式,以及如何為網(wǎng)絡(luò)教育提供個性化知識傳遞和個性化教學(xué)服務(wù)。成果屬于語義網(wǎng)研究領(lǐng)域中的數(shù)字圖書館與網(wǎng)絡(luò)教育教學(xué)領(lǐng)域結(jié)合的基礎(chǔ)性與應(yīng)用性研究課題,也可看作是網(wǎng)絡(luò)時代數(shù)字化圖書館知識整合與知識共享中的一個分支問題。對這種屬于不同學(xué)科領(lǐng)域的交叉研究,無論是國內(nèi)還是國外均很少見到。
業(yè)內(nèi)人士公認(rèn),目前,語義網(wǎng)本體開發(fā)和建設(shè)面臨兩個非常巨大的困難,一個是隨著系統(tǒng)規(guī)則變化越來越多,語義完成所需要的推論時間急劇增加,給搜索帶來困難。解決這個問題需要計算機(jī)硬件和軟件專家的相互配合,這項(xiàng)成果對該問題未做深入討論。此外,語義本體的創(chuàng)建工作量巨大,計算機(jī)專家、學(xué)科領(lǐng)域?qū)<液拖嚓P(guān)研究領(lǐng)域?qū)<叶家恢痹谘芯勘倔w構(gòu)建自動和半自動的方法,成果對此進(jìn)行了嘗試性技術(shù)研究。
二、主要研究內(nèi)容和研究結(jié)論
成果首先對以本體語義網(wǎng)為知識結(jié)構(gòu)的數(shù)字圖書館不同知識資源的關(guān)系、構(gòu)成與建設(shè)模式進(jìn)行了分析;之后,對語義網(wǎng)知識資源與網(wǎng)絡(luò)教育資源建設(shè)和教學(xué)活動的關(guān)系進(jìn)行了梳理,建立了網(wǎng)絡(luò)信息時代學(xué)習(xí)者需要的智能型數(shù)字資源之間的關(guān)系模型。在此基礎(chǔ)上,又從網(wǎng)絡(luò)教育實(shí)踐者的角度,比較系統(tǒng)地開展了語義網(wǎng)本體資源構(gòu)建的研究和基于語義網(wǎng)的知識資源和學(xué)習(xí)活動資源對網(wǎng)絡(luò)教育個性化服務(wù)的研究。
成果在技術(shù)方法上重點(diǎn)關(guān)注了提高語義網(wǎng)本體工程建設(shè)效率的兩種構(gòu)建方法——自然語言處理技術(shù)自動化本體構(gòu)建和社會化本體構(gòu)建;在網(wǎng)絡(luò)教育個性化服務(wù)中,主要研究了本體語義資源的檢索技術(shù)和個性化學(xué)習(xí)內(nèi)容推送技術(shù)等。
。ㄒ唬⿲W(xué)科知識的結(jié)構(gòu)、本體語義網(wǎng)與語義網(wǎng)知識型數(shù)字圖書館的關(guān)系
通過對學(xué)科知識結(jié)構(gòu)和本體層次關(guān)系進(jìn)行對比研究后認(rèn)為:第一,學(xué)科知識,其表現(xiàn)為學(xué)科現(xiàn)象、學(xué)科假說、學(xué)科理論和學(xué)科方法論與本體的四個層次,即應(yīng)用本體、任務(wù)本體、領(lǐng)域本體、頂級本體間存在著對應(yīng)關(guān)系,這種對應(yīng)關(guān)系是我們建立不同類型、不同層次知識本體的基礎(chǔ)。第二,學(xué)科方法論是本體論本身難以歸納描述的一類知識,因此在本體類知識型數(shù)字圖書館知識構(gòu)建中,對這類知識進(jìn)行本體化描述,其準(zhǔn)確度將會受到影響。第三,知識型數(shù)字圖書館的學(xué)科知識是那些具有概括性的、規(guī)律性知識,并不包含偶然的現(xiàn)象和信息。如果使用本體描述這類信息和現(xiàn)象,則準(zhǔn)確度將大大下降。
在深入理解語義網(wǎng)、本體和知識等概念關(guān)系的基礎(chǔ)上,通過文獻(xiàn)調(diào)研,成果對信息時代語義網(wǎng)知識型數(shù)字圖書館的理論構(gòu)想、技術(shù)途徑、服務(wù)模式以及需要解決的問題進(jìn)行了梳理后,得出三個主要結(jié)論:第一,雖然語義網(wǎng)本體的建設(shè)工程非常巨大,但我國已經(jīng)成熟的圖書分類法為構(gòu)建語義網(wǎng)格奠定了重要的理論基礎(chǔ),因此,數(shù)字圖書館具備采用網(wǎng)格、本體語義網(wǎng),逐步構(gòu)建、形成以本體內(nèi)容表達(dá)為主要形式的知識語義網(wǎng)的條件。第二,基于語義網(wǎng)的知識型數(shù)字圖書館不但能更廣泛地發(fā)揮傳統(tǒng)圖書館的作用,而且還可在更廣、更深的層次上發(fā)揮數(shù)字資源特有的知識服務(wù)、特別是遠(yuǎn)程服務(wù)的功能。在遠(yuǎn)程教育及逐步發(fā)展而來的社會化學(xué)習(xí)、終身學(xué)習(xí)社會中,具有語義的知識型數(shù)字圖書館將發(fā)揮出不可替代的重要作用。第三,從語義網(wǎng)知識型數(shù)字圖書館的理論模型我們可以看出,無論從技術(shù)到人力,創(chuàng)建語義網(wǎng)知識型數(shù)字圖書館都是一項(xiàng)巨大的工程,需要各個領(lǐng)域、各個不同知識背景的專家們共同規(guī)劃、統(tǒng)一協(xié)調(diào),克服技術(shù)和管理的難關(guān),才能使這一理想從理論走向現(xiàn)實(shí)。
(二)提高知識本體創(chuàng)建準(zhǔn)確性和效率的方法
這項(xiàng)成果對目前本體構(gòu)建方法和本體構(gòu)建工具進(jìn)行了較為充分的研究,發(fā)現(xiàn)目前這些方法均局限在專家個人創(chuàng)建領(lǐng)域本體的范圍,沒有涉及多專業(yè)集體協(xié)同工作完成本體創(chuàng)建的問題,并且,不同層次的本體創(chuàng)建均需要進(jìn)行先期的技術(shù)處理,以降低工作難度,提高準(zhǔn)確度和工作效率。基于以上認(rèn)識,成果對社會化本體構(gòu)建模式和社會化本體構(gòu)建平臺進(jìn)行了一定的研究,并以此開發(fā)了包括本體創(chuàng)建、管理、評價和生長的軟件平臺,該平臺采用了更廣泛的用戶共同對初始本體進(jìn)行評價和貢獻(xiàn)本體,比較科學(xué)地完成了社會化本體的構(gòu)建、評價和自動演化生長。
語義網(wǎng)研究人員一直在努力尋找,在滿足應(yīng)用需要前提下,高效創(chuàng)建本體的工作方法。面對這一問題,成果首先使用了自然語言處理技術(shù),基于分詞算法的概念抽取技術(shù),對來自于網(wǎng)絡(luò)課程教學(xué)內(nèi)容和該課程所屬專業(yè)詞典的術(shù)語進(jìn)行了初步處理,但試驗(yàn)結(jié)果未能達(dá)到授課教師能夠?qū)πg(shù)語做進(jìn)一步處理的要求。之后,研究人員使用全自動化方式進(jìn)行了本體構(gòu)建,包括本體概念、實(shí)例的自動抽取、關(guān)系的自動構(gòu)建試驗(yàn)研究。研究認(rèn)為,使用自然語言處理技術(shù)進(jìn)行計算機(jī)輔助構(gòu)建本體,全自動化構(gòu)建本體的出發(fā)點(diǎn)是正確的,但應(yīng)用是否有效取決于兩個條件:一個是領(lǐng)域本體要求的精確度。這項(xiàng)研究面對的教育領(lǐng)域、學(xué)術(shù)研究領(lǐng)域是屬于對知識的精確度要求較高的領(lǐng)域;另一個是領(lǐng)域知識可結(jié)構(gòu)化的程度。研究中參考樣例“西方經(jīng)濟(jì)學(xué)”知識本體是一門偏重經(jīng)驗(yàn)類的應(yīng)用學(xué)科,若使用先期處理方法,其結(jié)構(gòu)化程度不能很好滿足教學(xué)本體建設(shè)的需要。為了保證本體能夠符合教學(xué)和科研需要,這項(xiàng)研究參照了《本體工程論》中論述的本體創(chuàng)建方法,開發(fā)了比較適合教學(xué)和教師使用的本體創(chuàng)建工具,由西方經(jīng)濟(jì)學(xué)課程專家完成了課程知識領(lǐng)域初始本體的構(gòu)建工作,包括100多個類、40多個屬性、700多個個體。該本體創(chuàng)建系統(tǒng)包含有:類管理、屬性管理、個體管理、查詢功能、圖形可視化功能和導(dǎo)出owl本體文件等功能。
。ㄈ┚W(wǎng)絡(luò)學(xué)習(xí)領(lǐng)域本體構(gòu)建和個性化學(xué)習(xí)服務(wù)
課題組經(jīng)過文獻(xiàn)調(diào)研和分析認(rèn)為,由于前面提到的本體語義網(wǎng)在知識表達(dá)方面的固有缺陷,應(yīng)用于計算機(jī)網(wǎng)絡(luò)遠(yuǎn)程學(xué)習(xí)的智能化資源不應(yīng)該只含有語義網(wǎng),而需要多種類、多層次資源的組合。研究認(rèn)為,基于語義網(wǎng)的個性化教學(xué)資源服務(wù)模型包括四個層次,分別是信息資源層、靜態(tài)知識層、動態(tài)知識層、智能服務(wù)層。這樣,在固化語義關(guān)聯(lián)的靜態(tài)知識基礎(chǔ)上,知識服務(wù)在使用過程中能不斷演化和改進(jìn),確保了知識服務(wù)的靈活性、動態(tài)性和智能性。這項(xiàng)研究針對非本體類學(xué)習(xí)資源,利用本體標(biāo)注工具,進(jìn)行了知識標(biāo)注,使這些網(wǎng)頁具有語義性質(zhì),成為計算機(jī)可理解的知識,為智能檢索、智能答疑、個性化知識推送等智能教學(xué)打下了基礎(chǔ)。
這項(xiàng)成果還認(rèn)為,一個完整的、以語義網(wǎng)為基礎(chǔ)的個性化智能教學(xué)系統(tǒng),領(lǐng)域本體不能僅限于課程知識領(lǐng)域和相關(guān)學(xué)科知識領(lǐng)域本體,還需要包括教學(xué)策略領(lǐng)域本體、學(xué)生學(xué)習(xí)模型領(lǐng)域本體、學(xué)習(xí)診斷模型領(lǐng)域本體等。為了實(shí)施個性化學(xué)習(xí)服務(wù),課題組對遠(yuǎn)程教學(xué)理論和適應(yīng)成人學(xué)習(xí)者的遠(yuǎn)程學(xué)習(xí)模型進(jìn)行了研究,對未來網(wǎng)絡(luò)學(xué)習(xí)的發(fā)展趨勢——社會化協(xié)作學(xué)習(xí)模式進(jìn)行了研究。采用了北京師范大學(xué)遠(yuǎn)程教育研究所開發(fā)的“中國遠(yuǎn)程學(xué)習(xí)者學(xué)習(xí)風(fēng)格量表”,并將該學(xué)習(xí)風(fēng)格分析結(jié)果與跟蹤記錄學(xué)習(xí)者學(xué)習(xí)行為系統(tǒng)相結(jié)合,建立了學(xué)習(xí)者動態(tài)學(xué)習(xí)模型。在分析了學(xué)習(xí)目標(biāo)和學(xué)習(xí)者學(xué)習(xí)特征基礎(chǔ)上,課題組采用了探究、協(xié)作和任務(wù)驅(qū)動的學(xué)習(xí)策略,對課程學(xué)習(xí)系統(tǒng)進(jìn)行了詳細(xì)的設(shè)計,包括知識導(dǎo)航、交流環(huán)境、學(xué)習(xí)模塊、學(xué)習(xí)跟蹤及反饋、教師操作功能等。其中基于本體知識的圖形導(dǎo)航、課程Blog和學(xué)習(xí)者個人Blog相結(jié)合的交流環(huán)境、記錄學(xué)習(xí)者瀏覽資源等的電子學(xué)檔、個性化學(xué)習(xí)建議等功能可以為學(xué)習(xí)者提供較為完整的個性化學(xué)習(xí)服務(wù),具有較好的應(yīng)用價值。
在個性化學(xué)習(xí)服務(wù)技術(shù)研究方面,這項(xiàng)成果基于本體的智能檢索和個性化學(xué)習(xí)內(nèi)容推送兩個方面開展了研究,實(shí)現(xiàn)了基于本體的智能查詢;實(shí)現(xiàn)了基于學(xué)習(xí)背景的學(xué)習(xí)建議內(nèi)容推送、基于關(guān)鍵字查詢的內(nèi)容推送、基于學(xué)習(xí)進(jìn)度的內(nèi)容推送、基于課程 Blog的內(nèi)容推送、基于學(xué)習(xí)者學(xué)習(xí)評價的內(nèi)容推送和基于知識結(jié)構(gòu)的內(nèi)容推送等。研究認(rèn)為,首先,個性化智能服務(wù)是一個多學(xué)科綜合問題,另外,目前語義智能檢索系統(tǒng)本身也存在諸多問題,如對信息資源的自動標(biāo)注問題,檢索結(jié)果的排序問題等,這些問題將直接影響到檢索的效率。因此,這些方面還需要研究者們進(jìn)行更深入的探索。
(責(zé)編:陳葉軍)