舊版網(wǎng)站入口

站內(nèi)搜索

《基于多維度聚合的網(wǎng)絡(luò)資源知識發(fā)現(xiàn)研究》中期檢查報告

2016年03月11日14:39

一、 研究進(jìn)展情況

1. 研究計(jì)劃總體執(zhí)行情況及各子課題進(jìn)展情況

總體上,本項(xiàng)目組成員依據(jù)項(xiàng)目的研究計(jì)劃和時間安排,基本完成了預(yù)期的研究目標(biāo)。目前,本課題的研究工作和進(jìn)度基本與研究計(jì)劃吻合,主要對項(xiàng)目的總體研究框架,子課題一和子課題二展開了廣泛而深入的研究。具體來說,本課題的研究工作與進(jìn)度如下:

1.1研究架構(gòu)

課題組在進(jìn)一步了解本課題相關(guān)領(lǐng)域理論研究和實(shí)踐進(jìn)展的基礎(chǔ)上,完善了研究架構(gòu),確定了研究重點(diǎn)和難點(diǎn),進(jìn)一步明確了任務(wù)分工。在此基礎(chǔ)上,制定了最終的研究方案。形成了一篇研究成果《基于多維度聚合的網(wǎng)絡(luò)資源知識發(fā)現(xiàn)》(已經(jīng)錄用),該論文詳細(xì)論述了基于多維度的網(wǎng)絡(luò)資源知識發(fā)現(xiàn)框架。該框架依據(jù)知識發(fā)現(xiàn)的基本流程(數(shù)據(jù)準(zhǔn)備->數(shù)據(jù)挖掘->解釋與評估),從網(wǎng)絡(luò)信息資源的結(jié)構(gòu)信息、網(wǎng)絡(luò)內(nèi)容信息和網(wǎng)絡(luò)使用信息三個維度,分別探討三個維度上的網(wǎng)絡(luò)信息資源的知識發(fā)現(xiàn)方法,而后在上述研究基礎(chǔ)上,探討面向全網(wǎng)絡(luò)資源多維度聚合的知識發(fā)現(xiàn)方法。由此可見,該知識發(fā)現(xiàn)框架既遵循知識發(fā)現(xiàn)的一般規(guī)律,具有可靠的理論基礎(chǔ),同時又針對網(wǎng)絡(luò)資源的特性,具有針對性。最后,論文又依托該框架,以科技成果資源為應(yīng)用對象,設(shè)計(jì)了基于多維度聚合的網(wǎng)絡(luò)資源知識發(fā)現(xiàn)框架的應(yīng)用實(shí)施方案。通過上述分析可知,本論文作為項(xiàng)目初步研究成果,具有提綱挈領(lǐng)的作用,為后繼的研究提供了方向和實(shí)施方案。

1.2子課題一研究進(jìn)展

子課題1的研究已經(jīng)全面展開,重點(diǎn)研究了四個方面的內(nèi)容:網(wǎng)絡(luò)資源的關(guān)聯(lián)結(jié)構(gòu)特征研究,網(wǎng)絡(luò)資源關(guān)聯(lián)網(wǎng)絡(luò)中的知識分布研究,網(wǎng)絡(luò)資源關(guān)聯(lián)網(wǎng)絡(luò)的演化研究,網(wǎng)絡(luò)資源關(guān)聯(lián)網(wǎng)絡(luò)中的用戶行為研究。具體來說,各部分的研究情況如下:

(1) 網(wǎng)絡(luò)資源的關(guān)聯(lián)結(jié)構(gòu)特征研究

對網(wǎng)絡(luò)資源關(guān)聯(lián)網(wǎng)絡(luò)結(jié)構(gòu)形態(tài)進(jìn)行研究,重點(diǎn)考察了以下幾個方面的內(nèi)容:首先,對關(guān)聯(lián)網(wǎng)絡(luò)的基本特征進(jìn)行統(tǒng)計(jì)分析,通過度分布、聚類系數(shù)的統(tǒng)計(jì)分析考察關(guān)聯(lián)網(wǎng)絡(luò)知識節(jié)點(diǎn)的離散聚合特征,通過特征路徑長度分析考察知識節(jié)點(diǎn)的連通性和距離;其次,進(jìn)一步研究了關(guān)聯(lián)網(wǎng)絡(luò)中的社區(qū)結(jié)構(gòu),從中觀層次分析知識的集聚特征和領(lǐng)域劃分,通過對研究網(wǎng)絡(luò)的層次結(jié)構(gòu)研究領(lǐng)域關(guān)鍵詞的層次性,通過對網(wǎng)絡(luò)自相似形態(tài)的分析考察關(guān)聯(lián)網(wǎng)絡(luò)的對稱性和復(fù)制性;最后,以模體和群落為對象分析了網(wǎng)絡(luò)資源的中觀結(jié)構(gòu),探尋從微觀個體到宏觀結(jié)構(gòu)的聯(lián)系。論文《網(wǎng)絡(luò)資源的關(guān)聯(lián)結(jié)構(gòu)探析》正在撰寫中,論文架構(gòu)已經(jīng)搭建,實(shí)驗(yàn)數(shù)據(jù)已經(jīng)搜集。

(2) 網(wǎng)絡(luò)資源關(guān)聯(lián)網(wǎng)絡(luò)中的知識分布研究

本部分重點(diǎn)研究了網(wǎng)絡(luò)資源關(guān)聯(lián)網(wǎng)絡(luò)中的知識特征與規(guī)律。已經(jīng)形成論文《網(wǎng)絡(luò)資源關(guān)聯(lián)網(wǎng)絡(luò)中的知識分布規(guī)律研究》(正在撰寫),該論文主要通過統(tǒng)計(jì)分析關(guān)聯(lián)網(wǎng)絡(luò)的節(jié)點(diǎn)分布,識別關(guān)鍵知識節(jié)點(diǎn);通過研究連接分布,分析關(guān)聯(lián)網(wǎng)絡(luò)的中心節(jié)點(diǎn)/中心連線;通過研究關(guān)聯(lián)網(wǎng)絡(luò)知識單元的作者分布,尋找網(wǎng)絡(luò)中的關(guān)鍵的知識生產(chǎn)者;通過研究作者合作關(guān)系,探索關(guān)聯(lián)網(wǎng)絡(luò)中的知識合作和知識遷移;通過研究關(guān)聯(lián)網(wǎng)絡(luò)中的機(jī)構(gòu)分布,尋找知識創(chuàng)造的核心群體;通過知識節(jié)點(diǎn)產(chǎn)生時間的分布研究,分析知識節(jié)點(diǎn)的增長老化特征;通過對網(wǎng)絡(luò)資源類型的時序統(tǒng)計(jì)分析,探索資源的分布和資源生產(chǎn)的發(fā)展趨勢。

(3) 網(wǎng)絡(luò)資源關(guān)聯(lián)網(wǎng)絡(luò)的演化研究

本部分重點(diǎn)研究了在大數(shù)據(jù)環(huán)境下,網(wǎng)絡(luò)資源關(guān)聯(lián)網(wǎng)絡(luò)動態(tài)演化特征,通過分析與實(shí)證研究,我們發(fā)現(xiàn)一方面網(wǎng)絡(luò)資源關(guān)聯(lián)網(wǎng)絡(luò)的結(jié)構(gòu)形態(tài)是隨時間動態(tài)變化的,另一方面網(wǎng)絡(luò)資源關(guān)聯(lián)網(wǎng)絡(luò)的結(jié)構(gòu)演化形成網(wǎng)絡(luò)中的小世界效應(yīng)和無標(biāo)度特征。小世界效應(yīng)表現(xiàn)知識單元的強(qiáng)關(guān)聯(lián)性,無標(biāo)度反映知識節(jié)點(diǎn)的非均勻性。此外,通過研究網(wǎng)絡(luò)中心性的遷移規(guī)則,分析了中心遷移和新知識產(chǎn)生的關(guān)系,通過研究了網(wǎng)絡(luò)中的弱鏈接,討論了新知識的演化和發(fā)現(xiàn)。

(4) 網(wǎng)絡(luò)資源關(guān)聯(lián)網(wǎng)絡(luò)中的用戶行為研究。

有關(guān)網(wǎng)絡(luò)資源關(guān)聯(lián)網(wǎng)絡(luò)中的用戶行為研究主要探索了:用戶的檢索和使用路徑的形成規(guī)律和內(nèi)在動因。并形成了論文《社會化標(biāo)簽系統(tǒng)中基于社會網(wǎng)絡(luò)的知識推送網(wǎng)絡(luò)演化研究》(已經(jīng)發(fā)表),具體來說,主要是利用網(wǎng)絡(luò)分析方法,將社會化標(biāo)簽系統(tǒng)中基于社會網(wǎng)絡(luò)的知識推送網(wǎng)絡(luò)構(gòu)造方法描述為六個步驟。借鑒演化理論,將基于社會網(wǎng)絡(luò)的知識推送網(wǎng)絡(luò)演化動力歸納為內(nèi)生動力和外生動力。移植生物進(jìn)化論的相關(guān)理論,提出多重動力機(jī)制作用下基于社會網(wǎng)絡(luò)的知識推送網(wǎng)絡(luò)演化周期性模型: 每個周期的起點(diǎn)就是新一輪社會網(wǎng)絡(luò)的構(gòu)建,每個周期內(nèi)部的演化過程分為選擇階段、遺傳階段、變異階段。該知識推送網(wǎng)絡(luò)演化模型,為向用戶提供主動推送服務(wù)提供了依據(jù)。

1.3子課題二研究進(jìn)展

課題2網(wǎng)絡(luò)資源語義揭示與多維度聚合已經(jīng)展開初步的研究。具體來說,主要是對海量網(wǎng)絡(luò)信息資源的多粒度分割、語義提取、語義標(biāo)注、多維度聚合等幾個方面進(jìn)行了探索,并形成了相關(guān)研究成果《基于有序分類的文本多粒度分割與語義標(biāo)注研究》(已經(jīng)投稿),網(wǎng)絡(luò)通常以一篇web文檔作為網(wǎng)絡(luò)信息資源組織的基本單位,信息組織的粒度過粗,這也直接導(dǎo)致很難實(shí)現(xiàn)檢索即所得的信息資源精準(zhǔn)定位服務(wù),更難完成網(wǎng)絡(luò)信息資源的多維度語義關(guān)聯(lián),實(shí)現(xiàn)網(wǎng)絡(luò)信息資源的關(guān)聯(lián)集成服務(wù)。為解決網(wǎng)絡(luò)信息資源組織存在的上述問題,該論文采取有序分類的方法對網(wǎng)絡(luò)信息資源的多粒度分割與語義標(biāo)注進(jìn)行了研究,提出了基于有序分類的文本多粒度層級分割與語義標(biāo)注方法,該方法在總體上采取自下而上的分層聚類的方法來實(shí)現(xiàn)網(wǎng)絡(luò)內(nèi)容信息的層級分割,構(gòu)建出一棵文檔分割樹。該結(jié)構(gòu)的突出優(yōu)勢是可以實(shí)現(xiàn)信息資源的多粒度組織。在對網(wǎng)絡(luò)內(nèi)容信息進(jìn)行多粒度分割的同時,進(jìn)行各個粒度層次上的語義提取與關(guān)聯(lián),并形成論文《Research on fine-grained linked data creation for digital library resources》(已經(jīng)投稿),具體來說,采取潛在語義分析的方式進(jìn)行文檔分割樹各個粒度層次上的語義提取,而后,基于相似度計(jì)算、基于規(guī)則推理,借助D2R,SILK等工具,實(shí)現(xiàn)各個粒度層次上的語義關(guān)聯(lián),將各個文檔分割樹關(guān)聯(lián)成多粒度的語義網(wǎng)絡(luò)結(jié)構(gòu)(也即關(guān)聯(lián)數(shù)據(jù)),實(shí)現(xiàn)網(wǎng)絡(luò)內(nèi)容信息的多粒度多維度的語義關(guān)聯(lián),進(jìn)而滿足網(wǎng)絡(luò)用戶的多粒度的信息需求,實(shí)現(xiàn)檢索即所得的集成知識服務(wù),降低用戶負(fù)擔(dān),提高用戶滿意度。

2. 調(diào)查研究及學(xué)術(shù)交流情況

(1)文獻(xiàn)資料收集

通過圖書館、期刊網(wǎng)、互聯(lián)網(wǎng)、內(nèi)部參考、簡報等渠道大量收集了國內(nèi)外與本課題相關(guān)的文獻(xiàn)。下載了期刊論文438篇,學(xué)位論文30余篇,會議論文120余篇,此外還通過各種渠道獲得了時新的PPT,研究手稿等重要的研究資料,并對這些資料進(jìn)行了分類,整理。

(2)學(xué)術(shù)會議與交流

為分享研究成果,征得其他專家學(xué)者的幫助,項(xiàng)目成員也開展了廣泛的學(xué)術(shù)交流。具體來說:已在11th International Conference on Knowledge Management上投稿,該會議將于2015年11月在日本舉行。

(3)國際合作

為與項(xiàng)目組的國外專家開展廣泛的合作,派遣多名項(xiàng)目成員去國外訪學(xué),在國外專家的指導(dǎo)下深入開展項(xiàng)目的研究工作。

3. 研究中存在的主要問題、改進(jìn)措施,研究心得、意見建議

隨著項(xiàng)目研究的不斷拓展和深入,在項(xiàng)目研究中也遇到了一些問題。這些問題給項(xiàng)目的順利開展帶來了不小的困難。具體來說,主要體現(xiàn)在以下幾個方面:

(1)隨著項(xiàng)目研究的不斷擴(kuò)展,各子課題研究的內(nèi)容也越來越豐富,這勢必會造成各個子課題內(nèi)部,以及子課題之間的研究內(nèi)容之間的聯(lián)系越來越復(fù)雜,使得整體把握項(xiàng)目的內(nèi)在聯(lián)系變得越來越困難。

(2)隨著項(xiàng)目研究的不斷深入,各子課題探索的內(nèi)容也越來越專指,這勢必會造成各子課題之間關(guān)聯(lián)性的降低,甚至脫節(jié),使得項(xiàng)目研究偏離研究的核心內(nèi)容。

為解決上述問題,保證項(xiàng)目研究的順利進(jìn)行,項(xiàng)目組經(jīng)過討論,對項(xiàng)目組的成員結(jié)構(gòu)進(jìn)行了調(diào)整。除設(shè)立“學(xué)術(shù)秘書”負(fù)責(zé)整體協(xié)調(diào)各子課題的研究進(jìn)展之外,還在各子課題之間設(shè)立了“跨子課題研究專員”,該研究專員負(fù)責(zé)兩個子課題之間的銜接。

二、 研究成果情況

三、 代表性成果簡介

(1)《基于多維度聚合的網(wǎng)絡(luò)資源知識發(fā)現(xiàn)框架研究》(已經(jīng)錄用)

該論文詳細(xì)論述了基于多維度的網(wǎng)絡(luò)資源知識發(fā)現(xiàn)框架。該框架依據(jù)知識發(fā)現(xiàn)的基本流程(數(shù)據(jù)準(zhǔn)備->數(shù)據(jù)挖掘->解釋與評估),從網(wǎng)絡(luò)信息資源的結(jié)構(gòu)信息、網(wǎng)絡(luò)內(nèi)容信息和網(wǎng)絡(luò)使用信息三個維度,分別探討三個維度上的網(wǎng)絡(luò)信息資源的知識發(fā)現(xiàn)方法,而后在上述研究基礎(chǔ)上,探討面向全網(wǎng)絡(luò)資源多維度聚合的知識發(fā)現(xiàn)方法。由此可見,該知識發(fā)現(xiàn)框架既遵循知識發(fā)現(xiàn)的一般規(guī)律,具有可靠的理論基礎(chǔ),同時又針對網(wǎng)絡(luò)資源的特性,具有針對性。最后,論文又依托該框架,以科技成果資源為應(yīng)用對象,設(shè)計(jì)了基于多維度聚合的網(wǎng)絡(luò)資源知識發(fā)現(xiàn)框架的應(yīng)用實(shí)施方案。

(2)《社會化標(biāo)簽系統(tǒng)中基于社會網(wǎng)絡(luò)的知識推送網(wǎng)絡(luò)演化研究》(已經(jīng)發(fā)表)

該論文主要是利用網(wǎng)絡(luò)分析方法,將社會化標(biāo)簽系統(tǒng)中基于社會網(wǎng)絡(luò)的知識推送網(wǎng)絡(luò)構(gòu)造方法描述為六個步驟。借鑒演化理論,將基于社會網(wǎng)絡(luò)的知識推送網(wǎng)絡(luò)演化動力歸納為內(nèi)生動力和外生動力。移植生物進(jìn)化論的相關(guān)理論,提出多重動力機(jī)制作用下基于社會網(wǎng)絡(luò)的知識推送網(wǎng)絡(luò)演化周期性模型: 每個周期的起點(diǎn)就是新一輪社會網(wǎng)絡(luò)的構(gòu)建,每個周期內(nèi)部的演化過程分為選擇階段、遺傳階段、變異階段。

四、 階段性成果清單

[1] 基于多維度聚合的網(wǎng)絡(luò)資源知識發(fā)現(xiàn). 夏立新,陳晨,王忠義.論文.情報科學(xué)雜志.錄用.9274字.

[2] 社會化標(biāo)簽系統(tǒng)中基于社會網(wǎng)絡(luò)的知識推送網(wǎng)絡(luò)演化研究.易明,毛進(jìn),鄧衛(wèi)華,曹高輝.論文.中國圖書館學(xué)報.2014年3月.16373字

[3] Inferring microbial interaction networks based on consensus similarity network fusion.Jiang Xingpeng, Hu Xiaohua. 論文,Science China.2014年11月,4024字.

[4] Social network analysis on a topic based navigation guidance system in a public health portal. Journal of the American Society for Information Science & Technology. Zhang, J., Zhai, S., Liu, H., & Stevenson, J.(2015年已錄用)

[5] Optimization of the Subject Directory in a Government Agriculture Department Web Portal. Journal of the American Society for Information Science & Technology. Zhang, J., Zhai, S., Stevenson, J. & Xia, L.(2015年已錄用)

[6] 大數(shù)據(jù)時代情報危機(jī)的發(fā)展演變及其應(yīng)對策略.夏立新,陳燕芳.情報學(xué)報(二審)。

(責(zé)編:李葉)
延津县| 南城县| 天长市| 介休市| 武夷山市| 莆田市| 噶尔县| 自治县| 漳州市| 阿拉善左旗| 荥经县| 七台河市| 嘉义市| 永修县| 渑池县| 西安市| 广元市| 临高县| 福清市| 临潭县| 周至县| 龙游县| 福贡县| 英超| 汝阳县| 合作市| 都安| 罗平县| 清远市| 深州市| 太白县| 五常市| 监利县| 蒙城县| 宾川县| 巍山| 吴旗县| 镇远县| 青铜峡市| 蒙阴县|