一、 研究進(jìn)展情況
1、課題開題與子課題進(jìn)展情況
課題“大數(shù)據(jù)時(shí)代知識融合的體系架構(gòu)、實(shí)現(xiàn)模式及實(shí)證研究”自立項(xiàng)以來,認(rèn)真組織、積極探討,按照項(xiàng)目預(yù)定計(jì)劃及國家社會科學(xué)基金各項(xiàng)規(guī)定執(zhí)行。項(xiàng)目整體進(jìn)展順利,召開課題啟動會1次,邀請校內(nèi)外專家進(jìn)行指導(dǎo)把關(guān);課題組及各子課題之間定期召開討論會,討論項(xiàng)目進(jìn)展及下一步研究計(jì)劃。其中課題核心成員約10人堅(jiān)持每周開組會。
截至2017年7月底,共發(fā)表學(xué)術(shù)論文4篇,其中英文論文1篇(SCI收錄),中文論文3篇。項(xiàng)目首席專家或子課題負(fù)責(zé)人學(xué)術(shù)報(bào)告14人次,其中在全國性全學(xué)術(shù)會議上學(xué)術(shù)報(bào)告7次,專題報(bào)告2次,博士生在海外報(bào)告2次,國內(nèi)報(bào)告3次。子課題負(fù)責(zé)人劉曉娟老師與化柏林老師在本課題研究的基礎(chǔ)上,進(jìn)一步拓展研究,并分別以“社交媒體視域下科研評價(jià)的理論與方法研究”與“基于多源數(shù)據(jù)融合的情報(bào)用戶需求探測研究”為題申報(bào)國家社會科學(xué)基金面上項(xiàng)目,并于今年獲批。具體情況如下:
(1)已發(fā)表論文
[1] Hui Xie, Guangjian Li, Yongjie Yan, and Sihui Shu, “Evolution of Bounded Confidence Opinion in Social Networks,” Discrete Dynamics in Nature and Society, vol. 2017, Article ID 3173016, 5 pages, 2017. doi:10.1155/2017/3173016. ISSN: 1026-0226.(SCI檢索)
[2] 祝振媛,李廣建.“數(shù)據(jù)-信息-知識”整體視角下的知識融合初探. 情報(bào)理論與實(shí)踐, 2017(2)
[3] 劉曉娟,李廣建,化柏林.知識融合:概念辨析與界說[J].圖書情報(bào)工作,2016,60(13)
[4] 李廣建,劉曉娟,王昊賢.知識融合研究進(jìn)展. 載《信息資源管理研究進(jìn)展》,武漢大學(xué)出版社,2017年
(2)拓展項(xiàng)目
2017年國家社會科學(xué)基金面上項(xiàng)目
[1] 社交媒體視域下科研評價(jià)的理論與方法研究.劉曉娟.北京師范大學(xué)
[2] 基于多源數(shù)據(jù)融合的情報(bào)用戶需求探測研究.化柏林.北京大學(xué)
2、調(diào)查研究及學(xué)術(shù)交流情況
(1)調(diào)研數(shù)據(jù)整理
知識融合項(xiàng)目組自立項(xiàng)以來已準(zhǔn)備各項(xiàng)支撐數(shù)據(jù)與實(shí)驗(yàn)數(shù)據(jù),目前已通過各種渠道與方式獲取LIS領(lǐng)域在WoS上文獻(xiàn)題錄數(shù)據(jù)近30萬條,通過arvix獲取開放全文數(shù)據(jù)1123000篇,約1個TB,下載專利數(shù)據(jù)近1百萬條等,另外還有主題詞表、情感詞表、領(lǐng)域本體等支撐數(shù)據(jù),收集并整理了一些微博等社會媒體數(shù)據(jù)。
(2)文獻(xiàn)資料收集整理
項(xiàng)目組廣泛搜集各類文獻(xiàn)資料,截至2017年7月底共收集與項(xiàng)目相關(guān)的學(xué)術(shù)期刊論文200余篇,講稿PPT30余份,學(xué)術(shù)著作20余部。
(3)學(xué)術(shù)交流
[1] 李廣建. 數(shù)據(jù)挖掘、知識融合與知識服務(wù),2015全國知識組織與知識鏈接學(xué)術(shù)交流會,2016 年 9 月19-21 日,武漢
[2] 李廣建. 數(shù)據(jù)挖掘、知識融合與知識服務(wù), 2016年京津冀信息資源管理高峰論壇 2016年11月17-18日,保定
[3] 李廣建. 大數(shù)據(jù)時(shí)代的知識融合 2016全國知識組織與知識鏈接學(xué)術(shù)交流會,2016年12月10-12日,北京
[4]張智雄. 基于對象計(jì)算的知識揭示和組織——四類不同知識的揭示和組織應(yīng)用方法. 2016全國知識服務(wù)與情報(bào)工程學(xué)術(shù)交流會,2016年12月8-9日,北京
[5] 化柏林. 面向智能情報(bào)的知識抽取. 2016 全國知識服務(wù)與情報(bào)工程學(xué)術(shù)交流會,2016年12月8-9日,北京
[6] 李廣建. 基于大數(shù)據(jù)技術(shù)的可配置計(jì)算型情報(bào)分析系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn),首屆數(shù)據(jù)分析與知識發(fā)現(xiàn)學(xué)術(shù)會議,2017年6月8-9日,北京
[7] 李廣建. 基于機(jī)器學(xué)習(xí)的情報(bào)分析比較方法研究與實(shí)現(xiàn),數(shù)據(jù)驅(qū)動知識發(fā)現(xiàn):情報(bào)學(xué)與數(shù)據(jù)科學(xué)的交互與融匯國際研討會,2016年6月19-22日,北京
[8]王曉笛《A Study on LDA Topic Modeling Topic Word Interpretation Aided by Automatic Methods》.亞太信息學(xué)院論壇(the Asia-Pacific Forum of Information Schools,APIS2016)和第18屆亞太數(shù)字圖書館國際會議(18th International Conference on Asia-Pacific Digital Libraries,ICADL2016),2016年12月5-9日,日本筑波(注:該論文獲博士生論壇的最佳論文獎)
[9] 徐敏. Research on frontier topic detection based on probability outbreak and correlation analysis. APIS2016 & 18th International Conference on Asia-Pacific Digital Libraries,ICADL2016),2016年12月5-9日,日本筑波
3、學(xué)術(shù)會議與學(xué)術(shù)交流活動
(1)學(xué)術(shù)會議
項(xiàng)目開題論證會
2016年3月8日,北京大學(xué)信息管理系李廣建教授主持的國家社會科學(xué)基金重大項(xiàng)目“大數(shù)據(jù)時(shí)代知識融合的體系架構(gòu)、實(shí)現(xiàn)模式及實(shí)證研究”開題論證會在信息管理系507會議室召開。出席論證會的專家有:中國社會科學(xué)院學(xué)部委員、國家社科規(guī)劃辦圖書館?情報(bào)與文獻(xiàn)學(xué)學(xué)科規(guī)劃評審組組長黃長著研究員,中國科學(xué)技術(shù)信息研究所黨委書記趙志耘研究員,中國國防科技信息中心主任劉林山研究員,南開大學(xué)信息資源管理系柯平教授,中國人民大學(xué)信息資源管理學(xué)院副院長盧小賓教授。北京大學(xué)校長助理、社會科學(xué)部部長王博教授出席了此次會議。開題論證會由黃長著研究員主持。
王博教授首先代表學(xué)校對出席論證會的各位專家表示熱烈歡迎和感謝,并對李廣建教授獲批國家社科基金重大項(xiàng)目表示祝賀。他充分肯定了課題組在項(xiàng)目申請中取得的成績,并指出,能取得國家社科基金重大項(xiàng)目是一件好事,但是將項(xiàng)目做好才是最終目的,今天各位專家為項(xiàng)目把脈論證,課題組要認(rèn)真領(lǐng)會并充分吸收專家的建議,為高水平地完成項(xiàng)目任務(wù)奠定基礎(chǔ)。王博教授還表示,學(xué)校社會科學(xué)部會大力支持課題組的研究工作,并預(yù)祝項(xiàng)目順利完成。
項(xiàng)目首席專家李廣建教授從課題研究內(nèi)容的設(shè)計(jì)、研究的改進(jìn)和實(shí)施方案等三個方面進(jìn)行了匯報(bào),論述了四個子課題的內(nèi)容構(gòu)成和相互關(guān)系,并提出了本課題研究可能的四個創(chuàng)新點(diǎn)以及目標(biāo)成果。他針對課題申報(bào)過程中的評審意見,從知識融合的概念辨析、新文獻(xiàn)的計(jì)量分析與跟蹤、實(shí)驗(yàn)數(shù)據(jù)的準(zhǔn)備與計(jì)劃三個方面介紹了項(xiàng)目的改進(jìn)情況。四位子課題負(fù)責(zé)人北京大學(xué)信息管理系申靜教授、化柏林助理教授,中國科學(xué)院文獻(xiàn)情報(bào)中心張智雄研究員,北京師范大學(xué)政府管理學(xué)院劉曉娟副教授分別就大數(shù)據(jù)時(shí)代知識融合的理論研究、知識融合體系架構(gòu)研究、知識融合技術(shù)方法與實(shí)現(xiàn)模式研究、知識融合系統(tǒng)原型與實(shí)證研究進(jìn)行了匯報(bào)。
本次論證會中,專家對課題研究中的重點(diǎn)、難點(diǎn)、關(guān)鍵問題,以及可能產(chǎn)生的重要突破點(diǎn)等都提出了一系列具有重要價(jià)值的具體建議,使得課題組成員進(jìn)一步拓寬了研究思路,明確了研究任務(wù)。課題組成員圍繞具體研究問題與專家們進(jìn)行了深入交流,李廣建教授代表課題組感謝專家們的寶貴建議,并表態(tài)說,課題組成員將會通力合作,按時(shí)保質(zhì)完成課題工作,力爭產(chǎn)出高質(zhì)量高水準(zhǔn)的科研成果。
(2)專題報(bào)告
[1] 2017年5月31日下午,子課題負(fù)責(zé)人張智雄研究員受邀到中科院蘭州文獻(xiàn)情報(bào)中心作題為《豐富語義組織揭示的研究與實(shí)踐》的學(xué)術(shù)報(bào)告,蘭州文獻(xiàn)情報(bào)中心相關(guān)業(yè)務(wù)部門人員及研究生60余人參加了報(bào)告會。
[2] 2017年4月28日上午,子課題負(fù)責(zé)人化柏林研究員受邀到中國人民大學(xué)信息資源管理學(xué)院作題為《針對學(xué)術(shù)文獻(xiàn)的句子級知識抽取》的學(xué)術(shù)報(bào)告,并與該學(xué)院的師生進(jìn)行了交流。
(3)國際合作
2016年7月5-8日,課題組成員化柏林赴德國參加第19屆信息融合國際會議,在會議期間聆聽了國際同行的報(bào)告,并與一些人員作了交流;貒笈c課題組成員進(jìn)行了分享。
4、成果推介與宣傳
2016年03月16日中國社會科學(xué)網(wǎng)報(bào)道了“李廣建教授主持2015年度重大項(xiàng)目開題論證會召開”,http://www.cssn.cn/skjj/skjj_jjgg/201603/t20160316_2925137.shtml
由于本項(xiàng)目基礎(chǔ)工作量較大,目前尚未形成重大研究成果。課題組將悉心組織,全力攻克關(guān)鍵技術(shù)問題,在一到兩年內(nèi)多報(bào)送成果。
二、 研究成果情況
代表性成果簡介:
[1] 論文《知識融合:概念辨析與界說》(圖書情報(bào)工作,2016) 的基本內(nèi)容、主要觀點(diǎn)與學(xué)術(shù)價(jià)值:
通過充分調(diào)研和分析,在理論和實(shí)踐層面汲取以往研究中的觀點(diǎn)和成果,一方面選取不同時(shí)期和不同領(lǐng)域的知識融合概念的典型表述,并分別提取“處理對象”“融合過程”以及“融合結(jié)果”3 個關(guān)鍵要素; 另一方面通過知識融合系統(tǒng)體系架構(gòu)的剖析來進(jìn)一步明確知識融合的研究范疇與邊界。綜合概括得到一個相對完整的知識融合概念定義,并從流程角度對知識融合概念進(jìn)行分解。
文章認(rèn)為,知識融合是面向知識服務(wù)和決策問題,以多源異構(gòu)數(shù)據(jù)為基礎(chǔ),在本體庫和規(guī)則庫的支持下,通過知識抽取和轉(zhuǎn)換獲得隱藏在數(shù)據(jù)資源中的知識因子及其關(guān)聯(lián)關(guān)系,進(jìn)而在語義層次上組合、推理、創(chuàng)造出新知識的過程,并且這個過程需要根據(jù)數(shù)據(jù)源的變化和用戶反饋進(jìn)行實(shí)時(shí)動態(tài)調(diào)整
知識融合是一個隨技術(shù)環(huán)境和社會環(huán)境不斷發(fā)展變化的概念,并可應(yīng)用于多個學(xué)科領(lǐng)域,然而目前學(xué)術(shù)領(lǐng)域?qū)χR融合的概念界定還缺少一致的理解,對其進(jìn)行辨析有利于推動后續(xù)研究。
文章結(jié)合當(dāng)前的理論和實(shí)踐研究,選取來自不同年代、不同學(xué)科領(lǐng)域的典型概念表述和系統(tǒng)體系架構(gòu),從中提取共同特征,把握知識融合的核心要素; 同時(shí)也對其中存在的差異進(jìn)行了探究,以便判別知識融合的邊界與范疇,進(jìn)而綜合概括得到一個相對全面的知識融合概念的定義,以期明確知識融合概念的內(nèi)涵與外延,為下一步的理論研究和系統(tǒng)開發(fā)奠定基礎(chǔ)。
[2] 論文《“數(shù)據(jù)-信息-知識”整體視角下的知識融合初探》.(情報(bào)理論與實(shí)踐, 2017)的主要內(nèi)容與觀點(diǎn):
文章在調(diào)研融合研究文獻(xiàn)的基礎(chǔ)上,利用內(nèi)容分析法梳理知識融合概念產(chǎn)生的背景與演進(jìn)情況,并從“數(shù)據(jù)—信息—知識”整體視角,揭示數(shù)據(jù)融合、信息融合以及知識融合相關(guān)研究的發(fā)展淵源、研究演進(jìn)與應(yīng)用趨勢等方面情況。
本文選取“數(shù)據(jù)—信息—知識”三者融合的整體視角梳理融合研究的不同側(cè)重點(diǎn),得到以下結(jié)論: ①傳統(tǒng)的數(shù)據(jù)融合相關(guān)研究的關(guān)注點(diǎn)集中在網(wǎng)絡(luò)異構(gòu)數(shù)據(jù)的集成、多傳感器圖像與影像的融合等方面,對數(shù)據(jù)的集成是主要側(cè)重點(diǎn)。傳統(tǒng)的信息融合相關(guān)研究的關(guān)注點(diǎn)集中在多傳感器的信息融合的技術(shù)與方法方面上,研究更傾向于對傳感器收集的信息的處理與整合。②大數(shù)據(jù)背景環(huán)境下,數(shù)據(jù)融合與信息融合研究的內(nèi)容日益趨同,研究邊界并不十分清晰,均側(cè)重于多傳感器信息與數(shù)據(jù)的融合以及異構(gòu)數(shù)據(jù)的集成。③知識融合關(guān)注點(diǎn)集中在數(shù)字資源的整合、網(wǎng)絡(luò)文獻(xiàn)的集成、異構(gòu)數(shù)字化資源整合、企業(yè)知識庫組織、本體的構(gòu)建等方面,對文獻(xiàn)與知識的融合是研究的主要側(cè)重點(diǎn)。知識融合的研究明顯不同于數(shù)據(jù)融合與知識融合,主要側(cè)重在知識庫的建設(shè)、知識地圖的構(gòu)建、本體的構(gòu)建等方面,這些方面更強(qiáng)調(diào)語義和資源之間關(guān)系的組織與表達(dá)。
課題組供稿