舊版網(wǎng)站入口

站內(nèi)搜索

面向知識創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)理論與方法研究的中期檢查報告

2018年12月03日16:01來源:全國哲學(xué)社會科學(xué)工作辦公室

一、研究進(jìn)展情況

1研究計劃總體執(zhí)行情況及各子課題進(jìn)展情況

本項目共分為五個子課題,分別為:

子課題一:面向知識創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)理論研究:目的與體系

子課題二:面向知識創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)方法研究:信息采集與知識抽取

子課題三:面向知識創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)方法研究:知識融合與知識發(fā)現(xiàn)

子課題四:面向知識創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)應(yīng)用研究:知識創(chuàng)新服務(wù)機(jī)制

子課題五:面向知識創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)應(yīng)用研究:實現(xiàn)與驗證

以總體方案為指導(dǎo),按照研究計劃,通過文獻(xiàn)檢索、網(wǎng)絡(luò)調(diào)查、實地調(diào)研、專家訪談與通信咨詢等方式,針對要解決的問題和要研究的內(nèi)容,分別開展了各個子課題的研究,并在研究過程中注重各個子課題之間的關(guān)聯(lián),總體執(zhí)行情況概要如下:

? 從2016年12月開始,結(jié)合原有的工作積累,對有關(guān)“知識創(chuàng)新”“知識服務(wù)”“數(shù)據(jù)科學(xué)”“知識發(fā)現(xiàn)”“知識融合”等相關(guān)研究進(jìn)行文獻(xiàn)檢索、文摘閱讀與原文篩選下載等工作,并且這項工作一直在持續(xù)進(jìn)行著;

? 咨詢國內(nèi)外領(lǐng)域?qū)<覍φn題開展與開題等工作進(jìn)行指導(dǎo),同時,制定課題開題論證會議議程,2017年2月25日召開了開題會,邀請到會的9位專家分別來自中國社會科學(xué)院、上海社科科學(xué)院、北京大學(xué)、武漢大學(xué)、南京大學(xué)、華中師范大學(xué)、南京農(nóng)業(yè)大學(xué)等機(jī)構(gòu);

? 2017年4-7月間,分別對中國科技信息研究所、中國船舶749所、中國兵器210所、中國同方、等知識服務(wù)機(jī)構(gòu)進(jìn)行實地訪問和網(wǎng)絡(luò)調(diào)查,向情報工作人員發(fā)放問卷,與研究人員交流等,獲得了有關(guān)知識服務(wù)、知識創(chuàng)新等方面的第一手資料;

? 選取數(shù)字圖書館、全文數(shù)據(jù)庫網(wǎng)站、學(xué)術(shù)搜索引擎三種類型的在線知識服務(wù)平臺和Research Gate、分答、值乎、推文等社交平臺,采集相關(guān)數(shù)據(jù)進(jìn)行數(shù)據(jù)處理、數(shù)據(jù)挖掘、知識融合與發(fā)現(xiàn)等的數(shù)據(jù)科學(xué)理論和方法研究;

? 邀請國內(nèi)外學(xué)者研討與交流6次;

? 舉辦主題為“數(shù)據(jù)科學(xué)驅(qū)動的圖書資訊學(xué)變革與轉(zhuǎn)型”第14屆海峽兩岸圖書資訊學(xué)學(xué)術(shù)研討會1次;

? 完成發(fā)表17篇期刊論文,其中:被SCI/SSCI雙收錄1篇、CSSCI收錄13篇、CSSCI擴(kuò)展版收錄3篇;

? 完成頂級國際會議論文7篇;

? 完成錄用待發(fā)表期刊論文8篇,其中:被SCI/SSCI雙收錄1篇、被SCI收錄2篇、ESI收錄1篇、CSSCI期刊收錄4篇;

? 完成待出版專著1本:數(shù)據(jù)驅(qū)動的知識服務(wù)體系與方法;

? 此外,參加2017年計算語言學(xué)領(lǐng)域的自動摘要國際測評比賽論文1篇,專家寄語1篇,首席專家被邀大會報告與講座9次。

下面將分別簡述子課題的進(jìn)展情況

1.1子課題一:面向知識創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)理論研究:目的與體系

該子課題是關(guān)于研究背景、需求與體系構(gòu)建的探索部分,圍繞著大數(shù)據(jù)、學(xué)科知識創(chuàng)新、知識創(chuàng)新服務(wù)和數(shù)據(jù)科學(xué)展開。

① 2017年1月至2017年3月,按照計劃開展的工作如下:

? 對有關(guān)“知識創(chuàng)新”“知識服務(wù)”“數(shù)據(jù)科學(xué)”等相關(guān)研究進(jìn)行文獻(xiàn)與綜述;

? 在聽取專家論證建議與文獻(xiàn)綜述分析基礎(chǔ)上,課題組進(jìn)一步凝練了要強(qiáng)化圖書情報與數(shù)據(jù)科學(xué)關(guān)聯(lián)研究,并突出實證檢驗研究以體現(xiàn)理論對實踐的指導(dǎo)意義的方案。

②2017年4月至2017年8月,按照計劃開展的工作如下:

? 通過文獻(xiàn)調(diào)查、數(shù)據(jù)調(diào)查等手段,研究知識創(chuàng)新與大數(shù)據(jù)、知識服務(wù)與大數(shù)據(jù)、知識創(chuàng)新服務(wù)內(nèi)涵、數(shù)據(jù)科學(xué)的內(nèi)涵、特征,以及綜述與分析相關(guān)研究的國內(nèi)外現(xiàn)狀;

? 通過實地調(diào)查與專家訪談,探究大數(shù)據(jù)環(huán)境下現(xiàn)有知識服務(wù)存在的問題以及知識服務(wù)未來的發(fā)展動向。在調(diào)研中,側(cè)重對知識獲取、知識特征提取、知識多源集成、知識檢索、知識抽取和知識應(yīng)用六個方面的服務(wù)進(jìn)行調(diào)查與分析,研究大數(shù)據(jù)對學(xué)科知識創(chuàng)新的重構(gòu),總結(jié)大數(shù)據(jù)環(huán)境下學(xué)科知識創(chuàng)新的知識創(chuàng)新服務(wù)需求。

③2017年9月至2018年2月,按照計劃開展的工作如下:

? 通過文獻(xiàn)調(diào)查、歸納總結(jié)等方法,在對國內(nèi)外知識創(chuàng)新服務(wù)相關(guān)研究現(xiàn)狀研究基礎(chǔ)上,結(jié)合學(xué)科知識創(chuàng)新的轉(zhuǎn)變與新路徑研究以及知識服務(wù)的重構(gòu)需求,引入野中郁次郎的SECI模型和DIKW價值鏈模型,研究知識創(chuàng)新服務(wù)的內(nèi)涵、特征、影響因素與支撐要素;

? 以“DIKW價值鏈”為指導(dǎo),借助于“綜合集成研討廳”將專家智慧、數(shù)據(jù)和信息、計算機(jī)技術(shù)相結(jié)合的思想,首先,分析在知識創(chuàng)新服務(wù)中的數(shù)據(jù)流動的特點、方法與表現(xiàn)形式;然后,對“DIKW價值鏈”按照“大數(shù)據(jù)(D)?蘊含知識的信息(I)?元知識(K)?智慧(融合和涌現(xiàn)知識)(W)”進(jìn)行重構(gòu)與解讀。再次,以“重構(gòu)的DIKW價值鏈”為主線,研究并構(gòu)建面向知識創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)的學(xué)理思想與基本方法論。

④2018年3月至2018年7月,按照計劃開展的工作如下:

? 以知識創(chuàng)新服務(wù)需求為驅(qū)動,以重構(gòu)的“DIKW價值鏈”為導(dǎo)向,將數(shù)據(jù)科學(xué)的核心研究內(nèi)容(多源異構(gòu)數(shù)據(jù)獲取、數(shù)據(jù)預(yù)處理、數(shù)據(jù)統(tǒng)計分析、數(shù)據(jù)挖掘、數(shù)據(jù)可視化和數(shù)據(jù)產(chǎn)品)與知識創(chuàng)新服務(wù)的核心內(nèi)容(知識創(chuàng)新、信息采集與知識抽取、知識融合與知識發(fā)現(xiàn)、知識創(chuàng)新服務(wù)機(jī)制、知識創(chuàng)新服務(wù)應(yīng)用)相結(jié)合,研究并構(gòu)建面向知識創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)理論與方法體系。

1.2子課題二:面向知識創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)方法研究:信息采集與知識抽取

該子課題是圍繞知識創(chuàng)新服務(wù)目標(biāo),探索多源數(shù)據(jù)的信息采集與知識抽取面臨的特殊性和困境,提出可行的信息采集與知識抽取模式、途徑和程序。

①2017年1月至2017年3月,按照計劃開展的工作如下:

? 整理與分析現(xiàn)有基于多源數(shù)據(jù)的信息采集與知識抽取現(xiàn)狀、功能和缺陷等。

②2017年4月至2017年6月,按照計劃開展的工作如下:

? 通過分別對中國科技信息研究所、中國船舶749所、中國兵器210所、中國同方等知識服務(wù)機(jī)構(gòu)進(jìn)行實地訪問和網(wǎng)絡(luò)調(diào)查,研究面向知識創(chuàng)新服務(wù)的知識源特征與采集需求,分析了面向知識創(chuàng)新服務(wù)的知識抽取的新特點與需求。

③2017年7月至2017年9月,按照計劃開展的工作如下:

? 在現(xiàn)有研究調(diào)查基礎(chǔ)上,研究了數(shù)據(jù)源的評估原則、數(shù)據(jù)數(shù)據(jù)源質(zhì)量評估體系構(gòu)建,數(shù)據(jù)源質(zhì)量評估方法實現(xiàn);

? 針對基于多源數(shù)據(jù)的信息采集模式與采集加工平臺,從采集流程中三個重要組成部分展開了研究:一是多源異構(gòu)資源及其相應(yīng)的數(shù)據(jù)格式(數(shù)據(jù)源產(chǎn)生途徑、類型特征、分布形式);二是用戶需求經(jīng)轉(zhuǎn)化后形成的數(shù)據(jù)源質(zhì)量信息和配置信息;三是針對不同類型數(shù)據(jù)源采集模塊的功能設(shè)計。具體地,首先對網(wǎng)絡(luò)數(shù)據(jù)資源采集的典型方法和關(guān)鍵技術(shù)開展技術(shù)基礎(chǔ)進(jìn)行了研究;其次通過實驗樣例和測評指標(biāo)對多源數(shù)據(jù)的信息采集技術(shù)方案適用性進(jìn)行評估;再次針對所采集的數(shù)據(jù)結(jié)果,研究數(shù)據(jù)清洗與預(yù)處理的手段。由此,設(shè)計提出了基于多源數(shù)據(jù)的信息采集模式與流程。

④2017年10月至2018年2月,按照計劃開展的工作如下:

? 對大數(shù)據(jù)驅(qū)動的知識抽取涉及到的關(guān)鍵技術(shù)進(jìn)行研究,具體有異構(gòu)知識源的知識抽取方法研究和大數(shù)據(jù)驅(qū)動的知識迭代抽取模式,包括詞語語義知識的分類研究,引文域的自動識別、引用類型的分類以及自動摘要研究。尤其是針對科技文本的引文內(nèi)容方面,進(jìn)行了引文內(nèi)容抽取與相關(guān)應(yīng)用的研究,利用在線圖書評論數(shù)據(jù),對圖書評論與館藏的相關(guān)性進(jìn)行了探索等。

⑤2018年3月至2018年6月,按照計劃開展的工作如下:

? 調(diào)查了知識驗證方法方面的國內(nèi)外研究現(xiàn)狀,尤其是對候選知識質(zhì)量評估方法進(jìn)行了比較分析,并以人工智能的研究為例,進(jìn)行實證分析。

1.3子課題三:面向知識創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)方法研究:知識融合與知識發(fā)現(xiàn)

該子課題是圍繞著知識融合和知識發(fā)現(xiàn)的理論、方法、技術(shù)以及工具等,進(jìn)一步深化面向知識創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)的理論與方法研究。

①2017年1月至2017年3月,按照計劃開展的工作如下:

? 結(jié)合原有關(guān)于知識融合研究(發(fā)表在《數(shù)字圖書館論壇》上的論文“大數(shù)據(jù)時代知識融合體系架構(gòu)設(shè)計研究”和前期課題)的工作積累,實證走訪調(diào)查了中國科技信息研究所、上海社會科學(xué)院信息研究所、江蘇省科學(xué)技術(shù)情報研究所、中國同方等機(jī)構(gòu),咨詢國內(nèi)外領(lǐng)域?qū)<,收集和閱讀有關(guān)知識融合與知識發(fā)現(xiàn)等相關(guān)文獻(xiàn),并進(jìn)一步整理和分析國內(nèi)外研究現(xiàn)狀,掌握現(xiàn)有知識融合與知識發(fā)現(xiàn)的現(xiàn)狀、功能和缺陷等。

②2017年4月至2017年8月,按照計劃開展的工作如下:

? 針對基于多維動態(tài)組合的知識融合與知識發(fā)現(xiàn)模式進(jìn)行了系列研究,主要有:通過引文內(nèi)容分析探索高被引論文的影響力演化模式,利用中文在線社交網(wǎng)站研究用戶飲食的偏好與演化模式,通過情感分析技術(shù)探測社交網(wǎng)絡(luò)上的中國用戶飲食偏好等。

③2017年9月至2018年2月,按照計劃開展的工作如下:

? 針對大數(shù)據(jù)驅(qū)動的知識融合與知識發(fā)現(xiàn)關(guān)鍵技術(shù)和方法進(jìn)行了系列研究,主要有:利用引文數(shù)據(jù)的內(nèi)容融合探測學(xué)科交叉知識,以Research Gate為例評估學(xué)術(shù)社會化問答平臺的答案質(zhì)量,對學(xué)術(shù)論文寫作風(fēng)格的度量、論文接受與稿件處理周期的關(guān)系、基于學(xué)術(shù)社交網(wǎng)絡(luò)上閱讀行為進(jìn)行學(xué)科交叉度計算,基于科學(xué)推文數(shù)據(jù)的非正式科學(xué)交流語言分布、作者行為模式與地理分布,基于政策文件數(shù)據(jù)的替代計量指標(biāo)分布特征等。

④2018年3月至2018年8月,按照計劃開展的工作如下:

? 針對知識融合與知識發(fā)現(xiàn)結(jié)果的展示及驗證,主要的研究有文獻(xiàn)調(diào)查與整理,構(gòu)建情報研究知識庫,分別以人工智能和石墨烯為例的實證分析,形成了初步的研究結(jié)果。

1.4子課題四:面向知識創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)應(yīng)用研究:知識創(chuàng)新服務(wù)機(jī)制

該子課題的研究包括知識創(chuàng)新服務(wù)的需求、知識創(chuàng)新服務(wù)的模式、知識創(chuàng)新服務(wù)的運作以及知識創(chuàng)新服務(wù)的保障等。

① 2017年1月至2017年6月,按照計劃開展的工作如下:

? 通過網(wǎng)絡(luò)調(diào)查,選取數(shù)字圖書館、全文數(shù)據(jù)庫網(wǎng)站和學(xué)術(shù)搜索引擎三種類型的在線知識服務(wù)平臺進(jìn)行研究,以分析現(xiàn)有知識服務(wù)平臺提供的學(xué)術(shù)資源、知識服務(wù)的表現(xiàn)形式與平臺功能等;

? 結(jié)合調(diào)查與分析,研究與界定知識創(chuàng)新服務(wù)的定義、內(nèi)涵與特點,以形成相關(guān)的理論與方法基礎(chǔ)。

②2017年7月至2017年12月,按照計劃開展的工作如下:

? 借鑒數(shù)據(jù)科學(xué)的理論方法探索知識創(chuàng)新服務(wù)的顯在需求分析、潛在需求分析,對用戶的行為軌跡和活動規(guī)律進(jìn)行特征表示、特征提取、用戶建模,挖掘出用戶潛在和顯在的知識服務(wù)需求進(jìn)行研究,并通過綜述研究了IT采納和使用中用戶轉(zhuǎn)移行為的特征、模式與影響因素。

③2018年1月至2018年6月,按照計劃開展的工作如下:

? 通過調(diào)查與實證分析大數(shù)據(jù)時代知識服務(wù)平臺和系統(tǒng)所需的各種情報技術(shù)和工具,基于“DIKW價值鏈”從知識揭示、知識導(dǎo)航、智能檢索、知識學(xué)習(xí)和知識挖掘等方面進(jìn)行考查,并以基于語音互動的付費知識問答社區(qū)運營模式為例,研究了知識服務(wù)平臺的運營現(xiàn)狀與發(fā)展的對策;

? 為探索以文獻(xiàn)資源主導(dǎo)的顯性知識創(chuàng)新服務(wù)模式和以參與者為主導(dǎo)的隱性知識創(chuàng)新服務(wù)模式,研究國際公眾科學(xué)領(lǐng)域演化路徑與研究熱點,從項目視角、理論方法視角以及參與者視角等研究樂基于群體參與及協(xié)作的公眾科學(xué)研究模式的興起與發(fā)展?fàn)顟B(tài),以及對策建議等。

1.5子課題五:面向知識創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)應(yīng)用研究:實現(xiàn)與驗證

該子課題是以知識創(chuàng)新研究為實證場景,構(gòu)建面向知識創(chuàng)新服務(wù)應(yīng)用模式與實現(xiàn)系統(tǒng),通過利用數(shù)據(jù)科學(xué)的理論與方法,以達(dá)到支撐使多源異構(gòu)數(shù)據(jù)得以處理、提取、匯聚、關(guān)聯(lián)、分析、融合,并實現(xiàn)從數(shù)據(jù)到知識的轉(zhuǎn)化直至最終創(chuàng)造出新知識的研究宗旨。

① 2017年6月至2017年12月,按照計劃開展的工作如下:

? 數(shù)字圖書館、全文數(shù)據(jù)庫網(wǎng)站和學(xué)術(shù)搜索引擎三種類型的在線知識服務(wù)平臺為例,描繪平臺運行的信息流,進(jìn)而系統(tǒng)分析大數(shù)據(jù)知識服務(wù)的組織架構(gòu)、組織網(wǎng)絡(luò)、規(guī)章制度、組織信息管理等。

② 2018年1月至2018年12月,按照計劃開展的工作如下:

? 面向?qū)W科領(lǐng)域的研究前沿探索應(yīng)用實證,以人工智能為例,開展了研究前沿探索的實證。進(jìn)而,分析大數(shù)據(jù)時代知識創(chuàng)新服務(wù)平臺和系統(tǒng)所需的各種情報技術(shù)和工具,知識服務(wù)的全過程進(jìn)行平臺原型的功能設(shè)計等。

2調(diào)查研究及學(xué)術(shù)交流情況(調(diào)研數(shù)據(jù)整理運用、文獻(xiàn)資料收集整理、學(xué)術(shù)會議、學(xué)術(shù)交流、國際合作等)

2.1調(diào)研數(shù)據(jù)整理運用

? 在Web of Science數(shù)據(jù)庫核心合集中下載有關(guān)“人工智能”數(shù)據(jù)72萬多條,并用于學(xué)科領(lǐng)域前沿的研究中;下載Public Library of Science (PLOS)中的7756論文并用于引文內(nèi)容抽取與分析中;下載Scopus和Altmetric.com數(shù)據(jù)集中共45萬多條科學(xué)推文及其元數(shù)并用于知識挖掘與發(fā)現(xiàn)的研究中;下載 Altmetric.com公司中從2013年1月到2016年6月收集的所有政策文件數(shù)據(jù)共90036條,并用于知識挖掘與發(fā)現(xiàn)的研究中;在CNKI數(shù)據(jù)庫和SIPO數(shù)據(jù)庫中下載有關(guān)“石墨烯”領(lǐng)域的2000條文獻(xiàn)數(shù)據(jù)和4000條專利數(shù)據(jù) 并用于知識庫的構(gòu)建研究及分析中;下載美團(tuán)網(wǎng)美食頻道19個類別、5132道菜肴中的115321條評論數(shù)據(jù)并用于在線社交網(wǎng)站的知識抽取研究中;

? 選取數(shù)字圖書館、全文數(shù)據(jù)庫網(wǎng)站、學(xué)術(shù)搜索引擎三種類型的在線知識服務(wù)平臺和Research Gate、分答、值乎、推文等社交平臺,采集相關(guān)數(shù)據(jù)用于數(shù)據(jù)處理、數(shù)據(jù)挖掘、知識融合與發(fā)現(xiàn)等的數(shù)據(jù)科學(xué)理論和方法研究;

? 分別對中國科技信息研究所、中國船舶749所、中國兵器210所、中國同方、等知識服務(wù)機(jī)構(gòu)進(jìn)行實地訪問和網(wǎng)絡(luò)調(diào)查,向情報工作人員發(fā)放問卷,用于2017年4-7月間,與研究人員交流等,獲得了有關(guān)知識服務(wù)、知識創(chuàng)新等方面的第一手資料。

2.2文獻(xiàn)資料收集整理

? 檢索了有關(guān)“知識創(chuàng)新”“知識服務(wù)”“數(shù)據(jù)科學(xué)”“知識融合”“知識發(fā)現(xiàn)”等方面的國內(nèi)外研究論文,一共有1200多篇,選擇主要的文獻(xiàn)進(jìn)行閱讀,用于主要觀點與內(nèi)容的提煉、研究綜述的撰寫等。

2.3學(xué)術(shù)會議、學(xué)術(shù)交流與國際合作

? 2017年2月25日召開了開題會,邀請有9位專家到會并征集咨詢建議;

? 組織學(xué)術(shù)研討與報告會6次,先后邀請印第安納大學(xué)丁穎教授、華北水利水電大學(xué)張琳教授、大連理工大學(xué)王賢文教授、武漢大學(xué)吳丹教授、加拿大麥吉爾大學(xué)舒非博士、北卡羅來納大學(xué)教堂山分校Javed Mostafa教授參加項目研討并做學(xué)術(shù)講座:

(1)2017年5月16日,華北水利水電大學(xué)張琳教授學(xué)術(shù)報告:“文獻(xiàn)計量與科學(xué)家個人成果評價研究”(http://sem.njust.edu.cn/38/34/c6134a145460/page.htm);

(2)2017年5月16日,大連理工大學(xué)王賢文教授學(xué)術(shù)報告:“地理位置大數(shù)據(jù)與計算社會科學(xué)研究”(http://sem.njust.edu.cn/38/34/c6134a145460/page.htm);

(3)2017年5月17日,武漢大學(xué)吳丹教授學(xué)術(shù)報告:“基于情境與APP交互的用戶移動搜索行為研究”(http://sem.njust.edu.cn/38/75/c6134a145525/page.htm);

(4)2017年6 月21日,美國印第安納大學(xué)教授、教育部長江學(xué)者講座教授丁穎博士學(xué)術(shù)報告:“Zero to One:Success to Innovation”(http://sem.njust.edu.cn/41/01/c6134a147713/page.htm);

(5)2018年4月18日,加拿大麥吉爾大學(xué)舒非博士學(xué)術(shù)報告:“National and International Scientific Elites”(http://sem.njust.edu.cn/97/ab/c6134a169899/page.htm);

(6)2018年6月20日,北卡羅來納大學(xué)教堂山分校Javed Mostafa教授學(xué)術(shù)報告:“Consumer Health Information Searching: TowardAutomated, Trustworthy, and Secure Personalization” (http://sem.njust.edu.cn/af/4a/c6134a175946/page.htm)。

? 2018年7月6日至8日,舉辦“第十四屆海峽兩岸圖書資訊學(xué)學(xué)術(shù)研討會”,本屆會議主題為:“數(shù)據(jù)科學(xué)驅(qū)動的圖書資訊學(xué)變革與轉(zhuǎn)型”,到會的海峽兩岸40余所高校與科研院所的160余名知名專家、學(xué)者和學(xué)生,

(http://sem.njust.edu.cn/b1/d7/c6134a176599/page.htm)。

? 組織小型學(xué)術(shù)研討會12次,除了課題組成員外,還邀請了校外內(nèi)專業(yè)技術(shù)領(lǐng)域人員到會參與課題研討。

? 2017年8月29日,北京國際會議中心2C,參加納米研究前沿分析報告發(fā)布會。

? 2017年11月15-17日,貴陽大數(shù)據(jù)中心參觀與交流。

3成果宣傳推介情況(成果發(fā)布會、《工作簡報》報送情況、國家社科基金專刊投稿及采用情況等)

? 中國社會科學(xué)網(wǎng)報道:數(shù)據(jù)科學(xué)理論與方法體系亟待完善(2017年03月06日)(http://www.cssn.cn/gd/gd_rwhd/xslt/201703/t20170306_3441434.shtml)

? 首席專家被邀請會議主題報告與學(xué)術(shù)講座:

(1)王曰芬.2016年12月7日,中國“互聯(lián)網(wǎng)公益”研究報告發(fā)布會,分論壇:互聯(lián)網(wǎng)公益數(shù)據(jù)監(jiān)護(hù)主持,并做報告:互聯(lián)網(wǎng)公益數(shù)據(jù)監(jiān)護(hù)

(https://charity.nju.edu.cn/9d/18/c835a171288/page6.htm)

(2)王曰芬.2017年2月24日,上海社會科學(xué)院學(xué)術(shù)演講“數(shù)據(jù)科學(xué)支撐的知識服務(wù)創(chuàng)新對策思考”( http://www2.sass.org.cn/detailAction.do?method=ShowNewsContent)

(3)王曰芬.2017年4月20-22日,高校新型智庫建設(shè)與協(xié)同創(chuàng)新發(fā)展論壇,河南財經(jīng)政法大學(xué),鄭州市東方維景國際酒店,CNKI主辦,主題報告:面向智庫的情報搜集與分析(http://edu.people.com.cn/n1/2017/0421/c1053-29228184.html)

(4)王曰芬.2017年6月8-9日,首屆數(shù)據(jù)分析與知識發(fā)現(xiàn)學(xué)術(shù)研討會,北京世紀(jì)金源香山商旅酒店,主題報告:信息哲學(xué)視域下數(shù)據(jù)驅(qū)動的科學(xué)知識發(fā)現(xiàn)方法論思考(大學(xué)圖書館學(xué)報,2017(5):126-127)

(5)王曰芬.2017年7月21-23日,第七屆全國博士生論壇,北京科學(xué)院大學(xué)雁棲湖,大會報告:數(shù)據(jù)科學(xué)支撐的知識服務(wù)創(chuàng)新對策思考(http://ndsis.las.ac.cn/dct/page/65583)

(6)王曰芬.2017年8月18日,第六屆中國電科戰(zhàn)略情報研討會,成都黃龍溪欣瑞大酒店,主題報告:大數(shù)據(jù)時代科技情報理論與方法創(chuàng)新及應(yīng)用

(http://www.sohu.com/a/165709252_466078)

(7)王曰芬.2017年9月13日,江蘇大學(xué)圖書館學(xué)術(shù)講座:數(shù)據(jù)科學(xué)支撐的知識服務(wù)創(chuàng)新對策思考(http://www.ujs.edu.cn/info/1065/17520.htm)

(8)王曰芬.2018年5月7日,華南師范大學(xué)講座:大數(shù)據(jù)與數(shù)據(jù)科學(xué)及其應(yīng)用

(http://em.scnu.edu.cn/a/20180507/6288.html)

(9)Wang Yuefen .Evolution study of individual author and component network in the life cycle stage based on scientific collaboration network data,The Annual Conference on Data, Information, and Society ,Nanjing, China, July 3–6, 2018.( http://www.dis2018.net/Program.html)

4研究中存在的主要問題、改進(jìn)措施,研究心得、意見建議

4.1研究中存在的主要問題與改進(jìn)措施

? 在研究中面臨的主要問題:一是,難以收集到可以有效借鑒的國外研究資料;二是,從各種數(shù)據(jù)資源(數(shù)據(jù)庫)中下載的數(shù)據(jù)處理上存在有效算法支撐不足,而導(dǎo)致效率低下、處理時間長;三是,在國際交流的范圍與深度上還不夠;四是,在傳播學(xué)術(shù)研究成果過程中向期刊投稿,大部分國內(nèi)期刊需要收取版面發(fā)稿補(bǔ)貼費用,而導(dǎo)致有些論文不能及時發(fā)表。

? 改進(jìn)的措施:一是,擴(kuò)大文獻(xiàn)檢索與實際調(diào)研的范圍,擬將從2018年9月開始加大對外交流的力度;二是,加大實證研究的范圍,并爭取與專業(yè)化學(xué)會取得聯(lián)系,將研究成果通過專業(yè)學(xué)會的傳播與發(fā)布;三是,與計算機(jī)等專業(yè)人員合作,爭取在數(shù)據(jù)處理算法與應(yīng)用上有一定的突破;四是,爭取多向國家社科基金委資助的期刊投稿。

4.2研究心得與意見建議

? 研究心得:本項目是一個以圖書館、情報與文獻(xiàn)學(xué)為主的多學(xué)科交叉融合的前沿性綜合研究,既要系統(tǒng)地探索數(shù)據(jù)科學(xué)的理論與方法,又要與面向知識創(chuàng)新服務(wù)的實踐應(yīng)用緊密結(jié)合,研究的難度較大、涉及的面較廣。為了使研究具有理論的深度、方法的效度與應(yīng)用的代表性,一方面需要廣泛地收集國內(nèi)外相關(guān)的研究成果,閱讀、匯總與摘錄,并進(jìn)行定量與定性結(jié)合的綜述,另一方面需要對國內(nèi)外相關(guān)的服務(wù)平臺與系統(tǒng)進(jìn)行調(diào)查研究、專家訪談,同時從多源異構(gòu)的數(shù)據(jù)源中下載大批量的數(shù)據(jù),以實踐與驗證數(shù)據(jù)采集、處理、挖掘與知識融合、知識發(fā)現(xiàn)等方法和流程。因此,本課題后續(xù)研究中,要加大人力投入、總結(jié)提煉與實踐嘗試,同時,注重各個課題之間內(nèi)容研究的銜接。

? 意見建議:由于從2016年開始的經(jīng)費預(yù)算中在研究成果出版費上有限制,導(dǎo)致階段性的研究論文發(fā)表受到影響,為了更及時地傳播研究成果,特別是前沿性研究傳播的新穎性,建議在出版費(國內(nèi)期刊論文版面費)的限制上能夠有所區(qū)別。

5其他需要說明的問題

? 本課題的項目號是16ZDA224,課題在研究中,由于沒有注重項目號正確的寫法,導(dǎo)致在論文發(fā)表時出現(xiàn)了三種不同的寫法,分別是:16ZDA224、16ZAD224、16DZA224,后面兩種寫法出現(xiàn)了錯誤。在中文期刊發(fā)表時,由于能夠出現(xiàn)項目的名稱,所以目前的狀態(tài)是項目名稱是正確的,而有些論文項目編號中的字母出現(xiàn)上述錯誤。如今發(fā)現(xiàn)了這種錯誤,并通知給各個子課題負(fù)責(zé)人,相信后期將不會有類似錯誤發(fā)生。

? 在已經(jīng)發(fā)表的17篇期刊論文中,為了得到其他基金在出版費方面的支持,有7篇論文標(biāo)有兩個或者以上的項目號。待出版8篇論文中,有4篇標(biāo)有兩個或者以上的項目號。后續(xù)的研究中,將盡可能使發(fā)表的論文在基金署名上專屬一個基金,并加強(qiáng)研究成果的及時發(fā)表傳播。

? 為了鼓勵研究生積極申報與參加江蘇省研究生科研創(chuàng)新計劃項目,相關(guān)部門提出由導(dǎo)師主持項目給予資助并經(jīng)過審核立項的倡議,所以,課題研究過程中,為了使研究生尤其是博士研究生在投入研究時又能獲得省研究生科研創(chuàng)新計劃項目立項,將用于資助學(xué)生參與會議和助研費等的課題經(jīng)費同時算作是對創(chuàng)新計劃項目的支持,因此論文發(fā)表時也要對立項的研究生創(chuàng)新計劃項目加以標(biāo)注,出現(xiàn)論文發(fā)表時沒有單標(biāo)一個項目。盡管如此,卻體現(xiàn)出國家社科基金所做的貢獻(xiàn)。

二、研究成果情況

1代表性成果簡介

1.1基本內(nèi)容與主要觀點

? 關(guān)于知識創(chuàng)新面臨的大數(shù)據(jù)挑戰(zhàn)

從科學(xué)研究角度看,知識創(chuàng)新指通過科學(xué)研究獲得新的基礎(chǔ)科學(xué)和技術(shù)科學(xué)知識的過程,知識創(chuàng)新不僅是技術(shù)創(chuàng)新的基礎(chǔ),是新技術(shù)、新發(fā)明的源泉,還是促進(jìn)科技進(jìn)步和經(jīng)濟(jì)增長的革命性力量。伴隨我國創(chuàng)新發(fā)展驅(qū)動戰(zhàn)略和科技創(chuàng)新的需求,知識創(chuàng)新的目標(biāo)與要求必須朝著國家戰(zhàn)略倡導(dǎo)的“在新思想、新發(fā)現(xiàn)、新知識、新原理、新方法上積極進(jìn)取,強(qiáng)化源頭儲備”上發(fā)展。

作為大數(shù)據(jù)的重要組成部分,科學(xué)大數(shù)據(jù)正在使科學(xué)世界發(fā)生變化,驅(qū)動科學(xué)研究進(jìn)入數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)范式這一全新階段。科學(xué)大數(shù)據(jù)是科學(xué)發(fā)現(xiàn)與知識創(chuàng)新的新引擎,將改變?nèi)祟惿罴捌鋵κ澜绲纳顚永斫。在大?shù)據(jù)背景下,及時更新、開放的海量數(shù)據(jù)為知識創(chuàng)新提供豐富的知識原料,大數(shù)據(jù)技術(shù)與工具極大提高知識共享和轉(zhuǎn)化的效率,但大量多源、異構(gòu)、碎片化、良莠不齊的數(shù)據(jù)源和知識源也給知識創(chuàng)新帶來挑戰(zhàn)。因此,大數(shù)據(jù)使研究人員對知識的獲取和使用從過去的“一種混沌”(知識供給匱乏同時有效知識不足)走向“另一種混沌”(數(shù)據(jù)來源多樣、信息供給過載但有效知識不足),人們迫切希望從大數(shù)據(jù)中獲取系統(tǒng)化的知識支撐。

? 關(guān)于大數(shù)據(jù)對學(xué)科知識創(chuàng)新模式的重構(gòu)

大數(shù)據(jù)重構(gòu)了傳統(tǒng)科學(xué)研究中“數(shù)據(jù)—信息—知識—智慧”的價值鏈,體現(xiàn)在4個方面:①由于數(shù)據(jù)來源的廣泛性,知識不再以孤立的種群存在于某一種生態(tài)位(如某一種形態(tài)、某一個領(lǐng)域、某一種平臺、某一種存量與其他知識或者環(huán)境的簡單關(guān)系)上,而愈來愈呈現(xiàn)出復(fù)雜種群系統(tǒng)特征,噪音和不確定性并未因為知識的多位性而弱化,反而愈益強(qiáng)化;②由于數(shù)據(jù)變化的瞬態(tài)性,運行于這種復(fù)雜種群基礎(chǔ)上的知識自生、交互與反饋、共生與競爭、演化與再生等機(jī)制已經(jīng)發(fā)生質(zhì)的改變,知識“涌現(xiàn)”現(xiàn)象日益突出;③由于數(shù)據(jù)載體的多樣性,知識生產(chǎn)者、提供者、使用者與知識之間的“主體-客體”界限已經(jīng)模糊,學(xué)科知識創(chuàng)新研究的正式知識交流模式與非正式知識交流模式亦已交融整合,數(shù)據(jù)的無處不在使知識的不同依存載體、傳播媒介及價值鏈節(jié)點與能量要素也形成了一種數(shù)據(jù)“泛在協(xié)同”關(guān)系,與此同時,這種泛在協(xié)同關(guān)系本身又為學(xué)科創(chuàng)新服務(wù)提供了一種全新的可轉(zhuǎn)化為知識的數(shù)據(jù)來源;④由于數(shù)據(jù)的多維關(guān)聯(lián)性,在數(shù)據(jù)與知識的交互和演化過程中,知識的“因果”已不再重要,取而代之的是基于數(shù)據(jù)關(guān)聯(lián)支撐的知識間的泛在“關(guān)聯(lián)”,這即可為學(xué)科創(chuàng)新研究生命周期各階段的全景知識提供了源泉,以激活學(xué)科創(chuàng)新工作者的隱形知識,其亦是學(xué)科創(chuàng)新研究中的“偶遇”“意外”或者“異想”知識的源泉,為學(xué)科創(chuàng)新工作靈感提供動力。因此,大數(shù)據(jù)使學(xué)科創(chuàng)新活動處于“數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)”的第四范式,此研究范式產(chǎn)生的多源、廣泛、瞬態(tài)、多維關(guān)聯(lián)的大數(shù)據(jù),一方面為學(xué)科創(chuàng)新研究帶來越來越難以處理的數(shù)據(jù)困擾和知識渴求,另一方面為學(xué)科知識創(chuàng)新生命周期各階段全景知識提供源泉,也為研究中的等創(chuàng)新工作靈感或隱性知識提供激活的更多可能。

? 關(guān)于大數(shù)據(jù)驅(qū)動下知識創(chuàng)新服務(wù)及其新需求

主要體現(xiàn)在以下4個方面:①從知識主體上,大數(shù)據(jù)對知識創(chuàng)新主體提出新要求,知識主體需要基于數(shù)據(jù)和數(shù)據(jù)技術(shù)來決策,從數(shù)據(jù)中挖掘出知識的價值、發(fā)現(xiàn)新的知識,借助社會媒體激發(fā)靈感或基于數(shù)字化平臺進(jìn)行廣泛交流與合作;②從知識資源上,知識的獲取不再局限于已經(jīng)公開的文獻(xiàn)資源或組織內(nèi)部及其所在的社會網(wǎng)絡(luò),科研過程中的數(shù)據(jù)集、互聯(lián)網(wǎng)資源與社交媒體的交互數(shù)據(jù)都是組織知識創(chuàng)新的重要源頭;③從方法與途徑上,隨著數(shù)據(jù)存儲、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、人工智能的發(fā)展,為知識的交流、共享、吸收與利用提供便利。同時,各種媒體、專門機(jī)構(gòu)及其提供的服務(wù)可以使知識創(chuàng)新的主體突破地域的限制,促使知識創(chuàng)新社會化生態(tài)的形成。技術(shù)與方法成為知識創(chuàng)新主體的功能外延,媒體與專門機(jī)構(gòu)成為支撐知識創(chuàng)新的重要途徑,知識創(chuàng)新主體對于方法與途徑的依賴越來越強(qiáng);④從實現(xiàn)的支撐上,創(chuàng)新的源泉來自數(shù)據(jù)、信息與知識的轉(zhuǎn)化。知識經(jīng)濟(jì)的核心是通過知識與服務(wù)實現(xiàn)創(chuàng)新,進(jìn)而優(yōu)化科學(xué)研究、商業(yè)經(jīng)濟(jì)、企業(yè)管理、國家政策和制度設(shè)計,知識服務(wù)是支撐知識創(chuàng)新的重要途徑。在大數(shù)據(jù)和關(guān)聯(lián)數(shù)據(jù)環(huán)境下,圖書情報、數(shù)據(jù)科學(xué)、計算機(jī)科學(xué)、科學(xué)學(xué)等進(jìn)一步匯聚,所形成的新的知識發(fā)現(xiàn)、趨勢鑒別、情報研究和決策分析方法、工具和服務(wù),正成為知識服務(wù)滿足知識創(chuàng)新需求的應(yīng)用支撐能力。服務(wù)機(jī)構(gòu)將以最大程度地激勵和支持用戶進(jìn)行創(chuàng)新作為知識服務(wù)的重要使命,借助于大數(shù)據(jù)思維與技術(shù)支撐知識創(chuàng)新變革,并提供有價值的知識或提供使數(shù)據(jù)/信息/知識/智慧得以高效轉(zhuǎn)化的途徑。

? 關(guān)于數(shù)據(jù)科學(xué)的理論與方法

數(shù)據(jù)科學(xué)這一術(shù)語早在二十世紀(jì)六十年代就已出現(xiàn),并常被用來指代數(shù)據(jù)的表示、收集、儲存、整合、分析和理解的科學(xué)原理。自二十世紀(jì)八十年代以來,以大量數(shù)據(jù)支持決策的趨勢逐漸成為主流,在二十世紀(jì)九十年代初,隨著關(guān)系型數(shù)據(jù)庫技術(shù)的成熟以及數(shù)據(jù)業(yè)務(wù)的流程更加自動化,數(shù)據(jù)科學(xué)領(lǐng)域誕生并迅速發(fā)展起來。數(shù)據(jù)科學(xué)的內(nèi)涵與特征主要體現(xiàn)在:

其一,以知識發(fā)現(xiàn)為主要研究目的。數(shù)據(jù)科學(xué)隨著大數(shù)據(jù)的興起,也被賦予了更加豐富的內(nèi)涵,亦在研究中被更廣泛的應(yīng)用。大量的研究人員從數(shù)據(jù)科學(xué)的具體實施過程和目的入手對其進(jìn)行了闡釋,在將知識發(fā)現(xiàn)與提取作為數(shù)據(jù)科學(xué)的主要目的這一點上已基本形成了共識。

其二,多學(xué)科與復(fù)合領(lǐng)域特性。數(shù)據(jù)科學(xué)的多學(xué)科與復(fù)合領(lǐng)域特性在其興起伊始就被廣大數(shù)據(jù)科學(xué)研究人員所廣泛提及,數(shù)據(jù)科學(xué)的基礎(chǔ)學(xué)科知識組成應(yīng)該來源于計算機(jī)科學(xué),數(shù)學(xué)與統(tǒng)計學(xué)和應(yīng)用領(lǐng)域?qū)W科。

? 關(guān)于數(shù)據(jù)科學(xué)的主要應(yīng)用領(lǐng)域

其一,支持預(yù)測與決策。對未來的預(yù)測是基于統(tǒng)計學(xué)原理,從數(shù)據(jù)分析技術(shù)產(chǎn)生的開始就建立的一個主要實踐方向。實現(xiàn)預(yù)測一直以來也是數(shù)據(jù)科學(xué)的一個重要應(yīng)用,也是進(jìn)行后續(xù)決策優(yōu)化的一個重要步驟。這一應(yīng)用的體現(xiàn)主要在經(jīng)濟(jì)管理領(lǐng)域,但是隨著數(shù)據(jù)科學(xué)的發(fā)展,應(yīng)用涉及領(lǐng)域的范圍也越來越廣泛。主要包括:一是實現(xiàn)更精確的預(yù)測。

其二,服務(wù)于創(chuàng)新型學(xué)科知識研究與發(fā)現(xiàn)。由于目前對數(shù)據(jù)科學(xué)的應(yīng)用多是在大數(shù)據(jù)背景下實現(xiàn)的,新型的數(shù)據(jù)集往往可以對已有的方法、流程進(jìn)行優(yōu)化,也可使決策更加智能。所以數(shù)據(jù)科學(xué)在研究優(yōu)化方法、決策等方面的應(yīng)用也越來越流行。數(shù)據(jù)科學(xué)的這一應(yīng)用主要是面向本身就會產(chǎn)生復(fù)合大數(shù)據(jù)時代特征的新型數(shù)據(jù)集的學(xué)科,這些對象的特性決定了其與數(shù)據(jù)科學(xué)的相生相依的關(guān)系。這一應(yīng)用的主要體現(xiàn)在生物科學(xué)、醫(yī)學(xué)、環(huán)境科學(xué)等領(lǐng)域。

1.2學(xué)術(shù)價值與社會影響

? 研究產(chǎn)生的主要觀點的學(xué)術(shù)價值

? 推動數(shù)據(jù)科學(xué)理論與方法體系的建設(shè)和迭代創(chuàng)新

數(shù)據(jù)科學(xué)是在多科學(xué)交叉基礎(chǔ)上產(chǎn)生的新興研究領(lǐng)域,一方面需要研究數(shù)據(jù)本身具有或者呈現(xiàn)出的各種類型、特點、存在方式及其變化形式和規(guī)律,另一方面要為社會科學(xué)與自然科學(xué)提供新的研究方法。因此,基于現(xiàn)有的基礎(chǔ)理論與方法,結(jié)合應(yīng)用的需求,形成一套從數(shù)據(jù)獲取、處理到分析的數(shù)據(jù)科學(xué)理論與方法體系和針對應(yīng)用的關(guān)鍵技術(shù)方法,使數(shù)據(jù)/信息/知識得以轉(zhuǎn)化成解決實踐問題的基本依據(jù),是建立和發(fā)展適應(yīng)大數(shù)據(jù)時代特征的各學(xué)科領(lǐng)域數(shù)據(jù)科學(xué)所必要的。同時,針對理論與方法的具體內(nèi)容和應(yīng)用問題,進(jìn)一步探索與大數(shù)據(jù)思維和技術(shù)結(jié)合的基礎(chǔ)理論與共性方法的科學(xué)性,將有力推動數(shù)據(jù)科學(xué)理論與方法體系的迭代創(chuàng)新發(fā)展。

? 優(yōu)化大數(shù)據(jù)和數(shù)據(jù)科學(xué)新發(fā)展機(jī)遇背景下的圖書情報學(xué)科研究體系

在圖書情報領(lǐng)域,一方面,在技術(shù)與經(jīng)濟(jì)發(fā)展的驅(qū)動下,實踐環(huán)節(jié)中產(chǎn)生了許許多多亟待解決的重大問題,其中,如何使數(shù)據(jù)、信息更有效的集成,并轉(zhuǎn)化為知識進(jìn)而轉(zhuǎn)變形成支撐決策的智慧,關(guān)系到圖書情報領(lǐng)域?qū)W科體系創(chuàng)新的趨向與能否贏取核心競爭優(yōu)勢的途徑;另一方面,已有的知識服務(wù)、知識創(chuàng)新、知識發(fā)現(xiàn)等理論與方法在其它學(xué)科滲透沖擊下迫切需要變革創(chuàng)新或者不斷完善以形成有實際效用的體系框架。大數(shù)據(jù)的發(fā)展與知識創(chuàng)新服務(wù)的迫切需求,為圖書情報領(lǐng)域的學(xué)科發(fā)展提供了一個切合時代趨勢的機(jī)遇。本課題從理論方法構(gòu)建、關(guān)鍵技術(shù)方法研究與應(yīng)用驗證多個方面切入,并基于多元化的理論與多學(xué)科支撐,形成面向知識創(chuàng)新服務(wù)需求的數(shù)據(jù)科學(xué)的系列化研究成果,這將為圖書情報領(lǐng)域優(yōu)化學(xué)科體系提供重要的研究基礎(chǔ)與保障。同時,針對學(xué)科知識創(chuàng)新的重構(gòu)和提供知識創(chuàng)新服務(wù),以數(shù)據(jù)科學(xué)作為圖書情報學(xué)科體系研究的重要支撐,將突破現(xiàn)有學(xué)科發(fā)展局限、深化研究主題、開拓新的研究空間、提升研究水平,促使圖書情報領(lǐng)域的學(xué)科體系建設(shè)在未來發(fā)展中抓住核心競爭力的優(yōu)勢契機(jī)。

? 研究產(chǎn)生的社會影響

課題在研究過程中,被國內(nèi)多個學(xué)術(shù)會議和研究機(jī)構(gòu)邀請進(jìn)行學(xué)術(shù)交流,所撰寫的論文被國內(nèi)外核心期刊與頂級會議錄用,產(chǎn)生了較大社會影響。

? 課題研究觀點被社會的評價

上海社會科學(xué)院信息研究所的評價: “2017年2月24日上午,國家社科重大項目首席專家、南京理工大學(xué)經(jīng)濟(jì)管理學(xué)院信息管理系王曰芬教授到信息所作學(xué)術(shù)演講。報告會上,王曰芬教授以“數(shù)據(jù)科學(xué)支撐的知識服務(wù)創(chuàng)新對策思考”,從國家大數(shù)據(jù)戰(zhàn)略和國家科技創(chuàng)新規(guī)劃切手,介紹了所承擔(dān)的國家重大項目的申請背景與項目內(nèi)涵旨意,深入分析了國內(nèi)外知識服務(wù)、數(shù)據(jù)科學(xué)的起始與發(fā)展,結(jié)合中國當(dāng)代的發(fā)展環(huán)境,提出了基于數(shù)據(jù)科學(xué)的創(chuàng)新對策的新理念、新戰(zhàn)略和新實踐,為我們提供了以數(shù)據(jù)為基礎(chǔ)的知識服務(wù)如何發(fā)展并達(dá)到新經(jīng)濟(jì)與新技術(shù)所需的服務(wù)業(yè)態(tài)的全新思考。王曰芬教授在演講中所提出的數(shù)據(jù)的收集、分析與建模并為學(xué)科創(chuàng)新工作靈感提供動力;數(shù)據(jù)科學(xué)可提供管理的優(yōu)化研究精度的提高;在以往知識服務(wù)產(chǎn)品的基礎(chǔ)上注重工具的使用;如何在雙輪互動中進(jìn)行研究熱點挖掘、主題演化、趨勢預(yù)測,如何將大數(shù)據(jù)分析與學(xué)科領(lǐng)域生命周期結(jié)合起來,并進(jìn)行深度聚合與挖掘,用以發(fā)現(xiàn)各學(xué)科領(lǐng)域中的作者關(guān)鍵詞關(guān)系圖……,以上這些論述與分析,對信息所正在從事的一帶一路研究、科技創(chuàng)新研究、互聯(lián)網(wǎng)研究、信息安全研究、城市信息化研究、人才信息研究等均具有重要的啟示。(http://www2.sass.org.cn/detailAction.do?method=ShowNewsContent)”

? 課題研究中論文發(fā)表與引用及下載情況

發(fā)表期刊論文17篇,其中:SCI/SSCI雙收錄期刊《Scientometrics》發(fā)表論文1篇(在Web of Science核心合集數(shù)據(jù)庫中的Usage Metrics為43次)、CSSCI收錄的一級學(xué)會期刊《中國圖書館學(xué)報》發(fā)表2篇、CSSCI收錄的一級學(xué)會期刊《情報學(xué)報》發(fā)表3篇、CSSCI收錄期刊《圖書情報工作》《圖書與情報》《情報資料工作》《數(shù)據(jù)分析與知識發(fā)現(xiàn)》等期刊發(fā)表9篇、CSSCI擴(kuò)展版收錄期刊《數(shù)字圖書館論壇》發(fā)表3篇;發(fā)表本學(xué)科頂級會議(ISSI2017、ASIST2017)論文長文3篇、短文4篇,其中被EI收錄6篇;發(fā)表的中文16篇學(xué)術(shù)期刊論文在CNKI數(shù)據(jù)庫中,截止到2018年7月22日共被下載4056次、被引用19次。

2階段性成果清單

2.1 學(xué)術(shù)論文發(fā)表

? 發(fā)表的學(xué)術(shù)期刊論文共17篇(其中:SCI/SSCI雙收錄期刊論文1篇,國內(nèi)一級學(xué)會期刊論文5篇)和發(fā)表的本學(xué)科頂級學(xué)術(shù)會議論文7篇(其中:被EI收錄6篇),具體信息見附件EXCEL。

2.2錄用待發(fā)表論文與交付待出版專著

? 被錄用待發(fā)表的學(xué)術(shù)期刊論文(共8篇)

(1) Lei Li, Daqing He, Chengzhi Zhang*, Li Geng, Ke Zhang. Characterizing Peer-Judged Answer Quality on Academic Q&A Sites: A Cross-Disciplinary Case Study on ResearchGate[J].Aslib Journal of Information Management.(in press)(SCI/SSCI雙收錄期刊)

(2) Qing qing Zhou*, Chengzhi Zhang*. Detecting Users’ Dietary Preferences and Their Evolutions via Chinese Social Media[J].Journal of Database Management. (in press) (SCI收錄期刊)

(3) Shutian Ma*, Yingyi Zhang, Chengzhi Zhang*. Using Multiple Web Resources and Inference Rules to Classify Chinese Word Semantic Relation[J].Information Discovery and Delivery.(in press). (ESI收錄期刊)

(4) Chao Min,Ying Ding, Jiang Li,Yi Bu,Lei Pei,Jianjun Sun*.Innovation or Imitation: The Diffusion of Citations[J].Journal of the association for information science and technology, 2018(in press). (SCI收錄期刊)

(5) 余厚強(qiáng),曹嘉君,王曰芬.情報學(xué)視角下的國際人工智能研究前沿分析[J].情報雜志(錄用)(CSSCI收錄期刊)

(6) 王曰芬*,鄒本濤,宋小康.大數(shù)據(jù)驅(qū)動下情報研究知識庫及其體系架構(gòu)設(shè)計[J].情報理論與實踐(錄用)(CSSCI收錄期刊)

(7) 宋小康,何勁,王曰芬*.大數(shù)據(jù)驅(qū)動下情報研究知識庫構(gòu)建的關(guān)鍵技術(shù)及實現(xiàn)[J].情報理論與實踐(錄用)(CSSCI收錄期刊)

(8) 曹嘉君,王曰芬*,宋小康.大數(shù)據(jù)驅(qū)動下情報研究知識庫的應(yīng)用:以石墨烯領(lǐng)域為例[J].情報理論與實踐(錄用)(CSSCI收錄期刊)

? 待出版的專著:王曰芬等.數(shù)據(jù)驅(qū)動的知識服務(wù)體系與方法[M].科學(xué)出版社

2.3發(fā)表其他研究成果

(1) 在2017年計算語言學(xué)領(lǐng)域的自動摘要國際測評比賽論文

Shutian Ma, Jin Xu, Jie Wang and Chengzhi Zhang*. NJUST @ CLSciSumm-17. In: Proceedings of the 2nd Joint Workshop on Bibliometric-enhanced Information Retrieval and Natural Language Processing for Digital Libraries (BIRNDL 2017), Aug, 2017, Tokyo, Japan. (CL-SciSumm 2017測評比賽冠軍)

(2) 專家寄語:王曰芬.創(chuàng)新驅(qū)動發(fā)展需要基于大數(shù)據(jù)的知識服務(wù)[J]數(shù)字圖書館論壇,2018(3):1

(注:*表明的是課題的主要研究者)

三、下一步研究計劃

總體上,進(jìn)一步按照研究計劃,以理論與方法研究為重點、以應(yīng)用研究為落腳點,強(qiáng)化學(xué)術(shù)交流、成果發(fā)布、國際合作。在2018年9月召開一次中期研討會,在2019年上半年將理論與方法研究成果與實踐工作部門對接,以爭取一定范圍的應(yīng)用,2019年底完成課題的總報告。具體地,每個子課題的工作方案如下:

? 子課題一:面向知識創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)理論研究:目的與體系

2018年9月至2019年6月

通過專家咨詢和集體攻關(guān)途徑,攻克與面向知識創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)理論與方法體系架構(gòu)有關(guān)的難點問題;與其他子課題合作,在后續(xù)知識抽取、知識融合和知識創(chuàng)新服務(wù)的實現(xiàn)模式和實證應(yīng)用研究過程中,完善需求分析、理論與方法體系以及應(yīng)用與保障體系架構(gòu)設(shè)計;在此過程中,整理并發(fā)表若干篇高水平的學(xué)術(shù)論文;

2019年7月至2019年12月

完成子課題研究報告。

? 子課題二:面向知識創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)方法研究:信息采集與知識抽取

2018年7月至2018年9月

分別開展大數(shù)據(jù)驅(qū)動的多層次知識表示模式、大數(shù)據(jù)用戶知識表示方法的研究;

2018年10月至2019年6月

與其他子課題合作,在后續(xù)有關(guān)大數(shù)據(jù)驅(qū)動的知識融合的實現(xiàn)模式和實證應(yīng)用研究過程中,完善知識抽取模式、方法與技術(shù)實現(xiàn)方案;在此過程中,整理并發(fā)表若干篇高水平的學(xué)術(shù)論文;

2019年7月至2019年12月

完成子課題研究報告。

? 子課題三:面向知識創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)方法研究:知識融合與知識發(fā)現(xiàn)

2018年7月至2018年8月

分別開展知識融合與知識發(fā)現(xiàn)結(jié)果的展示、知識融合與知識發(fā)現(xiàn)結(jié)果的驗證研究;

2018年9月至2019年6月

與其他子課題合作,在后續(xù)有關(guān)知識創(chuàng)新服務(wù)應(yīng)用和實證研究過程中,完善知識融合和知識發(fā)現(xiàn)的模式、方法與技術(shù)實現(xiàn)方案;在此過程中,整理并發(fā)表若干篇高水平的學(xué)術(shù)論文;

2019年7月至2019年12月

完成子課題研究報告。

? 子課題四:面向知識創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)應(yīng)用研究:知識創(chuàng)新服務(wù)機(jī)制

2018年7月至2019年3月

基于知識管理的認(rèn)知模型和社會模型,探索知識創(chuàng)新服務(wù)的孵化機(jī)制;基于組織科學(xué)的創(chuàng)新擴(kuò)散理論,探索知識創(chuàng)新服務(wù)的擴(kuò)散機(jī)制;基于野中郁次郎的知識管理模型,探索知識創(chuàng)新服務(wù)的轉(zhuǎn)化機(jī)制;基于認(rèn)知科學(xué)的認(rèn)知吸收理論和組織行為學(xué)的吸收能力理論,探索知識創(chuàng)新服務(wù)的吸收機(jī)制;

2019年4月至2019年12月

對數(shù)據(jù)科學(xué)支撐的知識創(chuàng)新服務(wù)保障進(jìn)行系統(tǒng)研究,分別就組織管理、技術(shù)保障、產(chǎn)學(xué)研合作以及人才培養(yǎng)進(jìn)行充分調(diào)研和探索;發(fā)表若干篇高水平的學(xué)術(shù)論文,并最終形成論文集和結(jié)項驗收報告作為子課題成果,完成子課題結(jié)項。

? 子課題五:面向知識創(chuàng)新服務(wù)的數(shù)據(jù)科學(xué)應(yīng)用研究:實現(xiàn)與驗證

2018年7月至2018年12月

理清大數(shù)據(jù)時代知識創(chuàng)新服務(wù)平臺和系統(tǒng)的創(chuàng)新型知識服務(wù)模式,分析服務(wù)平臺和系統(tǒng)中各要素,建立要素之間的關(guān)系;建立完整的大數(shù)據(jù)時代知識創(chuàng)新服務(wù)機(jī)制和模式的理論框架;進(jìn)行大數(shù)據(jù)知識創(chuàng)新服務(wù)平臺和系統(tǒng)的詳細(xì)設(shè)計,進(jìn)行知識庫的構(gòu)建,完成知識服務(wù)平臺的建設(shè);

2019年1月至2019年8月

以某技術(shù)領(lǐng)域為例,開展面向?qū)W科領(lǐng)域的研究前沿探索應(yīng)用實證、面向科研資源共享與用戶項目眾包的科研眾包應(yīng)用實證;構(gòu)建知識創(chuàng)新服務(wù)的應(yīng)用反饋機(jī)制,建立應(yīng)用效果的評估體系,實現(xiàn)服務(wù)的應(yīng)用反饋和效果評估;

2019年9月至2019年12月

對課題研制過程中形成的技術(shù)文檔進(jìn)行整理,并對整體的應(yīng)對體系進(jìn)行整合;發(fā)表若干篇高水平的學(xué)術(shù)論文,并最終形成論文集和結(jié)項驗收報告作為子課題成果,完成子課題結(jié)項。

(課題組供稿)

(責(zé)編:孫爽、閆妍)
文成县| 喀喇| 屏东县| 象州县| 五华县| 泰宁县| 汉阴县| 青海省| 增城市| 安乡县| 商洛市| 托克逊县| 盐城市| 绥芬河市| 繁峙县| 雷波县| 沙湾县| 惠东县| 沈阳市| 石河子市| 化德县| 荥阳市| 泰和县| 大理市| 汕头市| 齐齐哈尔市| 神农架林区| 同江市| 迁西县| 永定县| 凭祥市| 清远市| 徐闻县| 眉山市| 南澳县| 宁津县| 灯塔市| 卢氏县| 民丰县| 寿阳县|