一、研究進(jìn)展情況
1.研究進(jìn)展
自2014年7月以來(lái),國(guó)家社會(huì)科學(xué)基金重大項(xiàng)目“云計(jì)算環(huán)境下的信息資源集成與服務(wù)研究”在首席專家、咨詢專家、各子課題負(fù)責(zé)人及全體項(xiàng)目組成員的共同努力下,按項(xiàng)目計(jì)劃順利完成了預(yù)期研究任務(wù)和項(xiàng)目管理目標(biāo)。主要研究進(jìn)展如下:
1.1云計(jì)算環(huán)境下的信息資源集成與服務(wù)的系統(tǒng)框架(子課題1)
在2012年至2014年期間已完成的研究成果(基于云計(jì)算環(huán)境下的Hadoop的索引創(chuàng)建方法及其索引方法;基于云計(jì)算環(huán)境下的海量文本數(shù)據(jù)的一種相似度衡量;大數(shù)據(jù)的壓縮、清洗、分析和挖掘)的基礎(chǔ)上,側(cè)重完成了以下研究工作:
(1)進(jìn)一步凝練研究對(duì)象和研究環(huán)境的針對(duì)性,加強(qiáng)研究結(jié)論的問題導(dǎo)向性:在研究對(duì)象方面,突出了課題研究對(duì)象的特殊性——多源、異構(gòu)、海量和動(dòng)態(tài)的碎片化信息資源;在研究環(huán)境方面,突出了云計(jì)算及其四個(gè)基本特征:虛擬化、彈性計(jì)算、經(jīng)濟(jì)性、按需服務(wù)。因此,系統(tǒng)框架設(shè)計(jì)具備較強(qiáng)的針對(duì)性和實(shí)用性。
(2)體系結(jié)構(gòu)的優(yōu)化:以碎片化管理、分層實(shí)現(xiàn)、彈性計(jì)算、負(fù)載均衡、故障恢復(fù)和數(shù)據(jù)連續(xù)性保障為主要設(shè)計(jì)目的,將系統(tǒng)框架分為存儲(chǔ)、計(jì)算、集成和服務(wù)四個(gè)層次。其中,信息存儲(chǔ)層的關(guān)鍵問題為分片、復(fù)制及數(shù)據(jù)一致性保障;信息計(jì)算層則主要解決數(shù)據(jù)流和控制流的分離;信息集成層的關(guān)鍵問題則碎片信息的溯源與集成;信息服務(wù)層主要解決的是個(gè)性化服務(wù)及數(shù)據(jù)驅(qū)動(dòng)型服務(wù)。
(3)碎片信息資源的全生命期管理:重點(diǎn)研究云計(jì)算環(huán)境下的碎片信息資源的生成、傳播、演化、跟蹤、關(guān)聯(lián)、分析、集成與利用的基本原則和關(guān)鍵技術(shù)。相關(guān)研究成果:論文《Knowledge Fragmentation and Its Connectivity Assurance》已被第13屆智力資本、知識(shí)管理與組織學(xué)習(xí)國(guó)際會(huì)議(3th International Conference on Intellectual Capital和Knowledge Management & Organisational Learning)錄用;專著《數(shù)據(jù)科學(xué)》(清華大學(xué)出版社)中討論了數(shù)據(jù)連續(xù)性保障問題。
1.2云計(jì)算環(huán)境下的信息資源存儲(chǔ)和組織模式研究(子課題2)
研究?jī)?nèi)容主要涉及推薦算法和信息網(wǎng)絡(luò)挖掘兩部分:推薦算法包括基于張量分解、隨機(jī)決策樹的推薦算法以及符號(hào)網(wǎng)絡(luò)的正負(fù)關(guān)系預(yù)測(cè)算法,信息網(wǎng)絡(luò)挖掘主要是不確定圖上的SimRank計(jì)算和結(jié)點(diǎn)相似度計(jì)算。
(1)推薦算法:主要包括符號(hào)社會(huì)網(wǎng)絡(luò)中正負(fù)關(guān)系預(yù)測(cè)算法研究、CROWN:結(jié)合上下文信息進(jìn)行新聞推薦、大數(shù)據(jù)與推薦系統(tǒng)、基于高效張量分解的上下文感知推薦算法以及基于隨機(jī)決策樹的上下文感知推薦算法。相關(guān)研究成果:Shaoqing Wang, Cuiping Li, Kankan Zhao, Mengwei Lan, and Hong Chen “Fusing Hierarchical Information in Context-aware Recommendations”已投稿Dasfaa2016。
(2)信息網(wǎng)絡(luò)挖掘:主要包括不確定圖上的SimRank計(jì)算、多關(guān)系網(wǎng)絡(luò)中結(jié)點(diǎn)之間相似度計(jì)算以及分析SimRank,Personalized PageRank和P-rank的誤差估計(jì)。相關(guān)研究成果有Lingxia Du, Cuiping Li, Hong Chen, Liwen Tan, Yinglong Zhang, Probabilistic SimRank computation over uncertain graphs, Information Sciences, Volume 295, 20 February 2015: 521-535(CCF B類)、Jing Xu, Cuiping Li, Hong Chen, Hui Sun. SimRank Based Top-k Query Aggregation for Multi-Relational Networks. WAIM 2015. (CCF C類)和Yinglong Zhang, Cuiping Li, Chengwang Xie,Hong Chen, Accuracy Estimation of Link-based Similarity Measures and Its Application, Frontiers of Computer Science, 2015:1-11(CCF C類)。
1.3 云計(jì)算環(huán)境下的信息資源集成方法研究(子課題3)
主要以提供具有集成化的、支持大數(shù)據(jù)的、虛擬化的“資源池”為研究目的,重點(diǎn)研究了云計(jì)算環(huán)境下的信息資源的碎片化處理、碎片數(shù)據(jù)的傳播與管理、碎片數(shù)據(jù)的質(zhì)量控制、個(gè)性化知識(shí)圖譜的生成和 數(shù)據(jù)驅(qū)動(dòng)型信息集成等特定研究問題,并在以下幾個(gè)方面取得了一定的研究進(jìn)展:
(1)云計(jì)算環(huán)境下碎片信息的預(yù)處理:主要研究云計(jì)算環(huán)境下的信息資源,尤其是碎片信息資源的預(yù)處理原則、方法、流程和技術(shù),為信息資源集成效果和效率的提升奠定數(shù)據(jù)基礎(chǔ)。
(2)云計(jì)算環(huán)境下的碎片信息管理及語(yǔ)義標(biāo)注:主要研究云計(jì)算環(huán)境下的信息資源,尤其是碎片信息資源的管理要求、審計(jì)、版本戳管理和其他元數(shù)據(jù)管理的方法、技術(shù)與工具,并以語(yǔ)義集成為目的進(jìn)行語(yǔ)義標(biāo)注。
(3)云計(jì)算環(huán)境下的碎片信息資源的數(shù)據(jù)驅(qū)動(dòng)型集成:主要研究如何采用個(gè)性化集成和語(yǔ)義標(biāo)注方法,將云計(jì)算環(huán)境下的信息資源,尤其是碎片信息資源集成為數(shù)據(jù)驅(qū)動(dòng)型知識(shí)圖譜。
相關(guān)研究成果已被第13屆智力資本、知識(shí)管理與組織學(xué)習(xí)國(guó)際會(huì)議(3th International Conference on Intellectual Capital和Knowledge Management & Organisational Learning)錄用;論文《基于開放度的可控自管理科技數(shù)字資源集成平臺(tái)構(gòu)架》發(fā)表在中文期刊《情報(bào)理論與實(shí)踐》;更多研究成果正在投稿之中。
1.4云計(jì)算環(huán)境下的信息資源服務(wù)模式研究(子課題4)
主要針對(duì)信息資源和計(jì)算資源從個(gè)人計(jì)算機(jī)和企業(yè)服務(wù)器向云端遷移的過程中服務(wù)模式的轉(zhuǎn)變,重點(diǎn)進(jìn)行了云計(jì)算環(huán)境下信息資源服務(wù)特征分析、模式構(gòu)建和采納行為、法律問題等方面的研究,為云計(jì)算環(huán)境下信息資源服務(wù)模式與方法的進(jìn)一步奠定了較好的基礎(chǔ)。主要進(jìn)展如下:
(1)云計(jì)算環(huán)境下的信息資源服務(wù)特征分析:系統(tǒng)地梳理了云計(jì)算技術(shù)給信息分析與服務(wù)帶來(lái)的關(guān)鍵問題、挑戰(zhàn)與發(fā)展趨勢(shì),既從頂層設(shè)計(jì)的角度提出了對(duì)策建議,也從微觀上提出了技術(shù)優(yōu)化與改進(jìn)策略。相關(guān)研究成果已在《圖書情報(bào)工作》、《情報(bào)雜志》、《中國(guó)信息年鑒》等國(guó)內(nèi)相關(guān)領(lǐng)域的重要刊物上發(fā)表。
(2)信息資源服務(wù)模式構(gòu)建:重點(diǎn)研究了知識(shí)共享、知識(shí)服務(wù)和政務(wù)云服務(wù)模式,提出了模式構(gòu)建的關(guān)鍵要素、組織模式、運(yùn)行機(jī)制和實(shí)現(xiàn)模型等,解決了信息資源服務(wù)的實(shí)踐問題。相關(guān)研究成果已在《情報(bào)理論與實(shí)踐》、《情報(bào)雜志》、《圖書館論壇》、《圖書館學(xué)研究》等國(guó)內(nèi)相關(guān)領(lǐng)域的重要刊物上發(fā)表,并形成碩士學(xué)位論文一篇。
(3)云計(jì)算信息服務(wù)采納:重點(diǎn)研究了政府、企業(yè)與個(gè)人作為主體對(duì)云計(jì)算信息服務(wù)的采納行為與影響因素,提出了云計(jì)算采納行為模型與相關(guān)研究的未來(lái)研究焦點(diǎn),分析了組織或用戶對(duì)云計(jì)算信息服務(wù)采納的態(tài)度和行為,為該領(lǐng)域的研究提供了研究基礎(chǔ)。相關(guān)研究成果已在《中國(guó)圖書館學(xué)報(bào)》上發(fā)表,并形成博士學(xué)位論文兩篇。
(4)信息資源服務(wù)的法律問題:重點(diǎn)研究了政府信息資源在開放與服務(wù)的過程中所依據(jù)的我國(guó)現(xiàn)有法律、法規(guī)及國(guó)外立法相關(guān)情況與法律適用現(xiàn)狀,并結(jié)合典型案例反映信息資源開發(fā)、利用的實(shí)踐問題,提出了《政府信息公開條例》與《檔案法》對(duì)信息資源服務(wù)的雙重規(guī)制,尋求了適合我國(guó)國(guó)情的解決途徑。相關(guān)研究成果已在《檔案學(xué)通訊》上發(fā)表。
1.5 云計(jì)算環(huán)境中的學(xué)科知識(shí)信息資源集成與服務(wù)平臺(tái)架構(gòu)與評(píng)估(子課題5)
在已有研究成果(學(xué)科資源云平臺(tái)構(gòu)建、學(xué)科資源獲取與集成、學(xué)科知識(shí)展示與服務(wù)的理論)的基礎(chǔ)上,優(yōu)化了學(xué)科資源云平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)。本子課題實(shí)現(xiàn)了EventTeller系統(tǒng)較好地支持實(shí)時(shí)抓取相關(guān)Web頁(yè)面數(shù)據(jù),并自動(dòng)過濾不相關(guān)網(wǎng)頁(yè),利用網(wǎng)頁(yè)標(biāo)題、摘要、發(fā)布時(shí)間更好的計(jì)算新聞網(wǎng)頁(yè)相似度,并支持在線事件偵測(cè)和展示。目前已實(shí)現(xiàn)的主要功能模塊有:在線事件偵測(cè),計(jì)算新聞網(wǎng)頁(yè)相似度,并設(shè)計(jì)了實(shí)時(shí)計(jì)算詞語(yǔ)權(quán)重算法,建立倒排索引以及使用新聞標(biāo)題索引來(lái)過濾不相關(guān)網(wǎng)頁(yè);融入更多類型的資源,實(shí)時(shí)抓取事件相關(guān)圖片,微博等;話題追蹤,設(shè)計(jì)了基于鄰域更新的算法來(lái)解決事件頁(yè)面集合更新;利用分布式系統(tǒng)進(jìn)行數(shù)據(jù)存儲(chǔ)及信息抽取,利用Hadoop的HDFS文件系統(tǒng),存儲(chǔ)實(shí)時(shí)抓取的數(shù)據(jù)。
1.6云測(cè)試管理與服務(wù)示范性應(yīng)用模式研究(子課題6)
本課題對(duì)云計(jì)算環(huán)境下的信息資源集成應(yīng)用案例進(jìn)行了廣泛的調(diào)研分析,并重點(diǎn)針對(duì)圖書館RFID通用數(shù)據(jù)交換平臺(tái)和思源探索云平臺(tái)這兩個(gè)實(shí)踐案例進(jìn)行了深入的研究,總結(jié)出應(yīng)用評(píng)價(jià)與示范性應(yīng)用模式。課題主要進(jìn)展如下:
(1)云計(jì)算環(huán)境下信息資源的集成特點(diǎn)與平臺(tái)應(yīng)用評(píng)價(jià)研究:以當(dāng)前圖書館海量的數(shù)據(jù)信息資源作為研究對(duì)象,重點(diǎn)研究了大數(shù)據(jù)環(huán)境下,信息資源的幾個(gè)典型特征以及讀者對(duì)于信息資源的獲取需求。提出了建設(shè)云數(shù)據(jù)平臺(tái)的方案,并以思源探索云服務(wù)平臺(tái)為例,從館員、讀者等不同的角度出發(fā),給出了一套完整的應(yīng)用評(píng)價(jià)體系,對(duì)于其它云服務(wù)或云測(cè)試平臺(tái)的評(píng)價(jià)具備很好的指導(dǎo)意義。
(2)基于云的協(xié)同創(chuàng)新平臺(tái)與學(xué)科服務(wù)研究:在云計(jì)算平臺(tái)和協(xié)同創(chuàng)新工作理念的背景下,分別從系統(tǒng)平臺(tái)和學(xué)科服務(wù)實(shí)踐的角度,開展了深入的研究分析工作。對(duì)當(dāng)前主流的一些云學(xué)科資源平臺(tái)進(jìn)行了分析比對(duì),總結(jié)出了一些建設(shè)面向?qū)W科協(xié)同創(chuàng)新的信息資源集成與服務(wù)系統(tǒng)的通用模式與特征;通過這種特征與模式的提煉,給未來(lái)的系統(tǒng)建設(shè)提供建設(shè)性的框架與參考依據(jù),從而設(shè)計(jì)出更好用、更智能化的學(xué)科信息資源系統(tǒng)。同時(shí)在服務(wù)上也提出了一些新的策略與建議,從而能更好的提升服務(wù)的水準(zhǔn)。相關(guān)研究成果已在《大學(xué)圖書情報(bào)學(xué)刊》等國(guó)內(nèi)核心刊物上發(fā)表。
(3)RFID云通用數(shù)據(jù)交換平臺(tái)研究:重點(diǎn)研究RFID云通用數(shù)據(jù)交換平臺(tái)中的數(shù)據(jù)交互問題和平臺(tái)管理模式,提出了圖書館RFID應(yīng)用的一種新模式,該RFID云服務(wù)平臺(tái)已正式在圖書館投入使用,對(duì)該平臺(tái)進(jìn)行了大量的RFID應(yīng)用端功能測(cè)試與使用,包括各種前端設(shè)備的使用與數(shù)據(jù)交互,從而能夠總結(jié)出一套行之有效的云服務(wù)應(yīng)用與管理模式,進(jìn)而推廣到其它應(yīng)用或其它領(lǐng)域。另外在標(biāo)簽轉(zhuǎn)換、盤點(diǎn)等設(shè)備的使用過程中,積累了大量的前端交互數(shù)據(jù),并結(jié)合圖書館管理系統(tǒng)等其它系統(tǒng)的數(shù)據(jù),做了海量的數(shù)據(jù)分析比對(duì)等工作,提出了RFID云服務(wù)平臺(tái)應(yīng)用中的數(shù)據(jù)分析策略與實(shí)際應(yīng)用模式。
(4)圖書館思源探索平臺(tái)實(shí)踐研究:圖書館思源探索平臺(tái)是一套基于云計(jì)算環(huán)境的資源發(fā)現(xiàn)系統(tǒng),系統(tǒng)在本地存儲(chǔ)少量數(shù)據(jù),絕大部分?jǐn)?shù)據(jù)都分散在云端的各個(gè)子系統(tǒng)上。系統(tǒng)通過OAI、JSON、X-service、Web Services、deep linking、OpenSearch、plug-ins、adaptor等接口從其他數(shù)據(jù)庫(kù)自動(dòng)抓取數(shù)據(jù)。目前思源探索包含的基本數(shù)據(jù)源包括圖書館的原始書目數(shù)據(jù)、電子資源和自建數(shù)據(jù)庫(kù)資源等,思源探索系統(tǒng)的后臺(tái)數(shù)據(jù)庫(kù)定期會(huì)從配置好的多個(gè)數(shù)據(jù)庫(kù)中收割相關(guān)數(shù)據(jù),滿足用戶對(duì)館藏資源的檢索需求;網(wǎng)絡(luò)資源,從點(diǎn)評(píng)網(wǎng)、豆瓣網(wǎng)等獲取到網(wǎng)絡(luò)平臺(tái)的資源數(shù)據(jù)以及本地資源的附屬信息,例如書評(píng)和封面等內(nèi)容;商用數(shù)據(jù)庫(kù)資源,系統(tǒng)即時(shí)從各個(gè)商用數(shù)據(jù)庫(kù)收割至思源探索的數(shù)據(jù)資源中心,存放在云端,供讀者進(jìn)行一站式的資源檢索。從信息資源的特征和資源訪問查詢的需求入手,以思源探索系統(tǒng)為例,研究了云平臺(tái)的搭建與設(shè)計(jì)模式,并與同樣類型的云平臺(tái)進(jìn)行了詳細(xì)的比對(duì)分析,從數(shù)據(jù)分析的角度分析了平臺(tái)的運(yùn)行現(xiàn)狀,并最終給出一套云服務(wù)平臺(tái)完整的應(yīng)用評(píng)價(jià)體系和應(yīng)用模式推薦。
2.調(diào)查研究與學(xué)術(shù)交流
課題組特別重視調(diào)查研究與學(xué)術(shù)交流,特別是跨子課題的交流與合作,多次召集各子課題負(fù)責(zé)人和部分代表交流各自的研究進(jìn)展、存在問題和解決思路,確保了項(xiàng)目研究的整體性。例如:
(1)2014~2016年,在文獻(xiàn)研究的基礎(chǔ)上,根據(jù)研究要點(diǎn)到北京、天津、河北、長(zhǎng)春等地信息機(jī)構(gòu)進(jìn)行了有針對(duì)性的調(diào)研,對(duì)理論研究進(jìn)行了實(shí)證分析;
(2)2015年4月,參加在首爾舉行的ICDE 2015國(guó)際會(huì)議;
(3)2015年6月,參加在青島舉行的WAIM 2015國(guó)際會(huì)議;
(4)2014~2015年,對(duì)思源探索平臺(tái)的使用進(jìn)行了問卷調(diào)研分析,并對(duì)云服務(wù)平臺(tái)相關(guān)的一些文獻(xiàn)資料進(jìn)行了收集整理工作;
(5)2014~2015年,對(duì)國(guó)內(nèi)外云計(jì)算采納相關(guān)文獻(xiàn)進(jìn)行系統(tǒng)的調(diào)研,在此基礎(chǔ)上提出個(gè)人云存儲(chǔ)用戶采納行為模型,然后,對(duì)云存儲(chǔ)的個(gè)人用戶進(jìn)行調(diào)查研究,通過訪談?wù){(diào)研和發(fā)放問卷兩種方式,對(duì)模型進(jìn)行了實(shí)證和進(jìn)一步解釋;
(6)2015年,參與 “2015中國(guó)信息資源管理論壇”;
(7)2015年,參與在泰國(guó)曼谷舉行的智力資本、知識(shí)管理與組織學(xué)習(xí)國(guó)際會(huì)議(International Conference on Intellectual Capital和Knowledge Management & Organizational Learning)。
(8)2014~2015年,參加IBM大數(shù)據(jù)分析師資培訓(xùn)。
3.成果宣傳推介
(1)2015年10月,課題首席專家杜小勇教授和盧小賓教授在《中國(guó)信息年鑒》發(fā)表特約論文《云計(jì)算環(huán)境下的信息資源集成與服務(wù)》;
(2)2014年10月,課題組向國(guó)家社科基金委提交成果要報(bào)《關(guān)于加強(qiáng)我國(guó)云端信息資源管理工作的幾點(diǎn)建議》;
(3)2015年6月,課題組提交的研究報(bào)告《大數(shù)據(jù)背景下政府?dāng)?shù)據(jù)資源的可持續(xù)管理與利用機(jī)制研究》等作為國(guó)家發(fā)改委制定相關(guān)政策提供了重要參考,并接到來(lái)自國(guó)家發(fā)改委高技術(shù)產(chǎn)業(yè)司的感謝信。
(4)在課題官網(wǎng)http://deke.ruc.edu.cn/static/icloud/index.html。上定期發(fā)布課題研究成果。
二、研究成果情況
自立項(xiàng)以來(lái),本課題已完成研究成果有87項(xiàng),其中專著/教材3部、標(biāo)準(zhǔn)2項(xiàng)、發(fā)明專利申請(qǐng)5項(xiàng)、軟件著作權(quán)申請(qǐng)9項(xiàng),發(fā)表論文67篇(國(guó)際發(fā)文26篇)、年鑒特邀稿1篇,具體如下表所示。
序號(hào) |
成果名稱 |
作者 |
成果形式 |
出版社或刊物名 |
出版或刊發(fā)時(shí)間(年/月) |
1 |
開放源代碼社區(qū)啟發(fā)下的知識(shí)共享組織模型研究 |
肖源, 楊哲倫, 郝杰 |
論文 |
圖書館學(xué)研究 |
2016.1 |
2 |
個(gè)人云存儲(chǔ)用戶采納模型及實(shí)證研究 |
王建亞,羅晨陽(yáng) |
論文 |
情報(bào)資料工作 |
2016.1 |
3 |
企業(yè)云服務(wù)采納模式及影響因素研究 |
王濤 |
論文 |
博士學(xué)位論文 |
2016.6 |
4 |
基于流式計(jì)算的網(wǎng)絡(luò)輿情分析模型研究 |
高歡 |
論文 |
情報(bào)學(xué)報(bào) |
已錄用 |
5 |
信息分析視角下的大數(shù)據(jù)分析平臺(tái)構(gòu)架研究 |
肖源,郝杰,劉瑩,王濤 |
論文 |
情報(bào)科學(xué) |
已錄用 |
6 |
云架構(gòu)下智慧政府服務(wù)模式研究 |
霍亮 |
論文 |
現(xiàn)代情報(bào) |
已錄用 |
7 |
Random Partition Factorization Machines for Context-Aware Recommendations |
Shaoqing Wang等 |
論文 |
WAIM2016, Nanchang, China. |
2016.6 |
8 |
Learn to recommend local event using heterogeneous social networks. |
Shaoqing Wang, Zheng Wang, Cuiping Li |
論文 |
APWeb2016, Suzhou, China. |
已錄用 |
9 |
面向?qū)W科化服務(wù)的高校云協(xié)同創(chuàng)新支持實(shí)踐 |
郭晶等 |
論文 |
大學(xué)圖書情報(bào)學(xué)刊 |
已錄用 |
10 |
信息分析的若干核心問題探討 |
朝樂門等 |
論文 |
情報(bào)理論與實(shí)踐 |
2016.2 |
11 |
電子文件管理系統(tǒng)測(cè)試工作的對(duì)比研究 |
朝樂門等 |
論文 |
北京檔案 |
2016.4 |
12 |
Knowledge Fragmentation and Its Connectivity Assurance |
朝樂門等 |
論文 |
13th International Conference on Intellectual Capital, Knowledge Management & Organisational Learning |
已錄用 |
13 |
數(shù)據(jù)科學(xué) |
朝樂門 |
教材 |
清華大學(xué)出版社 |
2016.7 |
14 |
信息資源管理術(shù)語(yǔ)及概念體系 |
安小米 |
專著 |
中國(guó)標(biāo)準(zhǔn)化出版社 |
2016.1 |
15 |
GB/Z 32002-2015 信息與文獻(xiàn) 用于文件管理的工作過程分析 |
安小米 |
國(guó)家標(biāo)準(zhǔn) |
中國(guó)標(biāo)準(zhǔn)化出版社 |
2015.12 |
16 |
分布式系統(tǒng)與云計(jì)算概論(第二版) |
陸嘉恒 |
教材 |
清華大學(xué)出版社 |
2013.12 |
17 |
Big data challenge: a data management perspective |
陸嘉恒 |
論文 |
Frontiers of Computer Science |
2013.7 |
18 |
一種基于代價(jià)敏感支持向量機(jī)的遙感圖像自動(dòng)解譯方法 |
陸嘉恒 |
發(fā)明專利 |
201310170288.2,2013.05.10 |
2013.05.10 |
19 |
基于Hadoop的索引創(chuàng)建方法及其索引方法 |
陸嘉恒 |
發(fā)明專利 |
201310302669.1,2013.07.17 |
2013.07.17 |
20 |
一種基于海量文本數(shù)據(jù)的相似度衡量方法 |
陸嘉恒 |
發(fā)明專利 |
201310335123.6,2013.08.02 |
2013.08.02 |
21 |
分布式海量Web數(shù)據(jù)爬取共享系統(tǒng) |
陸嘉恒 |
發(fā)明專利 |
201310471593.5, 2013.10.11 |
2013.10.11 |
22 |
友好的XML圖形化搜索系統(tǒng)軟件V1.0 |
陸嘉恒,林春彬 |
軟件著作權(quán) |
2013SR035944,2013.04.22 |
2013.04.22 |
23 |
海量Web數(shù)據(jù)信息自動(dòng)爬取與半自動(dòng)化抽取系統(tǒng)軟件V1.0 |
陸嘉恒 |
軟件著作權(quán) |
2013SR116778,2013.10.31 |
2013.10.31 |
24 |
海量非結(jié)構(gòu)化數(shù)據(jù)管理系統(tǒng)測(cè)試軟件[簡(jiǎn)稱:NSRunner] V1.0 |
陸嘉恒,蔡曉華 |
軟件著作權(quán) |
2013SR131745 2013.11.25 |
2013.11.25 |
25 |
A Skylining Approach to Optimize Influence and Cost in Location Selection |
Juwei Shi,Hua Lu,Jiaheng Lu,Chengxuan Liao |
論文 |
DASFAA/2014 B類 |
2014.1 |
26 |
pandasearch: a fine-grained academic search engine for research documents |
Feiran Huang,Jia Li,Jiaheng Lu 等 |
論文 |
ICDE/2014 A類 |
2014.1 |
27 |
面向?qū)W術(shù)的精準(zhǔn)搜索系統(tǒng)軟件 [簡(jiǎn)稱:CS Serach] V1.0 |
陸嘉恒,顧向南 |
軟件著作權(quán) |
2014SR049788 2014.04.25 |
2014.04.25 |
28 |
基于學(xué)術(shù)搜索系統(tǒng)的人名自動(dòng)提示軟件[簡(jiǎn)稱:Scholar_AutoComplete] v1.0 |
陸嘉恒,蔡曉華 |
軟件著作權(quán) |
2014SR136332,2014.09.11 |
2014.09.11 |
29 |
大規(guī)模圖數(shù)據(jù)處理系統(tǒng)軟件V1.0 |
陸嘉恒,楊華 |
軟件著作權(quán) |
2014SR026073 2014.03.04 |
2014.03.04 |
30 |
面向?qū)W術(shù)搜索的圖片爬取系統(tǒng)軟件V1.0 |
李德陽(yáng),陸嘉恒 |
軟件著作權(quán) |
2014SR202098 2014.06.30 |
2014.06.30 |
31 |
開放環(huán)境下面向?qū)W術(shù)應(yīng)用的論文信息自動(dòng)獲取系統(tǒng)軟件V1.0 |
趙嘉迪,陸嘉恒 |
軟件著作權(quán) |
014SR204396 2014.10.30 |
2014.10.30 |
32 |
MapReduce-Based SimRank Computation and Its Application in Social Recommender System |
Lina Li, Cuiping Li等 |
論文 |
IEEE Bigdata Congress, 2013 |
2013.6 |
33 |
On Perspective Aware Top-k Similarity Search in Multi-Relational Networks |
Yinglong Zhang, Cuiping Li, Hong Chen |
論文 |
DASFAA 2014. |
2014.4 |
34 |
信息網(wǎng)絡(luò)中一個(gè)有效的結(jié)點(diǎn)相似度度量 |
張應(yīng)龍,李翠平,陳紅 |
論文 |
軟件學(xué)報(bào) |
2014.11 |
35 |
Accuracy Estimation of Link-based Similarity Measures and Its Application |
Yinglong Zhang, Cuiping Li, Hong Chen |
論文 |
Frontiers of Computer Science |
2015.1 |
36 |
Probabilistic SimRank Computation over Uncertain Graphs |
Lingxia Du, Cuiping Li, 等 |
論文 |
Information Sciences |
2015.1 |
37 |
基于用戶信任和張量分解的社會(huì)網(wǎng)絡(luò)推薦 |
鄒本友, 李翠平等 |
論文 |
軟件學(xué)報(bào). |
2014.12 |
38 |
國(guó)外智慧城市知識(shí)中心構(gòu)建機(jī)制及其借鑒研究 |
安小米 |
論文 |
情報(bào)資料工作 |
2013.4 |
39 |
面向智慧城市發(fā)展的信息資源管理協(xié)同創(chuàng)新策略構(gòu)想 |
安小米 |
論文 |
情報(bào)資料工作 |
2013.4 |
40 |
詞語(yǔ)位置加權(quán)TextRank的關(guān)鍵詞抽取研究 |
夏天 |
論文 |
現(xiàn)代圖書情報(bào)技術(shù) |
2013.9 |
41 |
融合LDA 與TextRank 的關(guān)鍵詞抽取研究 |
夏天等 |
論文 |
現(xiàn)代圖書情報(bào)技術(shù) |
2014.7 |
42 |
大數(shù)據(jù)時(shí)代的政府信息資源管理:國(guó)外數(shù)字連續(xù)性戰(zhàn)略及借鑒 |
安小米 |
論文 |
智慧城市 |
2014.1 |
43 |
Vocabularies of ISO/TC46/SC11 Publications |
安小米 |
標(biāo)準(zhǔn) |
the 30th ISO/TC46/SC11 meeting, Washington D.C., US |
2014.5 |
44 |
電子文件管理系統(tǒng)的技術(shù)特征 |
朝樂門 |
論文 |
現(xiàn)代圖書情報(bào)技術(shù) |
2013.4 |
45 |
電子文件管理系統(tǒng)測(cè)試方法研究 |
朝樂門 |
論文 |
檔案學(xué)通訊 |
2014.6 |
46 |
數(shù)據(jù)空間及其信息資源管理視角研究 |
朝樂門 |
論文 |
情報(bào)理論與實(shí)踐 |
2013.11 |
47 |
Mass Collaborative Knowledge Processing on the Amazon Mechanical Turk |
朝樂門 |
論文 |
International Journal of Computer Science Issues |
2014.2 |
48 |
一種電子文件管理系統(tǒng)的自動(dòng)化測(cè)試方法及系統(tǒng) |
朝樂門、杜小勇、薛四新 |
發(fā)明專利 |
CN201410045487.5 |
2014.12 |
49 |
云計(jì)算環(huán)境下電子文件管理的關(guān)鍵技術(shù)研究 |
薛四新,朝樂門,田雷 |
論文 |
北京檔案 |
2013.1 |
50 |
云計(jì)算環(huán)境下的信息資源的集成與服務(wù)研究 |
盧小賓、杜小勇、朝樂門 |
論文 |
《中國(guó)信息年鑒》特約論文 |
2015.1 |
51 |
Google三大云計(jì)算技術(shù)對(duì)海量數(shù)據(jù)分析流程的技術(shù)改進(jìn)優(yōu)化研究 |
王濤、盧小賓 |
論文 |
圖書情報(bào)工作, |
2015.3 |
52 |
大數(shù)據(jù)時(shí)代信息分析的關(guān)鍵問題、挑戰(zhàn)與對(duì)策 |
官思發(fā),朝樂門 |
論文 |
圖書情報(bào)工作, |
2015.3 |
53 |
計(jì)算機(jī)輔助信息分析及其發(fā)展趨勢(shì)研究 |
熊志正、朝樂門 |
論文 |
圖書情報(bào)工作, |
2015.3 |
54 |
《檔案法》規(guī)制下的政府信息公開問題探析 |
盧小賓、高歡 |
論文 |
檔案學(xué)通訊 |
2015.6 |
55 |
美國(guó)競(jìng)爭(zhēng)情報(bào)軟件發(fā)展現(xiàn)狀及對(duì)我國(guó)的啟示 |
官思發(fā),李宗潔 |
論文 |
圖書情報(bào)工作 |
2015.4 |
56 |
大數(shù)據(jù)環(huán)境下知識(shí)服務(wù)關(guān)鍵要素與實(shí)現(xiàn)模型研究 |
官思發(fā),李宗潔 |
論文 |
情報(bào)理論與實(shí)踐 |
2015.12 |
57 |
政務(wù)網(wǎng)絡(luò)信息生態(tài)鏈中的可信云服務(wù)模式構(gòu)建 |
王濤;曲榮華;洪先鋒 |
論文 |
情報(bào)雜志, |
2015.4 |
58 |
Scalable and noise tolerant web knowledge extraction for search task simplification. |
Jun He, Y. Gu, H. Liu, J. Yan, H. Chen. |
論文 |
Decision Support Systems |
2013.9 |
59 |
Predicting Microblog User's Age based on Text Information. |
Y. Li, T. Liu, H. Liu, Jun He and X. Du. |
論文 |
The 14th International Conference on Web Information System Engineering |
2013.9 |
60 |
The Study of UHF-RFID Data Model Construction in University Libraries |
GUO Jing etc. |
論文 |
The Electronic Library |
2014.5 |
61 |
Design and Implementation of a Subject Librarian Training Program for University Libraries in China |
GUO Jing etc. |
論文 |
Reference & User Services Quarterly |
2014.2 |
62 |
A Comprehensive Concept Map for Adequate Protection and Effective Management of Personal Information in Networked Chinese Services. |
An X, Bai W, Deng H, Sun S, Dong Y, Zhong W, Hu J (2015). |
論文 |
The Electronic Library |
2015.6 |
63 |
Mass collaborative knowledge management:Towards the next generation of knowledge management studies |
朝樂門 |
論文 |
Program |
2015.4 |
64 |
The information resources utilization index: a case study in China |
朝樂門等 |
論文 |
Program |
2016.1 |
65 |
元分析方法在信息分析中的應(yīng)用 |
陳鶴陽(yáng),朝樂門. |
論文 |
情報(bào)資料工作, 2015.6 |
2015.1 |
66 |
CROWN: A Context-aware RecOmmender for Web News |
Wang S, Zou B, Li C, et al. |
論文 |
Data Engineering (ICDE) |
2015.4 |
67 |
GPUTENSOR: Efficient Tensor Factorization for Context-Aware Recommendations. |
Benyou Zou, Cuiping Li, Liwen Tan and Hong Chen. |
論文 |
Information Sciences |
2015.4 |
68 |
Probabilistic SimRank computation over uncertain graphs |
Hong Chen, Liwen Tan, Yinglong Zhang |
論文 |
Information Sciences |
2015.2 |
69 |
SimRank Based Top-k Query Aggregation for Multi-Relational Networks. |
Jing Xu, Cuiping Li, Hong Chen, Hui Sun. |
論文 |
Web-Age Information Management. Springer |
2015.12 |
70 |
符號(hào)社會(huì)網(wǎng)絡(luò)中正負(fù)關(guān)系預(yù)測(cè)算法研究綜述 |
藍(lán)夢(mèng)微,李翠平,等 |
論文 |
計(jì)算機(jī)研究與發(fā)展 |
2015.2 |
71 |
大數(shù)據(jù)與推薦系統(tǒng) |
李翠平, 藍(lán)夢(mèng)微等 |
論文 |
大數(shù)據(jù) |
2015.3 |
72 |
大數(shù)據(jù)分析研究現(xiàn)狀、問題與對(duì)策 |
官思發(fā),孟璽,李宗潔,劉揚(yáng) |
論文 |
情報(bào)雜志 |
2015.5 |
73 |
大數(shù)據(jù)知識(shí)服務(wù)關(guān)鍵要素與實(shí)現(xiàn)模型研究 |
官思發(fā) |
論文 |
圖書館論壇 |
2015.6 |
74 |
政務(wù)網(wǎng)絡(luò)信息生態(tài)鏈中的可信云服務(wù)維度構(gòu)建 |
王濤,張?zhí)K,曲榮華等 |
論文 |
情報(bào)雜志 |
2015.4 |
75 |
云環(huán)境下政務(wù)信息生態(tài)鏈運(yùn)行機(jī)制研究 |
張皓月 |
論文 |
碩士學(xué)位論文 |
2015.6 |
76 |
Developing a Comprehensive Regime for Personal Information Protection in Networked Chinese Public Sectors |
Xiaomi An等 |
論文 |
Management |
2015.3 |
77 |
云計(jì)算采納行為研究現(xiàn)狀分析 |
盧小賓, 王建亞. |
論文 |
中國(guó)圖書館學(xué)報(bào), |
2015.1 |
78 |
電子文件管理系統(tǒng)的測(cè)試方法研究 |
朝樂門. |
論文 |
檔案學(xué)通訊 |
2014.6 |
79 |
電子文件管理系統(tǒng)研發(fā)的重點(diǎn)與難點(diǎn)分析 |
朝樂門. |
論文 |
檔案學(xué)通訊 |
2014.1 |
80 |
基于開放度的可控自管理科技數(shù)字資源集成平臺(tái)構(gòu)架 |
董宇, 安小米, 錢澄,等 |
論文 |
情報(bào)理論與實(shí)踐 |
2014.11 |
81 |
中國(guó)政府網(wǎng)站移動(dòng)瀏覽器兼容性研究 |
夏天, 陳杰, 魏小貞,等 |
論文 |
現(xiàn)代情報(bào) |
2014.11 |
82 |
大數(shù)據(jù)下基于異步累積更新的高效P-Rank計(jì)算方法 |
王旭叢, 李翠平, 陳紅. |
論文 |
軟件學(xué)報(bào) |
2014.09 |
83 |
現(xiàn)代國(guó)家治理的云端思維——信息治理能力與政府轉(zhuǎn)型的多重挑戰(zhàn) |
安小米. |
論文 |
人民論壇·學(xué)術(shù)前沿 |
2015.02 |
84 |
Location-Based Recommendation Using Incremental Tensor Factorization Model |
Zou B, Li C, Tan L, et al. |
論文 |
Advanced Data Mining and Applications Springer |
2014.11 |
85 |
Explicit semantic path mining via wikipedia knowledge tree |
Xia T, Chen M, Liu X. |
論文 |
Proceedings of the American Society for Information Science and Technology |
2014.6 |
86 |
Fast Approximation of Shortest Path on Dynamic Information Networks |
Jin J, Shi X, Li C, et al. |
論文 |
Web-Age Information Management. Springer |
2014.5 |
87 |
信息資源開發(fā)利用指數(shù)數(shù)據(jù)處理系統(tǒng) |
朝樂門等 |
軟件著作權(quán) |
登記號(hào) 2015SR226408 |
2015.9 |
其中,自2014年7月以來(lái),比較有代表性的成果簡(jiǎn)介如下:
(1)云計(jì)算采納行為研究現(xiàn)狀分析。在中國(guó)圖書館學(xué)報(bào)上發(fā)表了論文《云計(jì)算采納行為研究現(xiàn)狀分析》。論文采用定量和定性相結(jié)合的方法,對(duì)外文數(shù)據(jù)庫(kù)中云計(jì)算采納行為研究的文獻(xiàn)進(jìn)行梳理和分析。研究發(fā)現(xiàn):應(yīng)重視發(fā)展中國(guó)家和中小企業(yè)云計(jì)算采納行為研究,以促進(jìn)他們應(yīng)用云計(jì)算技術(shù);個(gè)人層面的云計(jì)算采納行為將成為一個(gè)重要的研究主題;需要構(gòu)建符合云計(jì)算技術(shù)特征的實(shí)證模型;需要結(jié)合應(yīng)用情境分析云計(jì)算采納行為的影響因素,云計(jì)算的安全、隱私、信任將成為本領(lǐng)域關(guān)注的焦點(diǎn)。論文通過對(duì)云計(jì)算采納行為研究現(xiàn)狀的分析,為我國(guó)該領(lǐng)域的研究提供研究思路和理論基礎(chǔ)。
(2)基于GFS、MapReduce和Bigtable的信息資源集成方法。在《圖書情報(bào)工作》上發(fā)表了論文《Google三大云計(jì)算技術(shù)對(duì)海量數(shù)據(jù)分析流程的技術(shù)改進(jìn)優(yōu)化研究》。論文針對(duì)傳統(tǒng)海量數(shù)據(jù)分析處理數(shù)據(jù)細(xì)節(jié)方式所導(dǎo)致的分析質(zhì)量與效率問題, 通過對(duì)Google三大云計(jì)算技術(shù)——GFS、MapReduce和Bigtable進(jìn)行文獻(xiàn)調(diào)查、內(nèi)容分析和技術(shù)分析,梳理出Google云計(jì)算技術(shù)在數(shù)據(jù)處理、技術(shù)架構(gòu)和算法模型等方面的部署創(chuàng)新和設(shè)計(jì)改進(jìn),并與傳統(tǒng)本地?cái)?shù)據(jù)分析處理方式與細(xì)節(jié)進(jìn)行比較分析,提出海量數(shù)據(jù)分析流程在存儲(chǔ)和訪問、組織與管理以及并行處理3個(gè)方面的技術(shù)優(yōu)化與改進(jìn)策略。其中提出的解決方案對(duì)本課題信息服務(wù)的構(gòu)建中數(shù)據(jù)處理和技術(shù)架構(gòu)等方面,有一定參考和指導(dǎo)意義。
(3)基于隨機(jī)決策樹的上下文推薦算法。隨著信息的爆炸式增長(zhǎng),推薦系統(tǒng)成為一個(gè)重要的工具,它可以有效地幫助用戶找到喜愛的物品。用戶的行為(如點(diǎn)擊、購(gòu)買、轉(zhuǎn)發(fā)、評(píng)論等)是基于特定的環(huán)境的,稱為上下文。上下文包括時(shí)間、地點(diǎn),心情,同伴等。在實(shí)際的應(yīng)用中,上下文可以很容易地被收集到。相對(duì)于傳統(tǒng)的僅基于用戶-物品二元交互的推薦系統(tǒng),上下文推薦可以顯著地提高推薦性能,F(xiàn)有的工作中,已經(jīng)有很多上下文推薦方法被提出。其中,因子分解機(jī)是一個(gè)很有影響力和流行的模型。因子分解機(jī)把用戶-物品-上下文交互表示為潛在因子的線性組合,并且平等地對(duì)待每一個(gè)用戶、物品、上下文因子,而不能很好地捕獲用戶、物品、上下文之間崔在的層次信息。實(shí)際上,層次結(jié)構(gòu)能夠在不同水平上捕獲更豐富的上下文信息,應(yīng)該被充分利用以提高推薦質(zhì)量。直覺上,在局部同質(zhì)的上下文環(huán)境下,用戶傾向于產(chǎn)生相似的評(píng)分。我們提出隨機(jī)分割因子分解機(jī),采用隨機(jī)決策樹層次化地分割上下文以便于更好地捕獲復(fù)雜的局部交互。在決策樹的每個(gè)節(jié)點(diǎn)上,我們探索因子分解機(jī)中潛在因子之間的相似度,采用k-means聚類方法分割用戶-物品-上下文元組。每個(gè)節(jié)點(diǎn)上的數(shù)據(jù)子集被期望有更好的交互影響。我們?cè)谌齻(gè)公開數(shù)據(jù)集上與現(xiàn)有的最新的5個(gè)上下文推薦模型做對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,我們提出的隨機(jī)分割因子分解機(jī)具有良好的性能。相關(guān)研究成果“Random Partition Factorization Machines for Context-Aware Recommendations”已經(jīng)發(fā)表于中國(guó)計(jì)算機(jī)學(xué)會(huì)推薦的國(guó)際會(huì)議WAIM2016。
(4)基于異構(gòu)社交網(wǎng)絡(luò)的推薦模型,F(xiàn)有的社交網(wǎng)絡(luò)蘊(yùn)含多個(gè)異構(gòu)的社交信息,如Meetup、豆瓣同城等基于事件的社交網(wǎng)絡(luò)連接線上和線下兩種社交網(wǎng)絡(luò),伴隨用戶和事件的急劇增長(zhǎng),有必要把相關(guān)事件推薦給用戶,F(xiàn)有的推薦系統(tǒng)的研究已經(jīng)表明,充分利用社交網(wǎng)絡(luò)信息能夠顯著地提高推薦性能。直覺上,用戶是否會(huì)對(duì)某一事件進(jìn)行響應(yīng)取決于他自身的興趣偏好和好友的行為。我們提出異構(gòu)社交泊松因子分解模型(HSPF)。HSPF模型組合在線和離線社交網(wǎng)絡(luò)到一個(gè)框架中,并把好友之間的關(guān)系強(qiáng)度集成到模型中。我們?cè)贛eetup數(shù)據(jù)集上測(cè)試我們提出的模型,實(shí)驗(yàn)結(jié)果表明,我們提出的HSPF模型戰(zhàn)勝了現(xiàn)有的模型。相關(guān)研究成果“Learn to recommend local event using heterogeneous social networks”已經(jīng)被中國(guó)計(jì)算機(jī)學(xué)會(huì)推薦的國(guó)際會(huì)議APWeb2016錄用。
(5)圖書館的RFID應(yīng)用中構(gòu)建云數(shù)據(jù)平臺(tái)的設(shè)計(jì)方法。主要探討了圖書館的RFID應(yīng)用中構(gòu)建云數(shù)據(jù)平臺(tái)的設(shè)計(jì)思路與方法,按照規(guī)范來(lái)設(shè)計(jì)平臺(tái),所有的RFID前端應(yīng)用如自助借還、標(biāo)簽轉(zhuǎn)換、盤點(diǎn)設(shè)備、自動(dòng)分揀設(shè)備等通過網(wǎng)絡(luò)和云數(shù)據(jù)平臺(tái)進(jìn)行數(shù)據(jù)交互,從而完成其功能應(yīng)用并實(shí)時(shí)記錄各項(xiàng)操作中的大數(shù)據(jù)日志記錄。主要觀點(diǎn)是通過建設(shè)一個(gè)圖書館RFID云數(shù)據(jù)平臺(tái),首先將大量的RFID交換數(shù)據(jù)匯總在一起存儲(chǔ)并使用;其次通過接口形式提供服務(wù),靈活性更好,可實(shí)現(xiàn)前端任意RFID設(shè)備的隨意接入;最后通過遵守?cái)?shù)據(jù)模型和通用數(shù)據(jù)交換規(guī)范,各個(gè)圖書館都能方便地互相交互RFID數(shù)據(jù),實(shí)現(xiàn)大區(qū)域RFID云共享云應(yīng)用的目標(biāo)。其中提出的解決方案對(duì)本課題云測(cè)試服務(wù)模式的研究有一定參考和指導(dǎo)意義,通過對(duì)該RFID云服務(wù)平臺(tái)的設(shè)計(jì)與搭建,可進(jìn)行大量的RFID應(yīng)用端功能測(cè)試,從而能夠?qū)Ρ菊n題的云測(cè)試管理方式提供一點(diǎn)的借鑒意義,可總結(jié)出一套行之有效的云服務(wù)應(yīng)用模式,進(jìn)而推廣到其它應(yīng)用或其它領(lǐng)域。相關(guān)研究成果《RFID通用數(shù)據(jù)交換平臺(tái)建設(shè)研究》在《圖書情報(bào)工作》上發(fā)表。
課題組供稿