舊版網(wǎng)站入口

站內(nèi)搜索

云計(jì)算環(huán)境下的信息資源集成與服務(wù)研究中期檢測(cè)報(bào)告

2016年11月29日15:41來(lái)源:全國(guó)哲學(xué)社會(huì)科學(xué)工作辦公室

一、研究進(jìn)展情況

1.研究進(jìn)展

自2014年7月以來(lái),國(guó)家社會(huì)科學(xué)基金重大項(xiàng)目“云計(jì)算環(huán)境下的信息資源集成與服務(wù)研究”在首席專家、咨詢專家、各子課題負(fù)責(zé)人及全體項(xiàng)目組成員的共同努力下,按項(xiàng)目計(jì)劃順利完成了預(yù)期研究任務(wù)和項(xiàng)目管理目標(biāo)。主要研究進(jìn)展如下:

1.1云計(jì)算環(huán)境下的信息資源集成與服務(wù)的系統(tǒng)框架(子課題1)

在2012年至2014年期間已完成的研究成果(基于云計(jì)算環(huán)境下的Hadoop的索引創(chuàng)建方法及其索引方法;基于云計(jì)算環(huán)境下的海量文本數(shù)據(jù)的一種相似度衡量;大數(shù)據(jù)的壓縮、清洗、分析和挖掘)的基礎(chǔ)上,側(cè)重完成了以下研究工作:

(1)進(jìn)一步凝練研究對(duì)象和研究環(huán)境的針對(duì)性,加強(qiáng)研究結(jié)論的問題導(dǎo)向性:在研究對(duì)象方面,突出了課題研究對(duì)象的特殊性——多源、異構(gòu)、海量和動(dòng)態(tài)的碎片化信息資源;在研究環(huán)境方面,突出了云計(jì)算及其四個(gè)基本特征:虛擬化、彈性計(jì)算、經(jīng)濟(jì)性、按需服務(wù)。因此,系統(tǒng)框架設(shè)計(jì)具備較強(qiáng)的針對(duì)性和實(shí)用性。

(2)體系結(jié)構(gòu)的優(yōu)化:以碎片化管理、分層實(shí)現(xiàn)、彈性計(jì)算、負(fù)載均衡、故障恢復(fù)和數(shù)據(jù)連續(xù)性保障為主要設(shè)計(jì)目的,將系統(tǒng)框架分為存儲(chǔ)、計(jì)算、集成和服務(wù)四個(gè)層次。其中,信息存儲(chǔ)層的關(guān)鍵問題為分片、復(fù)制及數(shù)據(jù)一致性保障;信息計(jì)算層則主要解決數(shù)據(jù)流和控制流的分離;信息集成層的關(guān)鍵問題則碎片信息的溯源與集成;信息服務(wù)層主要解決的是個(gè)性化服務(wù)及數(shù)據(jù)驅(qū)動(dòng)型服務(wù)。

(3)碎片信息資源的全生命期管理:重點(diǎn)研究云計(jì)算環(huán)境下的碎片信息資源的生成、傳播、演化、跟蹤、關(guān)聯(lián)、分析、集成與利用的基本原則和關(guān)鍵技術(shù)。相關(guān)研究成果:論文《Knowledge Fragmentation and Its Connectivity Assurance》已被第13屆智力資本、知識(shí)管理與組織學(xué)習(xí)國(guó)際會(huì)議(3th International Conference on Intellectual Capital和Knowledge Management & Organisational Learning)錄用;專著《數(shù)據(jù)科學(xué)》(清華大學(xué)出版社)中討論了數(shù)據(jù)連續(xù)性保障問題。

1.2云計(jì)算環(huán)境下的信息資源存儲(chǔ)和組織模式研究(子課題2)

研究?jī)?nèi)容主要涉及推薦算法和信息網(wǎng)絡(luò)挖掘兩部分:推薦算法包括基于張量分解、隨機(jī)決策樹的推薦算法以及符號(hào)網(wǎng)絡(luò)的正負(fù)關(guān)系預(yù)測(cè)算法,信息網(wǎng)絡(luò)挖掘主要是不確定圖上的SimRank計(jì)算和結(jié)點(diǎn)相似度計(jì)算。

(1)推薦算法:主要包括符號(hào)社會(huì)網(wǎng)絡(luò)中正負(fù)關(guān)系預(yù)測(cè)算法研究、CROWN:結(jié)合上下文信息進(jìn)行新聞推薦、大數(shù)據(jù)與推薦系統(tǒng)、基于高效張量分解的上下文感知推薦算法以及基于隨機(jī)決策樹的上下文感知推薦算法。相關(guān)研究成果:Shaoqing Wang, Cuiping Li, Kankan Zhao, Mengwei Lan, and Hong Chen “Fusing Hierarchical Information in Context-aware Recommendations”已投稿Dasfaa2016。

(2)信息網(wǎng)絡(luò)挖掘:主要包括不確定圖上的SimRank計(jì)算、多關(guān)系網(wǎng)絡(luò)中結(jié)點(diǎn)之間相似度計(jì)算以及分析SimRank,Personalized PageRank和P-rank的誤差估計(jì)。相關(guān)研究成果有Lingxia Du, Cuiping Li, Hong Chen, Liwen Tan, Yinglong Zhang, Probabilistic SimRank computation over uncertain graphs, Information Sciences, Volume 295, 20 February 2015: 521-535(CCF B類)、Jing Xu, Cuiping Li, Hong Chen, Hui Sun. SimRank Based Top-k Query Aggregation for Multi-Relational Networks. WAIM 2015. (CCF C類)和Yinglong Zhang, Cuiping Li, Chengwang Xie,Hong Chen, Accuracy Estimation of Link-based Similarity Measures and Its Application, Frontiers of Computer Science, 2015:1-11(CCF C類)。

1.3 云計(jì)算環(huán)境下的信息資源集成方法研究(子課題3)

主要以提供具有集成化的、支持大數(shù)據(jù)的、虛擬化的“資源池”為研究目的,重點(diǎn)研究了云計(jì)算環(huán)境下的信息資源的碎片化處理、碎片數(shù)據(jù)的傳播與管理、碎片數(shù)據(jù)的質(zhì)量控制、個(gè)性化知識(shí)圖譜的生成和 數(shù)據(jù)驅(qū)動(dòng)型信息集成等特定研究問題,并在以下幾個(gè)方面取得了一定的研究進(jìn)展:

(1)云計(jì)算環(huán)境下碎片信息的預(yù)處理:主要研究云計(jì)算環(huán)境下的信息資源,尤其是碎片信息資源的預(yù)處理原則、方法、流程和技術(shù),為信息資源集成效果和效率的提升奠定數(shù)據(jù)基礎(chǔ)。

(2)云計(jì)算環(huán)境下的碎片信息管理及語(yǔ)義標(biāo)注:主要研究云計(jì)算環(huán)境下的信息資源,尤其是碎片信息資源的管理要求、審計(jì)、版本戳管理和其他元數(shù)據(jù)管理的方法、技術(shù)與工具,并以語(yǔ)義集成為目的進(jìn)行語(yǔ)義標(biāo)注。

(3)云計(jì)算環(huán)境下的碎片信息資源的數(shù)據(jù)驅(qū)動(dòng)型集成:主要研究如何采用個(gè)性化集成和語(yǔ)義標(biāo)注方法,將云計(jì)算環(huán)境下的信息資源,尤其是碎片信息資源集成為數(shù)據(jù)驅(qū)動(dòng)型知識(shí)圖譜。

相關(guān)研究成果已被第13屆智力資本、知識(shí)管理與組織學(xué)習(xí)國(guó)際會(huì)議(3th International Conference on Intellectual Capital和Knowledge Management & Organisational Learning)錄用;論文《基于開放度的可控自管理科技數(shù)字資源集成平臺(tái)構(gòu)架》發(fā)表在中文期刊《情報(bào)理論與實(shí)踐》;更多研究成果正在投稿之中。

1.4云計(jì)算環(huán)境下的信息資源服務(wù)模式研究(子課題4)

主要針對(duì)信息資源和計(jì)算資源從個(gè)人計(jì)算機(jī)和企業(yè)服務(wù)器向云端遷移的過程中服務(wù)模式的轉(zhuǎn)變,重點(diǎn)進(jìn)行了云計(jì)算環(huán)境下信息資源服務(wù)特征分析、模式構(gòu)建和采納行為、法律問題等方面的研究,為云計(jì)算環(huán)境下信息資源服務(wù)模式與方法的進(jìn)一步奠定了較好的基礎(chǔ)。主要進(jìn)展如下:

(1)云計(jì)算環(huán)境下的信息資源服務(wù)特征分析:系統(tǒng)地梳理了云計(jì)算技術(shù)給信息分析與服務(wù)帶來(lái)的關(guān)鍵問題、挑戰(zhàn)與發(fā)展趨勢(shì),既從頂層設(shè)計(jì)的角度提出了對(duì)策建議,也從微觀上提出了技術(shù)優(yōu)化與改進(jìn)策略。相關(guān)研究成果已在《圖書情報(bào)工作》、《情報(bào)雜志》、《中國(guó)信息年鑒》等國(guó)內(nèi)相關(guān)領(lǐng)域的重要刊物上發(fā)表。

(2)信息資源服務(wù)模式構(gòu)建:重點(diǎn)研究了知識(shí)共享、知識(shí)服務(wù)和政務(wù)云服務(wù)模式,提出了模式構(gòu)建的關(guān)鍵要素、組織模式、運(yùn)行機(jī)制和實(shí)現(xiàn)模型等,解決了信息資源服務(wù)的實(shí)踐問題。相關(guān)研究成果已在《情報(bào)理論與實(shí)踐》、《情報(bào)雜志》、《圖書館論壇》、《圖書館學(xué)研究》等國(guó)內(nèi)相關(guān)領(lǐng)域的重要刊物上發(fā)表,并形成碩士學(xué)位論文一篇。

(3)云計(jì)算信息服務(wù)采納:重點(diǎn)研究了政府、企業(yè)與個(gè)人作為主體對(duì)云計(jì)算信息服務(wù)的采納行為與影響因素,提出了云計(jì)算采納行為模型與相關(guān)研究的未來(lái)研究焦點(diǎn),分析了組織或用戶對(duì)云計(jì)算信息服務(wù)采納的態(tài)度和行為,為該領(lǐng)域的研究提供了研究基礎(chǔ)。相關(guān)研究成果已在《中國(guó)圖書館學(xué)報(bào)》上發(fā)表,并形成博士學(xué)位論文兩篇。

(4)信息資源服務(wù)的法律問題:重點(diǎn)研究了政府信息資源在開放與服務(wù)的過程中所依據(jù)的我國(guó)現(xiàn)有法律、法規(guī)及國(guó)外立法相關(guān)情況與法律適用現(xiàn)狀,并結(jié)合典型案例反映信息資源開發(fā)、利用的實(shí)踐問題,提出了《政府信息公開條例》與《檔案法》對(duì)信息資源服務(wù)的雙重規(guī)制,尋求了適合我國(guó)國(guó)情的解決途徑。相關(guān)研究成果已在《檔案學(xué)通訊》上發(fā)表。

1.5 云計(jì)算環(huán)境中的學(xué)科知識(shí)信息資源集成與服務(wù)平臺(tái)架構(gòu)與評(píng)估(子課題5)

在已有研究成果(學(xué)科資源云平臺(tái)構(gòu)建、學(xué)科資源獲取與集成、學(xué)科知識(shí)展示與服務(wù)的理論)的基礎(chǔ)上,優(yōu)化了學(xué)科資源云平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)。本子課題實(shí)現(xiàn)了EventTeller系統(tǒng)較好地支持實(shí)時(shí)抓取相關(guān)Web頁(yè)面數(shù)據(jù),并自動(dòng)過濾不相關(guān)網(wǎng)頁(yè),利用網(wǎng)頁(yè)標(biāo)題、摘要、發(fā)布時(shí)間更好的計(jì)算新聞網(wǎng)頁(yè)相似度,并支持在線事件偵測(cè)和展示。目前已實(shí)現(xiàn)的主要功能模塊有:在線事件偵測(cè),計(jì)算新聞網(wǎng)頁(yè)相似度,并設(shè)計(jì)了實(shí)時(shí)計(jì)算詞語(yǔ)權(quán)重算法,建立倒排索引以及使用新聞標(biāo)題索引來(lái)過濾不相關(guān)網(wǎng)頁(yè);融入更多類型的資源,實(shí)時(shí)抓取事件相關(guān)圖片,微博等;話題追蹤,設(shè)計(jì)了基于鄰域更新的算法來(lái)解決事件頁(yè)面集合更新;利用分布式系統(tǒng)進(jìn)行數(shù)據(jù)存儲(chǔ)及信息抽取,利用Hadoop的HDFS文件系統(tǒng),存儲(chǔ)實(shí)時(shí)抓取的數(shù)據(jù)。

1.6云測(cè)試管理與服務(wù)示范性應(yīng)用模式研究(子課題6)

本課題對(duì)云計(jì)算環(huán)境下的信息資源集成應(yīng)用案例進(jìn)行了廣泛的調(diào)研分析,并重點(diǎn)針對(duì)圖書館RFID通用數(shù)據(jù)交換平臺(tái)和思源探索云平臺(tái)這兩個(gè)實(shí)踐案例進(jìn)行了深入的研究,總結(jié)出應(yīng)用評(píng)價(jià)與示范性應(yīng)用模式。課題主要進(jìn)展如下:

(1)云計(jì)算環(huán)境下信息資源的集成特點(diǎn)與平臺(tái)應(yīng)用評(píng)價(jià)研究:以當(dāng)前圖書館海量的數(shù)據(jù)信息資源作為研究對(duì)象,重點(diǎn)研究了大數(shù)據(jù)環(huán)境下,信息資源的幾個(gè)典型特征以及讀者對(duì)于信息資源的獲取需求。提出了建設(shè)云數(shù)據(jù)平臺(tái)的方案,并以思源探索云服務(wù)平臺(tái)為例,從館員、讀者等不同的角度出發(fā),給出了一套完整的應(yīng)用評(píng)價(jià)體系,對(duì)于其它云服務(wù)或云測(cè)試平臺(tái)的評(píng)價(jià)具備很好的指導(dǎo)意義。

(2)基于云的協(xié)同創(chuàng)新平臺(tái)與學(xué)科服務(wù)研究:在云計(jì)算平臺(tái)和協(xié)同創(chuàng)新工作理念的背景下,分別從系統(tǒng)平臺(tái)和學(xué)科服務(wù)實(shí)踐的角度,開展了深入的研究分析工作。對(duì)當(dāng)前主流的一些云學(xué)科資源平臺(tái)進(jìn)行了分析比對(duì),總結(jié)出了一些建設(shè)面向?qū)W科協(xié)同創(chuàng)新的信息資源集成與服務(wù)系統(tǒng)的通用模式與特征;通過這種特征與模式的提煉,給未來(lái)的系統(tǒng)建設(shè)提供建設(shè)性的框架與參考依據(jù),從而設(shè)計(jì)出更好用、更智能化的學(xué)科信息資源系統(tǒng)。同時(shí)在服務(wù)上也提出了一些新的策略與建議,從而能更好的提升服務(wù)的水準(zhǔn)。相關(guān)研究成果已在《大學(xué)圖書情報(bào)學(xué)刊》等國(guó)內(nèi)核心刊物上發(fā)表。

(3)RFID云通用數(shù)據(jù)交換平臺(tái)研究:重點(diǎn)研究RFID云通用數(shù)據(jù)交換平臺(tái)中的數(shù)據(jù)交互問題和平臺(tái)管理模式,提出了圖書館RFID應(yīng)用的一種新模式,該RFID云服務(wù)平臺(tái)已正式在圖書館投入使用,對(duì)該平臺(tái)進(jìn)行了大量的RFID應(yīng)用端功能測(cè)試與使用,包括各種前端設(shè)備的使用與數(shù)據(jù)交互,從而能夠總結(jié)出一套行之有效的云服務(wù)應(yīng)用與管理模式,進(jìn)而推廣到其它應(yīng)用或其它領(lǐng)域。另外在標(biāo)簽轉(zhuǎn)換、盤點(diǎn)等設(shè)備的使用過程中,積累了大量的前端交互數(shù)據(jù),并結(jié)合圖書館管理系統(tǒng)等其它系統(tǒng)的數(shù)據(jù),做了海量的數(shù)據(jù)分析比對(duì)等工作,提出了RFID云服務(wù)平臺(tái)應(yīng)用中的數(shù)據(jù)分析策略與實(shí)際應(yīng)用模式。

(4)圖書館思源探索平臺(tái)實(shí)踐研究:圖書館思源探索平臺(tái)是一套基于云計(jì)算環(huán)境的資源發(fā)現(xiàn)系統(tǒng),系統(tǒng)在本地存儲(chǔ)少量數(shù)據(jù),絕大部分?jǐn)?shù)據(jù)都分散在云端的各個(gè)子系統(tǒng)上。系統(tǒng)通過OAI、JSON、X-service、Web Services、deep linking、OpenSearch、plug-ins、adaptor等接口從其他數(shù)據(jù)庫(kù)自動(dòng)抓取數(shù)據(jù)。目前思源探索包含的基本數(shù)據(jù)源包括圖書館的原始書目數(shù)據(jù)、電子資源和自建數(shù)據(jù)庫(kù)資源等,思源探索系統(tǒng)的后臺(tái)數(shù)據(jù)庫(kù)定期會(huì)從配置好的多個(gè)數(shù)據(jù)庫(kù)中收割相關(guān)數(shù)據(jù),滿足用戶對(duì)館藏資源的檢索需求;網(wǎng)絡(luò)資源,從點(diǎn)評(píng)網(wǎng)、豆瓣網(wǎng)等獲取到網(wǎng)絡(luò)平臺(tái)的資源數(shù)據(jù)以及本地資源的附屬信息,例如書評(píng)和封面等內(nèi)容;商用數(shù)據(jù)庫(kù)資源,系統(tǒng)即時(shí)從各個(gè)商用數(shù)據(jù)庫(kù)收割至思源探索的數(shù)據(jù)資源中心,存放在云端,供讀者進(jìn)行一站式的資源檢索。從信息資源的特征和資源訪問查詢的需求入手,以思源探索系統(tǒng)為例,研究了云平臺(tái)的搭建與設(shè)計(jì)模式,并與同樣類型的云平臺(tái)進(jìn)行了詳細(xì)的比對(duì)分析,從數(shù)據(jù)分析的角度分析了平臺(tái)的運(yùn)行現(xiàn)狀,并最終給出一套云服務(wù)平臺(tái)完整的應(yīng)用評(píng)價(jià)體系和應(yīng)用模式推薦。

2.調(diào)查研究與學(xué)術(shù)交流

課題組特別重視調(diào)查研究與學(xué)術(shù)交流,特別是跨子課題的交流與合作,多次召集各子課題負(fù)責(zé)人和部分代表交流各自的研究進(jìn)展、存在問題和解決思路,確保了項(xiàng)目研究的整體性。例如:

(1)2014~2016年,在文獻(xiàn)研究的基礎(chǔ)上,根據(jù)研究要點(diǎn)到北京、天津、河北、長(zhǎng)春等地信息機(jī)構(gòu)進(jìn)行了有針對(duì)性的調(diào)研,對(duì)理論研究進(jìn)行了實(shí)證分析;

(2)2015年4月,參加在首爾舉行的ICDE 2015國(guó)際會(huì)議;

(3)2015年6月,參加在青島舉行的WAIM 2015國(guó)際會(huì)議;

(4)2014~2015年,對(duì)思源探索平臺(tái)的使用進(jìn)行了問卷調(diào)研分析,并對(duì)云服務(wù)平臺(tái)相關(guān)的一些文獻(xiàn)資料進(jìn)行了收集整理工作;

(5)2014~2015年,對(duì)國(guó)內(nèi)外云計(jì)算采納相關(guān)文獻(xiàn)進(jìn)行系統(tǒng)的調(diào)研,在此基礎(chǔ)上提出個(gè)人云存儲(chǔ)用戶采納行為模型,然后,對(duì)云存儲(chǔ)的個(gè)人用戶進(jìn)行調(diào)查研究,通過訪談?wù){(diào)研和發(fā)放問卷兩種方式,對(duì)模型進(jìn)行了實(shí)證和進(jìn)一步解釋;

(6)2015年,參與 “2015中國(guó)信息資源管理論壇”;

(7)2015年,參與在泰國(guó)曼谷舉行的智力資本、知識(shí)管理與組織學(xué)習(xí)國(guó)際會(huì)議(International Conference on Intellectual Capital和Knowledge Management & Organizational Learning)。

(8)2014~2015年,參加IBM大數(shù)據(jù)分析師資培訓(xùn)。

3.成果宣傳推介

(1)2015年10月,課題首席專家杜小勇教授和盧小賓教授在《中國(guó)信息年鑒》發(fā)表特約論文《云計(jì)算環(huán)境下的信息資源集成與服務(wù)》;

(2)2014年10月,課題組向國(guó)家社科基金委提交成果要報(bào)《關(guān)于加強(qiáng)我國(guó)云端信息資源管理工作的幾點(diǎn)建議》;

(3)2015年6月,課題組提交的研究報(bào)告《大數(shù)據(jù)背景下政府?dāng)?shù)據(jù)資源的可持續(xù)管理與利用機(jī)制研究》等作為國(guó)家發(fā)改委制定相關(guān)政策提供了重要參考,并接到來(lái)自國(guó)家發(fā)改委高技術(shù)產(chǎn)業(yè)司的感謝信。

(4)在課題官網(wǎng)http://deke.ruc.edu.cn/static/icloud/index.html。上定期發(fā)布課題研究成果。

二、研究成果情況

自立項(xiàng)以來(lái),本課題已完成研究成果有87項(xiàng),其中專著/教材3部、標(biāo)準(zhǔn)2項(xiàng)、發(fā)明專利申請(qǐng)5項(xiàng)、軟件著作權(quán)申請(qǐng)9項(xiàng),發(fā)表論文67篇(國(guó)際發(fā)文26篇)、年鑒特邀稿1篇,具體如下表所示。

序號(hào)

成果名稱

作者

成果形式

出版社或刊物名

出版或刊發(fā)時(shí)間(年/月)

1

開放源代碼社區(qū)啟發(fā)下的知識(shí)共享組織模型研究

肖源, 楊哲倫, 郝杰

論文

圖書館學(xué)研究

2016.1

2

個(gè)人云存儲(chǔ)用戶采納模型及實(shí)證研究

王建亞,羅晨陽(yáng)

論文

情報(bào)資料工作

2016.1

3

企業(yè)云服務(wù)采納模式及影響因素研究

王濤

論文

博士學(xué)位論文

2016.6

4

基于流式計(jì)算的網(wǎng)絡(luò)輿情分析模型研究

高歡

論文

情報(bào)學(xué)報(bào)

已錄用

5

信息分析視角下的大數(shù)據(jù)分析平臺(tái)構(gòu)架研究

肖源,郝杰,劉瑩,王濤

論文

情報(bào)科學(xué)

已錄用

6

云架構(gòu)下智慧政府服務(wù)模式研究

霍亮

論文

現(xiàn)代情報(bào)

已錄用

7

Random Partition Factorization Machines for Context-Aware Recommendations

Shaoqing Wang等

論文

WAIM2016, Nanchang, China.

2016.6

8

Learn to recommend local event using heterogeneous social networks.

Shaoqing Wang, Zheng Wang, Cuiping Li

論文

APWeb2016, Suzhou, China.

已錄用

9

面向?qū)W科化服務(wù)的高校云協(xié)同創(chuàng)新支持實(shí)踐

郭晶等

論文

大學(xué)圖書情報(bào)學(xué)刊

已錄用

10

信息分析的若干核心問題探討

朝樂門等

論文

情報(bào)理論與實(shí)踐

2016.2

11

電子文件管理系統(tǒng)測(cè)試工作的對(duì)比研究

朝樂門等

論文

北京檔案

2016.4

12

Knowledge Fragmentation and Its Connectivity Assurance

朝樂門等

論文

13th International Conference on Intellectual Capital, Knowledge Management & Organisational Learning

已錄用

13

數(shù)據(jù)科學(xué)

朝樂門

教材

清華大學(xué)出版社

2016.7

14

信息資源管理術(shù)語(yǔ)及概念體系

安小米

專著

中國(guó)標(biāo)準(zhǔn)化出版社

2016.1

15

GB/Z 32002-2015 信息與文獻(xiàn) 用于文件管理的工作過程分析

安小米

國(guó)家標(biāo)準(zhǔn)

中國(guó)標(biāo)準(zhǔn)化出版社

2015.12

16

分布式系統(tǒng)與云計(jì)算概論(第二版)

陸嘉恒

教材

清華大學(xué)出版社

2013.12

17

Big data challenge: a data management perspective

陸嘉恒

論文

Frontiers of Computer Science

2013.7

18

一種基于代價(jià)敏感支持向量機(jī)的遙感圖像自動(dòng)解譯方法

陸嘉恒

發(fā)明專利

201310170288.2,2013.05.10

2013.05.10

19

基于Hadoop的索引創(chuàng)建方法及其索引方法

陸嘉恒

發(fā)明專利

201310302669.1,2013.07.17

2013.07.17

20

一種基于海量文本數(shù)據(jù)的相似度衡量方法

陸嘉恒

發(fā)明專利

201310335123.6,2013.08.02

2013.08.02

21

分布式海量Web數(shù)據(jù)爬取共享系統(tǒng)

陸嘉恒

發(fā)明專利

201310471593.5, 2013.10.11

2013.10.11

22

友好的XML圖形化搜索系統(tǒng)軟件V1.0

陸嘉恒,林春彬

軟件著作權(quán)

2013SR035944,2013.04.22

2013.04.22

23

海量Web數(shù)據(jù)信息自動(dòng)爬取與半自動(dòng)化抽取系統(tǒng)軟件V1.0

陸嘉恒

軟件著作權(quán)

2013SR116778,2013.10.31

2013.10.31

24

海量非結(jié)構(gòu)化數(shù)據(jù)管理系統(tǒng)測(cè)試軟件[簡(jiǎn)稱:NSRunner] V1.0

陸嘉恒,蔡曉華

軟件著作權(quán)

2013SR131745  2013.11.25

2013.11.25

25

A Skylining Approach to Optimize Influence and Cost in Location Selection

Juwei Shi,Hua Lu,Jiaheng Lu,Chengxuan Liao

論文

DASFAA/2014 B類

2014.1

26

pandasearch: a fine-grained academic search engine for research documents

Feiran Huang,Jia Li,Jiaheng Lu 等

論文

 ICDE/2014 A類

2014.1

27

面向?qū)W術(shù)的精準(zhǔn)搜索系統(tǒng)軟件 [簡(jiǎn)稱:CS Serach] V1.0

陸嘉恒,顧向南

軟件著作權(quán)

2014SR049788 2014.04.25

2014.04.25

28

基于學(xué)術(shù)搜索系統(tǒng)的人名自動(dòng)提示軟件[簡(jiǎn)稱:Scholar_AutoComplete] v1.0

陸嘉恒,蔡曉華

軟件著作權(quán)

2014SR136332,2014.09.11

2014.09.11

29

大規(guī)模圖數(shù)據(jù)處理系統(tǒng)軟件V1.0

陸嘉恒,楊華

軟件著作權(quán)

2014SR026073 2014.03.04

2014.03.04

30

面向?qū)W術(shù)搜索的圖片爬取系統(tǒng)軟件V1.0

李德陽(yáng),陸嘉恒

軟件著作權(quán)

2014SR202098 2014.06.30

2014.06.30

31

開放環(huán)境下面向?qū)W術(shù)應(yīng)用的論文信息自動(dòng)獲取系統(tǒng)軟件V1.0

趙嘉迪,陸嘉恒

軟件著作權(quán)

014SR204396 2014.10.30

2014.10.30

32

MapReduce-Based SimRank Computation and Its Application in Social Recommender System

Lina Li, Cuiping Li等

論文

IEEE Bigdata Congress, 2013

2013.6

33

On Perspective Aware Top-k Similarity Search in Multi-Relational Networks

Yinglong Zhang, Cuiping Li, Hong Chen

論文

DASFAA 2014.

2014.4

34

信息網(wǎng)絡(luò)中一個(gè)有效的結(jié)點(diǎn)相似度度量

張應(yīng)龍,李翠平,陳紅

論文

軟件學(xué)報(bào)

2014.11

35

Accuracy Estimation of Link-based Similarity Measures and Its Application

Yinglong Zhang, Cuiping Li, Hong Chen

論文

Frontiers of Computer Science

2015.1

36

 Probabilistic SimRank Computation over Uncertain Graphs

 Lingxia Du, Cuiping Li, 等

論文

 Information Sciences

2015.1

37

基于用戶信任和張量分解的社會(huì)網(wǎng)絡(luò)推薦

鄒本友, 李翠平等

論文

軟件學(xué)報(bào).

2014.12

38

國(guó)外智慧城市知識(shí)中心構(gòu)建機(jī)制及其借鑒研究

安小米

論文

情報(bào)資料工作

2013.4

39

面向智慧城市發(fā)展的信息資源管理協(xié)同創(chuàng)新策略構(gòu)想

安小米

論文

情報(bào)資料工作

2013.4

40

詞語(yǔ)位置加權(quán)TextRank的關(guān)鍵詞抽取研究

夏天

論文

現(xiàn)代圖書情報(bào)技術(shù)

2013.9

41

融合LDA 與TextRank 的關(guān)鍵詞抽取研究

夏天等

論文

現(xiàn)代圖書情報(bào)技術(shù)

2014.7

42

大數(shù)據(jù)時(shí)代的政府信息資源管理:國(guó)外數(shù)字連續(xù)性戰(zhàn)略及借鑒

安小米

論文

智慧城市

2014.1

43

Vocabularies of ISO/TC46/SC11 Publications

安小米

標(biāo)準(zhǔn)

the 30th ISO/TC46/SC11 meeting, Washington D.C., US

2014.5

44

電子文件管理系統(tǒng)的技術(shù)特征

朝樂門

論文

現(xiàn)代圖書情報(bào)技術(shù)

2013.4

45

電子文件管理系統(tǒng)測(cè)試方法研究

朝樂門

論文

檔案學(xué)通訊

2014.6

46

數(shù)據(jù)空間及其信息資源管理視角研究

朝樂門

論文

情報(bào)理論與實(shí)踐

2013.11

47

Mass Collaborative Knowledge Processing on the Amazon Mechanical Turk

朝樂門

論文

International Journal of Computer Science Issues

2014.2

48

一種電子文件管理系統(tǒng)的自動(dòng)化測(cè)試方法及系統(tǒng)

朝樂門、杜小勇、薛四新

發(fā)明專利

CN201410045487.5

2014.12

49

云計(jì)算環(huán)境下電子文件管理的關(guān)鍵技術(shù)研究

薛四新,朝樂門,田雷

論文

北京檔案

2013.1

50

云計(jì)算環(huán)境下的信息資源的集成與服務(wù)研究

盧小賓、杜小勇、朝樂門

論文

《中國(guó)信息年鑒》特約論文

2015.1

51

Google三大云計(jì)算技術(shù)對(duì)海量數(shù)據(jù)分析流程的技術(shù)改進(jìn)優(yōu)化研究

王濤、盧小賓

論文

圖書情報(bào)工作,

2015.3

52

大數(shù)據(jù)時(shí)代信息分析的關(guān)鍵問題、挑戰(zhàn)與對(duì)策

官思發(fā),朝樂門

論文

圖書情報(bào)工作,

2015.3

53

計(jì)算機(jī)輔助信息分析及其發(fā)展趨勢(shì)研究

熊志正、朝樂門

論文

圖書情報(bào)工作,

2015.3

54

《檔案法》規(guī)制下的政府信息公開問題探析

盧小賓、高歡

論文

檔案學(xué)通訊

2015.6

55

美國(guó)競(jìng)爭(zhēng)情報(bào)軟件發(fā)展現(xiàn)狀及對(duì)我國(guó)的啟示

官思發(fā),李宗潔

論文

圖書情報(bào)工作

2015.4

56

大數(shù)據(jù)環(huán)境下知識(shí)服務(wù)關(guān)鍵要素與實(shí)現(xiàn)模型研究

官思發(fā),李宗潔

論文

情報(bào)理論與實(shí)踐

2015.12

57

政務(wù)網(wǎng)絡(luò)信息生態(tài)鏈中的可信云服務(wù)模式構(gòu)建

王濤;曲榮華;洪先鋒

論文

情報(bào)雜志,

2015.4

58

Scalable and noise tolerant web knowledge extraction for search task simplification.

Jun He, Y. Gu, H. Liu, J. Yan, H. Chen.

論文

Decision Support Systems

2013.9

59

Predicting Microblog User's Age based on Text Information.

Y. Li, T. Liu, H. Liu, Jun He and X. Du.

論文

The 14th International Conference on Web Information System Engineering

2013.9

60

The Study of UHF-RFID Data Model Construction in University Libraries

GUO Jing etc.

論文

The Electronic Library

2014.5

61

Design and Implementation of a Subject Librarian Training Program for University Libraries in China

GUO Jing etc.

論文

Reference & User Services Quarterly

2014.2

62

A Comprehensive Concept Map for Adequate Protection and Effective Management of Personal Information in Networked Chinese Services.

An X, Bai W, Deng H, Sun S, Dong Y, Zhong W, Hu J (2015).

論文

The Electronic Library

2015.6

63

Mass collaborative knowledge management:Towards the next generation of knowledge management studies

朝樂門

論文

 Program

2015.4

64

The information resources utilization index: a case study in China

朝樂門等

論文

Program

2016.1

65

元分析方法在信息分析中的應(yīng)用

陳鶴陽(yáng),朝樂門.

論文

 情報(bào)資料工作, 2015.6

2015.1

66

CROWN: A Context-aware RecOmmender for Web News

Wang S, Zou B, Li C, et al.

論文

Data Engineering (ICDE)

2015.4

67

GPUTENSOR: Efficient  Tensor  Factorization  for  Context-Aware Recommendations.

Benyou  Zou, Cuiping  Li,  Liwen  Tan  and  Hong  Chen.

論文

Information Sciences

2015.4

68

Probabilistic SimRank computation over uncertain graphs

Hong Chen, Liwen Tan, Yinglong Zhang

論文

Information Sciences

2015.2

69

SimRank Based Top-k Query Aggregation for Multi-Relational Networks.

Jing Xu, Cuiping Li, Hong Chen, Hui Sun.

論文

Web-Age Information Management. Springer

2015.12

70

符號(hào)社會(huì)網(wǎng)絡(luò)中正負(fù)關(guān)系預(yù)測(cè)算法研究綜述

藍(lán)夢(mèng)微,李翠平,等

論文

計(jì)算機(jī)研究與發(fā)展

2015.2

71

大數(shù)據(jù)與推薦系統(tǒng)

李翠平, 藍(lán)夢(mèng)微等

論文

大數(shù)據(jù)

2015.3

72

大數(shù)據(jù)分析研究現(xiàn)狀、問題與對(duì)策

官思發(fā),孟璽,李宗潔,劉揚(yáng)

論文

情報(bào)雜志

2015.5

73

大數(shù)據(jù)知識(shí)服務(wù)關(guān)鍵要素與實(shí)現(xiàn)模型研究

官思發(fā)

論文

圖書館論壇

2015.6

74

政務(wù)網(wǎng)絡(luò)信息生態(tài)鏈中的可信云服務(wù)維度構(gòu)建

王濤,張?zhí)K,曲榮華等

論文

情報(bào)雜志

2015.4

75

云環(huán)境下政務(wù)信息生態(tài)鏈運(yùn)行機(jī)制研究

張皓月

論文

碩士學(xué)位論文

2015.6

76

Developing a Comprehensive Regime for Personal Information Protection in Networked Chinese Public Sectors

Xiaomi An等

論文

Management

2015.3

77

云計(jì)算采納行為研究現(xiàn)狀分析

盧小賓, 王建亞.

論文

 中國(guó)圖書館學(xué)報(bào),

2015.1

78

 電子文件管理系統(tǒng)的測(cè)試方法研究

朝樂門.

論文

檔案學(xué)通訊

2014.6

79

電子文件管理系統(tǒng)研發(fā)的重點(diǎn)與難點(diǎn)分析

朝樂門.

論文

檔案學(xué)通訊

2014.1

80

基于開放度的可控自管理科技數(shù)字資源集成平臺(tái)構(gòu)架

董宇, 安小米, 錢澄,等

論文

情報(bào)理論與實(shí)踐

2014.11

81

 中國(guó)政府網(wǎng)站移動(dòng)瀏覽器兼容性研究

夏天, 陳杰, 魏小貞,等

論文

現(xiàn)代情報(bào)

2014.11

82

大數(shù)據(jù)下基于異步累積更新的高效P-Rank計(jì)算方法

王旭叢, 李翠平, 陳紅.

論文

軟件學(xué)報(bào)

2014.09

83

現(xiàn)代國(guó)家治理的云端思維——信息治理能力與政府轉(zhuǎn)型的多重挑戰(zhàn)

安小米.

論文

人民論壇·學(xué)術(shù)前沿

2015.02

84

 Location-Based Recommendation Using Incremental Tensor Factorization Model

Zou B, Li C, Tan L, et al.

論文

Advanced Data Mining and Applications Springer

2014.11

85

 Explicit semantic path mining via wikipedia knowledge tree

Xia T, Chen M, Liu X.

論文

Proceedings of the American Society for Information Science and Technology

2014.6

86

Fast Approximation of Shortest Path on Dynamic Information Networks

Jin J, Shi X, Li C, et al.

論文

 Web-Age Information Management. Springer

2014.5

87

信息資源開發(fā)利用指數(shù)數(shù)據(jù)處理系統(tǒng)

朝樂門等

軟件著作權(quán)

登記號(hào) 2015SR226408

2015.9

其中,自2014年7月以來(lái),比較有代表性的成果簡(jiǎn)介如下:

(1)云計(jì)算采納行為研究現(xiàn)狀分析。在中國(guó)圖書館學(xué)報(bào)上發(fā)表了論文《云計(jì)算采納行為研究現(xiàn)狀分析》。論文采用定量和定性相結(jié)合的方法,對(duì)外文數(shù)據(jù)庫(kù)中云計(jì)算采納行為研究的文獻(xiàn)進(jìn)行梳理和分析。研究發(fā)現(xiàn):應(yīng)重視發(fā)展中國(guó)家和中小企業(yè)云計(jì)算采納行為研究,以促進(jìn)他們應(yīng)用云計(jì)算技術(shù);個(gè)人層面的云計(jì)算采納行為將成為一個(gè)重要的研究主題;需要構(gòu)建符合云計(jì)算技術(shù)特征的實(shí)證模型;需要結(jié)合應(yīng)用情境分析云計(jì)算采納行為的影響因素,云計(jì)算的安全、隱私、信任將成為本領(lǐng)域關(guān)注的焦點(diǎn)。論文通過對(duì)云計(jì)算采納行為研究現(xiàn)狀的分析,為我國(guó)該領(lǐng)域的研究提供研究思路和理論基礎(chǔ)。

(2)基于GFS、MapReduce和Bigtable的信息資源集成方法。在《圖書情報(bào)工作》上發(fā)表了論文《Google三大云計(jì)算技術(shù)對(duì)海量數(shù)據(jù)分析流程的技術(shù)改進(jìn)優(yōu)化研究》。論文針對(duì)傳統(tǒng)海量數(shù)據(jù)分析處理數(shù)據(jù)細(xì)節(jié)方式所導(dǎo)致的分析質(zhì)量與效率問題, 通過對(duì)Google三大云計(jì)算技術(shù)——GFS、MapReduce和Bigtable進(jìn)行文獻(xiàn)調(diào)查、內(nèi)容分析和技術(shù)分析,梳理出Google云計(jì)算技術(shù)在數(shù)據(jù)處理、技術(shù)架構(gòu)和算法模型等方面的部署創(chuàng)新和設(shè)計(jì)改進(jìn),并與傳統(tǒng)本地?cái)?shù)據(jù)分析處理方式與細(xì)節(jié)進(jìn)行比較分析,提出海量數(shù)據(jù)分析流程在存儲(chǔ)和訪問、組織與管理以及并行處理3個(gè)方面的技術(shù)優(yōu)化與改進(jìn)策略。其中提出的解決方案對(duì)本課題信息服務(wù)的構(gòu)建中數(shù)據(jù)處理和技術(shù)架構(gòu)等方面,有一定參考和指導(dǎo)意義。

(3)基于隨機(jī)決策樹的上下文推薦算法。隨著信息的爆炸式增長(zhǎng),推薦系統(tǒng)成為一個(gè)重要的工具,它可以有效地幫助用戶找到喜愛的物品。用戶的行為(如點(diǎn)擊、購(gòu)買、轉(zhuǎn)發(fā)、評(píng)論等)是基于特定的環(huán)境的,稱為上下文。上下文包括時(shí)間、地點(diǎn),心情,同伴等。在實(shí)際的應(yīng)用中,上下文可以很容易地被收集到。相對(duì)于傳統(tǒng)的僅基于用戶-物品二元交互的推薦系統(tǒng),上下文推薦可以顯著地提高推薦性能,F(xiàn)有的工作中,已經(jīng)有很多上下文推薦方法被提出。其中,因子分解機(jī)是一個(gè)很有影響力和流行的模型。因子分解機(jī)把用戶-物品-上下文交互表示為潛在因子的線性組合,并且平等地對(duì)待每一個(gè)用戶、物品、上下文因子,而不能很好地捕獲用戶、物品、上下文之間崔在的層次信息。實(shí)際上,層次結(jié)構(gòu)能夠在不同水平上捕獲更豐富的上下文信息,應(yīng)該被充分利用以提高推薦質(zhì)量。直覺上,在局部同質(zhì)的上下文環(huán)境下,用戶傾向于產(chǎn)生相似的評(píng)分。我們提出隨機(jī)分割因子分解機(jī),采用隨機(jī)決策樹層次化地分割上下文以便于更好地捕獲復(fù)雜的局部交互。在決策樹的每個(gè)節(jié)點(diǎn)上,我們探索因子分解機(jī)中潛在因子之間的相似度,采用k-means聚類方法分割用戶-物品-上下文元組。每個(gè)節(jié)點(diǎn)上的數(shù)據(jù)子集被期望有更好的交互影響。我們?cè)谌齻(gè)公開數(shù)據(jù)集上與現(xiàn)有的最新的5個(gè)上下文推薦模型做對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,我們提出的隨機(jī)分割因子分解機(jī)具有良好的性能。相關(guān)研究成果“Random Partition Factorization Machines for Context-Aware Recommendations”已經(jīng)發(fā)表于中國(guó)計(jì)算機(jī)學(xué)會(huì)推薦的國(guó)際會(huì)議WAIM2016。

(4)基于異構(gòu)社交網(wǎng)絡(luò)的推薦模型,F(xiàn)有的社交網(wǎng)絡(luò)蘊(yùn)含多個(gè)異構(gòu)的社交信息,如Meetup、豆瓣同城等基于事件的社交網(wǎng)絡(luò)連接線上和線下兩種社交網(wǎng)絡(luò),伴隨用戶和事件的急劇增長(zhǎng),有必要把相關(guān)事件推薦給用戶,F(xiàn)有的推薦系統(tǒng)的研究已經(jīng)表明,充分利用社交網(wǎng)絡(luò)信息能夠顯著地提高推薦性能。直覺上,用戶是否會(huì)對(duì)某一事件進(jìn)行響應(yīng)取決于他自身的興趣偏好和好友的行為。我們提出異構(gòu)社交泊松因子分解模型(HSPF)。HSPF模型組合在線和離線社交網(wǎng)絡(luò)到一個(gè)框架中,并把好友之間的關(guān)系強(qiáng)度集成到模型中。我們?cè)贛eetup數(shù)據(jù)集上測(cè)試我們提出的模型,實(shí)驗(yàn)結(jié)果表明,我們提出的HSPF模型戰(zhàn)勝了現(xiàn)有的模型。相關(guān)研究成果“Learn to recommend local event using heterogeneous social networks”已經(jīng)被中國(guó)計(jì)算機(jī)學(xué)會(huì)推薦的國(guó)際會(huì)議APWeb2016錄用。

(5)圖書館的RFID應(yīng)用中構(gòu)建云數(shù)據(jù)平臺(tái)的設(shè)計(jì)方法。主要探討了圖書館的RFID應(yīng)用中構(gòu)建云數(shù)據(jù)平臺(tái)的設(shè)計(jì)思路與方法,按照規(guī)范來(lái)設(shè)計(jì)平臺(tái),所有的RFID前端應(yīng)用如自助借還、標(biāo)簽轉(zhuǎn)換、盤點(diǎn)設(shè)備、自動(dòng)分揀設(shè)備等通過網(wǎng)絡(luò)和云數(shù)據(jù)平臺(tái)進(jìn)行數(shù)據(jù)交互,從而完成其功能應(yīng)用并實(shí)時(shí)記錄各項(xiàng)操作中的大數(shù)據(jù)日志記錄。主要觀點(diǎn)是通過建設(shè)一個(gè)圖書館RFID云數(shù)據(jù)平臺(tái),首先將大量的RFID交換數(shù)據(jù)匯總在一起存儲(chǔ)并使用;其次通過接口形式提供服務(wù),靈活性更好,可實(shí)現(xiàn)前端任意RFID設(shè)備的隨意接入;最后通過遵守?cái)?shù)據(jù)模型和通用數(shù)據(jù)交換規(guī)范,各個(gè)圖書館都能方便地互相交互RFID數(shù)據(jù),實(shí)現(xiàn)大區(qū)域RFID云共享云應(yīng)用的目標(biāo)。其中提出的解決方案對(duì)本課題云測(cè)試服務(wù)模式的研究有一定參考和指導(dǎo)意義,通過對(duì)該RFID云服務(wù)平臺(tái)的設(shè)計(jì)與搭建,可進(jìn)行大量的RFID應(yīng)用端功能測(cè)試,從而能夠?qū)Ρ菊n題的云測(cè)試管理方式提供一點(diǎn)的借鑒意義,可總結(jié)出一套行之有效的云服務(wù)應(yīng)用模式,進(jìn)而推廣到其它應(yīng)用或其它領(lǐng)域。相關(guān)研究成果《RFID通用數(shù)據(jù)交換平臺(tái)建設(shè)研究》在《圖書情報(bào)工作》上發(fā)表。

                                                    課題組供稿

(責(zé)編:沈王一)
吴江市| 云龙县| 通化县| 茂名市| 扎囊县| 扶风县| 宜章县| 平和县| 万盛区| 施秉县| 普格县| 潢川县| 漳浦县| 鸡东县| 津南区| 陇西县| 旬邑县| 高淳县| 泽库县| 常熟市| 华阴市| 囊谦县| 明水县| 庆安县| 右玉县| 上蔡县| 泰来县| 望都县| 迭部县| 锡林郭勒盟| 定安县| 洮南市| 梧州市| 汾西县| 南城县| 项城市| 五华县| 泸州市| 栾城县| 永定县|