一、研究進(jìn)展情況
①本項(xiàng)目于2012年12月立項(xiàng),研究已開展將近三年半,項(xiàng)目總體執(zhí)行情況以及各子課題進(jìn)展情況順利。自2014年6月中期檢查后,項(xiàng)目舉行課題中期報(bào)告說明會(huì),根據(jù)會(huì)上各課題組成員的討論和建議,繼續(xù)深化各子課題的研究方法和進(jìn)展,項(xiàng)目首席專家對后期工作的總體推進(jìn)和協(xié)調(diào)進(jìn)行了進(jìn)一步的統(tǒng)籌和調(diào)整。期間,課題組成員定期(每周或每兩周)召開例會(huì)集中匯報(bào)討論各課題組成員的研究進(jìn)展,并布置下一步任務(wù)與計(jì)劃,每次例會(huì)均有首席專家主持并點(diǎn)評,與會(huì)成員們積極發(fā)言討論。
子課題一:面向?qū)W科領(lǐng)域的網(wǎng)絡(luò)信息資源及其深度聚合與導(dǎo)航基本理論研究
1.圖情領(lǐng)域網(wǎng)絡(luò)資源分布及利用需求
在對網(wǎng)絡(luò)學(xué)術(shù)資源進(jìn)行類型劃分的基礎(chǔ)上,進(jìn)一步對網(wǎng)絡(luò)學(xué)術(shù)資源的分布、網(wǎng)絡(luò)學(xué)術(shù)資源的類型、網(wǎng)絡(luò)學(xué)術(shù)資源的微觀結(jié)構(gòu)和特征等方面進(jìn)行了深入研究。首先,從網(wǎng)絡(luò)引文的角度,對特定領(lǐng)域研究網(wǎng)絡(luò)學(xué)術(shù)資源的利用情況和需求進(jìn)行了深入的探討,包括主題分布、域名分布、類型分布、URL深度分布、研究者利用數(shù)量、利用類型、利用目的等特征。其次,以圖情領(lǐng)域網(wǎng)站間的社會(huì)網(wǎng)絡(luò)關(guān)系為切入點(diǎn),采用社會(huì)網(wǎng)絡(luò)分析法,借助社會(huì)網(wǎng)絡(luò)分析工具Ucient,從國內(nèi)圖情網(wǎng)站中選擇了15種資源類型,共306個(gè)有效網(wǎng)站進(jìn)行分析,按照網(wǎng)站間的友情鏈接關(guān)系構(gòu)建了網(wǎng)絡(luò)關(guān)系圖,并進(jìn)行了圖情領(lǐng)域整體網(wǎng)群可視化分析、網(wǎng)絡(luò)密度分析、中心性分析和核心-邊緣結(jié)構(gòu)分析。按照資源類型,對其中10種資源類型的圖情領(lǐng)域子網(wǎng)群的網(wǎng)絡(luò)結(jié)構(gòu)和中心性進(jìn)行了分析。網(wǎng)絡(luò)結(jié)構(gòu)分析發(fā)現(xiàn)圖情領(lǐng)域整體網(wǎng)群結(jié)構(gòu)松散,處于核心位置的網(wǎng)站較少;高校圖書館網(wǎng)群、科技情報(bào)研究所網(wǎng)群和公共圖書館網(wǎng)群聯(lián)系的最為緊密。中心性分析發(fā)現(xiàn)了三類核心網(wǎng)站,這三類網(wǎng)站都處于網(wǎng)絡(luò)中的重要位置。
2.網(wǎng)絡(luò)資源的引用行為與動(dòng)機(jī)
選擇在線百科這一類型網(wǎng)絡(luò)資源為研究對象,將引用類型劃分為八大類,分別為(1)網(wǎng)站或詞條本身的引用以證明網(wǎng)站或詞條的存在,此類主要包括直接在網(wǎng)站名或詞條名后進(jìn)行標(biāo)注,沒有具體引用其內(nèi)容。(2)圖書情報(bào)學(xué)專業(yè)術(shù)語的引用,此類是指引用的詞條為圖書情報(bào)學(xué)專業(yè)術(shù)語。(3)非圖書情報(bào)學(xué)專業(yè)術(shù)語的引用,如計(jì)算機(jī)科學(xué)、醫(yī)學(xué)、法律、社會(huì)學(xué)等的相關(guān)概念。(4)專有名詞、流行文化等的引用,此類包括不具體歸屬于某一學(xué)科的專有名詞,如人名、地名、機(jī)構(gòu)名、作品、公司名、產(chǎn)品名、網(wǎng)絡(luò)用語、某些新出現(xiàn)的網(wǎng)絡(luò)現(xiàn)象、新聞、歷史性事件的描述等。(5)數(shù)值類引用,主要是指引用某一具體數(shù)值,如社會(huì)經(jīng)濟(jì)指標(biāo)等。(6)公文標(biāo)準(zhǔn)類引用,包括政府政策、法規(guī)等以及明確指出某一協(xié)會(huì)或報(bào)告的間接性引用。(7)冗余引用,此類是指在引用在線百科資源之前還標(biāo)注其他類型資源的引文,而如果其他類型的引用是出現(xiàn)在之后則根據(jù)其特征歸入其他某一類中。(8)其他,如圖片、表格等的引用。并對這八種類型的引用分布進(jìn)行了統(tǒng)計(jì)分析。
子課題二:面向?qū)W科領(lǐng)域的網(wǎng)絡(luò)信息采集、抽取和預(yù)處理
1.基于主題的采集
互聯(lián)網(wǎng)上(如電子資源、網(wǎng)絡(luò)數(shù)據(jù)庫、專題論壇、研究博客、維基百科等等)積累了豐富的學(xué)科信息資源,這些資源由于缺少統(tǒng)一的形式化表達(dá)與操作標(biāo)準(zhǔn),呈現(xiàn)異質(zhì)、異構(gòu)、分散、重復(fù)、動(dòng)態(tài)和隱藏等特征,嚴(yán)重限制了資源的集成應(yīng)用,如何快速有效地獲取所需專業(yè)信息或決策信息成為亟待解決的重要問題。以1998年康奈爾大學(xué)的Watts和Strogatz建立的小世界模型、1999年圣母大學(xué)的Barabási和Albert建立的無標(biāo)度模型為標(biāo)志,研究人員廣泛使用復(fù)雜網(wǎng)絡(luò)理論對社會(huì)網(wǎng)絡(luò)進(jìn)行分析,分析網(wǎng)站之間構(gòu)成的網(wǎng)群的拓?fù)浣Y(jié)構(gòu),從而分析信息的發(fā)布、互動(dòng)和傳播特性,以便采集。利用復(fù)雜網(wǎng)絡(luò)理論對興趣社交網(wǎng)站進(jìn)行了拓?fù)浣Y(jié)構(gòu)分析。興趣社交網(wǎng)站就是興趣愛好的社交平臺(tái),人們通過共同愛好形成各種興趣社區(qū),針對某個(gè)或某幾個(gè)主題展開交流,作為“領(lǐng)域?qū)<业囊庖婎I(lǐng)袖”在引導(dǎo)興趣主題的發(fā)展上起著主導(dǎo)作用。3個(gè)社區(qū)的出入度分布的冪率指數(shù)a均滿足大多數(shù)社交網(wǎng)絡(luò)的度分布函數(shù)的冪率指數(shù)范圍1<a<2[22],這種無標(biāo)度特征揭示出網(wǎng)絡(luò)存在中心節(jié)點(diǎn)、網(wǎng)絡(luò)資源占有不平衡的現(xiàn)象。對興趣社交網(wǎng)站的采集,我們采用滾雪球采樣法,在開源軟件Heritrix的基礎(chǔ)上,自行開發(fā)數(shù)據(jù)采集器。采集器共抓取了近600萬頁面,總?cè)萘拷咏?0G。對百科資源的采集,采用維基百科中文版(zh.wikipedia.org)的鏡像文件,共約1.2G。在主題相關(guān)性計(jì)算方法方面,選擇中文維基百科這一理想的語義知識(shí)資源進(jìn)行領(lǐng)域概念的相關(guān)性研究,包括基于語義距離、信息量和文本重疊的計(jì)算方法三種。
2.基于語義的抽取。
采用基于依存句法分析的方法,基于哈工大的語言云平臺(tái),只需要根據(jù)API參數(shù)構(gòu)造HTTP請求即可在線獲得XML分析結(jié)果。繼而選用了中科院計(jì)算所譚松波博士提供的酒店、電腦2個(gè)領(lǐng)域的4000篇評論語料進(jìn)行了依存句法方面的分析。
子課題三:面向?qū)W科領(lǐng)域的網(wǎng)絡(luò)信息資源深度聚合研究
1.聚合單元內(nèi)容元數(shù)據(jù)
目前已有的元數(shù)據(jù)標(biāo)準(zhǔn)基本都以粗粒度的信息資源為單位,如一本書、一篇論文、一個(gè)網(wǎng)頁等,而缺少對細(xì)粒度信息資源的描述標(biāo)準(zhǔn),如章節(jié)、段落、句群等聚合單元。因此,為了使更細(xì)粒度的網(wǎng)絡(luò)信息資源得以被便捷、高效地檢索和利用,有必要建立細(xì)粒度信息資源的元數(shù)據(jù)描述框架。本文以圖書情報(bào)領(lǐng)域?yàn)槔,圖書情報(bào)領(lǐng)域網(wǎng)上免費(fèi)信息資源包括OA論文、百科、博客、微博、論壇、新聞、教案、程序等。本文對不同網(wǎng)絡(luò)信息資源類型進(jìn)行研究,探討網(wǎng)絡(luò)資源細(xì)粒度單元的劃分以及組織機(jī)制,旨在建立針對不同資源類型的統(tǒng)一的細(xì)粒度單元元數(shù)據(jù)描述框架,為網(wǎng)絡(luò)信息資源聚合提供可操作的信息組織理論基礎(chǔ)。本文在已有的研究基礎(chǔ)上,綜合對文獻(xiàn)單元研究的已有成果并借鑒應(yīng)用語言學(xué)對于體裁分析的研究確定聚合單元的定義框架。然后,針對不同層級(jí)單元的屬性特征,構(gòu)建描述聚合單元訪問信息、物理信息和語義信息的元數(shù)據(jù)框架,并探討了元數(shù)據(jù)實(shí)現(xiàn)自動(dòng)抽取的可能性。最后,本文依據(jù)元數(shù)據(jù)框架設(shè)計(jì)并實(shí)現(xiàn)了網(wǎng)絡(luò)資源細(xì)粒度單元檢索數(shù)據(jù)庫,通過實(shí)驗(yàn)法展示元數(shù)據(jù)框架支持聚合與檢索的效果。
2.學(xué)術(shù)會(huì)議PPT資源深度聚合
按照“相關(guān)理論研究-模型構(gòu)建-實(shí)證分析”的思路進(jìn)行研究。首先,總結(jié)和歸納國內(nèi)外學(xué)者在學(xué)科領(lǐng)域網(wǎng)絡(luò)信息資源理論、信息聚合、會(huì)議文獻(xiàn)資源等相關(guān)領(lǐng)域的研究成果,深入了解國內(nèi)外有關(guān)信息資源深度聚合的理論基礎(chǔ)及其最新研究成果。其次,借鑒已有的聚合理論與方法,結(jié)合會(huì)議 PPT 的特征,從文獻(xiàn)特征關(guān)聯(lián)維度,針對會(huì)議、關(guān)鍵詞、主講者、主講者機(jī)構(gòu)等的關(guān)聯(lián)關(guān)系,結(jié)合社會(huì)網(wǎng)絡(luò)分析方法與計(jì)量學(xué)方法,利用會(huì)議 PPT的主講者、主講者機(jī)構(gòu)、關(guān)鍵詞等關(guān)系及其之間交叉關(guān)系建立會(huì)議 PPT聚合模型,通過社會(huì)網(wǎng)絡(luò)關(guān)系可視化地展示關(guān)鍵詞網(wǎng)絡(luò)、關(guān)鍵詞-會(huì)議網(wǎng)絡(luò)、主講者-會(huì)議網(wǎng)絡(luò)、主講者-關(guān)鍵詞網(wǎng)絡(luò)、機(jī)構(gòu)-會(huì)議網(wǎng)絡(luò)、機(jī)構(gòu)-關(guān)鍵詞網(wǎng)絡(luò)、關(guān)鍵詞-會(huì)議-主講者網(wǎng)絡(luò)、關(guān)鍵詞-機(jī)構(gòu)-主講者網(wǎng)絡(luò)等,并且根據(jù)不同網(wǎng)絡(luò)的特點(diǎn),采用不同的社會(huì)網(wǎng)絡(luò)指標(biāo)(密度、中心性、小世界等)分析不同的網(wǎng)絡(luò),研究揭示了會(huì)議研究主國內(nèi)外圖情領(lǐng)域?qū)W術(shù)會(huì)議網(wǎng)絡(luò) PPT主題、會(huì)議主題相關(guān)性、主講者間潛在的交流關(guān)系、研究主題分布及各主講者的研究興趣、機(jī)構(gòu)間的潛在交流、機(jī)構(gòu)研究主題的相關(guān)性等。
3.情景相關(guān)的網(wǎng)絡(luò)學(xué)術(shù)資源聚合單元研究
在回顧多類型網(wǎng)絡(luò)資源聚合、細(xì)粒度檢索與聚合和用戶聚合需求與行為研究的基礎(chǔ)上,提出按照學(xué)科領(lǐng)域用戶認(rèn)知規(guī)律劃分聚合單元、通過揭示和利用用戶與多類型網(wǎng)絡(luò)學(xué)術(shù)文檔內(nèi)聚合單元的關(guān)聯(lián)關(guān)系從而實(shí)現(xiàn)細(xì)粒度聚合的聚合模式,以優(yōu)化用戶網(wǎng)絡(luò)學(xué)術(shù)資源獲取的效率與效用。在借鑒語言學(xué)的語篇體裁理論、相關(guān)性理論和圖書情報(bào)學(xué)的情景檢索理論的基礎(chǔ)上,以圖書情報(bào)學(xué)領(lǐng)域網(wǎng)絡(luò)文檔為研究對象和范圍,展開三階段實(shí)證研究:第一階段,在文獻(xiàn)回顧和網(wǎng)絡(luò)調(diào)查的基礎(chǔ)上構(gòu)建跨類型網(wǎng)絡(luò)文檔聚合單元類型體系,并進(jìn)行基于語料的有效性檢驗(yàn)。該體系涵蓋論文題錄、OA期刊論文、網(wǎng)絡(luò)百科和博客文章等四種體裁類型的網(wǎng)絡(luò)文檔,并統(tǒng)一劃分為篇章—構(gòu)成—功能單元三個(gè)層級(jí);第二階段,通過兩輪用戶調(diào)查檢驗(yàn)第一階段類型體系的有效性以及一組信息搜尋任務(wù)下各層級(jí)和各類聚合單元感知有用性的差異,并初步探討了與任務(wù)存在高相關(guān)性的聚合單元之間可能存在的關(guān)系;第三階段,在實(shí)證研究結(jié)果的基礎(chǔ)上,設(shè)計(jì)任務(wù)關(guān)聯(lián)的細(xì)粒度聚合系統(tǒng),并對網(wǎng)絡(luò)學(xué)術(shù)文檔聚合單元自動(dòng)識(shí)別進(jìn)行探討,從而為聚合單元類型體系的應(yīng)用提供借鑒。
4.特定學(xué)科領(lǐng)域的網(wǎng)絡(luò)資源語義聚合研究
在對語義聚合理論進(jìn)行總結(jié)和綜述的基礎(chǔ)上,提出了前控+后控的語義聚合模式。在前控階段,采集到學(xué)科領(lǐng)域網(wǎng)絡(luò)資源后,聚合系統(tǒng)先利用領(lǐng)域本體對資源進(jìn)行語義描述,建立資源之間的語義關(guān)系,構(gòu)成多維度的資源語義描述庫,并提取資源語義描述索引。在后控階段,聚合系統(tǒng)利用領(lǐng)域本體將用戶提出的自然語詞自動(dòng)轉(zhuǎn)換成學(xué)科領(lǐng)域概念,并根據(jù)領(lǐng)域本體中的概念關(guān)系對用戶提問作進(jìn)一步的語義引導(dǎo)和挖掘。最后,在聚合處理階段,聚合系統(tǒng)將語義明確的用戶需求與資源語義描述庫進(jìn)行語義匹配,計(jì)算提問和資源的語義距離,形成資源聚合體,并通過多種語義聚合網(wǎng)絡(luò)展示出來。
子課題四:用戶認(rèn)知導(dǎo)向的學(xué)科領(lǐng)域網(wǎng)絡(luò)信息資源導(dǎo)航機(jī)制研究
1.Flow測量
網(wǎng)絡(luò)環(huán)境下Flow量表的研究仍處于發(fā)展階段,研究重點(diǎn)在于Flow維度識(shí)別及其結(jié)構(gòu)厘清。已有研究中,F(xiàn)low的操作化定義形形色色,Romero(2015)宣稱其中不乏誤操作的產(chǎn)物,他們堅(jiān)持,只有深入認(rèn)識(shí)和理解Flow本質(zhì),才能準(zhǔn)確操作化Flow。Flow測量包括單一維度測量法和多維度測量法。單一維度測量法視心流體驗(yàn)為單一維度直接衡量。單一維度測量法又分為三種形式,第一種是“心流短摘錄”!靶牧鞫陶洝笔且院喍陶浀姆绞矫枋鲂牧黧w驗(yàn),以Bilgihan(2015)為例,它的“心流短摘錄”文本為:“’心流’是用來描述人們?nèi)硇耐度肽稠?xiàng)活動(dòng)的精神狀態(tài)。例如,當(dāng)用戶網(wǎng)上購物進(jìn)入心流狀態(tài)時(shí),心無雜念,身心合一,全神貫注地投入并享受其中。許多人在網(wǎng)頁瀏覽、在線聊天和文字編輯等活動(dòng)都會(huì)經(jīng)歷這種感覺。”第二種測量方法是“技巧與挑戰(zhàn)的平衡計(jì)分”,它的原理基于心流體驗(yàn)的四通道模型,該模型認(rèn)為,“流動(dòng)狀態(tài)”產(chǎn)生于挑戰(zhàn)與技巧適配且都處于高水平時(shí)。據(jù)此,可以通過量表的方式獲取被試在技巧和挑戰(zhàn)方面的得分,比較它們之間的得分就可以判斷受測者是處于技巧高于挑戰(zhàn)的“無趣狀態(tài)”、挑戰(zhàn)大于技巧的“焦慮狀態(tài)”,還是技巧與挑戰(zhàn)匹配的“流動(dòng)狀態(tài)”第三種是“混合維度測量法”,混合不同維度的指標(biāo)測量心流體驗(yàn)。陳潔(2009)和Skadberg and Kimmel(2004)定義心流體驗(yàn)為“時(shí)間感扭曲”和“愉悅感”,Senecal, Gharbi, and Nantel (2002)混合專注、控制、挑戰(zhàn)與愉悅感的指標(biāo)測量心流體驗(yàn),Jiang and Benbasat (2005),類似的,Jiang and Benbasat (2005)視控制、專注和愉悅感為心流體驗(yàn), Choi, Kim,and Kim (2000) 的心流體驗(yàn)測量由2個(gè)內(nèi)在興趣指標(biāo)、2個(gè)好奇感指標(biāo)、1個(gè)控制指標(biāo)和1個(gè)專注指標(biāo)組成。類似的研究有WU(2014)、Barker(2015)。為了彌補(bǔ)單一維度測量法無法全面揭示心流概念的不足,多維度測量法應(yīng)運(yùn)而生。與“混合維度測量法”把心流定義的部分維度指標(biāo)(如愉悅、控制或?qū)W⒌龋┗旌铣蓡我粯?gòu)念(construct)不同,多維度測量法視心流為多維度構(gòu)念,每個(gè)維度采用若干指標(biāo)單獨(dú)測量,運(yùn)用結(jié)構(gòu)方程模型檢驗(yàn)這些維度是否指向同一高階因子,從多維的角度呈現(xiàn)心流概念的結(jié)構(gòu)。在網(wǎng)絡(luò)環(huán)境下,早期多維度測量法的對象并不是Flow本身,而是Flow相似概念,例如Koufaris(2002)把體驗(yàn)操作化為五個(gè)維度,分別是控制、愉悅、專注、感知有用和感知易用,與之相似的還有Bridges and Florsheim(2008)把Flow操作化為臨境感、時(shí)間感扭曲、技巧、交互速度和重要性。作為中介變量,這些維度在研究架構(gòu)中的作用得到了檢驗(yàn),但研究對維度之間的關(guān)系避而不談。
2.學(xué)科領(lǐng)域網(wǎng)絡(luò)資源聚合系統(tǒng)導(dǎo)航的用戶行為研究
結(jié)合國內(nèi)外學(xué)者對導(dǎo)航行為的已有研究,構(gòu)建了學(xué)科領(lǐng)域網(wǎng)絡(luò)資源聚合系統(tǒng)導(dǎo)航的用戶行為研究模型,主要使用實(shí)驗(yàn)的方法,以圖情領(lǐng)域網(wǎng)絡(luò)資源聚合系統(tǒng)“e線圖情”作為實(shí)驗(yàn)網(wǎng)站,選取圖書情報(bào)學(xué)科的本科生、研究生共23名作為實(shí)驗(yàn)對象,設(shè)計(jì)了 10 個(gè)事實(shí)信息任務(wù),利用屏幕錄制軟件采集實(shí)驗(yàn)對象的行為,使用 SPSS19.0 對實(shí)驗(yàn)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。研究表明,個(gè)體特征中,性別、受教育程度、網(wǎng)絡(luò)使用年限對用戶的主觀復(fù)雜性判斷具有顯著影響;性別對用戶導(dǎo)航使用過程中的導(dǎo)航時(shí)間、每個(gè)頁面所花時(shí)間有顯著影響,受教育程度和網(wǎng)絡(luò)使用年限對導(dǎo)航使用行為沒有顯著影響。不同認(rèn)知風(fēng)格的用戶對任務(wù)的主觀復(fù)雜性判斷、導(dǎo)航使用過程中訪問的不重復(fù)頁面數(shù)量、主頁次數(shù)、導(dǎo)航欄次數(shù)都具有顯著差異。任務(wù)目標(biāo)頁面的邏輯層級(jí)對客觀任務(wù)復(fù)雜性有顯著影響,邏輯層級(jí)對導(dǎo)航欄
訪問次數(shù)有正向影響,與主頁訪問次數(shù)負(fù)顯著相關(guān)?陀^任務(wù)復(fù)雜性會(huì)影響用戶的主觀復(fù)雜性判斷,并對導(dǎo)航使用過程中訪問的頁面總數(shù)、不重復(fù)頁面數(shù)、導(dǎo)航欄訪問次數(shù)、重訪率、導(dǎo)航時(shí)間具有顯著影響,且與任務(wù)執(zhí)行結(jié)果顯著相關(guān)。用戶對任務(wù)復(fù)雜程度的主觀判斷會(huì)影響其執(zhí)行任務(wù)過程中的所有行為特征。
3.網(wǎng)絡(luò)信息資源聚合情境下大學(xué)生用戶心智模型研究
以信息用戶心智模型的構(gòu)成維度為研究切入點(diǎn),將定性與定量方法相結(jié)合,綜合利用概念列表法、半結(jié)構(gòu)化訪談法和問卷調(diào)查法,以中山大學(xué)學(xué)生為調(diào)查對象,探索當(dāng)前環(huán)境下大學(xué)生用戶對于網(wǎng)絡(luò)學(xué)術(shù)信息資源聚合及聚合系統(tǒng)的心理認(rèn)知情況。網(wǎng)絡(luò)信息資源聚合情境下大學(xué)生用戶心智模型主要包含認(rèn)知和評價(jià)兩個(gè)層面,其中認(rèn)知體系主要包括有用性認(rèn)知、資源聚合功能認(rèn)知、資源聚合的環(huán)境認(rèn)知,評價(jià)體系主要包括對比評價(jià)、檢索效果評價(jià)、負(fù)面評價(jià)。
子課題五:面向?qū)W科領(lǐng)域的網(wǎng)絡(luò)信息資源深度聚合與導(dǎo)航機(jī)制應(yīng)用研究
1.構(gòu)建面向?qū)W科領(lǐng)域的網(wǎng)絡(luò)信息資源深度聚合與導(dǎo)航原型系統(tǒng)
基于任務(wù)相關(guān)性的跨類型網(wǎng)絡(luò)資源聚合單元類型體系的細(xì)粒度聚合系統(tǒng)的設(shè)計(jì)將圍繞細(xì)粒度聚合系統(tǒng)設(shè)計(jì)原理、語料庫數(shù)據(jù)來源、數(shù)據(jù)結(jié)構(gòu)與組織、聚合機(jī)制、界面設(shè)計(jì)等幾個(gè)方面進(jìn)行。在聚合單元類型體系構(gòu)建和任務(wù)相關(guān)性研究的基礎(chǔ)上,我們得到由4類體裁、15類構(gòu)成單元和54類功能單元組成的聚合單元類型體系,為當(dāng)前聚合檢索系統(tǒng)原型的設(shè)計(jì)提供參考,從而通過提示和呈現(xiàn)與任務(wù)高度相關(guān)的聚合單元來促進(jìn)檢索的效率和效用。通過三個(gè)功能可達(dá)到這一目標(biāo):一個(gè)是聚合單元任務(wù)相關(guān)性的排序器,在主題相關(guān)性的基礎(chǔ)上,對聚合單元的排序進(jìn)行加權(quán);第二個(gè)是聚合單元選擇器,可根據(jù)用戶所選擇的任務(wù)類型選擇相關(guān)的聚合單元;第三個(gè)是相關(guān)聚合單元提示器,可在對各類資源進(jìn)行主題匹配的基礎(chǔ)上,根據(jù)檢索任務(wù)的相關(guān)性對相關(guān)的聚合單元進(jìn)行提示。系統(tǒng)采用JAVA語言編寫,采用JFINAL框架進(jìn)行開發(fā),并以Sqlserver數(shù)據(jù)庫管理系統(tǒng)對基于“引文分析”聚合單元語料庫的元數(shù)據(jù)和文本數(shù)據(jù)進(jìn)行管理和檢索,包含檢索匹配和結(jié)果呈現(xiàn)兩大功能模塊。語料庫中 81 篇資源分由三個(gè)層級(jí)的元數(shù)據(jù)表進(jìn)行組織。其中篇章元數(shù)據(jù)表主要包括:資源 ID、資源類型、資源體裁、標(biāo)題、篇關(guān)鍵詞、分類、來源、更新時(shí)間、作者等字段;構(gòu)成單元元數(shù)據(jù)表主要包括:構(gòu)成 ID、來源文獻(xiàn) ID、題名、章節(jié)層級(jí)、構(gòu)成名稱、標(biāo)題關(guān)鍵詞等;功能單元元數(shù)據(jù)表主要包括:功能單元 ID、來源文獻(xiàn)、構(gòu)成 ID、功能單元名、內(nèi)容關(guān)鍵詞等字段。三層級(jí)元數(shù)據(jù)除了包含上述字段及相應(yīng)內(nèi)容外,還包含對應(yīng)的全文內(nèi)容。篇章、構(gòu)成與功能單元三個(gè)層級(jí)的元數(shù)據(jù)為各層級(jí)單元內(nèi)容的檢索提供了支持,并支持三個(gè)層級(jí)內(nèi)容間的鏈接和跳轉(zhuǎn)。
②調(diào)查研究及學(xué)術(shù)交流情況(調(diào)研數(shù)據(jù)整理運(yùn)用、文獻(xiàn)資料收集整理、學(xué)術(shù)會(huì)議、學(xué)術(shù)交流、國際合作等);
1.數(shù)據(jù)收集與文獻(xiàn)資料整理
(1)數(shù)據(jù)收集。數(shù)據(jù)采集包括三個(gè)方面,一是學(xué)科領(lǐng)域網(wǎng)絡(luò)學(xué)術(shù)資源數(shù)據(jù)的采集,包括OA期刊論文、百度百科和維基百科、精品課程、學(xué)術(shù)會(huì)議等的采集,OA期刊論文如《現(xiàn)代圖書情報(bào)技術(shù)》、《知識(shí)管理論壇》、《圖書情報(bào)工作網(wǎng)刊》刊載的所有論文的文獻(xiàn)著錄數(shù)據(jù)和全文數(shù)據(jù),國內(nèi)外圖情領(lǐng)域會(huì)議的PPT資源等;二是輿情數(shù)據(jù)的采集;三是用戶利用與需求數(shù)據(jù)的采集,包括采用實(shí)驗(yàn)法和用戶調(diào)查法,如在圖情領(lǐng)域大學(xué)生用戶的網(wǎng)絡(luò)資源聚合需求以及其在網(wǎng)絡(luò)資源聚合系統(tǒng)中的查尋行為方面,通過問卷調(diào)查圖情領(lǐng)域?qū)W生對網(wǎng)絡(luò)資源聚合系統(tǒng)的使用情況和評價(jià)以及對網(wǎng)絡(luò)資源聚合粒度的需求,以了解用戶對網(wǎng)絡(luò)資源聚合的需求狀況,同時(shí)通過實(shí)驗(yàn),以檢索式策略、導(dǎo)航菜單使用頻率、檢索結(jié)果瀏覽方式、檢索時(shí)長作為指標(biāo),對比分析用戶在一般環(huán)境下和網(wǎng)絡(luò)資源聚合系統(tǒng)情境中查尋行為的差異以及個(gè)體特征、檢索技能與經(jīng)驗(yàn)、檢索任務(wù)復(fù)雜度和任務(wù)聚合粒度需求對用戶查尋行為的影響,同時(shí)對其檢索結(jié)果和過程的滿意度進(jìn)行評價(jià);
(2)文獻(xiàn)收集。
A.聚合單元相關(guān)研究。
國內(nèi)外對聚合單元的研究主要分為三個(gè)方面:知識(shí)元研究,學(xué)習(xí)對象研究和關(guān)聯(lián)數(shù)據(jù)研究。弗拉基米爾·斯拉麥卡來華講學(xué)時(shí)曾指出,知識(shí)的控制單位將從文獻(xiàn)深化到文獻(xiàn)中的數(shù)據(jù)、公式、事實(shí)、結(jié)論等最小的獨(dú)立的“數(shù)據(jù)元”(事實(shí)上指的就是“知識(shí)元”),而大量文獻(xiàn)中所包含的“知識(shí)元”及相關(guān)信息間的鏈接能產(chǎn)生極大的知識(shí)增值。馬費(fèi)成教授也指出情報(bào)學(xué)取得突破的關(guān)鍵之一是知識(shí)信息的表達(dá)和組織必須從物理層次的文獻(xiàn)單元向認(rèn)識(shí)層次的知識(shí)單元或情報(bào)單元轉(zhuǎn)換[1]。學(xué)者徐如鏡指出知識(shí)的控制單位長期停留在文獻(xiàn)一級(jí),而人們對知識(shí)的需求一般不是以文獻(xiàn)為單位[2]。周寧等指出互聯(lián)網(wǎng)信息檢索查準(zhǔn)率、查全率不高的原因主要是信息組織的深度還停留在文獻(xiàn)層次,根本的解決方法是對信息資源進(jìn)行深入到知識(shí)元層次的信息組織[2]。
在“知識(shí)元”的研究中,以西安電子科技大學(xué)溫有奎教授為代表的對中文文本知識(shí)元進(jìn)行的基礎(chǔ)性研究尤為引人注目,知識(shí)元及其構(gòu)建問題一經(jīng)提出即刻引起了情報(bào)學(xué)、信息管理等領(lǐng)域?qū)W者的高度關(guān)注和重視[3]。溫有奎教授指出我們假定文本內(nèi)容的組織排列,是由一個(gè)個(gè)獨(dú)立知識(shí)元素的邏輯排序結(jié)構(gòu),這種獨(dú)立的知識(shí)元素我們稱它為知識(shí)元,邏輯依存關(guān)系稱它為知識(shí)鏈,知識(shí)元是構(gòu)造知識(shí)結(jié)構(gòu)的基元,標(biāo)引知識(shí)元便于用戶直接查詢知識(shí)元,組合知識(shí)元,改善自己的知識(shí)結(jié)構(gòu),從而加快知識(shí)創(chuàng)新速度[4]。劉平峰等提出一種基于模糊等價(jià)關(guān)系的文本多粒度劃分方法,以模糊等價(jià)關(guān)系構(gòu)建文本信息顆粒,為多粒度知識(shí)服務(wù)基于主題的導(dǎo)航提供基礎(chǔ)[5]。王玉林等提出一種細(xì)粒度語義共詞分析方法,該方法一方面對詞對共現(xiàn)統(tǒng)計(jì)單元進(jìn)行碎片化處理,由“文獻(xiàn)單元”變?yōu)椤爸R(shí)單元”(RDF三元組),達(dá)到細(xì)粒度的目的;另一方面對共詞分析方法進(jìn)行語義化處理,將共現(xiàn)詞對的語義信息融入到共詞分析過程之中[6]。在知識(shí)元的處理單位上也有不少的研究,文獻(xiàn)[7,8,9]探討了把詞作為處理單元的知識(shí)抽取技術(shù),文獻(xiàn)[11,12 ,13]則研究句子級(jí)信息抽取和知識(shí)抽取的方法。
在E-Learning中,強(qiáng)調(diào)的就是將學(xué)習(xí)資源進(jìn)行分解、描述和揭示,剔除冗余、重復(fù)和劣質(zhì)信息,對學(xué)習(xí)資源來源、內(nèi)容和結(jié)構(gòu)進(jìn)行新的類聚和重組,形成一個(gè)具有特定邏輯組織、向?qū)院完P(guān)聯(lián)性的學(xué)習(xí)對象知識(shí)資源體系,其中,學(xué)習(xí)對象知識(shí)資源的整合依托于對不同類型和來源的學(xué)習(xí)資源的內(nèi)容進(jìn)行深度揭示和規(guī)范描述,形成標(biāo)準(zhǔn)規(guī)范的學(xué)習(xí)對象,之后再利用知識(shí)本體對學(xué)習(xí)對象中知識(shí)單元所標(biāo)引的邏輯關(guān)系形成具有新的組織結(jié)構(gòu)和功能的知識(shí)系統(tǒng)[10]。在這個(gè)過程中,對學(xué)習(xí)資源的標(biāo)引至關(guān)重要,首先就是要建立學(xué)習(xí)對象的元數(shù)據(jù)描述框架。目前,使用率最高的針對學(xué)習(xí)對象的元數(shù)據(jù)體系是本文2.2提到的LOM元數(shù)據(jù)框架[14]。在應(yīng)用方面,美國國家科學(xué)基金會(huì)進(jìn)行的可重用學(xué)習(xí)項(xiàng)目(The Reusable Learning Project,2003-2005)正是把學(xué)習(xí)資源切分為學(xué)習(xí)對象,因?yàn)檫@樣能夠通過分析用戶的目的和現(xiàn)有技能,聚合從資源中分解出的學(xué)習(xí)對象,使用戶不用在大量已經(jīng)熟知或不感興趣的信息中對確定需要的知識(shí)進(jìn)行篩選,更好地對用戶進(jìn)行個(gè)性化的服務(wù)。項(xiàng)目中學(xué)習(xí)對象的元數(shù)據(jù)框架包括:①基本描述信息(也稱數(shù)目元數(shù)據(jù)),包括資源的標(biāo)題、作者、描述、標(biāo)識(shí)和關(guān)鍵字,目的是使資源被發(fā)現(xiàn)和使用;②情境信息,包括適用年級(jí)、適用對象等教育資源的信息,使搜索能夠?yàn)槟骋粋(gè)特定情境服務(wù);③產(chǎn)權(quán)信息,描述資源使用的條件和權(quán)限;④技術(shù)信息,包括資源的格式信息以及使用和修改資源的軟硬件要求;⑤用戶信息,包括軟件文檔(在線、印刷或者幫助界面格式)、教學(xué)指導(dǎo)和其它能夠幫助更正確和有效地使用資源的信息[15]。項(xiàng)目也提出利用XML表示是一種可行的方法[16]。等學(xué)者提出將本體運(yùn)用到學(xué)習(xí)對象的元數(shù)據(jù)中只是有助于從數(shù)據(jù)庫中檢索出相關(guān)的學(xué)習(xí)對象,卻并不能讓學(xué)習(xí)對象中的組成成分獲得重用,也無法有效定義學(xué)習(xí)對象內(nèi)容的語義,因此,他們提出使用領(lǐng)域本體和結(jié)構(gòu)本體對學(xué)習(xí)對象的內(nèi)容進(jìn)行標(biāo)引的方法,使直接訪問學(xué)習(xí)對象的組成成分成為可能[17]。
常娥指出關(guān)聯(lián)數(shù)據(jù)采用RDF 數(shù)據(jù)模型,借助其核心技術(shù)URIs,可創(chuàng)建包含各種數(shù)據(jù)、信息和知識(shí)在內(nèi)的任何資源的細(xì)粒度化的數(shù)據(jù)網(wǎng)絡(luò),是語義網(wǎng)的簡化方案,且元數(shù)據(jù)和本體模型均可融入關(guān)聯(lián)數(shù)據(jù)的技術(shù)框架,因此,關(guān)聯(lián)數(shù)據(jù)為圖書館將各種資源轉(zhuǎn)化為細(xì)粒度提供連通著的網(wǎng)絡(luò)數(shù)據(jù),徹底轉(zhuǎn)變圖書館資源組織的模式,彌補(bǔ)館藏書目數(shù)據(jù)組織的粗粒度、無語義和封閉性的不足,從而打破館藏資源組織與利用的困境,提供很好的思路[18]。沈志宏等指出不同于Document Web,關(guān)聯(lián)數(shù)據(jù)將互聯(lián)網(wǎng)上任一信息內(nèi)容或其子內(nèi)容看成是一個(gè)可采用標(biāo)準(zhǔn)方法規(guī)范描述和調(diào)用的知識(shí)對象,通過創(chuàng)建和發(fā)布關(guān)于各類知識(shí)對象及其與各類其他知識(shí)對象之間關(guān)系的規(guī)范化描述信息,通過建立基于知識(shí)內(nèi)容的檢索以及基于知識(shí)關(guān)系的分析關(guān)聯(lián)機(jī)制,關(guān)聯(lián)數(shù)據(jù)便可支持在特定信息環(huán)境下對不同知識(shí)對象的關(guān)聯(lián)發(fā)現(xiàn)[19]。李成龍以科技報(bào)告為研究對象,通過對科技報(bào)告的結(jié)構(gòu)進(jìn)行分解,以章節(jié)為單元進(jìn)行中粒度關(guān)聯(lián)數(shù)據(jù)的創(chuàng)建與發(fā)布,為構(gòu)建多粒度的組織體系打下基礎(chǔ),以期達(dá)到滿足用戶多粒度的信息需求[20]。王忠義等為實(shí)現(xiàn)數(shù)字圖書館館藏資源目錄數(shù)據(jù)(中粒度)的中層關(guān)聯(lián)數(shù)據(jù)的創(chuàng)建與發(fā)布,在對現(xiàn)有關(guān)聯(lián)數(shù)據(jù)創(chuàng)建與發(fā)布方法進(jìn)行研究的基礎(chǔ)上,針對目錄數(shù)據(jù)自身的特點(diǎn),采用自動(dòng)標(biāo)引、主題詞映射等技術(shù)實(shí)現(xiàn)目錄數(shù)據(jù)的結(jié)構(gòu)化,借助目錄體系與文本匹配實(shí)現(xiàn)關(guān)聯(lián)數(shù)據(jù)的關(guān)聯(lián)發(fā)現(xiàn),借助 D2R最終實(shí)現(xiàn)中層關(guān)聯(lián)數(shù)據(jù)的創(chuàng)建與發(fā)布[21]。SWSE、Sindice等語義網(wǎng)搜索引擎分別將眾多書目的RDF文檔編入索引[22]。Olaf Hartig等從數(shù)據(jù)庫的角度來研究網(wǎng)絡(luò)上出現(xiàn)的關(guān)聯(lián)數(shù)據(jù),分析了近年來越來越多的供應(yīng)商采用了關(guān)聯(lián)數(shù)據(jù)原則來出版和連結(jié)結(jié)構(gòu)化數(shù)據(jù),從而創(chuàng)造了一個(gè)全球的分布式數(shù)據(jù)空間——網(wǎng)絡(luò)數(shù)據(jù)[23]。
B.體裁分析相關(guān)研究
John Swales等學(xué)者對學(xué)術(shù)論文這種特定的體裁進(jìn)行研究,學(xué)術(shù)文獻(xiàn)在語言的功能性和目的上比其它體裁更加明顯,由于期刊篇幅等的限制,學(xué)術(shù)文獻(xiàn)中的每一句話甚至話語出現(xiàn)的順序通常都具有很強(qiáng)的意識(shí)和目的性。John Swales認(rèn)為期刊論文具有一定的宏觀結(jié)構(gòu),可以劃分為四個(gè)組件(Component)——介紹(Introduction)、方法(Methods)、結(jié)果(Results)和討論(Discussion),即IMRD模型[1,2]。不過,IMRD模型主要是針對實(shí)證性論文,對于非實(shí)證性論文,學(xué)者楊瑞英提出由介紹(Introduction),理論基礎(chǔ)(Theoretical Basis),論證(Argumentation),結(jié)論(Conclusion)構(gòu)成[3]。
在組件的基礎(chǔ)上,Swales和Sperber等學(xué)者提出功能性單元的概念(functional units),功能單元是內(nèi)含在IMRD各個(gè)組件中有獨(dú)立交際功能的句群[4]。例如,在介紹組件中,回顧以往研究的文本片段可以被認(rèn)為是一個(gè)功能單元,其它沒有指示出以往研究的文本片段是不同的功能單元。功能單元的概念是基于Swales的構(gòu)建學(xué)術(shù)工作空間模型(Create a Research Space,CARS),該模型一開始是用來指導(dǎo)撰寫研究文獻(xiàn)介紹的。
對于功能性單元的劃分方法分為兩種派別,一個(gè)派別是“Swalesian School”,他們的劃分方法是語步(move)/步驟(step),他們的分析對象多以學(xué)術(shù)和職業(yè)語篇。另一個(gè)派別稱“Australian School”,他們的分析對象主要是與牙醫(yī)交際、講故事、求職、請人吃飯等事件。
2004年Swales又繼續(xù)修改他的模型,把三個(gè)語輪變?yōu)椋赫Z輪1-提出某領(lǐng)域論題;語輪2-收窄論題;語輪3-介紹當(dāng)前研究。Swales的研究促進(jìn)了介紹部分語輪/語步的進(jìn)一步研究,如Kanoksilapatham (2005)[5],Lewin et al. (2001)[6], and Nwogu (1997)[7]等。同時(shí),其它組件的研究也都開始進(jìn)行,如在方法部分,Lim通過分析管理學(xué)領(lǐng)域的20篇英語學(xué)術(shù)論文的方法部分,分析總結(jié)出方法部分的三個(gè)語輪分別為描述數(shù)據(jù)收集過程、描述變量測量過程和描述數(shù)據(jù)分析過程,以及每個(gè)語輪對應(yīng)下的多個(gè)語步[8];Zhang[9]對心理學(xué)領(lǐng)域的英語學(xué)術(shù)論文體裁分析,認(rèn)為方法部分的語篇語步包括:關(guān)聯(lián)以往或下一個(gè)實(shí)驗(yàn)、證明方法的合理性、預(yù)覽方法、預(yù)覽結(jié)果、描述被試者、描述支撐材料、描述任務(wù)、實(shí)驗(yàn)程序提要、呈現(xiàn)變量和概述數(shù)據(jù)分析程序。國內(nèi)楊瑞英對10篇英語應(yīng)用語言學(xué)實(shí)證性學(xué)術(shù)論文分析,認(rèn)為方法部分語輪包括背景信息、描述數(shù)據(jù)和介紹分析方法三個(gè)方面[3]。在結(jié)果部分,Nwogu (1997) 指出兩個(gè)語輪,而Kanoksilapatham (2005) 通過生物化學(xué)領(lǐng)域?qū)W術(shù)文獻(xiàn)的研究得到四個(gè)語輪。討論部分,Swales and Freak (1994: 195) 提出三個(gè)語輪:語輪1-鞏固研究空間;語輪2-結(jié)果啟示;語輪3-日后研究。而Dudley-Evans(1986)也提出三個(gè)語輪,介紹,結(jié)果解釋,總結(jié)與日后研究,在總結(jié)日后研究下他還提出三個(gè)語步,總結(jié)主要結(jié)果,總結(jié)主要觀點(diǎn)和推薦日后研究,他同時(shí)指出在這個(gè)部分語步往往是循環(huán)出現(xiàn)的。上述研究中的語步即揭示一個(gè)修辭單元的交際目的或稱功能。
C.網(wǎng)絡(luò)資源導(dǎo)航相關(guān)研究
無論是瀏覽還是搜索網(wǎng)絡(luò)信息,都離不開導(dǎo)航工具和導(dǎo)航系統(tǒng)的輔助。金燕總結(jié)的導(dǎo)航機(jī)制共有五種:基于超鏈接的導(dǎo)航機(jī)制、基于內(nèi)容的導(dǎo)航機(jī)制、時(shí)序機(jī)制、空間機(jī)制、社會(huì)導(dǎo)航機(jī)制,并對這五種機(jī)制進(jìn)行了比較,還介紹了可視化輔助機(jī)制及魚眼圖技術(shù)、Focus+Context技術(shù)、視點(diǎn)控制技術(shù)、突顯技術(shù)[5]。之后金燕還專門研究了社會(huì)機(jī)制的導(dǎo)航,介紹了其內(nèi)涵、特點(diǎn),并在此基礎(chǔ)上給出了一個(gè)基于多Agent 的社會(huì)導(dǎo)航模型,分析了該模型的導(dǎo)航策略[6]。王秀峰的博士論文中介紹了四種主要的web 導(dǎo)航機(jī)制,分別為基于瀏覽器的 web 導(dǎo)航、基于鏈接的 web 導(dǎo)航、基于站點(diǎn)地圖的 web 導(dǎo)航和社會(huì)導(dǎo)航機(jī)制[7]。國外學(xué)者通常將信息導(dǎo)航總結(jié)為三種機(jī)制:基于信息對象間空間關(guān)聯(lián)的空間導(dǎo)航、基于信息對象間語義關(guān)聯(lián)的語義導(dǎo)航和受社會(huì)因素影響的社會(huì)導(dǎo)航。Wexelblat 等人認(rèn)為,使用隱含在信息或結(jié)構(gòu)背后的語義屬性信息的是語義導(dǎo)航,而使用來自他人信息的是社會(huì)導(dǎo)航[8]。Dieberger 認(rèn)為,社會(huì)導(dǎo)航與其他導(dǎo)航方式的不同主要表現(xiàn)在導(dǎo)航建議是如何被提供給用戶的,社會(huì)導(dǎo)航的導(dǎo)航信息是由他人發(fā)出的,不是靜態(tài)設(shè)計(jì)好的而是動(dòng)態(tài)的,可針對用戶個(gè)人的具體情況給出動(dòng)態(tài)的建議,它不是根據(jù)頁面上端的指示性信息進(jìn)行的,而是搜集他人的社會(huì)性活動(dòng),并以此為指導(dǎo)進(jìn)行的[9]。導(dǎo)航策略是幫助用戶實(shí)現(xiàn)信息獲取目標(biāo)的一些途徑和方法。高尚在其博士論文中介紹了常用的導(dǎo)航設(shè)施,包括分層導(dǎo)航、跳轉(zhuǎn)、可視化組織器、地圖、回溯、歷史清單、查找、索引及在線幫助,并分析了各自的優(yōu)缺點(diǎn),隨后又總結(jié)了超文本學(xué)習(xí)系統(tǒng)中常用的導(dǎo)航策略,包括檢索導(dǎo)航、線索導(dǎo)航、幫助導(dǎo)航、瀏覽導(dǎo)航、演示導(dǎo)航和書簽導(dǎo)航[10]。金燕的博士論文“WWW信息導(dǎo)航機(jī)制研究”中總結(jié)了瀏覽器和網(wǎng)站提供的各種導(dǎo)航方法,包括支持直接搜索和頁面重訪的瀏覽器導(dǎo)航策略,從結(jié)構(gòu)、內(nèi)容和圖形化來實(shí)現(xiàn)導(dǎo)航的網(wǎng)站導(dǎo)航策略、面向用戶的個(gè)性化需求的“拉”、“推”式導(dǎo)航策略,并分析了用戶不同信息查詢行為的認(rèn)知過程、認(rèn)知負(fù)擔(dān)以及對導(dǎo)航支持的依賴程度,建議導(dǎo)航工具的設(shè)計(jì)者根據(jù)用戶查詢行為的特征提供不同的導(dǎo)航策略[11]。Cockburn 和Head 等外國學(xué)者研究認(rèn)為,網(wǎng)站瀏覽器、等級(jí)式內(nèi)容目錄和列表、搜索引擎、站點(diǎn)地圖、情景提示等是最重要的導(dǎo)航工具,它們也是導(dǎo)航策略[12][13]。Catledge 等人認(rèn)為瀏覽器是最基本的導(dǎo)航策略,它具備前進(jìn)、后退、歷史記錄、直接查詢和搜索、收藏夾等功能,可提供簡單的導(dǎo)航,特別是“后退”按鈕,占了導(dǎo)航使用中43%的導(dǎo)航份額;等級(jí)式內(nèi)容目錄和列表是基于分類思想的,受網(wǎng)站設(shè)計(jì)者的分類標(biāo)準(zhǔn)限制,用戶難以確定內(nèi)容的類目;搜索引擎受到檢索性能和排名算法影響,且存在詞匯控制問題。而站點(diǎn)地圖和情景提示會(huì)受用戶的使用習(xí)慣影響[14];趯(dǎo)航理論的研究,國內(nèi)外一些研究者提出或?qū)崿F(xiàn)了一些導(dǎo)航系統(tǒng)。國外的主要有:Cockburn 在其文章中介紹了一個(gè)擴(kuò)展導(dǎo)航功能的瀏覽器原型“WebNet”[26],Singer 和Pecatte 等人提出了一個(gè)多代理合作導(dǎo)航系統(tǒng) MAWA[27],Garg 等人提出了一個(gè)基于潛在語義技術(shù)的面向需求的環(huán)境內(nèi)容導(dǎo)航系統(tǒng)MediaCaddy,根據(jù)語義技術(shù)和本體技術(shù)不僅實(shí)現(xiàn)對元內(nèi)容資源的導(dǎo)航,而且可提供個(gè)性化服務(wù)[28]。1996 年盧增祥的碩士論文在分析搜索引擎技術(shù)內(nèi)容的基礎(chǔ)上,設(shè)計(jì)了一個(gè)使用網(wǎng)絡(luò)信息代理進(jìn)行網(wǎng)絡(luò)信息搜集、利用情報(bào)檢索技術(shù)進(jìn)行網(wǎng)絡(luò)信息查詢的網(wǎng)絡(luò)信息導(dǎo)航系統(tǒng)[29]。1997 年中經(jīng)網(wǎng)信息導(dǎo)航事業(yè)部利用超文本技術(shù)、依托CEInet 計(jì)算機(jī)網(wǎng)絡(luò)平臺(tái),研制出了 CEI 信息導(dǎo)航,為各級(jí)政府乃至全世界的網(wǎng)絡(luò)用戶提供免費(fèi)、快捷、方便的中國經(jīng)濟(jì)信息檢索手段[30]。于晏在其碩士論文中詳細(xì)闡述了Internet 信息導(dǎo)航系統(tǒng)的設(shè)計(jì)方案、算法、概念、主要技術(shù)、及實(shí)現(xiàn)方法[31]。朱江嶺等人則詳細(xì)說明了因特網(wǎng)信息導(dǎo)航系統(tǒng)的組成部分及需要解決的技術(shù)問題,并提出建立全國網(wǎng)絡(luò)導(dǎo)航體系和信息資源共享的構(gòu)想[32]。之后一些學(xué)者提出了基于某種技術(shù)建設(shè)網(wǎng)站導(dǎo)航系統(tǒng)的方法,包括基于信息地圖的可視化信息導(dǎo)航系統(tǒng)[33]、QUIC 智能超文本導(dǎo)航系統(tǒng)[34]、基于信息定制的信息導(dǎo)航系統(tǒng)[35]、基于用戶訪問序列聚類的網(wǎng)站導(dǎo)航系統(tǒng)[36]、基于信息構(gòu)建的電子商務(wù)網(wǎng)站導(dǎo)航系統(tǒng)[37]、基于序列模式的網(wǎng)站導(dǎo)航系統(tǒng)[38]。
導(dǎo)航模型方面,目前共有五種主要的導(dǎo)航模型,分別為:CoLiDeS 系列模型,2000 年Kitajima[42]等人推出 CoLiDeS——一個(gè)以理解為基礎(chǔ)的檢索關(guān)聯(lián)模型,CoLiDeS基于語義相似度、詞頻和文本匹配這三個(gè)因素來衡量特定的頁面與用戶目標(biāo)(信息氣味)之間的關(guān)聯(lián)性,語義相似度根據(jù)文字和文件之間的共現(xiàn)來計(jì)算,輔以潛在語義分析(LSA)這一算法,之后,Oostendorp 與Juvina[43]對該模型進(jìn)行了一些修正,引入“路徑充足”(導(dǎo)航路徑與用戶目標(biāo)間的語義相似度)這一概念來補(bǔ)充信息氣味,提出了網(wǎng)站導(dǎo)航的計(jì)算認(rèn)知模型CoLiDeS+,2012年Oostendorp[44]等人開發(fā)了考慮圖像內(nèi)容義信息的導(dǎo)航認(rèn)知模型CoLiDeS+Pic,新的模型建立在CoLiDeS模型基礎(chǔ)上,作者表明將用戶圖像信息的使用明確到模型中讓認(rèn)知導(dǎo)航模型更加完善;Pirolli 和 Fu 建立了模擬用戶執(zhí)行網(wǎng)頁任務(wù)的計(jì)算認(rèn)知模型SNIF-ACT(Scent-based Navigation and Information Foraging in theACT cognitivearchitec-ture),該模型預(yù)測導(dǎo)航選擇,即基于信息氣味預(yù)測下一步去哪里、何時(shí)停止(離開網(wǎng)站),信息氣味計(jì)算為基于詞的出現(xiàn)和共現(xiàn)的用戶目標(biāo)與鏈接文本之間的相互關(guān)聯(lián)性[45];Miller 與 Remington 提出的MESA(Method for EvaluatingSiteArchitectures)模型,該模型通過利用模擬用戶行為的信息導(dǎo)航計(jì)算模型來研究每個(gè)網(wǎng)頁的最佳選擇數(shù)量,通過改變鏈接標(biāo)簽的質(zhì)量發(fā)現(xiàn)最優(yōu)的信息結(jié)構(gòu)取決于標(biāo)簽的質(zhì)量[46];Marques 等人提出的 RED(Navigation Strategies Recognizer)模型,該模型介紹了一種識(shí)別用戶使用網(wǎng)站導(dǎo)航時(shí)的決策策略的方法,代理技術(shù)和解析算法是 RED的關(guān)鍵組件,基于用戶導(dǎo)航歷史來識(shí)別用戶策略,以此來評價(jià)網(wǎng)站的使用并為簡化交互提供建議[47];Vera Hollink 等人提出了探討鏈接結(jié)構(gòu)與導(dǎo)航可用性之間關(guān)系的導(dǎo)航行為模型,該模型包括一組關(guān)于用戶目標(biāo)和導(dǎo)航策略的明確假設(shè),用發(fā)現(xiàn)信息的數(shù)量(有效性)與找到信息所需時(shí)間(效率)這兩個(gè)指標(biāo)來明確導(dǎo)航過程的效用[48]。
[5] 金燕.WWW 信息導(dǎo)航機(jī)制研究[D]. 武漢大學(xué),2005.
[6] 金燕. 試論 WWW 信息導(dǎo)航的社會(huì)機(jī)制[J]. 現(xiàn)代情報(bào), 2007(9): 72-75.
[7] 王秀峰.Web導(dǎo)航中用戶認(rèn)知特征及行為研究[D]. 南京大學(xué), 2013.
[8] Wexelblat, A,. et al. Social navigation: what is it good for? (panel discussion)[C]. CHI’99
ExtendedAbstracts,ACM Conference on Human Factors in Computing Systems. 1999 May 15-20;
Pittsburgh, PA.NY:ACM; 1999: 89-90.
[9] Dieberger A. Social navigation--technique for building more usable systems[J]. Interaction,
2000(6): 36-45.
[10] 高尚. 基于超文本的學(xué)習(xí)模型及學(xué)習(xí)控制的研究[D]. 東北大學(xué), 2000.
[11] 金燕.WWW 信息導(dǎo)航機(jī)制研究[D]. 武漢大學(xué), 2005.
[12] Cockburn A. Which way now? Analyzing and easing inadequacies in WWW navigation[J].
Human Computer Studies, 1996(45): 105-129.
[13] Head M.,Archer N., YuanYF. World Wide Web navigation aid[J]. Human Computer Studies,
2000(53): 301-330.
[14] Catledge I., Pitkow J. Characterizing browsing strategies in the World Wide Web[J].
Computer Networks andISDN Systems, 1995(27): 1065-1073.
[15] David K. Farkas, Jean B. Farkas. Guidelines for designing web navigation[J]. Technical
Communication.2000,(3): 341-358.
[16] Susanne Jul, George W. Furnas. Navigation in Electronic Worlds: A CHI 97
workshop[EB/OL]. http://homepages.cwi.nl/~steven/sigchi/bulletin/1997.4/jul.html, 2014-12-25.
[17] 劉甲學(xué). 超媒體信息空間智能導(dǎo)航理論與實(shí)證研究[D]. 吉林大學(xué),2006.
[18] 詹姆斯·卡爾巴赫(James Kalbach).Web導(dǎo)航設(shè)計(jì)[M]. 北京: 電子工業(yè)出版社, 2009.
[19] 郭熙. 網(wǎng)站導(dǎo)航系統(tǒng)創(chuàng)意設(shè)計(jì)探究[D]. 南京藝術(shù)學(xué)院, 2010.
[20] 龔俊輝. 淺析網(wǎng)站建設(shè)中網(wǎng)絡(luò)導(dǎo)航形象識(shí)別系統(tǒng)的設(shè)計(jì)[J]. 美術(shù)大觀, 2004(1): 24-25.
[21] 李辛旺. 基于信息構(gòu)建理論的WEB導(dǎo)航系統(tǒng)視覺信息優(yōu)化設(shè)計(jì)[D]. 北京航空航天大學(xué),
2012.
[22] 詹晶晶, 黃慧琴, 劉沛芬. 網(wǎng)站導(dǎo)航欄設(shè)計(jì)的應(yīng)用心理[J]. 藝術(shù)與設(shè)計(jì)(理論),2010(12):
62-63.
[23] 滕廣青, 畢強(qiáng). 電子商務(wù)網(wǎng)站導(dǎo)航設(shè)計(jì)新理念:經(jīng)營目標(biāo)導(dǎo)向的以用戶為核心的電子商
務(wù)網(wǎng)站導(dǎo)航設(shè)計(jì)研究[J]. 圖書情報(bào)工作, 2009(20): 122-126.
[24] 陳子健, 孫禎祥. 從信息無障礙角度探討教學(xué)網(wǎng)站導(dǎo)航設(shè)計(jì)[J]. 中國醫(yī)學(xué)教育技術(shù),
2008(4): 311-314.
[25] 陳子健, 孫禎祥. 信息無障礙視角下網(wǎng)站的導(dǎo)航設(shè)計(jì)[J]. 圖書情報(bào)工作, 2008(9):6-8.
[26] Cockburn A. Which way now? Analyzing and easing inadequacies in WWW navigation[J].
Human Computer Studies, 1996(45): 105-129.
[27] Stinger N., Pecatte JM., Trouilhet S.. The multi-agent cooperative navigation system Mawa; a
model of dynamic knowledge specialization for a user-centric analyze of the Web[C].
International Conference on Computational Intelligence for Modeling, Control & Automation
Jointly with International Conference on Intelligence Agents, Web Technologies & Internet
Commerce.Vienna,AUSTRIA. NOV28-30, 2005: 289-294.
[28] Garg S, GoswamiA, Huylebroeck M. MediaCaddy - Semantic web based on-demand content
navigation system for entertainment[C]. 4th International Semantic Web Conference(ISWC2005).
Galway,IRELAND. NOV06-10, 2005: 858-871.
[29] 盧增祥. 網(wǎng)絡(luò)信息導(dǎo)航系統(tǒng)[D]. 清華大學(xué),1996.
[30] 佚名. CEI 信息導(dǎo)航的回顧與展望[J]. 信息經(jīng)濟(jì)與技術(shù). 1997(12): 46-48.
[31] 于晏. Internet 信息導(dǎo)航系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D]. 哈爾濱理工大學(xué), 1997.
[32] 朱江嶺, 趙淑君等. 因特網(wǎng)信息導(dǎo)航系統(tǒng)的建立與資源共享[J]. 電子出版, 2001(4):
32-34.
[33] 張錦, 傅辛等. 可視化 Internet 信息導(dǎo)航系統(tǒng)[J]. 計(jì)算機(jī)工程,2001(1): 99-101.
[34] 畢強(qiáng), 劉甲學(xué). QUIC——一個(gè)智能超文本導(dǎo)航系統(tǒng)[J]. 情報(bào)科學(xué), 2002(12):
1277-1281.
[35] 蔡建峰, 劉祎玎, 武立新. 基于信息定制的信息導(dǎo)航系統(tǒng)研究:以管理案例教學(xué)為例[J].
情報(bào)雜志, 2008(11):54-58.
[36] 王有為, 許博等. 基于用戶訪問序列聚類的網(wǎng)站導(dǎo)航系統(tǒng)[J]. 系統(tǒng)工程理論與實(shí)踐,
2010(7): 1305-1311.
[37] 余小鵬, 彭鴻儒. 基于信息構(gòu)建的電子商務(wù)網(wǎng)站導(dǎo)航系統(tǒng)研究[J]. 時(shí)代經(jīng)貿(mào), 2011(5):
50-51.
[38] 王有為, 張雯晶, 凌鴻. 基于序列模式的網(wǎng)站導(dǎo)航系統(tǒng)[J]. 系統(tǒng)管理學(xué)報(bào), 2012(5):
690-695.
[39] 康忠民. 網(wǎng)絡(luò)學(xué)術(shù)信息導(dǎo)航系統(tǒng)綜合評價(jià)指標(biāo)體系的研究及應(yīng)用[D]. 華中科技大學(xué),
2005.
[40] 劉甲學(xué). 超媒體信息空間智能導(dǎo)航理論與實(shí)證研究[D]. 吉林大學(xué),2006.
[41] Mohagag M.F., Graphics S.. The influence of hypertext linking structures on three efficiency
of information retrieval[J]. Human Factors, 1992(3): 351-367.
[42] Kitajima, M., Blackmon, M.H., Polson, P.G. A comprehension based model of web
navigation and its application to web usability analysis[A]. People and Computers XIV[C].
London:Springer,2000: 357-373.
[43] Oostendorp H. Van, Ion Juvina. Using a cognitive model to generate web navigation
support[J].International Journal of Human-Computer Studies, 2007:887-897.
[44] Oostendorp H. Van., Karanam S., Indurkhya B.. CoLiDeS+Pic: a cognitive model of web
navigation based on semantic information from pictures[J]. Behavior and Information Technology,
2012(31): 17-30.
[45] Peter Pirolli, Wai-Tat Fu. SNIF-ACT: a model of information foraging on the World Wide
Web[A].User Modeling 2003[C]. Heidelberg: Springer Berlin, 2003: 45-54.
[46] Craig S. Miller, Roger W. Remington. Modeling Information Navigation: Implications for
InformationArchitecture[J]. Human-Computer Interaction,2004(3): 225-271.
[47] Eduardo Marques, Ana Cristina Garcia, Inhaúma Ferraz. RED: A Model To Analyze Web
NavigationPatterns[EB/OL].http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.88.5075&rep=rep1&type=pdf.2014-12-25.
[48] Vera Hollink, Maarten van Someren, Bob J. Wielinga. Navigation behavior models for link
structure optimization[J]. User Modeling and User-Adapted Interaction,2007(4): 339-377.
D.用戶心智模型相關(guān)研究
心智模型的形成建立在人的有限理性[42]的理論基礎(chǔ)上,有限理性影響著個(gè)人認(rèn)知,這種有限理性主要表現(xiàn)在個(gè)人知識(shí)的局限性、不能完全做出準(zhǔn)確的預(yù)期以及行為受到限制,有限理性的存在使得個(gè)人在決策時(shí)需要依賴心理過程,這個(gè)過程就是心智模型,是解釋環(huán)境的內(nèi)部表征,是由人的認(rèn)知系統(tǒng)為應(yīng)對環(huán)境的不確定而創(chuàng)立[43]。心智模型與用戶認(rèn)知密切相關(guān),心智模型關(guān)注的是用戶心理認(rèn)知層面的內(nèi)容。 心智模型,又稱為心智模式、思維模型或心理模型等,由認(rèn)知心理學(xué)學(xué)者K.Craik(1943)首次提出,并認(rèn)為它真實(shí)存在于人們心中,能夠?qū)θ藗兠枋、解釋世界產(chǎn)生影響,對人們?nèi)绾尾扇⌒袆?dòng)的陳見、假設(shè)和印象產(chǎn)生影響[44]。心智模型是用戶對現(xiàn)有存在的思維方式與看法,受既有經(jīng)驗(yàn)的影響,具有相對持續(xù)的穩(wěn)定性[45]。后來,心智模型的研究逐漸從認(rèn)知心理學(xué)領(lǐng)域擴(kuò)展到情報(bào)學(xué)、計(jì)算機(jī)科學(xué)、經(jīng)濟(jì)學(xué)、管理學(xué)。
目前尚沒有關(guān)于心智模型的統(tǒng)一的定義。Johnson Laird將心智模型定義為:對世界的一種表征,人類系推理則是基于這種表征[46]。L.Wozny(1992)認(rèn)為心智模型包含陳述性知識(shí)和過程性知識(shí),這些知識(shí)都是依據(jù)歸類與關(guān)聯(lián)組織而形成的[47]。Rouse 和 Morris 認(rèn)為心智模型是一種心理機(jī)制,通過這種心理機(jī)制,人們可以對系統(tǒng)的目標(biāo)和形式進(jìn)行描述、對系統(tǒng)的功能進(jìn)行解釋、對系統(tǒng)的狀態(tài)和未來進(jìn)行觀察和預(yù)測[48],該定義揭示了心智模型的功用。白晨、甘立人等[49]認(rèn)為心智模型是個(gè)體理解和看待周圍事物的思維模型,將信息用戶的心智模型定義為用戶在個(gè)人知識(shí)基礎(chǔ)上,經(jīng)由檢索經(jīng)驗(yàn)和檢索過程學(xué)習(xí)而在腦海中形成的關(guān)于檢索策略的信念,用以指導(dǎo)未來的行為決策。
在信息檢索領(lǐng)域,Borgman是最早研究用戶心智模型的學(xué)者,采用實(shí)驗(yàn)的方法,以圖書館在線電子分類目錄用戶為實(shí)驗(yàn)對象,將用戶分成兩組,并分別給予不同的培訓(xùn),從而探索用戶的心智模型[50]。此后,國內(nèi)外學(xué)者們針對個(gè)研究對象從多個(gè)角度對用戶的心智模型進(jìn)行研究,其中研究對象主要有搜索引擎、數(shù)字圖書館、信息門戶網(wǎng)站、文獻(xiàn)數(shù)據(jù)庫、電子商務(wù)與電子政務(wù)網(wǎng)站等,而在具體的研究內(nèi)容上,主要集中在用戶心智模型的影響因素、構(gòu)成維度及測量、心智模型分類和動(dòng)態(tài)變化等方面。(1)信息用戶心智模型的影響因素。黃慕萱通過實(shí)驗(yàn)的方法發(fā)現(xiàn)學(xué)院、檢索經(jīng)驗(yàn)、年級(jí)、對主題的熟悉程度、檢索目的等均不會(huì)對心智模型產(chǎn)生影響[51]。Zhang Xiangmin 采用多因素方差分析法,得出教育和職業(yè)狀況、學(xué)術(shù)背景、計(jì)算機(jī)水平對文獻(xiàn)數(shù)據(jù)庫用心智模型有顯著影響[52]。Li Ping 以博士生為研究對象,得出在用戶使用網(wǎng)絡(luò)搜索引擎時(shí),僅僅認(rèn)知風(fēng)格因素與用戶心智模型的完備性有關(guān),即場獨(dú)立型風(fēng)格用戶的心智模型的完備性比場依存型風(fēng)格的用戶更高[53]。Zhang Yan 研究了外在情境因素對信息豐富網(wǎng)絡(luò)空間(information rich web space)用戶心智模型的影響,發(fā)現(xiàn)任務(wù)的復(fù)雜性間接影響用戶的心智模型[54]。(2)心智模型構(gòu)成維度及其測量研究。Borgman.C 和 Dimitroff A.通過開發(fā)用戶心智模型完備性量表,得出用戶心智模型由數(shù)據(jù)庫構(gòu)成和特征兩個(gè)維度構(gòu)成[50][55]。1997年,Saxon改編了Bimitroff的心智模型完善度量表,同時(shí)對用戶心智模型完備性量表的構(gòu)成維度進(jìn)行了修正,將用戶心智模型的構(gòu)成維度由兩個(gè)擴(kuò)展為數(shù)據(jù)庫結(jié)構(gòu)、搜索特征和交互層次三個(gè)維度[56]。Li Ping 以博士生為調(diào)查對象,測量出博士對于 Google 的心智模型有三個(gè)維度,分別是Google 的本質(zhì)特性、搜索特征和交互層次[53]。Zhang Xiangmin 利用凱利方格技術(shù)研究出用戶關(guān)于文獻(xiàn)數(shù)據(jù)庫的構(gòu)成維度由九個(gè)方面,分別是查詢的目的、功能和適用性,數(shù)據(jù)組織的適用性,瀏覽的目的和適用性,數(shù)據(jù)結(jié)構(gòu)的功能和適用性,文獻(xiàn)的功能[52],并基于這些維度研究了教育、母語、專業(yè)地位、學(xué)科、計(jì)算機(jī)經(jīng)驗(yàn)等用戶特征對心智模型的影響。Zhang Yan利用概念列表法和半結(jié)構(gòu)化訪談法抽取了醫(yī)學(xué)健康網(wǎng)站的用戶心智模型,并認(rèn)為該網(wǎng)站的用戶心智模型是由系統(tǒng)、系統(tǒng)內(nèi)容、信息組織和界面構(gòu)成[57]。 在用戶使用網(wǎng)站心智模型的測量方法上,李海濤、宋琳琳等[58]對用戶使用網(wǎng)站的心智模型測量的方法進(jìn)行了介紹,并提出卡片分類法是最適于記錄用戶關(guān)于網(wǎng)站的認(rèn)知信息,而路徑搜索法最適于測量網(wǎng)站用戶心智模型。 甘立人、白晨等將心智模型引入到信息用戶決策行為的研究過程中,認(rèn)為信息檢索中,用戶認(rèn)知偏差主要有信息偏差、感知偏差、“錨”定、習(xí)慣和保守,這都與心智模型相關(guān),分析了用戶心智模型構(gòu)成以及對決策行為的作用機(jī)制,采用實(shí)驗(yàn)的方法考察了心智模型對決策行為的影響效果[59],同時(shí)提出信息用戶的心智模型是由個(gè)人知識(shí)和信念構(gòu)成的[49]。 胡昌平、馬丹對信息用戶的心理過程、心智模型、心智模型表征、心智模型功能等進(jìn)行了分析,并闡述了基于 ZMET(隱喻抽取技術(shù))的心智模型構(gòu)建流程,以視覺隱喻和圖片想象為基礎(chǔ),結(jié)合方法-目的鏈理論,對信息用戶的心智模型的構(gòu)建進(jìn)行了研究[43]。 韓正彪[60][61]以綜合性文獻(xiàn)數(shù)據(jù)庫為研究實(shí)體,以大學(xué)生為調(diào)查對象,探索用戶心智模型,他首先通過概念列表法得出用戶心智模型由系統(tǒng)、系統(tǒng)內(nèi)容、系統(tǒng)內(nèi)容組織、系統(tǒng)界面和系統(tǒng)后臺(tái)五個(gè)維度組成,后有通過實(shí)證研究得出用戶心智模型由認(rèn)知、情感、策略三個(gè)層面和數(shù)據(jù)庫內(nèi)容認(rèn)知、常識(shí)認(rèn)知、檢索策略、用戶負(fù)面情感、用戶范圍評價(jià)、界面功能認(rèn)知、用戶動(dòng)機(jī)認(rèn)知等八個(gè)維度構(gòu)成,并分析了這些維度對用戶心智模型影響效應(yīng)的大小,發(fā)現(xiàn)對用戶心智模型直接效應(yīng)最大的是界面功能認(rèn)知和用戶負(fù)面情感。尤少偉,吳鵬等[62]以南京市政府網(wǎng)站旅游概念主題分類目錄為例進(jìn)行了實(shí)驗(yàn)研究,研究采用基于路徑搜索法定量測量用戶的心智模型,并對提出的假設(shè)進(jìn)行了驗(yàn)證。夏子然等[63]以中國制造網(wǎng)為例,使用心智模型完善度量表實(shí)驗(yàn)設(shè)計(jì),收集用戶在網(wǎng)絡(luò)信息檢索過程中的心智完善水平數(shù)據(jù)并進(jìn)行聚類分析,對用戶進(jìn)行探索性分類,并提出心智模型是一個(gè)相對持久的動(dòng)力系統(tǒng),這主要體現(xiàn)在兩個(gè)部分,第一是與檢索相關(guān)的個(gè)體知識(shí)背景,第二是對檢索方法的信念體系。因此,造成心智模型個(gè)體差異的兩個(gè)原因就是個(gè)人因素和個(gè)性因素,其中個(gè)體的教育背景、個(gè)人經(jīng)歷、工作環(huán)境等都是個(gè)人因素,而個(gè)體的性格特征屬于個(gè)性因素。(3)用戶心智模型對檢索績效的影響。心智模型是用戶信息行為產(chǎn)生的內(nèi)在機(jī)制,通過研究用戶心智模型對檢索績效的影響,可以更好地實(shí)現(xiàn)對心智模型的應(yīng)用。學(xué)者們普遍認(rèn)為,用戶心智模型對用戶檢索績效會(huì)產(chǎn)生影響,也即心智模型越完善,則用戶的檢索績效越高[55][64]。其中,韓正彪對 61 名大學(xué)生進(jìn)行試驗(yàn),得出網(wǎng)齡和認(rèn)知風(fēng)格是造成用戶心智模型不同的重要因素,但是性別、學(xué)科、年級(jí)、使用頻率、學(xué)習(xí)風(fēng)格等在用戶心智模型整體上沒有差異,只是在一些維度上會(huì)產(chǎn)生差異,同時(shí)他還發(fā)現(xiàn)用戶心智模型在用戶特征與用戶檢索績效之間存在中介效應(yīng),其中網(wǎng)齡起著完全中介效應(yīng),用戶認(rèn)知風(fēng)格起著部分中介效應(yīng)[65]。
[42] 赫伯特·西蒙.管理行為[M].北京:機(jī)械工業(yè)出版社,2007.
[43] 胡昌平,馬丹.基于 ZMET 的用戶心智模型構(gòu)建[J].情報(bào)科學(xué),2011(1):1-5.
[44] Craik K. The Nature of explanation[M]. Cambridge: Cambridge University
Press,1943.
[45] 宋琳琳,李海濤.近二十年來網(wǎng)絡(luò)用戶心智模型研究綜述[J].大學(xué)圖書情報(bào)學(xué)刊,
2016(2):100-112.
[46] Johnson-Laird P N. How we reason[J]. How We Reason, 2009.
[47] Wozny L A. Navigation in a metaphorical computer interface: A study of
analogical reasoning and mental models[D]. Philadelphia: Drexel University,1992.
[48] Rouse W B, Morris N M. On Looking into the Black Box: Prospects and Limits
in the Search for Mental Models[J]. Psychological Bulletin, 1985, 100(3):82.
[49] 白晨,甘利人,朱憲辰.基于信息用戶決策心智模型的實(shí)驗(yàn)研究[J].情報(bào)理論與實(shí)踐,
2009, 32(10):94-98.
[50] Borgman C L. The user's mental model of an information retrieval system:
effects on performance[D].USA: Stanford University,1984.
[51] 黃慕萱.影響個(gè)人心智模型之因素初探[J].(臺(tái)灣)圖書館資訊學(xué),2000,12(15):19-36.
[52] Zhang Xiangmin. A Study of the Effects of User Characters on Mental Models of Information Retrieval System [D]. Toronto : University of Toronto .1998.
[53] Li Ping. Doctor Students’ Mental Models of a Web Search Engine: An
Exploratory Study [D]. Montreal: McGill University,2007.
[54] Zhang Y. The impact of task complexity on people’s mental models of
MedlinePlus[J]. Information Processing & Management, 2012, 48(1):107-119.
[55] Dimitroff A. Mental models and error behavior in an interactive bibliographic
retrieval system [D].Alexanda: The University of Michigan,1990.
[56] SAXON. Seventh grade students and electronic information retrieval systems: an exploratory study of mental model formation, completeness and change[D].Scharlotte: The University of North Carolina,1997.
[57] Zhang Y. Dimensions and elements of people's mental models of an information-rich Web space[J]. Journal of the American Society for Information Science & Technology, 2010, 61(11):2206-2218.
[58] 李海濤,宋琳琳.用戶使用網(wǎng)站的心智模型測量方法的選擇及應(yīng)用[J].情報(bào)理論與實(shí)踐,
2015, 02:11-16.
[59] 甘利人,白晨,朱憲辰.信息用戶檢索決策中的心智模型分析[J].情報(bào)學(xué)報(bào),2010,
29:641-651.
[60] 韓正彪.基于訪談法的綜合性文獻(xiàn)數(shù)據(jù)庫用戶心智模型研究[J].圖書情報(bào)知識(shí),2014,
(1):90-96. [61] 韓正彪,許海云.我國綜合性文獻(xiàn)數(shù)據(jù)庫大學(xué)生用戶心智模型結(jié)構(gòu)測量實(shí)證研究[J].情報(bào)學(xué)報(bào),2014,33(7):740-751.
[62] 尤少偉,吳鵬,湯麗娟,等.基于路徑搜索法的政府網(wǎng)站分類目錄用戶心智模型研究——以南京市政府網(wǎng)站為例[J].圖書情報(bào)工作,2012,(9):129-135.
[63] 夏子然,吳鵬.基于心智模型完善度的信息檢索用戶心智模型分類研究[J].情報(bào)理論與實(shí)踐,2013,10:58-62.
[64] Chen H, Dhar V. User misconceptions of information retrieval systems[J]. Clinical Neurophysiology,2013,124(10):127–128.
[65] 韓正彪.綜合性文獻(xiàn)數(shù)據(jù)庫大學(xué)生用戶心智模型影響因素及效用分析:以 CNKI 為例[J].
圖書情報(bào)工作, 2014,58:81-91.
2.學(xué)術(shù)會(huì)議
(1)2015年11月25日-27日課題組成員參加由HACETTEPE UNIVERSITY信息管理學(xué)院、中山大學(xué)資訊管理學(xué)院在中國廣州共同舉辦的“第六屆變化世界中的信息管理國際學(xué)術(shù)研討會(huì)”(IMCW2015)。作為大會(huì)主要發(fā)言人以“ Content and Motivations for Citing Online Encyclopedia Resources among LIS Academic Publications”為題和以“Exploiting Task-functional Units Relationship in Support of Fine-grained Aggregated Search”進(jìn)行報(bào)告與交流。
(2)2014年11月24日-26日課題組成員參加由HACETTEPE UNIVERSITY信息管理學(xué)院在土耳其共同舉辦的“第五屆變化世界中的信息管理國際研討會(huì)”(IMCW2014)。作為大會(huì)主要發(fā)言人以“Research on the Measurement Method of the Event Theme Influence of Online Public Opinion”為題進(jìn)行報(bào)告與交流。
(3)2015年11月30日-12月2日課題組成員參加由東北師范大學(xué)在中國長春舉辦的第七屆信息資本、資產(chǎn)和信息倫理國際研討會(huì)。作為大會(huì)主要發(fā)言人以“聚合的概念與信息聚合模式研究The Research on the Concept of Aggregation and Aggregation Model”為題進(jìn)行報(bào)告與交流。
(4)2014年12月課題組成員參加由北京大學(xué)信息管理學(xué)系在中國北京舉辦的第六屆信息資本、資產(chǎn)和信息倫理國際研討會(huì)。
(5)2015年10月25日-27日課題組成員參加由武漢大學(xué)、全球頂尖信息學(xué)院聯(lián)盟iSchool、美國圖書情報(bào)學(xué)教育聯(lián)合會(huì)在中國武漢舉辦的第四屆中美數(shù)字時(shí)代圖書館學(xué)情報(bào)學(xué)教育國際研討會(huì)。作為大會(huì)主要發(fā)言人以“論大數(shù)據(jù)時(shí)代下的圖書情報(bào)學(xué)教育——基于iSchool院校“大數(shù)據(jù)”相關(guān)課程的調(diào)查及思考On LIS Education In the Era of Big Data-Based on the Investigation of “Big Data” related Courses in LIS School”為題進(jìn)行報(bào)告與交流。
3.學(xué)術(shù)交流
課題組專家所帶博士生分別參加吉林大學(xué)舉辦的2014年全國情報(bào)學(xué)博士生學(xué)術(shù)論壇、南開大學(xué)舉辦的2016年全國情報(bào)學(xué)博士生學(xué)術(shù)論壇,并在論壇上匯報(bào)宣讀論文成果。
③成果宣傳推介情況(成果發(fā)布會(huì)、《工作簡報(bào)》報(bào)送情況、國家社科基金專刊投稿及采用情況等);
無
④研究中存在的主要問題、改進(jìn)措施,研究心得、意見建議;
研究中存在的主要問題:課題研究進(jìn)度上,尤其是系統(tǒng)開發(fā)進(jìn)度比預(yù)期計(jì)劃要稍微落后、成果數(shù)量尤其是國際性頂尖刊物論文仍然不夠多、學(xué)術(shù)交流較多但是未建立密切、穩(wěn)定的國際合作關(guān)系。
改進(jìn)措施:面對課題研究中暴露出的問題,課題組成員以后將在課題研究中積極探索,突破難點(diǎn),推進(jìn)課題研究進(jìn)度,加大課題演技逇深度,針對具體問題進(jìn)行具體分析,計(jì)劃改進(jìn)的措施包括:按照用戶需求分析和模塊設(shè)計(jì)得到的原型系統(tǒng),組織人員加快系統(tǒng)開發(fā)的進(jìn)度;針對課題中遇到的理論和實(shí)踐問題,多渠道收集資料,提高理論水平和實(shí)際問題解決能力,盡量面向國際頂級(jí)期刊發(fā)表課題研究成果;逐步與國際組織和機(jī)構(gòu)建立穩(wěn)定、密切的合作關(guān)系。
研究心得:經(jīng)過將近三年半的課題研究,經(jīng)過不斷的深入調(diào)查研究,多次的交流探討,課題研究思路愈發(fā)清晰,并在實(shí)踐中不斷地修正和改進(jìn)得以順利推進(jìn)課題研究進(jìn)展。第一,我們認(rèn)識(shí)到課題研究中的團(tuán)隊(duì)合作與交流十分重要。每周一次或每兩周一次的例會(huì)以及主持人在例會(huì)上的點(diǎn)評與下一步研究計(jì)劃的安排,使得我們能明確自己各自的分工,相互配合與交流,使整個(gè)課題朝著一個(gè)正確的方向順利推進(jìn)和開展。第二,通過文獻(xiàn)閱讀追蹤最新學(xué)術(shù)動(dòng)態(tài),保持理論始終與實(shí)踐相結(jié)合。實(shí)踐問題的解決需要理論作為支撐,理論學(xué)習(xí)中文獻(xiàn)閱讀是必不可少的一項(xiàng)工作,通過選擇和閱讀頂級(jí)期刊文獻(xiàn),發(fā)現(xiàn)研究的新視角或切入點(diǎn),建立牢固的理論基礎(chǔ),以支撐實(shí)踐研究過程。第三,做好科研數(shù)據(jù)的共享與管理。為課題研究過程中產(chǎn)生的各種科研數(shù)據(jù)、成果、例會(huì)報(bào)告等資料建立共享資源池,一是可以最大化科研數(shù)據(jù)的重復(fù)利用,同時(shí)也可以避免開展重復(fù)工作,達(dá)到成員之間的資源共享。
二、研究成果情況
①代表性成果介紹
A.論文《知識(shí)圖譜研究的脈絡(luò)、流派與趨勢——基于SSCI與CSSCI期刊論文的計(jì)量與可視化》;
基本內(nèi)容和主要觀點(diǎn):知識(shí)圖譜作為快速興起和發(fā)展的跨學(xué)科研究領(lǐng)域,在國內(nèi)外不同學(xué)科間的發(fā)展軌跡、研究重點(diǎn)等方面總體上存在差異。適時(shí)梳理國內(nèi)外該領(lǐng)域發(fā)展歷史上的重要理論和技術(shù)發(fā)展軌跡,明晰核心人物和團(tuán)隊(duì),可為當(dāng)前和今后基于知識(shí)圖譜的可視化研究提供理論基礎(chǔ)。文章選取1998—2014 年間SSCI、CSSCI 中以知識(shí)圖譜為主題的期刊論文,以SATI、UCINET、NetDraw、CiteSpace 等為數(shù)據(jù)分析和可視化工具,通過時(shí)間分布揭示該領(lǐng)域發(fā)展的階段特征,通過節(jié)點(diǎn)性論文計(jì)算和高頻關(guān)鍵詞共現(xiàn)分析揭示該領(lǐng)域發(fā)展的內(nèi)容分布,從而厘清其發(fā)展脈絡(luò); 從學(xué)科分布、核心期刊和邊緣期刊的判別揭示該領(lǐng)域發(fā)展的跨學(xué)科概貌,通過核心作者綜合指數(shù)計(jì)算、合作分析和機(jī)構(gòu)分析揭示該領(lǐng)域研究的人物關(guān)系,厘清其發(fā)展流派。在此基礎(chǔ)上提出知識(shí)圖譜研究的弱化與主題的衍生、知識(shí)圖譜的跨學(xué)科研究與應(yīng)用和知識(shí)創(chuàng)造者的合作創(chuàng)新三個(gè)發(fā)展趨勢。
學(xué)術(shù)價(jià)值:該論文發(fā)表在圖書情報(bào)界影響因子最高的《中國圖書館學(xué)報(bào)》,并被人民大學(xué)《復(fù)印報(bào)刊資料》全文轉(zhuǎn)載。
B.論文《基于中文維基百科的領(lǐng)域概念相關(guān)性研究》
基本內(nèi)容和主要觀點(diǎn):以提高領(lǐng)域概念相關(guān)性判斷的準(zhǔn)確度為研究宗旨,提出綜合利用中文維基百科的分類體系結(jié)構(gòu)和概念釋義內(nèi)容進(jìn)行概念間語義相關(guān)度計(jì)算的方法。選取中文維基百科分類體系下的圖書情報(bào)領(lǐng)域的概念為實(shí)驗(yàn)對象,將基于分類信息和文本信息的加權(quán)算法與單獨(dú)基于分類信息的語義距離算法和信息量算法,以及基于文本信息的文本重疊算法進(jìn)行對比分析。實(shí)驗(yàn)結(jié)果表明: 加權(quán)算法能取得更好的效果,可為實(shí)現(xiàn)面向領(lǐng)域的信息檢索、領(lǐng)域本體構(gòu)建等應(yīng)用提供重要技術(shù)支持。
學(xué)術(shù)價(jià)值:該論文發(fā)表至今被引用1次。
C.論文《面向新型智庫建設(shè)的知識(shí)服務(wù):圖書情報(bào)機(jī)構(gòu)的新機(jī)遇》
基本內(nèi)容和主要觀點(diǎn):新型智庫建設(shè)是我國深化改革時(shí)期進(jìn)行科學(xué)決策的重要一環(huán),新型智庫的基礎(chǔ)資源是知識(shí)資源。圖書情報(bào)機(jī)構(gòu)作為存儲(chǔ)和傳播知識(shí)的媒介,在新型智庫建設(shè)中迎來了新的機(jī)遇,文章分析了圖書情報(bào)機(jī)構(gòu)服務(wù)新型智庫的可行性并提出了為其服務(wù)的五種基本途徑。
學(xué)術(shù)價(jià)值:該論文發(fā)表至今被引用2次。
D.論文《我國圖書情報(bào)領(lǐng)域研究者對網(wǎng)絡(luò)信息資源的利用分析》
基本內(nèi)容和主要觀點(diǎn):采用引文分析的方法,基于網(wǎng)絡(luò)信息資源聚合研究的展開要求,對特定領(lǐng)域研究者網(wǎng)絡(luò)信息資源的利用情況和需求進(jìn)行探討。首先,提出探究研究者網(wǎng)絡(luò)信息資源利用的網(wǎng)絡(luò)引文分析框架,框架從資源整體利用情況和以單篇論文為單位的個(gè)體利用情況兩個(gè)方面分析圖書情報(bào)領(lǐng)域研究者對網(wǎng)絡(luò)信息資源的利用情況。接著,參照框架對2010-2012年發(fā)表的圖書情報(bào)領(lǐng)域會(huì)議論文、期刊論文、博/碩士學(xué)位論文分開進(jìn)行計(jì)量分析,揭示其中主題分布、域名分布、類型分布、URL深度分布、研究者利用數(shù)量、利用類型、利用目的等的特征,總結(jié)圖書情報(bào)領(lǐng)域網(wǎng)絡(luò)信息資源利用的需求,得到對圖書情報(bào)領(lǐng)域網(wǎng)絡(luò)信息資源聚合研究的相關(guān)啟示。
學(xué)術(shù)價(jià)值:發(fā)表在《情報(bào)學(xué)報(bào)》,并被人民大學(xué)《復(fù)印報(bào)刊資料》全文轉(zhuǎn)載。
E.論文:《Efficient feature selection based on correlation measure between continuous and discrete features》
基本內(nèi)容和主要觀點(diǎn):The aggregated search, that assembles different types of content and granularities of retrieval in one interface, is regarded to be a new direction in web information retrieval . For the aggregation of multi genre type of web content can improve the recall rate while granularities of retrieval can improve the accuracy rate at the same time. However, there is no nified standard to classify the aggregated units for various genre types on the web today. How to organize various genre types of information in fine-grained level is still a question. With the purpose to organize different genres of web resources as aggregated units with thematic and functional relations, this study explores how to build a taxonomy of aggregated units for 3 kinds of web resources in discipline of Library and Information Sciences and how to apply it in information organization and visualization. This study can give reference to academic search engine or database design for multi genre information use in a fine-grained level.
學(xué)術(shù)價(jià)值:發(fā)表在SSCI期刊Information Processing Letters
F.論文:《A clustering-based feature selection via feature separability》
基本內(nèi)容和主要觀點(diǎn):With the extensive increase of the amount of data, such as text categorization, genomic microarray data, bioinformatics and digital images, there are more and more challenges in feature selection. Recently, feature selection has been widely studied in supervised learning, but there is significantly less work in unsupervised learning because of the absence of class information and explicit search criteria. In this work, we introduce a new measure to assess the importance of features in terms of feature separability. A clustering-based feature selection algorithm is then introduced to conduct the feature selection. The proposed algorithm with nearly linear time complexity selects final feature subset through a ranking procedure based on the separabilities of features and it is applicable to datasets of mixed nature. Experimental results on UCI datasets show that our method, by retaining relevant features, can obtain similar or even better results of classification and clustering for most datasets, and it outperforms other traditional supervised and unsupervised feature selection methods in terms of dimensionality reduction and classification accuracy.
學(xué)術(shù)價(jià)值:發(fā)表在SSCI期刊 Intelligent & Fuzzy Systems
課題組供稿