伴隨電子商務的飛速發(fā)展與社交媒體的廣泛應用,商品、交易、新聞、評論、用戶等社會化大數(shù)據(jù)呈爆炸式增長。海量的網(wǎng)絡用戶、巨大的市場規(guī)模,在促進經(jīng)濟與社會迅猛發(fā)展的同時,也帶來了新的挑戰(zhàn)。一方面,面對海量交易信息以及文本、圖片、視頻等復雜信息,信息超載問題日益突出,嚴重制約了市場相關(guān)參與主體的目標達成;另一方面,盡管當前信息傳播的多元化、智能化推動了網(wǎng)絡內(nèi)容的多樣化、情感化與信息共享的便捷化、普惠化,但面對全球各種思想文化交流交融交鋒的復雜情景以及商業(yè)網(wǎng)絡平臺存在的逐利現(xiàn)象,一些違背主流價值導向的網(wǎng)絡內(nèi)容甚至是低俗信息在網(wǎng)絡傳播中的存在,對社會穩(wěn)定和有效治理形成挑戰(zhàn)。在此背景下,從技術(shù)層面解決信息超載問題,并通過信息定向引導構(gòu)建良好的信息環(huán)境,成為應對挑戰(zhàn)的關(guān)鍵要素,而科學有效的社會化推薦對于解決上述問題具有重要現(xiàn)實意義。
傳統(tǒng)推薦方法在大數(shù)據(jù)時代面臨瓶頸
推薦研究可追溯到1992年美國施樂公司帕克研究中心研發(fā)的郵件過濾系統(tǒng)Tapestry。面對大量電子郵件,人們迫切需要高效的文件管理技術(shù)提升工作效率,而Tapestry的誕生滿足了這一需求。20世紀90年代末,作為亞馬遜網(wǎng)站核心競爭優(yōu)勢的人工書目推薦團隊,設立了《亞馬遜的聲音》欄目,成功提升了書籍的銷售業(yè)績;而后,基于客戶歷史偏好信息與商品的相似性,亞馬遜公司又推出了新的推薦技術(shù),帶來了遠高于人工推薦團隊的經(jīng)濟價值,其銷售貢獻達到亞馬遜網(wǎng)站的30%。2009年以來,伴隨社交媒體的發(fā)展,好友推薦技術(shù)成為臉譜、推特等社交平臺用戶規(guī)模擴張與保持用戶黏性的重要法寶。近年來,隨著人工智能的快速發(fā)展,深度學習技術(shù)極大推動了推薦研究的發(fā)展,并成為國際商業(yè)公司的重要推薦方法。
在中國電子商務產(chǎn)業(yè)發(fā)展進程中,電商平臺高度重視推薦系統(tǒng)的研發(fā)。例如,淘寶推薦系統(tǒng)涵蓋了諸如商品詳情、購物車等近百個不同的推薦應用場景;京東推薦系統(tǒng)基于用戶偏好、長短期行為以及地域三類召回模型構(gòu)建候選商品數(shù)據(jù)庫,并應用排序模型生成商品推薦列表。電商平臺推薦系統(tǒng)的應用,實現(xiàn)了從傳統(tǒng)的“千人一面”界面到“千人千面”界面的轉(zhuǎn)變,極大促進了經(jīng)營業(yè)績的提升。在新聞、娛樂等領域,推薦系統(tǒng)也已成為面向文本、圖片、視頻等多源異構(gòu)內(nèi)容傳播與推送的核心途徑,并推動了新興媒體的發(fā)展。
面對廣泛而深度的應用市場,全球眾多研究機構(gòu)、高校的科研團隊圍繞推薦方法開展了持續(xù)深入的研究,基本形成了基于內(nèi)容的推薦、協(xié)同過濾推薦、混合推薦三大類劃分,并針對冷啟動、可解釋性、結(jié)果評價等系列問題開展了進一步探索?茖W研究與市場應用的交叉創(chuàng)新,推動了推薦系統(tǒng)的發(fā)展。當前,我國網(wǎng)民規(guī)模已超過8億,電商平臺與社交媒體正在深刻改變?nèi)藗兊纳罘绞。面對海量、異?gòu)社會化大數(shù)據(jù)的復雜情境,一方面,在推薦方法的科學研究層面,推薦場景的復雜性與動態(tài)性為我們帶來了新的決策困難;另一方面,如何通過信息技術(shù)的創(chuàng)新實現(xiàn)對信息定向傳播的引導、優(yōu)質(zhì)內(nèi)容的推薦,弘揚正能量,是擺在我們面前更為重要的挑戰(zhàn)。
計算社會科學為完善推薦方法提供新視角
傳統(tǒng)推薦方法基于用戶的歷史評分數(shù)據(jù)構(gòu)建行為偏好模型進而生成推薦方案,但受地域、情感等多維因素的影響,推薦效果受到明顯制約。隨著社交媒體的廣泛應用,復雜的社交行為催生了用戶群體的社會化網(wǎng)絡。社會化網(wǎng)絡環(huán)境下,人們的通信、交通、交易甚至是瀏覽數(shù)據(jù)被完整記錄與存儲,海量的“數(shù)字腳印”繪制成包含多維信息的個人畫像、群組畫像以及群體網(wǎng)絡拓撲圖。在社會化網(wǎng)絡中,不同的子群體形成了橫向結(jié)構(gòu),不同的社會角色形成了縱向結(jié)構(gòu),而子群體內(nèi)部的個體關(guān)系、子群體之間的行為差異、不同角色之間的結(jié)構(gòu)均衡則影響著社會化網(wǎng)絡的穩(wěn)定和演變。事實上,子群體內(nèi)部個體之間的鏈接關(guān)系反映了相近的偏好,不同子群體的行為差異反映了群組的偏好特征;诰W(wǎng)絡子群體的特征分析,社會化網(wǎng)絡研究已廣泛應用于經(jīng)濟學、管理科學、歷史學、哲學、新聞傳播學等社會科學領域,并推動了計算機科學的發(fā)展。
2009年,來自于信息科學、經(jīng)濟學、管理科學、社會學、政治學、歷史學等不同領域的全球15位頂尖學者在《科學》雜志上提出了“計算社會科學”的概念,他們認為計算社會科學這門新的學科可為人類社會復雜規(guī)律的分析與挖掘提供新的研究范式。近年來,伴隨社會化網(wǎng)絡的日益復雜,計算社會科學領域的研究成果逐步涌現(xiàn)。從推薦方法現(xiàn)有的研究瓶頸來看,冷啟動、可解釋性、結(jié)果評價等仍然是其面臨的主要挑戰(zhàn),而立足于社會化大數(shù)據(jù)分析的計算社會科學,將為推薦理論與方法體系的發(fā)展完善提供一個新的研究方向。
社會化推薦應關(guān)注價值觀塑造與知識傳播
與傳統(tǒng)推薦方法相比,社會化推薦優(yōu)勢顯著。面向個體用戶,海量社會化大數(shù)據(jù)引入了用戶關(guān)系、用戶交互行為等信息以及跨領域的多維度信息,而用戶交互行為以及跨領域信息的融合可有效應對冷啟動、可解釋性的挑戰(zhàn),也有利于實現(xiàn)推薦結(jié)果的多樣性。而且,社會化信息的融合實現(xiàn)了日益精準的興趣建模,極大推動了“量身定制”的個性化推薦。面向群組用戶,在社會化網(wǎng)絡中,頻繁的用戶交互行為引致網(wǎng)絡社區(qū)不斷涌現(xiàn),如學術(shù)交流群組以及諸多公共服務均表現(xiàn)出典型的群組特性,社會化網(wǎng)絡大數(shù)據(jù)為群組相似性偏好、差異性偏好、群體偏好集結(jié)提供了天然的基礎數(shù)據(jù)支撐。如此,社會化推薦有助于增強用戶黏性,促進企業(yè)經(jīng)營業(yè)績的增長。但與此同時,如果社會化推薦仍與傳統(tǒng)推薦方法一樣,為產(chǎn)品營銷所驅(qū)動,則會帶來顯而易見的弊端。對個體用戶而言,個性化推薦的信息同質(zhì)性問題會誘導出“信息繭房”效應,進而引發(fā)個體偏執(zhí)、極端甚至個體社會化屬性的衰退;對群組用戶而言,“信息繭房”效應的蔓延將引致群體的觀點同質(zhì)、行為同質(zhì)、偏好同質(zhì),在社會重大問題或熱點問題中極易引發(fā)輿情極化行為,進而影響社會穩(wěn)定和經(jīng)濟發(fā)展。
有鑒于此,社會化推薦更應關(guān)注價值觀塑造與知識的傳播。具體而言,面向個體用戶,社會化推薦應立足于社會化大數(shù)據(jù)的多維度信息優(yōu)勢,通過個體社交大數(shù)據(jù)的有效挖掘,精準判斷個體的價值傾向與興趣偏好,有效表達用戶的多元化需求,基于社交影響力與興趣建模實現(xiàn)面向個體的價值引導,挖掘新穎性產(chǎn)品或信息,實現(xiàn)推薦結(jié)果的多樣化。面向群組用戶,社會化推薦應著眼于社會化網(wǎng)絡中橫向結(jié)構(gòu)群體之間的偏好差異、縱向結(jié)構(gòu)群體之間的外部關(guān)聯(lián),通過融合網(wǎng)絡結(jié)構(gòu)與多源數(shù)據(jù)信息,準確判斷建模群組的價值傾向、行為偏好與群組個體的影響力,實現(xiàn)面向群組的主流價值信息定向傳播,規(guī)避“信息繭房”效應。唯有如此,社會化推薦才能在深度挖掘用戶興趣偏好與價值傾向的同時,實現(xiàn)推薦精度的提升與主流價值的定向引導。
(作者:宋鵬、梁吉業(yè),分別系山西大學MBA教育中心執(zhí)行主任;山西大學副校長、計算智能與中文信息處理教育部重點實驗室主任)