舊版網(wǎng)站入口

站內(nèi)搜索

祁瑞華:跨學(xué)科研究 典籍英譯海外評論挖掘的有效路徑

祁瑞華2020年05月13日14:08來源:中國社會科學(xué)報國家社科基金?

作者系國家社科基金項目“典籍英譯國外讀者網(wǎng)上評論觀點挖掘研究”負(fù)責(zé)人、大連外國語大學(xué)教授

典籍英譯是中國文化“走出去”的重要途徑,讀者評論是譯本被接受的最終標(biāo)準(zhǔn)。當(dāng)前典籍英譯讀者觀點挖掘的研究趨勢為:在讀者接受理論指導(dǎo)下,引入自然語言處理技術(shù)和文本挖掘技術(shù),擴(kuò)大讀者觀點研究的視野,通過互聯(lián)網(wǎng)環(huán)境獲取大規(guī)模評論語料,對評論觀點進(jìn)行自動挖掘和定量分析,梳理讀者評論關(guān)注的重點主題,以便系統(tǒng)深入發(fā)現(xiàn)有價值的觀點信息,為掌握讀者評論提供準(zhǔn)確可靠的數(shù)據(jù)分析。而綜合運用自然語言處理技術(shù)、機(jī)器學(xué)習(xí)方法和語義分析的跨學(xué)科研究,是典籍英譯觀點挖掘的有效途徑,具體實施路徑如下。

第一,構(gòu)建典籍英譯評論語料庫,擴(kuò)大讀者觀點研究視野。以美國和英國讀者的評論文本為主要研究對象,通過Amazon海外網(wǎng)站API接口收集評論語料,目前尚無典籍英譯圖書評論的標(biāo)準(zhǔn)實驗語料,運用自然語言處理技術(shù)進(jìn)行去停用詞和噪聲數(shù)據(jù)、詞性標(biāo)注等預(yù)處理,在上下文環(huán)境中進(jìn)行句子的句法分析、指代消解和省略恢復(fù),建立典籍英譯評論語料庫。

第二,抽取典籍英譯評論主題詞表和修飾語,梳理讀者評論的重點。針對網(wǎng)絡(luò)評論文本篇幅短小、特征稀疏等特點,通過依存句法分析和語義分析等技術(shù)提取主題詞和觀點詞的搭配關(guān)系,探究主題詞和修飾語的固定搭配組合模式,分析評論文本中隱含的評論主題,識別評論語料的文本模式,自動抽取評論中的顯性主題詞,如譯本的文體、結(jié)構(gòu)、語言風(fēng)格等,探究評論語料中未直接描述但可以通過語義推理得出的隱性主題詞。

語義分析和領(lǐng)域知識表示是提高網(wǎng)絡(luò)評論觀點挖掘精準(zhǔn)程度的關(guān)鍵。語義分析的基礎(chǔ)是詞匯表示,在情感詞匯極性分類任務(wù)中采用詞向量表示、前饋神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)等深度學(xué)習(xí)算法,有效提高了情感詞匯極性分析、語義分析等任務(wù)的準(zhǔn)確率。

引入領(lǐng)域知識庫分析上下文語境能夠理解讀者真正要表達(dá)的情感,完善領(lǐng)域知識庫的基本任務(wù)是知識圖譜補全,現(xiàn)有知識圖譜補全算法耗時長、準(zhǔn)確率有限,跨學(xué)科深度學(xué)習(xí)算法是解決這一問題的有效研究途徑。

第三,判別觀點情感極性,建立典籍英譯評論觀點摘要。評論情感極性判別是探究潛在觀點態(tài)度的關(guān)鍵步驟。從機(jī)器學(xué)習(xí)的角度看,情感極性識別可以看作多類別、單標(biāo)簽文本分類任務(wù)。機(jī)器學(xué)習(xí)分類算法結(jié)合情感詞典,能夠有效標(biāo)注觀點修飾語的情感極性,為定量研究典籍英譯讀者的正負(fù)面評論觀點提供客觀數(shù)據(jù);結(jié)合聚類算法可以發(fā)現(xiàn)評論主題間的內(nèi)在聯(lián)系和客觀規(guī)律;通過在語法層面進(jìn)行句法分析和模式挖掘分析表達(dá)讀者觀點的修飾語,能夠?qū)υu論觀點主題摘要及情感極性進(jìn)行精確分析;基于機(jī)器學(xué)習(xí)和情感詞典形成觀點主題摘要,探究蘊含網(wǎng)絡(luò)評論中潛在的觀點態(tài)度,能夠幫助譯者和出版社基于可信數(shù)據(jù)準(zhǔn)確掌握讀者對譯本的正負(fù)面評論。

第四,深度挖掘評論語義主題,獲取隱性讀者觀點。典籍英譯評論觀點挖掘既要從譯本風(fēng)格、用詞遣句等微觀層面考察,又要從全局把握觀點主題的內(nèi)在聯(lián)系和重要性排序。網(wǎng)絡(luò)評論噪聲大、表達(dá)方式隨意、語料規(guī)模大、觀點稀疏分散。為梳理讀者關(guān)注的重點,需要構(gòu)建深度語義挖掘的觀點主題模型,在語義層面揭示評論主題,將高維評論文本映射到低維主題空間,使其具有更好的可解釋性,從多維度分析挖掘隱含的有價值主題,結(jié)合領(lǐng)域知識,對抽取出的主題詞進(jìn)行分類,繪制主題詞共詞聚類圖譜,通過可視化的相似度映射技術(shù)和加權(quán)的模塊參數(shù)化聚類算法呈現(xiàn)海外讀者共同高度關(guān)注的主題類簇,結(jié)合知識網(wǎng)絡(luò)節(jié)點中心度呈現(xiàn)各個類簇中的關(guān)鍵主題詞,可以突破原有圖書評論主題抽取囿于主觀分析和小樣本數(shù)據(jù)的局限,從冗雜的評論信息中抽取句子覆蓋面更廣、主題詞匯多樣性更豐富的隱性知識。

第五,文本可視化分析,系統(tǒng)分析讀者評論觀點。整合觀點摘要中的顯性觀點和主題模型中的隱性觀點,根據(jù)語義上的等同、等級和相關(guān)關(guān)系,對主題詞進(jìn)行合并、上下位或相關(guān)關(guān)系的描述和表示;將主題詞按照重要性排序;匯總讀者對哪些譯者、譯本的哪些主題詞進(jìn)行對比;基于主題聚類視角對目前廣為接受的中國文化典籍譯本讀者評價進(jìn)行對比研究,挖掘典籍英譯作品暢銷的深層次原因;分析主題詞和修飾語情感極性的分布情況,了解國外讀者對特定譯者或譯本所持有的具體態(tài)度,為譯者和出版社進(jìn)一步了解讀者需求提供科學(xué)可靠的依據(jù)?蛇M(jìn)一步采用統(tǒng)計上浮原理以主題詞云方式顯示典籍英譯評論中頻繁使用的主題詞,并將匯總后的主題詞按照重要性排序。分析觀點主題之間的語義關(guān)系,對網(wǎng)絡(luò)評論中的顯式對比關(guān)系進(jìn)行語義描述,計算話題簇之間的相似度,基于深層次的語言分析對評估觀點進(jìn)行語義聚類,系統(tǒng)分析讀者評論觀點。

第六,適應(yīng)多語言跨領(lǐng)域環(huán)境,迎接國際化挑戰(zhàn);ヂ(lián)網(wǎng)的國際化特質(zhì)決定了在多語言、跨領(lǐng)域上下文環(huán)境下研究典籍英譯評論尤為重要,句法分析、情感極性判別等基本分析方法與語言環(huán)境問題領(lǐng)域高度相關(guān),不同領(lǐng)域數(shù)據(jù)的情感特征并不完全相同,在某一領(lǐng)域數(shù)據(jù)中訓(xùn)練的情感預(yù)測模型,通常不能直接用于其他領(lǐng)域。隨著用戶評論數(shù)量和各種領(lǐng)域數(shù)量的持續(xù)增加,對所有領(lǐng)域單獨訓(xùn)練模型需要消耗大量的時間和資源。

跨領(lǐng)域情感分類通過相關(guān)源領(lǐng)域的知識改進(jìn)目標(biāo)領(lǐng)域,具體實現(xiàn)通過相近領(lǐng)域遷移學(xué)習(xí)或者領(lǐng)域適配模型,例如用圖書評論領(lǐng)域已標(biāo)注評論得到的情感分類器,遷移或者適配到數(shù)字視頻光盤領(lǐng)域,節(jié)省該領(lǐng)域評論的標(biāo)注時間和資源。評論情感在不同領(lǐng)域通常存在特征漂移問題,在書籍領(lǐng)域常用“可讀性強”“有思想”等表達(dá)積極情感,用“平淡”“無情節(jié)”等表示消極情感;而在數(shù)字視頻光盤領(lǐng)域,通常用“清晰度高”“光滑”等表示積極情感,用“模糊”“有劃痕”等表示消極情感。由于領(lǐng)域之間的差異,在源領(lǐng)域中訓(xùn)練的情感分類模型,在直接應(yīng)用于目標(biāo)領(lǐng)域時往往表現(xiàn)不佳。采用基于深度學(xué)習(xí)的方法,可以為跨領(lǐng)域環(huán)境下的情感特征漂移問題提供解決方案,需要解決的難點是如何處理語義豐富的評論短文本。

跨語言情感分析是利用源語言文本對目標(biāo)語言文本進(jìn)行情感傾向分析,具體實現(xiàn)可通過基于資源遷移和基于聯(lián)合學(xué)習(xí)的方法。資源遷移方法由于語言語料標(biāo)注體系各異而難以實施,基于聯(lián)合學(xué)習(xí)方法主要依賴機(jī)器翻譯,受翻譯結(jié)果質(zhì)量影響較大。近年,深度學(xué)習(xí)成為跨語言情感分析研究的熱點,目前主要圍繞粗粒度層面,跨語言細(xì)粒度情感分析需要進(jìn)一步研究。

(責(zé)編:孫爽、程宏毅)
石棉县| 闸北区| 建平县| 休宁县| 溧阳市| 凤城市| 乌鲁木齐市| 宣化县| 堆龙德庆县| 麻江县| 博野县| 拜泉县| 娱乐| 河曲县| 盱眙县| 高雄市| 梅河口市| 祁连县| 图们市| 澎湖县| 土默特左旗| 成都市| 临高县| 嘉善县| 凤庆县| 台前县| 青海省| 资讯 | 甘德县| 邯郸县| 措勤县| 克东县| 大同县| 定边县| 来凤县| 时尚| 金堂县| 旅游| 遂川县| 龙陵县|