北京航空航天大學(xué)衛(wèi)乃興主持完成的國家社會科學(xué)基金項目《基于大型可比語料庫的中國學(xué)者(科學(xué)家)學(xué)術(shù)英語現(xiàn)狀研究》(項目批準(zhǔn)號為:13BYY074),最終成果為同名專著。課題組成員有:高霞、何宇茵、張毓、楊越森、王冰昕、張磊、高歌、楊晨姣。
一 研究的目的和意義
(一)研究目的
(1)通過大型中西學(xué)者學(xué)術(shù)英語可比語料庫的建設(shè)和探索,從多視角定量、定性描述、探討中國學(xué)者學(xué)術(shù)英語的詞匯—語法特征、話語策略、話語行為與意義方式,凸顯其不同于西方學(xué)者文本的顯著性差異特征。(2)探索可比語料庫建設(shè)的技術(shù)方案優(yōu)化與改進(jìn);嘗試開發(fā)新的短語單位自動認(rèn)定技術(shù)和學(xué)術(shù)文本“局部語法”、“語義序列”研究分析技術(shù),為研究意義單位提供堅實的技術(shù)與數(shù)據(jù)支撐。
(二)研究意義
該成果基于數(shù)據(jù)開展中國學(xué)者學(xué)術(shù)英語現(xiàn)狀研究,發(fā)現(xiàn)了不同于以往研究結(jié)論的重要內(nèi)容及底層制約機制,豐富或重構(gòu)ESP及相關(guān)領(lǐng)域的某些描述體系,完善有關(guān)理論表述。項目所開展的系列研究為重新審視和探討話語策略和話語行為提供了新的觀察視角和方法路徑。這對學(xué)術(shù)英語能力的多層面評估與衡量,對我國的英語教育、ESP教育決策可提供有價值的反饋和參照。
二 成果的主要內(nèi)容和重要觀點或?qū)Σ呓ㄗh
(一)主要內(nèi)容
1.建設(shè)了一個截至目前國內(nèi)最大容量的中外學(xué)術(shù)英語可比語料庫Bei-jingCARE(Beijing Collection of Academic Research Essays)
該庫由“中國學(xué)者論文庫”和“西方學(xué)者論文庫”兩大子庫組成,涵蓋自然科學(xué)、工程學(xué)科、生命與醫(yī)學(xué)、人文與社會科學(xué)四大領(lǐng)域內(nèi)共23個學(xué)科的學(xué)術(shù)論文。于2015年初步建成,并逐年持續(xù)更新至今。Beijing CARE語料庫所含文本均為2000~2017年各學(xué)科影響因子較高的國際學(xué)術(shù)期刊所發(fā)表的西方國家學(xué)者和中國學(xué)者的論文,所選期刊總計150種。全庫共計收錄6155篇論文,總庫容為33415707形符、276129類符。其中,西方學(xué)者子庫包含3918個文本,總形符22671866詞次、類符171656詞,標(biāo)準(zhǔn)類符/形符比率為35.51%;各學(xué)科子庫庫容在975649形符到998532形符之間。中國學(xué)者論文庫共收錄2237個文本,包含10743841形符、104473類符,標(biāo)準(zhǔn)類符/形符比率為33.29%;各學(xué)科子庫庫容在459334形符到488420形符之間。中國學(xué)者論文的第一作者均來自中國大陸,西方學(xué)者論文庫第一作者來自英語內(nèi)圈國家,包括英國、美國、加拿大、澳大利亞和新西蘭。
2.語料加工
對語料進(jìn)行了適用于不同目的的多種加工與標(biāo)注。對全部文本進(jìn)行了元信息標(biāo)注和詞類信息賦碼,獲得了POS(part of speech)tagged語料庫。并對部分語料進(jìn)行句法分析和語篇特征標(biāo)注。
3.短語序列計算工具開發(fā)與數(shù)據(jù)庫建設(shè)
開發(fā)了新一代的短語序列計算工具(New MI等),用于學(xué)術(shù)英語短語的自動識別、提取。我們綜合多種計算技術(shù),包括頻數(shù)、內(nèi)部聯(lián)結(jié)力(in-ternal association)、邊界熵(boundary entropy)等,突破了傳統(tǒng)互聯(lián)網(wǎng)信息只能計算二元序列的限制,實現(xiàn)了基于多種統(tǒng)計手段的短語序列提取方法,并研制開發(fā)了相應(yīng)的系統(tǒng)。實驗結(jié)果表明,該系統(tǒng)能夠在普通計算機上支持千萬詞級規(guī)模的大型語料庫運算,并能顯著提高短語序列的提取質(zhì)量。在此基礎(chǔ)上,我們提取了大量的n元序、短語單位、常用型式,形成了豐富的學(xué)術(shù)英語數(shù)據(jù)資源。對學(xué)術(shù)英語研究、學(xué)術(shù)話語分析的方法論建設(shè)做了有益的建設(shè)性工作。
4.嘗試開發(fā)了適用于學(xué)術(shù)英語研究的“局部語法”(local grammar)、語義序列(semantic sequence)等分析技術(shù)
形成了分析學(xué)術(shù)文本意義方式、話語策略、態(tài)度意義的新的分析框架和視角。對開辟新的研究方向具有一定的引領(lǐng)作用。
(二)重要觀點
基于Beijing CARE語料庫,我們對中西學(xué)者論文的高頻短語序列、共選形式、局部功能和局部語法特征進(jìn)行了系統(tǒng)的跨文化群體、跨學(xué)科對比分析,主要發(fā)現(xiàn)包括以下三個方面。
1.局部功能
不同于傳統(tǒng)研究所述語言系統(tǒng)層級上的抽象/泛化功能,局部功能是有限類別文本或局部語境下的具體話語行為。局部功能不直接相關(guān)于語言系統(tǒng),而與局部文本環(huán)境下的語言共選形式緊密相連。局部功能探索是將功能研究引向深入,增強了描述詳盡性和解釋詳盡性。我們通過縝密檢查高頻詞語共選形式,發(fā)現(xiàn)了中國學(xué)者論文的一系列局部功能,如概指名詞(general nouns)形式的局部功能有“呈現(xiàn)當(dāng)前研究”、“報道結(jié)果/發(fā)現(xiàn)”、“提出方法”、“評價方法”、“表述效應(yīng)”、“時間/條件定位”等;動詞模糊語序列的局部功能有“解釋數(shù)據(jù)”、“表述聲言”、“驗證模型/理論”、“推理”、“轉(zhuǎn)述”等。
2.局部語法
不同于傳統(tǒng)語言學(xué)描述的通用語法,局部語法是關(guān)于有限類別文本或受限意義下語言使用規(guī)律描寫的一條新路徑;局部語法不直接相關(guān)于語言系統(tǒng),而是對具體語境下意義/功能實現(xiàn)方式的結(jié)構(gòu)化。我們建構(gòu)了適用于學(xué)術(shù)話語研究的局部語法分析框架。如“評價局部語法”的構(gòu)架包括:(1)評價形式(evaluative pattern);(2)功能范疇(functional category);(3)語義參量(semantic parameter);(4)局部語法形式(local grammar pattern);(5)特征性局部語法形式(characteristic local grammar pattern)。以此對比分析了中西法律學(xué)者的評價局部語法異同,發(fā)現(xiàn)中國學(xué)者的局部語法形式頻數(shù)顯著低于西方學(xué)者,且多聯(lián)結(jié)于最高頻的n v-link ADJ to-inf.形式,揭示其評價意義表達(dá)方式十分局限。兩組學(xué)者局部語法形式中的語義參量有著明顯差異:西方學(xué)者趨于評價與外部物質(zhì)世界相關(guān)的命題與對象;中國學(xué)者更關(guān)注與自身經(jīng)驗密切相關(guān)的事物以及語內(nèi)對象(discourse-internal object);等等。母語文化的認(rèn)識論、傳統(tǒng)修辭習(xí)慣影響、有限的二語英語水平制約是位于深層的制約因素。
3.話語策略
話語策略是成熟社團(tuán)成員在論文中使用的有效構(gòu)建知識、傳播信息的方法和手段。我們基于動詞模糊語序列的研究發(fā)現(xiàn),中國學(xué)者常用四種學(xué)術(shù)話語策略:準(zhǔn)確表述策略(accurate presentation strategy)、共識策略(consensus-seeking strategy)、聲言責(zé)任策略(claim commitment strategy)和介入策略(engagement strategy)。準(zhǔn)確表述策略與論文的客觀性知識緊密聯(lián)系,用于方法描述、數(shù)據(jù)呈述、結(jié)果報道;聲言責(zé)任策略緊密聯(lián)系于數(shù)據(jù)解釋和觀點表述;共識策略和介入策略面向讀者和話語社團(tuán),旨在與同行溝通,引導(dǎo)讀者解讀數(shù)據(jù)。四種策略交替使用、相輔相成,旨在構(gòu)建合格專業(yè)知識、明確個人貢獻(xiàn)且降低責(zé)任風(fēng)險,以及贏得社團(tuán)成員認(rèn)可。
4.意義方式
對中西學(xué)者學(xué)術(shù)論文中高頻it評價形式的對比研究表明,兩組學(xué)者共享4個特征性it形式。但是,除it v-link ADJ fornto形式外,中國學(xué)者的其他形式頻數(shù)均顯著低于西方學(xué)者,表明他們表達(dá)主觀態(tài)度意義的能力較弱。兩個群體所用it形式的語義分布差異顯著。中國學(xué)者尤其不善于評價事件或命題的重要性和似然性。中國學(xué)者趨于使用形式表達(dá)命題或事件的難易度和確定性意義,而西方學(xué)者趨于表達(dá)重要性和似然性意義。對N that-cl形式的對比研究表明,西方學(xué)者重視研究過程,包括觀點分析及邏輯推理,而中國學(xué)者更重視研究結(jié)果。這些區(qū)別反映了兩組學(xué)者“經(jīng)常述說之事”不同、站位與價值觀不同,亦即意義方式不同。
5.認(rèn)識論與文化制約
認(rèn)識論、母語文化、學(xué)科文化是學(xué)術(shù)語言使用的重要制約因素。中國學(xué)者的獨特用法形式可追溯至母語文化認(rèn)識論、傳統(tǒng)修辭習(xí)慣、二語英語水平制約?鐚W(xué)科對比分析則表明,學(xué)科認(rèn)識論與學(xué)科文化是學(xué)術(shù)話語特征的底層制約。純理型硬學(xué)科、應(yīng)用型硬學(xué)科、純理型軟學(xué)科及應(yīng)用型軟學(xué)科論文中的分布數(shù)據(jù)和意義表達(dá)折射出各自典型的知識結(jié)構(gòu)、知識發(fā)展與構(gòu)建方式、研究客體的不同特征,等等。具體而言,軟硬學(xué)科的對比:知識的結(jié)構(gòu)特征(原子型vs整體型)、知識發(fā)展方式(累積型vs迭代型)、知識構(gòu)建方式(實驗vs論述)、研究客體(自然物體/規(guī)律vs社會現(xiàn)象/概念)等制約了作者的形式選擇。如硬學(xué)科通過科學(xué)觀察與實驗構(gòu)建知識,因而趨于使用it v-link ADJ to,以對特定的研究活動或方法做出評判;軟學(xué)科主要依靠闡釋與論述構(gòu)建知識,故更傾向于使用it v-link ADJ that,從而易于評價命題信息。純理學(xué)科側(cè)重邏輯論證與理論分析,同樣頻繁使用it v-link ADJ that;應(yīng)用學(xué)科強調(diào)對接現(xiàn)實需求,則更趨于使用itv-linkADJfornto。由此,認(rèn)識論與學(xué)科文化制約著話語行為和意義方式,具有相同或相似認(rèn)識論的學(xué)科往往具有相似的形式使用趨勢。
三 成果的價值
該項目的研究成果具有較高的學(xué)術(shù)價值與應(yīng)用價值。其學(xué)術(shù)和應(yīng)用價值在于:(1)嘗試性使用了“局部功能”和“局部語法”的概念和分析框架,從新的視角和層面探討學(xué)術(shù)論文的意義方式、話語策略、話語行為及結(jié)構(gòu)特征,發(fā)現(xiàn)了大量新的語言事實和語言形式。對以往的普通語法研究和一般功能研究形成互補。這應(yīng)當(dāng)是國內(nèi)學(xué)界首個系統(tǒng)探索局部功能和局部語法的實證研究,有望引領(lǐng)、發(fā)展新的研究方向。(2)關(guān)于學(xué)術(shù)論文意義方式、話語策略、知識構(gòu)建方式的探索都是本領(lǐng)域比較新穎的探索話題和分析角度,對(學(xué)術(shù))話語分析下一步的發(fā)展走向具有啟示和建設(shè)性作用。(3)該成果開發(fā)的學(xué)術(shù)英語短語序列計算與自動提取工具(New MI等)極大地提高了數(shù)據(jù)提取的準(zhǔn)確率和召回率,對短語計算具有實用價值。(4)所進(jìn)行的學(xué)術(shù)論文跨文化群體、跨學(xué)科對比研究及其數(shù)據(jù)發(fā)現(xiàn)對外語教學(xué),尤其是學(xué)術(shù)英語寫作教學(xué)提供有益反饋和參照,具有現(xiàn)實的指導(dǎo)意義。