舊版網(wǎng)站入口

站內(nèi)搜索

“現(xiàn)代漢語計(jì)量語言學(xué)研究”中期檢查報(bào)告

2014年02月21日08:59來源:全國哲學(xué)社會(huì)科學(xué)工作辦公室

一、研究計(jì)劃總體執(zhí)行情況及各子課題進(jìn)展情況

1. 研究計(jì)劃總體執(zhí)行情況

自立項(xiàng)以來,課題組積極、認(rèn)真開展研究活動(dòng)。截止到2013年8月,基本完成了本時(shí)間段原定的研究計(jì)劃。具體來說,(1)完成了用于開展研究的“多語體現(xiàn)代漢語語料庫”“漢語歷時(shí)語料庫”“漢英平行語料庫”“依存語法樹庫”“漢語(句法)網(wǎng)絡(luò)”等語言數(shù)據(jù)資源庫的構(gòu)建和部分?jǐn)?shù)據(jù)統(tǒng)計(jì)、分析工作;(2)完成了大量文獻(xiàn)調(diào)研工作,尤其是計(jì)量語言學(xué)重要文獻(xiàn)的收集整理、翻譯、校訂等,已完成兩部譯著;(3)設(shè)計(jì)并實(shí)施了多種共計(jì)近1500人次的心理語言學(xué)實(shí)驗(yàn);(4)在上述基礎(chǔ)上開展研究,已發(fā)表10余項(xiàng)階段性研究成果,其中大多數(shù)成果發(fā)表于國內(nèi)外高水平學(xué)術(shù)期刊,被SCI、SSCI、A&HCI等檢索系統(tǒng)收錄的論文達(dá)到6篇。

目前,本課題的多個(gè)研究方向均處于緊鑼密鼓的研究階段,預(yù)計(jì)會(huì)產(chǎn)生不少高水平成果;部分研究方向在完成既定研究計(jì)劃后,將針對(duì)研究過程中遇到的問題進(jìn)行調(diào)整、補(bǔ)充,繼續(xù)深入追蹤相關(guān)問題,或增加新的研究方向。

就課題研究計(jì)劃來說,已經(jīng)完成的工作和取得的成果相對(duì)較多、質(zhì)量較好。一方面,這說明課題組態(tài)度積極、工作努力,采用的研究方法科學(xué)、高效,能夠在跨學(xué)科語言研究方面取得有價(jià)值的新發(fā)現(xiàn);另一方面,也說明本課題研究還有很大的拓展空間,值得繼續(xù)努力,深入開展研究。下面分子課題具體介紹研究進(jìn)展情況。

2. 子課題一“現(xiàn)代漢語文本的計(jì)量研究”進(jìn)展情況

子課題一的研究主要基于詞典數(shù)據(jù)和文本(包括口語轉(zhuǎn)寫文本)。目前已經(jīng)建立了一個(gè)涵蓋12種語體的百萬字規(guī)模的“現(xiàn)代漢語多種語體文本語料庫”,并在此基礎(chǔ)上開發(fā)了一系列計(jì)算機(jī)程序,形成了一個(gè)面向計(jì)量語言學(xué)研究的語言結(jié)構(gòu)特征數(shù)據(jù)庫。雖然在語料規(guī)模、樣本代表性與多樣性等方面還有待加強(qiáng),但是其架構(gòu)與內(nèi)容、計(jì)算方法與工具等,除了能夠滿足既定研究的需要外,還在一定程度上為開展其他層面的漢語計(jì)量語言學(xué)研究奠定了基礎(chǔ)。

除資源建設(shè)外,該子課題主要開展了漢語語音、詞長、詞長與詞義關(guān)系、詞性、詞頻、詞匯豐富程度等詞匯層面的計(jì)量研究,以及基于詞匯層面語言結(jié)構(gòu)的語體計(jì)量研究和歷時(shí)研究。以下前四項(xiàng)研究已經(jīng)發(fā)表或已錄用待發(fā)表,后三項(xiàng)研究處于論文寫作、修改階段。

(1)漢語語音計(jì)量研究,詳見“代表性成果簡介”第2項(xiàng)。

(2)漢語詞長與詞義關(guān)系研究;凇度嗣袢?qǐng)?bào)》和《現(xiàn)代漢語詞典(第五版)》(動(dòng)靜結(jié)合)的詞長分布與詞長-詞義函數(shù)關(guān)系研究發(fā)現(xiàn):第一,漢語最大限度的實(shí)現(xiàn)了經(jīng)濟(jì)原則,即在不擴(kuò)大單字符字庫的情況下,最大程度使用最短組合(兩字詞);第二,詞長分布一方面具有共性,如漢語詞長的靜態(tài)、動(dòng)態(tài)詞型(type)、動(dòng)態(tài)詞例(token)都符合Positive Cohen-negative Binomial分布,另一方面,動(dòng)態(tài)詞例具有特殊性,除了符合Positive Cohen-negative binomial分布,與Dacey-negative Binomial分布的擬合度更高。該函數(shù)的特點(diǎn)在于,它融合了Dacey-泊松、伽馬、貝塔3種分布。雖然共同屬于Negative Binomial分布的衍生形式,但較之Positive Cohen-negative Binomial分布更為復(fù)雜。此語言學(xué)現(xiàn)象結(jié)合統(tǒng)計(jì)學(xué)理論可解釋為,靜態(tài)與動(dòng)態(tài)語料的最大區(qū)別就在于頻率因素,而語境需求、語義明確化、詞匯多樣化、語言編碼解碼最優(yōu)化、傳輸準(zhǔn)確性保障都在頻率中有所體現(xiàn)。在頻率的影響下,詞長呈現(xiàn)了更復(fù)雜、多融合性的分布特點(diǎn)、表現(xiàn)出不同于靜態(tài)分布的特殊性質(zhì);第三,詞長-詞義雙向數(shù)量關(guān)系在動(dòng)、靜態(tài)條件下都符合冪律函數(shù),即詞長越長所承載詞義越少,詞長越短多義程度越高。

(3)漢語兼類詞計(jì)量研究;凇冬F(xiàn)代漢語詞典(第五版)》的詞性計(jì)量研究,在漢語學(xué)界首次給出漢語詞匯兼類的全部模式,首次提出新的語言學(xué)概念——詞性兼類度(Polyfunctionality),即詞匯所能承載的詞性數(shù)量,并得出其詞例和模式層面的分布規(guī)律。研究了兼類詞形成的原因,并從語言學(xué)理論角度進(jìn)行了解釋,即:漢語詞匯產(chǎn)生了功能性變體,卻由于缺乏形態(tài)變化而保持了原本詞形。該研究創(chuàng)新性地列出12種詞性的兼類度分布,發(fā)現(xiàn)其圖形呈雙曲線。該成果已被國際計(jì)量語言學(xué)權(quán)威刊物Journal of Quantitative Linguistics錄用,該刊為SSCI與A&HCI收錄期刊。

(4)漢語詞匯結(jié)構(gòu)的協(xié)同研究,詳見“代表性成果簡介”第3項(xiàng)。

(5)漢語詞頻分布研究;诙嗾Z體文本語料庫的漢語詞頻分布規(guī)律研究發(fā)現(xiàn),漢語文本中詞頻符合Zipf分布、Zeta分布、Zipf-Mandelbort分布、Negative Hypergeometric分布、Waring分布、Hyperpoisson分布等規(guī)律;詞頻譜符合Zeta分布、Zipf-Mandelbrot分布、Waring分布、Yule分布、Johnson-Kotz分布等規(guī)律。漢語文本中的詞頻(譜)分布規(guī)律與其他語言相比沒有特殊性。

(6)漢語語體詞匯豐富性研究。基于詞頻(譜)的詞匯豐富性計(jì)量研究發(fā)現(xiàn),詞頻分布規(guī)律中的參數(shù)、詞頻指數(shù)、詞頻幾何學(xué)指標(biāo)、詞頻熵和重復(fù)率指標(biāo)等,在不同語體中具有不同的計(jì)量特征,即這些指標(biāo)可以用于區(qū)別不同語體。不同指標(biāo)在區(qū)別不同語體方面具有顯著差異。

(7)漢語新詩形式的計(jì)量研究;诓煌瑫r(shí)期的詩歌語料開展了歷時(shí)研究,從單現(xiàn)詞(hapax)、N元組、詞匯豐富程度(包括型例比TTR、詞頻指標(biāo)h點(diǎn)和a指數(shù)、洛倫茨曲線、基尼系數(shù)等)、詞頻熵等角度,對(duì)不同時(shí)期的詩作文本進(jìn)行計(jì)量描寫與比較,初步發(fā)現(xiàn)了一些能夠體現(xiàn)漢語新詩特征的計(jì)量指標(biāo)。

3. 子課題二“現(xiàn)代漢語句法計(jì)量研究”進(jìn)展情況

該子課題已經(jīng)基本完成了“漢英平行語料庫”“漢語歷時(shí)語料庫”“依存語法樹庫”“漢語(句法)網(wǎng)絡(luò)”等研究資源的構(gòu)建工作,并在此基礎(chǔ)上開展了漢語配價(jià)的協(xié)同特征、人類語言句中信息分布研究、漢語多層級(jí)系統(tǒng)、漢語句法歷時(shí)比較、漢語文體比較、英漢句法比較、依存句法網(wǎng)絡(luò)特性及其在語言類型學(xué)領(lǐng)域的應(yīng)用等方面的研究。詳細(xì)進(jìn)展情況如下:

(1)漢語句法歷時(shí)演化研究。以唐前、唐五代、宋代、元明、清代和現(xiàn)代六個(gè)漢語依存樹庫為基礎(chǔ)對(duì)漢語句法的演化進(jìn)行了一些計(jì)量研究。就句法功能的詞類構(gòu)成而言,主語、定語以及“的”字補(bǔ)足語的詞類構(gòu)成具有較大的歷時(shí)變化。其他句法功能的詞類構(gòu)成相對(duì)變化較小。就詞類的句法功能來看,除了形容詞之外,其他詞類的主要句法功能歷時(shí)變化不大。漢語的演化過程,支配詞居后這個(gè)詞序逐漸占據(jù)了主導(dǎo)的地位。與此同時(shí),漢語的平均依存距離持續(xù)增加,意味著句法結(jié)構(gòu)變得更為復(fù)雜。這與定語關(guān)系以及狀語關(guān)系所占比例的持續(xù)增加可能密切相關(guān)。而“的”字補(bǔ)語關(guān)系以及量詞補(bǔ)語關(guān)系的大量出現(xiàn)可能體現(xiàn)了人們用以應(yīng)對(duì)這種復(fù)雜度增加的某種認(rèn)知策略。該研究立足于真實(shí)語料,以定量的方式清晰的展示了所研究語料在歷時(shí)維度上的句法變化。目前有關(guān)該研究的論文正在寫作與修改中。

(2)漢語句法語體比較研究,詳見“代表性成果簡介”第3項(xiàng)。。

(3)英漢句法比較研究。以《中國日?qǐng)?bào)》英漢雙語平行新聞?wù)Z料為基礎(chǔ),進(jìn)行了分詞、詞性標(biāo)注、依存關(guān)系句法標(biāo)注,從而構(gòu)建了英漢雙語依存句法樹庫。在此基礎(chǔ)之上,對(duì)兩個(gè)樹庫中詞類、詞類頻率、主要依存關(guān)系頻率、依存距離、依存方向、依存關(guān)系構(gòu)成、詞類句法功能以及特殊結(jié)構(gòu)等方面進(jìn)行了計(jì)量研究,獲得了大量反映了英漢兩種語言句法層面差異與相似之處的定量數(shù)據(jù)。這一研究從整體上更精確地把握了英漢句法差異。傳統(tǒng)的語言對(duì)比研究大都基于直覺內(nèi)省或簡單例句的分析討論,這往往難以全面地概括不同語言的結(jié)構(gòu)特點(diǎn)。以經(jīng)過標(biāo)注的真實(shí)語料為基礎(chǔ),借助定量的研究方法對(duì)不同語言進(jìn)行對(duì)比分析,有助于從語言整體的角度更清楚、更準(zhǔn)確地觀察語言的共性以及不同語言的特殊性。此外,我們并未止步于這些數(shù)據(jù)的描寫,而是結(jié)合其他語言學(xué)科的相關(guān)理論就英漢對(duì)比研究所獲得的數(shù)據(jù)進(jìn)行了語言學(xué)分析與討論,提出了能夠解釋這些差異的可能原因。目前該研究的相關(guān)論文正在撰寫中。

(4)句法復(fù)雜網(wǎng)絡(luò)研究;诰浞◤(fù)雜網(wǎng)絡(luò)的類型學(xué)研究成果已發(fā)表于國際語言學(xué)SSCI、A&HCI期刊和國內(nèi)自然科學(xué)綜合類頂級(jí)期刊《科學(xué)通報(bào)》(SCI收錄)之上,詳見“代表性成果簡介”第7、8項(xiàng)。此外,我們也進(jìn)行了句法復(fù)雜網(wǎng)絡(luò)作為語體分類知識(shí)源的研究,基于6種語體的句法樹庫構(gòu)建了6個(gè)依存句法網(wǎng)絡(luò),對(duì)這些網(wǎng)絡(luò)的邊數(shù)、節(jié)點(diǎn)數(shù)、節(jié)點(diǎn)平均度、聚類系數(shù)、平均最短路徑長度、網(wǎng)絡(luò)中心勢、直徑、節(jié)點(diǎn)度冪律分布的冪指數(shù)、度分布與冪律擬合的決定系數(shù)等整體特征進(jìn)行了對(duì)比分析。以這些整體特征為變量,采用歐幾里得的“最短距離”法,對(duì)這6種語體的句法網(wǎng)絡(luò)進(jìn)行了聚類分析。研究結(jié)果顯示,通過一些網(wǎng)絡(luò)的主要參數(shù),即網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)、聚集系數(shù)、平均路徑長度、中心勢以及節(jié)點(diǎn)度冪律分布的冪指數(shù),可以對(duì)所研究的文本進(jìn)行分類。與傳統(tǒng)的文本聚類方法相比,其結(jié)果更容易從語言學(xué)的角度進(jìn)行合理的解釋。該研究成果已發(fā)表于國內(nèi)刊物《計(jì)算機(jī)工程與應(yīng)用》2013年第8期。

(5)漢語動(dòng)詞配價(jià)的協(xié)同特征研究。以漢語依存樹庫和(《現(xiàn)代漢語詞典(第五版)》)為基礎(chǔ),抽取出動(dòng)詞的配價(jià)信息,對(duì)漢語動(dòng)詞配價(jià)的協(xié)同特征進(jìn)行研究,結(jié)果發(fā)現(xiàn):漢語動(dòng)詞的補(bǔ)足語形式分布和動(dòng)詞的多義度分布遵循一定的規(guī)則,動(dòng)詞配價(jià)及其序之間的關(guān)系遵循冪律分布。同時(shí),漢語動(dòng)詞的多義度、詞長、頻率、多文度與配價(jià)之間的關(guān)系表現(xiàn)為:第一,漢語中動(dòng)詞的多義度越大,配價(jià)越大;第二,漢語動(dòng)詞的詞長越短,配價(jià)越大;第三,動(dòng)詞出現(xiàn)的頻次越高,配價(jià)越大;第四,多文度越大,配價(jià)越大。為了找到最適合測量漢語詞長的單位,引入了體現(xiàn)漢語書面特點(diǎn)的“筆畫”和“部件”,提出并驗(yàn)證了關(guān)于漢語動(dòng)詞筆畫數(shù)的系列相關(guān)假設(shè):第一,動(dòng)詞部首的筆畫數(shù)越多,整個(gè)漢字筆畫數(shù)越多;第二,動(dòng)詞的筆畫數(shù)越少,多義度越大;第三,動(dòng)詞詞長越短,筆畫越少;第四,動(dòng)詞的筆畫越少,出現(xiàn)頻率越高;第五,動(dòng)詞的筆畫越少,配價(jià)越大。將筆畫數(shù)、部首數(shù)與體現(xiàn)漢語口語特點(diǎn)的拼音字母數(shù)相對(duì)比,我們認(rèn)為漢語的拼音字母數(shù)更適合測量漢語詞長。這項(xiàng)研究已被國際計(jì)量語言學(xué)權(quán)威刊物Journal of Quantitative Linguistics錄用,該刊為SSCI與A&HCI收錄期刊。

(6)基于概率配價(jià)模式理論的花園幽徑句研究;▓@幽徑句是在英語和漢語中都存在的一種特殊句子,該句子會(huì)造成人們理解的困難。為了更好地解釋花園幽徑句理解困難的原因,在概率配價(jià)模式理論的指導(dǎo)下,從定性和定量的角度對(duì)漢語花園幽徑句的理解過程進(jìn)行了分析,闡釋了花園幽徑句的理解機(jī)理。將漢語依存樹庫中提取出的數(shù)據(jù)與語言學(xué)中的統(tǒng)計(jì)規(guī)律相結(jié)合,證明理解花園幽徑句前面的歧義段,不同的歧義結(jié)果之間往往具有優(yōu)先性,同時(shí)提出受概率的影響和當(dāng)前概率優(yōu)先原則的支配是導(dǎo)致花園幽徑句理解困難的一個(gè)重要原因。本研究成果《基于概率配價(jià)模式理論的花園幽徑句研究》已被《語言文字應(yīng)用》錄用,待發(fā)表。

(7)現(xiàn)代漢語多層級(jí)網(wǎng)絡(luò)研究,F(xiàn)代語言學(xué)普遍將語言視作一個(gè)在意義-形式維度上具有不同層面的系統(tǒng)。這些層面都是語言系統(tǒng)的子系統(tǒng),可定義為相關(guān)的語言單位及其關(guān)系。在語言的較深層面,語言單位之間的關(guān)系表現(xiàn)為非線性的結(jié)構(gòu)關(guān)系(如句法結(jié)構(gòu)和語義結(jié)構(gòu)關(guān)系)。而在較淺的層面,語言單位之間的關(guān)系則是線性的同現(xiàn)關(guān)系(如詞同現(xiàn)和字同現(xiàn)關(guān)系)。如果語言是一個(gè)系統(tǒng),那么其在宏觀尺度上涌現(xiàn)出來的組織方式(整體特征)就無法用偏重語言局部結(jié)構(gòu)特征的語言學(xué)傳統(tǒng)方法來進(jìn)行研究。換言之,目前的語言學(xué)研究方法無法揭示語言是一個(gè)什么樣的系統(tǒng)。復(fù)雜網(wǎng)絡(luò)方法已用于研究不同的語言子系統(tǒng)。然而,這些研究存在著兩個(gè)較明顯的問題。一方面,這些研究多停留于對(duì)所研究的語言網(wǎng)絡(luò)模型的參數(shù)本身的探討,并沒有結(jié)合語言學(xué)及其周邊學(xué)科的觀點(diǎn)來解讀這些參數(shù)對(duì)于語言系統(tǒng)來說意味著什么。另一方面,這些研究一般只探討某一個(gè)語言子系統(tǒng)的宏觀組織方式,這樣就無法全面揭示語言作為一個(gè)分層系統(tǒng)的整體情況。因此,要研究某個(gè)語言作為一個(gè)分層系統(tǒng)的組織特征,理想的方法是基于相同的語料,在該語言的不同層面上分別構(gòu)建語言網(wǎng)絡(luò)模型,通過描述和比較這些模型的組織特征來獲得該語言作為分層系統(tǒng)的整體概觀。同時(shí),應(yīng)結(jié)合語言學(xué)及其周邊學(xué)科的觀點(diǎn)對(duì)研究的發(fā)現(xiàn)進(jìn)行解讀,以期讓復(fù)雜網(wǎng)絡(luò)的方法能夠真正地加深我們對(duì)于語言系統(tǒng)的理解。本研究采用復(fù)雜網(wǎng)絡(luò)方法研究作為分層系統(tǒng)的現(xiàn)代漢語。采用現(xiàn)代漢語真實(shí)語料構(gòu)擬了漢語在意義-形式維度上的(作為語言子系統(tǒng)的)四個(gè)層面的語言網(wǎng)絡(luò)模型,分別是:動(dòng)態(tài)語義網(wǎng)絡(luò)(實(shí)詞/詞匯概念作為節(jié)點(diǎn),其語義結(jié)構(gòu)關(guān)系作為邊)、句法依存網(wǎng)絡(luò)(詞作為節(jié)點(diǎn),其句法依存關(guān)系作為邊)、詞同現(xiàn)網(wǎng)絡(luò)(詞作為節(jié)點(diǎn),其同現(xiàn)關(guān)系作為邊)和字同現(xiàn)網(wǎng)絡(luò)(字作為節(jié)點(diǎn),其同現(xiàn)關(guān)系作為邊)。研究計(jì)算了四個(gè)網(wǎng)絡(luò)模型的主要復(fù)雜網(wǎng)絡(luò)參數(shù)。這些參數(shù)表明:四個(gè)網(wǎng)絡(luò)均在不同程度上呈現(xiàn)小世界(較短的平均路徑長度和較高的聚集系數(shù))、無尺度(度分布符合冪律)、負(fù)相關(guān)和層級(jí)組織的拓?fù)浣Y(jié)構(gòu)特性。小世界屬性意味著漢語在各個(gè)層面上的知識(shí)具有高效的組織方式。節(jié)點(diǎn)之間較短的距離能夠有效地減少擴(kuò)散激活過程中的能量損耗。無尺度屬性意味著在各個(gè)層面上只有極少數(shù)語言單位具有極強(qiáng)的結(jié)合能力,而大多數(shù)語言單位的結(jié)合能力都相對(duì)較弱。這是省力原則的一種體現(xiàn),反映了說話人在語言表達(dá)和聽話人在語言理解這兩方面的省力需求所達(dá)到的平衡。而小世界和無尺度屬性共同保證了漢語在各個(gè)層面上的知識(shí)網(wǎng)絡(luò)的“適航性”,保證了擴(kuò)散激活這一蠻力的、無指導(dǎo)的過程能夠順利進(jìn)行。層級(jí)組織特征則確保了小世界和無尺度特征能同時(shí)存在,而它又與負(fù)相關(guān)特征有著密切聯(lián)系。因此,漢語的四個(gè)子系統(tǒng)所體現(xiàn)出的宏觀組織特征是相輔相成的,共同保證了它們的高效組織方式。同時(shí),四個(gè)網(wǎng)絡(luò)模型的拓?fù)浣Y(jié)構(gòu)特征也存在著差異,反映著四個(gè)子系統(tǒng)之間的關(guān)系。動(dòng)態(tài)語義網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)特征與其他網(wǎng)絡(luò)具有較大差異。這表明,語義結(jié)構(gòu)子系統(tǒng)(作為概念表征子系統(tǒng))相比于其他三個(gè)子系統(tǒng)(作為語言表達(dá)子系統(tǒng))來說,是一個(gè)相對(duì)獨(dú)立的語言子系統(tǒng)。該網(wǎng)絡(luò)的某些拓?fù)浣Y(jié)構(gòu)特征(如小世界和負(fù)相關(guān))弱于其他網(wǎng)絡(luò),這是由于該層面缺少具有極強(qiáng)結(jié)合能力的語言單位。較弱的拓?fù)浣Y(jié)構(gòu)特征在宏觀尺度上體現(xiàn)了語義結(jié)構(gòu)的前語言性。對(duì)單個(gè)拓?fù)浣Y(jié)構(gòu)特征的比較以及聚類分析均發(fā)現(xiàn),句法依存網(wǎng)絡(luò)與詞同現(xiàn)網(wǎng)絡(luò)具有極高的相似性。這種相似性源于句法依存關(guān)系與詞同現(xiàn)關(guān)系的高度重合(50%以上的依存關(guān)系存在于相鄰的兩詞之間)。這種重合使得漢語句法在產(chǎn)出、理解和習(xí)得方面的難度都控制在一個(gè)較低的水平。而句法依存網(wǎng)絡(luò)與詞同現(xiàn)網(wǎng)絡(luò)之間的高度相似在系統(tǒng)層面上反映了漢語為句法產(chǎn)出、理解和習(xí)得所提供的便利。字同現(xiàn)網(wǎng)絡(luò)的某些拓?fù)浣Y(jié)構(gòu)特征明顯強(qiáng)于其他三種網(wǎng)絡(luò),這是由于其中樞節(jié)點(diǎn)的相對(duì)結(jié)合能力明顯較強(qiáng)。該網(wǎng)絡(luò)的中樞節(jié)點(diǎn)是單字的漢語虛詞,其在漢語理解的分詞過程中發(fā)揮著分隔符的作用,其較強(qiáng)的結(jié)合能力對(duì)于漢語這種缺乏顯式分詞機(jī)制的語言來說尤為重要?傊,本研究以定量的方式首次揭示了漢語作為分層系統(tǒng)的宏觀特征,并以語言學(xué)、認(rèn)知科學(xué)和網(wǎng)絡(luò)科學(xué)的觀點(diǎn)對(duì)研究發(fā)現(xiàn)進(jìn)行了解讀,拓展了我們對(duì)于語言作為分層系統(tǒng)的認(rèn)識(shí)。本研究已被國際著名漢語語言學(xué)研究刊物Journal of Chinese Linguistics錄用,該雜志為SSCI、A&HCI收錄期刊。

(8)漢語句子信息量分布研究。語言是一個(gè)通訊系統(tǒng),語言系統(tǒng)在通訊方面的性質(zhì)就是語言的重要性質(zhì)。信息理論證明,通訊系統(tǒng)在噪聲信道中最優(yōu)的信息傳遞方式是與信道能力相近的穩(wěn)定的傳遞速率。如果人類在語言進(jìn)化中在通訊方面已經(jīng)得到優(yōu)化,那么人類的語言和言語就應(yīng)該具有穩(wěn)定的信息傳遞速率或均勻信息密度(即UID假說或CER假說)。信息論可以解釋很多層面上的語言現(xiàn)象,但信息量是如何在句子中分布的這個(gè)可以使我們從信息量的角度理解句子的生成和理解的關(guān)鍵問題卻至今沒有一個(gè)滿意的答案。UID和CER假說只給出了一個(gè)一般性的觀點(diǎn),并沒有給出句子內(nèi)部的詳細(xì)說明。我們以與信息量相關(guān)的、具有明確意義的統(tǒng)計(jì)量開展了句子中信息量分布研究。這些統(tǒng)計(jì)量有:平均語境外信息量(熵),各位置上出現(xiàn)的詞的頻率特性、詞數(shù)、詞的冪律指數(shù)等。另外,一個(gè)句子是一個(gè)具有結(jié)構(gòu)的相對(duì)完整的語言單位,句中信息量是分布在整個(gè)句子上的,由于句尾可能具有不同信息量的分布,即句尾效應(yīng),因此,在不同長度的句子中同樣的位置上信息分布特征可能會(huì)不同,因此,統(tǒng)計(jì)句中不同位置上的平均信息量應(yīng)該在相同長度的句子上進(jìn)行。此研究結(jié)果發(fā)現(xiàn),句子中各位置的熵以及相關(guān)統(tǒng)計(jì)量均呈3步階梯式遞增,即,句首顯著小于句中間各位置(除去句首和句尾的位置),句中間顯著小于句尾,而句中間各位置上沒有顯著差異。這說明:第一,句中詞提供的語境信息并不是隨著詞的增加而累加,這意味著句中詞與句子整體的關(guān)系并不是多層遞進(jìn),而是多方面平行;第二,句中詞提供的語境信息呈現(xiàn)“整體大于部分之和”的模式,結(jié)構(gòu)也提供了信息。此研究不但發(fā)現(xiàn)了句中信息量的分布特性,提示我們處理通訊優(yōu)化約束以外還需要另外的參數(shù)來解釋句中信息量的分布,而且還表明在計(jì)算句中詞的信息量時(shí),常使用馬爾科夫模型建模語境的方法存在本質(zhì)上問題,為進(jìn)一步研究語境建模提供了指導(dǎo)。此研究成果正處于論文修改階段。

4. 子課題三“面向計(jì)算語言學(xué)的自然語言形式化計(jì)量研究”進(jìn)展情況

本子課題重點(diǎn)圍繞依存結(jié)構(gòu)樹的計(jì)數(shù)、枚舉、層次化等方面展開研究。

(1)依存結(jié)構(gòu)樹計(jì)數(shù)研究,F(xiàn)有的研究成果給出的依存結(jié)構(gòu)樹計(jì)數(shù)算法存在著兩個(gè)局限性:一是數(shù)據(jù)精度問題,由于計(jì)算機(jī)字長的限制,該算法能得到的正確結(jié)果非常少,其他結(jié)果都因?yàn)閿?shù)據(jù)溢出而不正確;二是算法的時(shí)間復(fù)雜度過高,在現(xiàn)實(shí)中無法應(yīng)用。為了克服上述局限,我們做了兩方面的準(zhǔn)備:一方面,我們提出一套基于字符數(shù)組的超長整數(shù)表示方法和四則運(yùn)算算法;另一方面,在超長整數(shù)表示方法和四則運(yùn)算的基礎(chǔ)上改進(jìn)了依存結(jié)構(gòu)樹的計(jì)數(shù)算法,能得到依存結(jié)構(gòu)樹的精確計(jì)數(shù)結(jié)果。改進(jìn)的計(jì)數(shù)算法依賴于“直接子樹”和在此基礎(chǔ)上定義的“依存結(jié)構(gòu)森林”這兩個(gè)概念,算法的核心思想是遞歸計(jì)算:具有給定結(jié)點(diǎn)數(shù)的依存結(jié)構(gòu)樹的不同形態(tài)數(shù)目可用若干依存結(jié)構(gòu)森林的計(jì)數(shù)結(jié)果來表示,依存結(jié)構(gòu)森林的計(jì)數(shù)結(jié)果可用若干更小的依存結(jié)構(gòu)樹的計(jì)數(shù)結(jié)果來表示。研究依存結(jié)構(gòu)樹的精確計(jì)數(shù)有助于深入了解依存結(jié)構(gòu)樹的形式特征,為依存結(jié)構(gòu)樹的枚舉提供理論支持,并在依存句法分析過程中預(yù)估問題的規(guī)模與復(fù)雜度。這部分成果正處于后期的整理和寫作當(dāng)中。

(2)依存結(jié)構(gòu)樹枚舉研究。我們提出了兩種不同的枚舉算法。一個(gè)是基于后繼思想的算法,另一個(gè)是基于后進(jìn)先出棧的算法。兩種算法都是以依存結(jié)構(gòu)樹的編碼為基礎(chǔ)的,它們使用的編碼是相同的。第一種算法定義了一種能將依存結(jié)構(gòu)樹形態(tài)編碼進(jìn)行排序的線序關(guān)系“前于”,并根據(jù)機(jī)械過程理論提出了求解任何一棵依存結(jié)構(gòu)樹在前于關(guān)系中的后繼樹的算法,按照這種算法可以順次生成所有可能的依存結(jié)構(gòu)樹。其特點(diǎn)是下一棵依存結(jié)構(gòu)樹的生成僅僅跟上一棵依存結(jié)構(gòu)樹有關(guān)。第二種算法定義了一種截然不同的線序關(guān)系,提出了一種基于棧的算法,根據(jù)這種線序關(guān)系順次生成所有可能的依存結(jié)構(gòu)樹。根據(jù)該算法產(chǎn)生的兩棵相鄰的依存結(jié)構(gòu)樹之間沒有直接關(guān)系,但該算法的一個(gè)優(yōu)點(diǎn)是它可以在滿足依存結(jié)構(gòu)樹部分結(jié)點(diǎn)間的依存關(guān)系的前提下來生成所有可能的依存結(jié)構(gòu)樹。兩種算法各有優(yōu)點(diǎn),后繼算法的空間復(fù)雜度優(yōu)于棧算法,但棧算法的時(shí)間復(fù)雜度優(yōu)于后繼算法。依存結(jié)構(gòu)樹枚舉算法研究給出了依存結(jié)構(gòu)樹的全部編碼空間,為下一步的基于依存結(jié)構(gòu)的語言分析與理解研究打下堅(jiān)實(shí)的理論基礎(chǔ),也為構(gòu)建基于概率統(tǒng)計(jì)的自然語言歧義消解機(jī)制研究創(chuàng)造了條件。這部分成果已經(jīng)初步完稿,待進(jìn)一步修改之后即可投稿。

(3)依存結(jié)構(gòu)樹層次化研究。我們提出一種算法,使用一種由純字符組成的圖形來表示依存結(jié)構(gòu)樹的結(jié)構(gòu)形態(tài)。這種圖形的好處有兩點(diǎn):一是不必借助專門的繪圖和看圖工具來查看依存結(jié)構(gòu)樹的結(jié)構(gòu)形態(tài),借助于普通的文本編輯軟件就可以查看;二是這種圖能清楚地表示依存結(jié)構(gòu)樹的層次。研究依存結(jié)構(gòu)樹的層次,有助于我們加深對(duì)依存距離最小化的認(rèn)識(shí),從而有助于對(duì)大腦的句子理解機(jī)制的研究。這部分內(nèi)容正在整理中,很快會(huì)完成數(shù)據(jù)梳理和論文撰寫的工作。

5. 子課題四“漢語計(jì)量研究與認(rèn)知結(jié)構(gòu)關(guān)系研究”進(jìn)展情況

本子課題已經(jīng)進(jìn)行了大量的材料收集和實(shí)驗(yàn)測量,積累了豐富的資料(包括評(píng)定后的500個(gè)分類學(xué)概念詞、100個(gè)情感詞、100個(gè)一般意義上的抽象詞、30萬字的聾人作文文本),構(gòu)建了多個(gè)不同語體、不同時(shí)期的漢語句法標(biāo)注樹庫和兩個(gè)英語樹庫,為下一步研究工作打下堅(jiān)實(shí)基礎(chǔ)。

在此基礎(chǔ)上,本子課題對(duì)中文詞識(shí)別機(jī)制、詞形態(tài)和語義認(rèn)知機(jī)制、長距離依存關(guān)系處理認(rèn)知機(jī)制等方面進(jìn)行了研究。其中,中文詞識(shí)別機(jī)制、詞形態(tài)和語義認(rèn)知機(jī)制研究以心理語言學(xué)實(shí)驗(yàn)方法為主,基于分類學(xué)概念理論體系,以不同特點(diǎn)群體為對(duì)象,參照文本語義網(wǎng)絡(luò)資源(http://corpora.uni-leipzig.de/)確定實(shí)驗(yàn)內(nèi)容(經(jīng)常出現(xiàn)在同一文本語境下的常見中文詞)并重點(diǎn)開展詞形態(tài)和語義認(rèn)知機(jī)制研究;依存距離與語言處理認(rèn)知機(jī)制研究以句法標(biāo)注語料庫計(jì)量方法為主,輔之以適當(dāng)?shù)男睦韺W(xué)實(shí)驗(yàn)。從目前研究來看,這幾方面之間可能存在密切的關(guān)系,詞識(shí)別機(jī)制和語義認(rèn)知機(jī)制對(duì)長距離依存關(guān)系的處理可能有較為重要的影響。這些方面的研究現(xiàn)在已經(jīng)取得了一些重要的成果,為今后全面系統(tǒng)地將計(jì)量語言研究與語言認(rèn)知結(jié)構(gòu)研究有機(jī)融合并進(jìn)行更深一步的研究打下了基礎(chǔ)。詳細(xì)的研究進(jìn)展如下:

(1)基于語義加工導(dǎo)向的中文單、雙字詞識(shí)別機(jī)制研究。中文句法結(jié)構(gòu)和句子的最小構(gòu)成成分(詞)之間的語義關(guān)系相互交融。在非語境中考察詞的語義加工受其他詞的影響是系統(tǒng)研究中文認(rèn)知結(jié)構(gòu)的前提。我們使用啟動(dòng)范式下的語義歸類任務(wù),同時(shí)以分類學(xué)概念中基本水平概念單、雙字詞為目標(biāo)刺激,操縱SOA和啟動(dòng)詞在形音義方面與目標(biāo)詞的關(guān)系,共對(duì)200人進(jìn)行實(shí)驗(yàn)測量(實(shí)驗(yàn)1和實(shí)驗(yàn)2),結(jié)果發(fā)現(xiàn)單、雙字詞的情況有相似也有差異。在反應(yīng)時(shí)上相似的是,啟動(dòng)效應(yīng)在137 ms及之后的幾個(gè)SOA水平(187、237和287 ms)上顯著;實(shí)驗(yàn)1形態(tài)輪廓、讀音和語義三種條件下,形態(tài)輪廓(兩/手表)和目標(biāo)詞(雨/小麥)相似啟動(dòng)詞對(duì)的啟動(dòng)效應(yīng)最小,其次是讀音(骨/消息)和目標(biāo)詞(故/小溪)相似的情況,啟動(dòng)效應(yīng)最大的是語義(狼/劇院)和目標(biāo)詞(豹/教堂)相近的情況;實(shí)驗(yàn)2啟動(dòng)刺激是目標(biāo)詞(餐廳或盤)的同位概念詞的字序顛倒(室教)或部件位置顛倒(木字旁在右不字在左)——類內(nèi)倒序,是目標(biāo)詞(地震或盤)的同位概念詞的字序顛倒(室教或球)或部件位置顛倒(王字旁在右求字在左)——同詞顛倒、是目標(biāo)詞(劇院或狼)的語義相近詞(教堂或豹)——語義相近,在這三種條件下,本詞顛倒情況的啟動(dòng)效應(yīng)最小,同類顛倒和語義相近情況的啟動(dòng)效應(yīng)大小差不多。單、雙字詞的不同是,在反應(yīng)時(shí)上,實(shí)驗(yàn)1中,單字詞條件下的啟動(dòng)效應(yīng)較小,雙字詞條件下的啟動(dòng)效應(yīng)較大。在準(zhǔn)確率上,實(shí)驗(yàn)1與單字目標(biāo)詞輪廓相似的啟動(dòng)刺激對(duì)目標(biāo)刺激的判斷有干擾效應(yīng),與雙字詞語義相近的啟動(dòng)刺激對(duì)目標(biāo)刺激的判斷有有干擾效應(yīng)。實(shí)驗(yàn)2,啟動(dòng)刺激和目標(biāo)刺激語義相近時(shí),雙字詞條件下,目標(biāo)刺激的判斷受到啟動(dòng)刺激較大干擾。這兩個(gè)實(shí)驗(yàn)的發(fā)現(xiàn)不僅補(bǔ)充了以往研究,而且系統(tǒng)揭示了常見具體事物概念詞的語義判斷在形音義方面受其他相關(guān)信息加工方面的影響。相關(guān)論文正在撰寫之中。

(2)第二語言詞形態(tài)和語義加工的心理機(jī)制研究。作為第一、二語言句法結(jié)構(gòu)認(rèn)知研究的前提,在詞的層面,我們對(duì)近1000人經(jīng)數(shù)次測量,比較了一、二語言條件下分類學(xué)概念中上位和基本水平概念詞之間的概念聯(lián)系意識(shí)(實(shí)驗(yàn)3)、情感詞語義加工與詞呈現(xiàn)的上下空間位置的隱喻關(guān)聯(lián)(實(shí)驗(yàn)4)、一般意義抽象詞間的語義關(guān)系意識(shí)(實(shí)驗(yàn)5),考察了英文派生詞和曲折詞的形態(tài)加工過程(實(shí)驗(yàn)6)。結(jié)果發(fā)現(xiàn),實(shí)驗(yàn)3在一、二語言條件下,分類學(xué)概念中不同水平概念詞間的聯(lián)系意識(shí)有不同的模式:在第二語言條件下,對(duì)上位水平概念詞的語義加工機(jī)制不同于對(duì)基本水平概念詞。不同水平概念詞的自動(dòng)化識(shí)別有明顯孤立性傾向;上位水平詞的有意識(shí)識(shí)別能夠激活它與基本水平概念詞間的概念聯(lián)系,但是,基本水平詞的有意識(shí)識(shí)別卻不能夠激活它與上位水平概念詞間的概念聯(lián)系。實(shí)驗(yàn)4在知識(shí)層面,一、二語言情感詞的語義加工機(jī)制有相似,但是,第二語言情感詞的自動(dòng)化加工不能激活詞義與空間位置之間的隱喻關(guān)聯(lián)。實(shí)驗(yàn)5結(jié)果和實(shí)驗(yàn)4相似,第二語言詞的有意識(shí)的識(shí)別似乎是借助于翻譯完成,但是,二語詞的自動(dòng)化識(shí)別卻不能激活抽象詞間的語義聯(lián)系。實(shí)驗(yàn)6與其他國家研究發(fā)現(xiàn)不同的是,中國大學(xué)生(浙大一二年級(jí)理工科學(xué)生)對(duì)于曲折詞發(fā)展有明確構(gòu)詞意識(shí);對(duì)于派生詞,他們也能發(fā)展一定程度的構(gòu)詞意識(shí)。所以如此可能得益于中文字詞識(shí)別習(xí)慣的影響。有關(guān)這些研究的論文正在審稿與撰寫中。

(3)聾人青少年書面詞形態(tài)和語義加工的心理機(jī)制研究。聾人作為特殊群體,他們在書面語認(rèn)知活動(dòng)中表現(xiàn)出的認(rèn)知規(guī)律對(duì)于普遍意義上的書面語研究有獨(dú)特的價(jià)值。我們也初步完成了對(duì)聾人青少年在具體詞間分類學(xué)聯(lián)系和主題關(guān)聯(lián)聯(lián)系方面的比較(實(shí)驗(yàn)7)和在分類學(xué)概念詞間的語義聯(lián)系意識(shí)的考察(實(shí)驗(yàn)8、9),結(jié)果發(fā)現(xiàn),實(shí)驗(yàn)7對(duì)于具體事物概念詞,聾人青少年能夠發(fā)展分類學(xué)聯(lián)系意識(shí),但是,相比之下,他們較難發(fā)展主題關(guān)聯(lián)聯(lián)系意識(shí)。本研究已經(jīng)發(fā)表于American Annals of the Deaf 156(5)。實(shí)驗(yàn)8對(duì)于基本水平概念詞,聾人青少年能夠發(fā)展概念詞之間的語義聯(lián)系意識(shí),只是相對(duì)健聽人較弱,但是,在上位水平概念詞自動(dòng)化識(shí)別加工過程中,他們產(chǎn)生概念間聯(lián)系的意識(shí)特別弱。實(shí)驗(yàn)9聾人青少年識(shí)別上位水平概念詞的過程中,他們不可避免的需要經(jīng)過多個(gè)相應(yīng)的典型性水平較低概念成員的心理表征的激活。相關(guān)論文正在審稿與撰寫中。。

(4)漢語長距離依存關(guān)系研究。對(duì)依存標(biāo)注語料庫的計(jì)量研究表明漢語中主語、賓語、介詞賓語以及介詞狀語關(guān)系是最高頻的長距離依存關(guān)系。對(duì)主語進(jìn)行的計(jì)量研究表明,主語本身的信息特點(diǎn)與依存距離有密切關(guān)系。新主語(新信息)的依存距離往往較短,舊主語(前文已出現(xiàn)過的信息)的依存距離往往較長,兩者之間具有顯著差異。這顯然與啟動(dòng)效應(yīng)有密切的關(guān)系:語義啟動(dòng)詞具有非常強(qiáng)的啟動(dòng)效應(yīng)。這表明就主語的處理而言,依存距離與主語的信息特點(diǎn)之間可能存在協(xié)同作用,長距離主語關(guān)系可能未必一定難以處理。介詞往往涉及長距離介詞賓語關(guān)系與介詞狀語關(guān)系,對(duì)漢語中最常見的介詞是“在”進(jìn)行的反應(yīng)時(shí)實(shí)驗(yàn)表明,長依存距離對(duì)“在”涉及的介詞賓語以及狀語關(guān)系的處理并無顯著影響。其原因可能在于“在”作為高頻虛詞可能主要扮演了格標(biāo)記的角色,對(duì)句法及語義結(jié)構(gòu)起到標(biāo)示作用,本身不涉及語義關(guān)系,處理較為簡單。高頻虛詞的激活可能較為容易,長依存距離帶來的工作記憶衰退問題可能相應(yīng)并不嚴(yán)重。其次,漢語的結(jié)構(gòu)特點(diǎn)使得介詞“在”的賓語往往與謂語距離較近,其長距離介賓關(guān)系往往意味著較短的語義依存距離,從語義加工的角度來看,這可能也有利于語言處理。值得注意的是,漢語中大多數(shù)的虛詞可能都具有這些特點(diǎn)。在漢語小句的各種依存關(guān)系中,賓語的平均依存距離是最長的。但是賓語位于句尾,如果語言的處理是一個(gè)增量的、不斷進(jìn)行預(yù)測和判斷的過程,賓語的位置可能也可以在某種程度上減少處理的復(fù)雜度,因?yàn)樘幚碣e語時(shí)句子的大部分信息是已知的信息。對(duì)長距離賓語的概率p(obj|pre,atr)進(jìn)行的計(jì)量研究表明,相當(dāng)一部分(45%)的長距離賓語的概率p(obj|pre,atr)大于0.1,其余賓語的概率則極低,或者無法統(tǒng)計(jì)。對(duì)于這些賓語,完型填空問卷研究表明p(obj|pre,atr)大于0.1的賓語的正確率基本都在0.2以上。根據(jù)現(xiàn)有文獻(xiàn)來看,這個(gè)正確率說明處理難度有效地減少了。p(obj|pre,atr)大于0.1反映了較高的可預(yù)測度。對(duì)于其余的低正確率賓語,在提供語境(前一個(gè)句子)的情況下的研究,結(jié)果表明一部分賓語的正確率也提高到0.2。這些研究表明,長距離賓語往往可能伴隨著較高可預(yù)測度與較低的信息度,這無疑有利于賓語詞的識(shí)別與加工。這兩個(gè)因素往往可能也使得長依存距離對(duì)賓語處理復(fù)雜度不會(huì)帶來顯著的影響。該研究表明在較微觀的具體依存關(guān)系層面,真實(shí)語言中的長依存距離可能僅僅是影響處理復(fù)雜度的一個(gè)因素,同時(shí)受到其他諸多因素(如詞的識(shí)別與語義處理機(jī)制等)的制約。這些因素協(xié)同作用,可能使得真實(shí)語言中高頻出現(xiàn)的長依存距離往往不會(huì)顯著增加真實(shí)使用的語言的處理難度。目前課題組正在根據(jù)該研究成果撰寫論文,擬投稿語言學(xué)及認(rèn)知類的SSCI期刊。

(5)語碼轉(zhuǎn)換機(jī)制的認(rèn)知與計(jì)量研究。該研究階段性成果已發(fā)表于國際著名普通語言學(xué)刊物L(fēng)ingua,詳見“代表性成果簡介”第5項(xiàng)。

二、調(diào)研及學(xué)術(shù)交流情況

1. 調(diào)研情況

國內(nèi)計(jì)量語言學(xué)研究尚處于起步階段,課題組在申請(qǐng)課題時(shí)已經(jīng)對(duì)國內(nèi)外計(jì)量語言學(xué)研究現(xiàn)狀有過較為詳細(xì)的了解,立項(xiàng)后課題組主要進(jìn)行了以下兩方面的工作。

第一,文獻(xiàn)資料收集整理。課題組雖然已經(jīng)掌握大量的計(jì)量語言學(xué)及相關(guān)領(lǐng)域文獻(xiàn)資料,但是為了本課題研究能夠處于國際學(xué)術(shù)前沿水平,始終注重文獻(xiàn)收集與整理工作。除了已有的幾種計(jì)量語言學(xué)學(xué)術(shù)期刊的全部期數(shù)和計(jì)量語言學(xué)主要經(jīng)典著作外,還繼續(xù)收集了大量論文和著作,以及同一著作的不同語言版本。其中不乏一些稀缺資源,包括英語、德語、俄語、法語等語種的文獻(xiàn)。在此基礎(chǔ)上,完成了《協(xié)同語言學(xué)》和一些計(jì)量語言學(xué)領(lǐng)域重要論文的翻譯、校訂工作。

第二,與國內(nèi)外高校和科研機(jī)構(gòu)開展多種形式的合作交流。為了提升國內(nèi)學(xué)者對(duì)計(jì)量語言學(xué)的關(guān)注熱情、加強(qiáng)不同學(xué)科領(lǐng)域的交流合作、增強(qiáng)課題研究成果的影響與價(jià)值,課題組對(duì)西安交通大學(xué)、北京外國語大學(xué)、黑龍江大學(xué)、大連海事大學(xué)、寧夏大學(xué)、浙江師范大學(xué)、寧波大學(xué)等學(xué)術(shù)機(jī)構(gòu)進(jìn)行了走訪,就課題研究內(nèi)容與進(jìn)展同國內(nèi)學(xué)者進(jìn)行交流討論,商討合作研究等事宜。

2. 學(xué)術(shù)交流情況

為了開闊學(xué)術(shù)視野,尋求廣泛和深入的合作,增強(qiáng)研究成果宣傳推介力度,課題組積極組織、大力支持各類學(xué)術(shù)交流活動(dòng)。一方面,“請(qǐng)進(jìn)來”,邀請(qǐng)國內(nèi)外專家學(xué)者參與本課題研究或給予指導(dǎo);另一方面,“走出去”,積極參加國內(nèi)外學(xué)術(shù)會(huì)議,出國訪問學(xué)習(xí),走訪國內(nèi)外相關(guān)研究單位,開展學(xué)術(shù)報(bào)告,向國內(nèi)外學(xué)界介紹我們的研究進(jìn)展與成果。

目前,課題組與國際計(jì)量語言學(xué)的幾個(gè)主要研究機(jī)構(gòu),如德國特里爾大學(xué)、波鴻大學(xué)、法蘭克福大學(xué)、奧地利維也納大學(xué)、捷克奧洛穆茨帕拉茨基大學(xué)、西班牙加泰倫尼亞理工大學(xué)等機(jī)構(gòu)的學(xué)者保持著密切的學(xué)術(shù)交流關(guān)系,并已展開一些實(shí)質(zhì)性的研究。項(xiàng)目首席專家劉海濤為Journal of Quantitative Linguistics、Glottometrics、Glottotheory三本國際著名的計(jì)量語言學(xué)期刊的編委會(huì)成員,這一方面保證了本課題組各項(xiàng)研究內(nèi)容的前沿性,另一方面也為課題組研究成果的國際交流與共享創(chuàng)造了條件。

課題組2012年年度會(huì)議于2012年12月16日在浙江大學(xué)紫金港校區(qū)舉行。會(huì)議特邀教育部語言文字應(yīng)用研究所馮志偉研究員出席指導(dǎo)。馮志偉研究員聽取課題組關(guān)于已取得的研究成果與正在開展的研究課題的匯報(bào)后給予充分肯定,并就研究中遇到的一些具體問題給出了指導(dǎo)性建議。同時(shí)他還鼓勵(lì)課題組要爭取更多地在國際上發(fā)表課題相關(guān)研究成果,以增強(qiáng)我國人文社會(huì)科學(xué)研究在國際學(xué)術(shù)界的影響力。

課題組成員已有數(shù)人出國訪問、學(xué)習(xí),如:王璐目前在德國特里爾大學(xué)跟隨國際計(jì)量語言學(xué)會(huì)前會(huì)長Reinhard K?hler學(xué)習(xí)計(jì)量語言學(xué),開展?jié)h語計(jì)量研究;陳芯瑩于2013年8月赴意大利參加國際計(jì)量語言學(xué)暑期班(IQLA-GIAT International Summer School on Quantitative Analysis of Textual Data)進(jìn)修;瞿云華曾赴美國跟隨著名語料庫專家Douglas Biber學(xué)習(xí),開展語料庫語言學(xué)研究;樂明也曾赴美隨著名語言學(xué)家Joan Bybee學(xué)習(xí),開展語言的歷時(shí)計(jì)量研究。

課題組成員何蓮珍、馬博森、李德高、王永、梁君英、陳芯瑩等多次參加國內(nèi)外學(xué)術(shù)會(huì)議并在會(huì)上宣讀了與本課題有關(guān)的學(xué)術(shù)論文。

三、代表性成果簡介

課題組在計(jì)量語言學(xué)理論與方法、漢語(語音、詞匯、句法、語義、語體等)計(jì)量研究、多語計(jì)量研究、語言認(rèn)知、語言計(jì)量研究方法創(chuàng)新等方面取得了豐富的研究成果。以下選取各方面代表性成果進(jìn)行簡要介紹。

1. 《計(jì)量語言學(xué)的現(xiàn)狀、理論與方法》(發(fā)表于《浙江大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版)》2012年第2期)

本文從理論、方法、歷史與現(xiàn)狀等方面,系統(tǒng)地總結(jié)和介紹了計(jì)量語言學(xué)這一新興的和重要的語言學(xué)分支學(xué)科。計(jì)量語言學(xué)以真實(shí)語料為基礎(chǔ),用精確的方法來研究語言結(jié)構(gòu)與發(fā)展規(guī)律,揭示各種語言現(xiàn)象形成的內(nèi)在原因,探索語言系統(tǒng)的自適應(yīng)機(jī)制和語言演化的動(dòng)因。計(jì)量語言學(xué)認(rèn)為語言是一種生物-認(rèn)知現(xiàn)象和心理-社會(huì)現(xiàn)象,語言系統(tǒng)是一個(gè)自組織、自適應(yīng)的動(dòng)態(tài)系統(tǒng),是一個(gè)復(fù)雜系統(tǒng)。計(jì)量語言學(xué)具有精確、真實(shí)、動(dòng)態(tài)三大特點(diǎn),是一個(gè)典型的文理交叉學(xué)科,具有鮮明的跨學(xué)科研究特質(zhì)。計(jì)量語言學(xué)研究對(duì)于構(gòu)建一種現(xiàn)代科學(xué)意義上的語言學(xué)理論是非常重要的。本文在回顧歷史、把握現(xiàn)狀的基礎(chǔ)上,厘清了該學(xué)科進(jìn)一步發(fā)展的走向,在向國內(nèi)學(xué)界引介國際計(jì)量語言學(xué)研究的同時(shí),對(duì)漢語的計(jì)量研究給予了特別關(guān)注,旨在引起國內(nèi)學(xué)者對(duì)該學(xué)科領(lǐng)域的重視,進(jìn)而推動(dòng)中國語言學(xué)的國際化與語言學(xué)研究的科學(xué)化水平。

2. Statistical Analysis of Chinese Phonemic Contrast(發(fā)表于Phonetica, 68, 2011,SCI、SSCI、A&HCI收錄)

在語音層面對(duì)旨在說明音位演化的Martinet假設(shè)進(jìn)行了深入研究。研究表明,如果以音位對(duì)立度(phonemic contrast)作為功能負(fù)荷(functional load)的量化指標(biāo),那么音位的功能負(fù)荷大小與某些音位的消失并無直接關(guān)系,這從定量與統(tǒng)計(jì)的角度對(duì)傳統(tǒng)的Martinet假設(shè)提出了有力的質(zhì)疑,也就是說音位的功能負(fù)荷(對(duì)立度)并非越大越好。我們的研究表明,元音與輔音的音位對(duì)立度與詞長之間可以分別用兩個(gè)函數(shù)來描述:f(x)=7.249*exp(-2.673*x),f(x)=2.864*exp(-2.716*x),即:漢語的音位對(duì)立度普遍較低。較低的音位對(duì)立度意味著較高的稀疏度,從而提高了語言的冗余度。從語言的交際功能與認(rèn)知心理基礎(chǔ)來看,這種高冗余度非常有利于提高語言交際過程中信息傳遞的可靠性。這一發(fā)現(xiàn)也為設(shè)計(jì)更好的自動(dòng)語音識(shí)別系統(tǒng)提供了重要的啟發(fā)。

3. Synergetic Study on Chinese Lexical Structure(已錄用,將發(fā)表于Journal of Quantitative Linguistics,SSCI與A&HCI收錄期刊)

本研究在協(xié)同語言學(xué)理論框架下,使用《人民日?qǐng)?bào)》標(biāo)注語料庫,在漢語詞匯層面使用頻率、詞長、多義度和多文度4個(gè)屬性,實(shí)驗(yàn)了協(xié)同模型,取得良好結(jié)果。具體來說,首先,模型的直接關(guān)系,間接關(guān)系,雙重間接關(guān)系擬合結(jié)果與其他語言研究得到的結(jié)果類似。說明詞匯層面,語言是一個(gè)自適應(yīng)系統(tǒng),漢語與其他語言在這方面是一致的。其次,頻率-詞長關(guān)系,即詞長受到頻率的影響程度,較為特殊,其圖線噪聲較大,數(shù)據(jù)點(diǎn)圍繞理論曲線在一定面積內(nèi)分布。仿照此前的協(xié)同模型研究,使用時(shí)序分析的處理方法,平均移動(dòng),得到了與其他語言一樣的圖形,即圍繞理論曲線上下波動(dòng)的線圖。雖然冪律關(guān)系尚不能精確描述詞長受頻率的影響,但還是在一定程度上揭示了語言的共性。對(duì)于漢語,我們又發(fā)現(xiàn),平均移動(dòng)后的線圖,更符合指數(shù)方程。該研究一方面在語言類型上豐富了協(xié)同模型的可應(yīng)用范圍,另一方面明確了漢語自身的特點(diǎn)以及與其他語言的異同。

4. 《基于依存句法標(biāo)注樹庫的漢語語體差異研究》(發(fā)表于《語言文字應(yīng)用》2012年第4期)

以前期建設(shè)的依存句法標(biāo)注語料庫為基礎(chǔ),我們首次嘗試在句法層面對(duì)語體進(jìn)行精確的定量研究。研究表明,書面語中主語大多數(shù)由名詞充當(dāng),口語中主語大多數(shù)由代詞充當(dāng);書面語的定語構(gòu)成中名詞占絕對(duì)優(yōu)勢;口語中定語構(gòu)成中量詞結(jié)構(gòu)和“的”字結(jié)構(gòu)占多數(shù);書面語中副詞占29.8%,介詞結(jié)構(gòu)占24.8%;口語中副詞占57.5%,介詞結(jié)構(gòu)占10.6%;書面語中補(bǔ)語構(gòu)成較分散,口語中補(bǔ)語構(gòu)成較集中,主要是動(dòng)詞。不同語體在謂語、賓語的詞類構(gòu)成方面差別較小,定語、狀語、補(bǔ)語等在詞類構(gòu)成上分布較為分散。該研究基于大量真實(shí)語料,將句法計(jì)量研究與語體比較研究相結(jié)合,對(duì)不同語體進(jìn)行定量的描寫與比較,有助于發(fā)現(xiàn)潛在的語言規(guī)律。

5. Syntactic Variations in Chinese-English Code-switching(發(fā)表于Lingua, 123(1), 2013,SSCI與A&HCI收錄)

語碼轉(zhuǎn)換是指在日常交際中兩種或兩種以上語言或語言變體的語言運(yùn)用;跐h英語碼轉(zhuǎn)換的依存樹庫,我們發(fā)現(xiàn):漢英語碼轉(zhuǎn)換樹庫存在依存距離的變異和以依存方向?yàn)闇y量指標(biāo)的詞序變異;祀s依存比具有相同支配詞的單語依存的平均依存距離長。具體而言,漢英語碼轉(zhuǎn)換語料庫的平均依存距離比英語單語的平均依存距離長,比漢語單語的平均依存距離短。在語碼轉(zhuǎn)換樹庫中,存在兩類依存關(guān)系:單語依存和混雜依存。混雜依存類型比單語依存類型的平均依存距離長。主要語法關(guān)系(主語、賓語、定語和狀語)在句法變異中發(fā)揮著重要作用。依存方向在單語依存和混雜依存中的分布差異導(dǎo)致了語碼轉(zhuǎn)換的詞序變異。主要語法關(guān)系在單語依存和混雜依存中的分布差異導(dǎo)致了依存方向的分布差異。本研究以基于真實(shí)語料庫的計(jì)量語言學(xué)方法來研究語言在實(shí)際使用中呈現(xiàn)的趨勢和傾向,并進(jìn)而探究了這些趨勢和傾向背后的認(rèn)知功能等機(jī)制。把計(jì)量語言學(xué)研究成果和認(rèn)知科學(xué)研究有機(jī)地結(jié)合起來無疑將使我們對(duì)語言有更為深入的認(rèn)識(shí)。

6. Probability Distribution of Semantic Roles in a Chinese Treebank Annotated with Semantic Roles(發(fā)表于Synergetic Linguistics: Text and Languages as Dynamic Systems. Wien: Praesens Verlag. 2012)

語義是語言學(xué)的重要研究領(lǐng)域,但是目前該領(lǐng)域的計(jì)量研究非常少見。以語義標(biāo)注語料庫為基礎(chǔ),我們首次對(duì)漢語語義角色的分布進(jìn)行了研究。研究表明,漢語中語義角色的的頻率(frequency)以及頻率秩(frequency-rank)之間存在函數(shù)關(guān)系。語義角色的分布符合右截尾Zipf-Alekseev分布。這一發(fā)現(xiàn)有力地說明,在語義層面上語言的演化同樣經(jīng)歷了其他語言層面曾經(jīng)出現(xiàn)過的多樣化(diversification)過程。也就是說,各種不同的語義角色都是由某一個(gè)原型角色通過多樣化過程不斷演化發(fā)展而產(chǎn)生的。

7. Quantitative Typological Analysis of Romance Languages(發(fā)表于Poznań Studies in Contemporary Linguistics, 48(4), 2012,SSCI與A&HCI收錄)

以依存樹庫和相應(yīng)的句法復(fù)雜網(wǎng)絡(luò)為基礎(chǔ),將句法計(jì)量研究方法與句法復(fù)雜網(wǎng)絡(luò)研究方法應(yīng)用于羅曼語族的語言歷時(shí)研究和類型學(xué)共時(shí)研究。結(jié)果表明,著眼于整體的句法復(fù)雜網(wǎng)絡(luò)參數(shù)聚類分析和句法依存方向定量分析很好地體現(xiàn)了語言變化與差異的連續(xù)性,可以較好的揭示語言的歷時(shí)變化以及共時(shí)的類型學(xué)差異,為羅曼語族的歷史句法演變以及共時(shí)區(qū)分問題提供了令人滿意的答案。傳統(tǒng)的語言學(xué)解構(gòu)觀點(diǎn)可以對(duì)語言中某些細(xì)節(jié)的具體的問題做出描述。物理學(xué)中的復(fù)雜網(wǎng)絡(luò)分析方法和基于真實(shí)語料的計(jì)量方法則可以幫助我們從整體的角度來觀察語言。這種整體的觀點(diǎn)對(duì)于語言類型學(xué)的研究具有重要的意義。因?yàn)椴煌Z言之間的差異是連續(xù)的,這意味著定性的傳統(tǒng)類型學(xué)研究方法有很大局限性。因?yàn)閺牟煌募?xì)節(jié)著眼,人們會(huì)對(duì)不同語族(如羅曼語族)的劃分得出完全不同的觀點(diǎn)。該研究將句法復(fù)雜網(wǎng)絡(luò)方法、依存樹庫計(jì)量方法與語言歷時(shí)研究、語言類型學(xué)研究結(jié)合起來,具有較強(qiáng)的研究方法指導(dǎo)意義。

8. Language Clustering with Word co-occurrence Networks based on Parallel Texts(發(fā)表于Chinese Science Bulletin, 58(10), 2013,SCI收錄)

將語言作為一個(gè)系統(tǒng)的觀念是現(xiàn)代語言學(xué)中最重要的假設(shè)之一。語言學(xué)的傳統(tǒng)方法無法揭示語言在宏觀尺度上的整體特征。而能夠以整體觀考察各種系統(tǒng)的復(fù)雜網(wǎng)絡(luò)可以彌補(bǔ)語言學(xué)在這方面的欠缺。對(duì)語言網(wǎng)絡(luò)的定量分析可望成為語言學(xué)中不同領(lǐng)域的潛在研究方法。語言分類就是一個(gè)有代表性的例子。以往研究表明,基于真實(shí)語料構(gòu)建句法依存網(wǎng)絡(luò),并采用這些網(wǎng)絡(luò)的主要參數(shù)進(jìn)行聚類分析,能夠大致反映出對(duì)應(yīng)的語言在語言譜系中的親緣關(guān)系。由于語言復(fù)雜網(wǎng)絡(luò)反映的正是語言在宏觀尺度上的整體特征,基于復(fù)雜網(wǎng)絡(luò)的語言分類是對(duì)整體類型學(xué)的一大貢獻(xiàn)。然而,這些研究所獲得的語言分類并不精細(xì),一般只滿足于將不同的語言大致劃入各自的語族。從方法上講,這些研究存在兩大問題。一是構(gòu)建句法依存網(wǎng)絡(luò)所采用的語料在語義內(nèi)容和語體方面不一致,可能會(huì)影響分類結(jié)果。二是句法依存網(wǎng)絡(luò)的構(gòu)建費(fèi)時(shí)費(fèi)力,不適用于對(duì)較多語言進(jìn)行分類。考慮到以上這些問題,本研究采用了在語義和語體上均一致的平行文本作為語料,采用可以自動(dòng)方式構(gòu)建的詞同現(xiàn)網(wǎng)絡(luò)作為網(wǎng)絡(luò)模型來進(jìn)行語言分類實(shí)驗(yàn)。研究采用的平行文本共14個(gè),其中12個(gè)為斯拉夫語族不同語言的文本,其余2個(gè)為漢語和英語文本。因此,本研究能夠檢驗(yàn)復(fù)雜網(wǎng)絡(luò)方法對(duì)同一語族的不同語言的分類,即較為精細(xì)的語言分類的適用性。研究分別計(jì)算了14個(gè)詞同現(xiàn)網(wǎng)絡(luò)的10個(gè)主要參數(shù),采用這些參數(shù)的64種不同組合進(jìn)行聚類實(shí)驗(yàn)。結(jié)果表明,有15種組合能夠得出較為理想的分類結(jié)果,即,既能將斯拉夫語言與非斯拉夫語言區(qū)分開來,又能將12種斯拉夫語言正確地劃分到各自的語支中去。此外,聚類結(jié)果還能反映出某些斯拉夫語言在其語支內(nèi)部的親緣關(guān)系。該分類結(jié)果要稍好于基于斯拉夫語言中的型例關(guān)系而得出的結(jié)果,與采用包括詞匯統(tǒng)計(jì)學(xué)在內(nèi)的其他方法所得到的結(jié)果大致具有可比性。結(jié)果也表明,這些語言在書寫系統(tǒng)上的差異對(duì)其分類并無影響。這也引起我們對(duì)語言與書寫系統(tǒng)之間關(guān)系的思考。另外,由于本研究所采用的方法依據(jù)的是語言作為一個(gè)系統(tǒng)的整體特征,其分類結(jié)果明顯好于采用依存方向等語序指標(biāo)所得到的結(jié)果。這也表明, 對(duì)于像斯拉夫語言這樣具有較豐富的屈折形態(tài)變化的語言來說, 語序可能不是其分類的最佳依據(jù)。由于本研究的方法完全是從定量的角度去進(jìn)行語言分類,它反映出來的語言之間的異同是連續(xù)性的,而非離散的。本研究的結(jié)論是:平行詞同現(xiàn)網(wǎng)絡(luò)能夠被用于語言的精細(xì)分類,而且在基于復(fù)雜網(wǎng)絡(luò)的語言分類中可被用作句法依存網(wǎng)絡(luò)的一種更為便捷的替代品。本研究所采用的方法也有助于建立一種注重整體特征的、定量的、能反映語言之間連續(xù)性差異的語言類型學(xué)研究路向。

四、成果宣傳推介情況

1. 開題研討會(huì)

本課題開題研討會(huì)于2012年2月26日在浙江大學(xué)外語學(xué)院舉行。專家組由教育部語言文字應(yīng)用研究所、大連海事大學(xué)、北京大學(xué)、清華大學(xué)、廣東外語外貿(mào)大學(xué)的知名學(xué)者構(gòu)成。浙江省社會(huì)科學(xué)界聯(lián)合會(huì)、浙江省哲學(xué)社會(huì)科學(xué)規(guī)劃辦公室、浙江大學(xué)、浙江大學(xué)社會(huì)科學(xué)研究院等單位的領(lǐng)導(dǎo)同志到會(huì)指導(dǎo)。與會(huì)專家和領(lǐng)導(dǎo)認(rèn)真聽取了課題組的報(bào)告,對(duì)本課題的選題意義與價(jià)值、研究思路與方法、課題組人員配置分工等給予了充分肯定,就多方面相關(guān)問題與課題組成員展開廣泛和深入的討論,希望并一致認(rèn)為課題組能夠在語言學(xué)跨學(xué)科研究方面取得突破性進(jìn)展、取得豐碩成果,增強(qiáng)與提高中國語言學(xué)在國際學(xué)術(shù)界的聲望與話語權(quán)。開題研討會(huì)的已被國家社科規(guī)劃辦以及浙江大學(xué)相關(guān)網(wǎng)站報(bào)道。

2. 《光明日?qǐng)?bào)》刊登《計(jì)量語言學(xué):語言研究的科學(xué)化途徑》一文

2012年2月15日,《光明日?qǐng)?bào)》(第16版)刊登了本課題首席專家劉海濤撰寫的文章《計(jì)量語言學(xué):語言研究的科學(xué)化途徑》。這是該報(bào)“國家社科基金”專刊開辟“跨學(xué)科研究”專欄后的首篇文章。文章指出,語言研究的科學(xué)化一直是現(xiàn)代語言學(xué)家的一個(gè)主要努力方向與重要目標(biāo);在語言學(xué)中引入計(jì)量方法可能是語言學(xué)科學(xué)化的必要途徑;開展多層次的漢語計(jì)量語言學(xué)研究不僅是對(duì)國際計(jì)量語言學(xué)的補(bǔ)充與發(fā)展,也有助于提高中國語言學(xué)的國際化與語言學(xué)的科學(xué)化,是一個(gè)值得更多語言學(xué)家參與的領(lǐng)域。文章還對(duì)計(jì)量語言學(xué)的理論、方法、歷史與現(xiàn)狀進(jìn)行了介紹。

3. 國際著名計(jì)量語言學(xué)期刊Glottometrics對(duì)本項(xiàng)目進(jìn)行了專題報(bào)道

國際著名計(jì)量語言學(xué)刊物Glottometrics在2011年出版的第22期中,對(duì)本項(xiàng)目進(jìn)行了較詳細(xì)的報(bào)道與介紹。鑒于這本期刊在國際計(jì)量語言學(xué)中的重要地位,該報(bào)道使得幾乎所有的國際計(jì)量語言學(xué)同行都對(duì)我們的項(xiàng)目有了一個(gè)較詳細(xì)的了解,起到了很好的宣傳效果,為項(xiàng)目進(jìn)一步的國際合作奠定了基礎(chǔ)。

4. 課題組研究工作與成果的相關(guān)報(bào)道

課題組2012年年度會(huì)議于12月16-17日在浙江大學(xué)外語學(xué)院舉行。浙大相關(guān)單位的網(wǎng)站對(duì)會(huì)議召開(以及上述開題研討會(huì)與《光明日?qǐng)?bào)》刊文等)進(jìn)行了詳細(xì)報(bào)道。課題組成員共30余人參加了會(huì)議。會(huì)議回顧了課題研究的目標(biāo)、內(nèi)容、計(jì)劃進(jìn)度等,總結(jié)了已經(jīng)取得的成果,討論并明確了研究中存在的一些問題和下一步的研究計(jì)劃。

浙江大學(xué)人文學(xué)院網(wǎng)站于2013年1月以《語言與認(rèn)知研究中心博士生王琳在國際知名語言學(xué)期刊發(fā)表論文》為題報(bào)道課題組成員在Lingua發(fā)表研究成果。報(bào)道稱,“該論文的發(fā)表是長期以來堅(jiān)持跨學(xué)科研究、問題意識(shí)引導(dǎo)以及培養(yǎng)學(xué)生具有國際視野的成果體現(xiàn)”。Lingua創(chuàng)刊于1949年,是被SSCI和A&HCI同時(shí)收錄的最重要的國際普通語言學(xué)專業(yè)期刊之一。

階段性成果

序號(hào)

成果名稱

作者

成果形式

刊物名或出版社、刊發(fā)或出版時(shí)間

字?jǐn)?shù)

轉(zhuǎn)載、引用、獲獎(jiǎng)等情況

1

計(jì)量語言學(xué)的現(xiàn)狀、理論與方法

劉海濤
黃偉

論文

浙江大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版)
2012年第2期

15000

 

2

基于依存句法標(biāo)注樹庫的漢語語體差異研究

劉丙麗
牛雅嫻
劉海濤

論文

語言文字應(yīng)用
2012年第4期

12000

 

3

Statistical Analysis of Chinese Phonemic Contrast

于水源

徐春山

劉海濤

論文

Phonetica, 68. 2011.

15000

SSCI, SCI, A&HCI

4

Language Clustering with Word Co-occurrence Networks based on Parallel Texts

劉海濤

叢進(jìn)

論文

Chinese Science Bulletin, 58(10), 2013.

8000

SCI

5

Quantitative Typological Analysis of Romance Languages

劉海濤

徐春山

論文

Poznań Studies in Contemporary Linguistics, 48(4), 2012.

25000

SSCI, A&HCI

6

Syntactic Variations in Chinese-English Code-switching.

王琳

劉海濤

論文

Lingua, 123(1), 2013.

25000

SSCI, A&HCI

7

Probability Distribution of Semantic Roles in a Chinese Treebank Annotated with Semantic Roles

劉海濤

論文

In: Synergetic Linguistics: Text and Language as Dynamic Systems. Wien: Praesens Verlag. 2012.

7000

 

8

Word Length in Chinese

王璐

論文

In: Issues in Quantitative Linguistics 3. Ram-Verlag. 2013.

16000

 

9

Chinese Deaf and Hard of Hearing Adolescents’ Awareness of Thematic and Taxonomic Relations among Ordinary Concepts Represented by Pictures and Written Words

李德高等

論文

American Annals of the Deaf, 10, 2012.

16000

SSCI

10

Mosuos’ Awareness of Taxonomic Relations in Word Associations, Lexicon Decisions and Semantic Categorizations

李德高等

論文

Scandinavian Journal of Psychology, 2012, 6.

18000

SSCI

11

句法復(fù)雜網(wǎng)絡(luò)作為語體分類的知識(shí)源研究

陳芯瑩
劉海濤

論文

計(jì)算機(jī)工程與應(yīng)用
2013, 49 (8).

7500

 

(課題組供稿)

(責(zé)編:趙晶)
松滋市| 怀来县| 阿拉善右旗| 平乐县| 南京市| 尚志市| 冕宁县| 顺平县| 武宁县| 且末县| 措勤县| 焦作市| 武强县| 特克斯县| 南木林县| 赫章县| 鹤岗市| 襄城县| 临颍县| 曲麻莱县| 洮南市| 象州县| 蓝田县| 措美县| 常宁市| 抚远县| 石家庄市| 阳原县| 萨嘎县| 皮山县| 伊宁县| 天祝| 体育| 芒康县| 手游| 洞口县| 崇仁县| 那曲县| 沿河| 乐都县|