国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

文章推介 | 自然語言處理技術(shù)下的二語寫作語言特征研究:回顧與展望

0
分享至

自然語言處理技術(shù)下的二語寫作語言特征研究:回顧與展望

陳怡

摘要

本文系統(tǒng)梳理過去二三十年來國內(nèi)外運(yùn)用自然語言處理技術(shù)進(jìn)行的二語寫作語言特征研究。文獻(xiàn)回顧顯示,各類自然語言處理工具在學(xué)習(xí)者語料庫上的應(yīng)用,不僅揭示了任務(wù)、體裁、話題等中介因素下的詞匯復(fù)雜度、句法復(fù)雜度、語篇銜接等多維度語言特征與二語寫作質(zhì)量之間的關(guān)系,也為理解二語習(xí)得和二語寫作能力的發(fā)展提供了有力的實(shí)證支持。文章還概括了最近幾年這一研究領(lǐng)域的新進(jìn)展,包括語言特征指標(biāo)的拓展以及機(jī)器學(xué)習(xí)的深入運(yùn)用。文章最后提出未來研究需要特別關(guān)注的兩個重點(diǎn)方向,即理論框架的突破和技術(shù)范式的更新。

關(guān)鍵詞:二語寫作、自然語言處理技術(shù)、語言特征指標(biāo)、機(jī)器學(xué)習(xí)


正文

1. 引言

隨著計算機(jī)技術(shù)的發(fā)展,數(shù)據(jù)處理的自動化程度不斷提升,極大地推動了基于學(xué)習(xí)者語料庫的二語寫作語言特征的研究。借助各類自然語言處理工具,研究者從各維度考察了二語寫作的語言特征與文本質(zhì)量、寫作能力及其發(fā)展之間的關(guān)系,為二語寫作教學(xué)研究提供了寶貴的數(shù)據(jù)支持。Crossley(2020)對這一領(lǐng)域的研究現(xiàn)狀進(jìn)行了回顧,但并非完全針對二語,也未提及中國學(xué)者的貢獻(xiàn),加之最近幾年人工智能飛速發(fā)展,所以有必要再進(jìn)行一個綜合的回顧。本文旨在系統(tǒng)梳理過去二三十年來關(guān)于二語寫作(主要是英語二語寫作)語言特征研究的主要成果,選擇代表性研究進(jìn)行評述,總結(jié)最近幾年的新發(fā)展,展望未來研究趨勢,以期進(jìn)一步推動數(shù)字人文視域下的二語寫作教學(xué)和研究。

2. 自然語言處理工具與二語寫作語言特征

2.1 應(yīng)用于二語研究的自然語言處理工具

目前應(yīng)用于二語文本的自然語言處理工具大體可分為三類。第一類是較早出現(xiàn)的自動化詞性標(biāo)注工具,如 Biber Tagger(Biber 1988)等。第二類是專用文本特征分析工具。繼整合詞匯、句法、語篇指標(biāo)的多維度文本分析器 Coh- Metrix(Graesser et al. 2004)問世之后,新一代分化更細(xì)的文本分析器紛紛出現(xiàn)。比如 Lexical Complexity Analyzer(LCA)(Lu 2012)、Tool for the Automatic Analysis of Lexical Sophistication(TAALES)(Kyle & Crossley 2015)和 Tool for the Automatic Analysis of Lexical Diversity(TAALED)(Kyle,Crossley & Jarvis 2021)專門用于分析詞匯復(fù)雜度或復(fù)雜度下的成熟度 / 多樣性,L2 Syntactic Complexity Analyzer(L2SCA)(Lu 2011)和 Tool for the Automatic Analysis of Syntactic Sophistication and Complexity(TAASSC)(Kyle 2016)用于句法復(fù)雜度分析,Tool for the Automatic Analysis of Cohesion(TAACO)

(Crossley,Kyle & McNamara 2016)針對語篇銜接性進(jìn)行分析。第三類是通用自然語言處理庫,如 Stanford CoreNLP 和 Python 的 NLTK、spaCy、Gensim、 Stanza 等 1。上述各類自然語言處理工具的運(yùn)用,顯著提升了對學(xué)習(xí)者語料庫的分析效率,極大地推動了二語寫作語言特征的研究。

2.2 文本質(zhì)量評估視角下的二語寫作語言特征研究

運(yùn)用自然語言處理工具從學(xué)習(xí)者筆語語料庫中提取特定語言特征指標(biāo),并通過回歸分析或結(jié)構(gòu)方程模型分析這些指標(biāo)對文本整體/ 分項(xiàng)得分或評級的預(yù)測力,是二語寫作語言特征研究的核心議題之一。這類研究多以獨(dú)立寫作議論文為主,主要關(guān)注詞匯復(fù)雜度、句法復(fù)雜度、語篇銜接性等特征維度。

2.2.1 詞匯復(fù)雜度

詞 匯 復(fù) 雜 度 包括 詞 匯 密 度(density)、多 樣 性(diversity)和 成 熟 度(sophistication),是文本質(zhì)量評估的重要維度。研究表明,詞匯復(fù)雜度與 EFL 寫作質(zhì)量呈顯著正相關(guān),更高的文本質(zhì)量意味著更多樣的詞語以及更多以頻率、分布和心理語言學(xué)屬性為標(biāo)識的高階實(shí)詞的產(chǎn)出(Crossley et al. 2010)。研究發(fā)現(xiàn),指向二語寫作質(zhì)量的詞匯復(fù)雜度還包括多元(n-gram)詞語組,特別是二元和三元詞語組在本族語參照語料庫中的出現(xiàn)頻率和關(guān)聯(lián)強(qiáng)度(Kim,Crossley & Kyle 2018)。此外,還有研究通過提取構(gòu)成搭配的二元詞語組(Bestgen & Granger 2014)或具有特定依存關(guān)系但并不一定由相鄰詞構(gòu)成的詞語搭配(Paquot 2018),進(jìn)一步證明了詞語組合復(fù)雜度指標(biāo)對二語寫作質(zhì)量的貢獻(xiàn)度。

2.2.2 句法復(fù)雜度

句法復(fù)雜度也是評估二語寫作文本質(zhì)量的一個關(guān)鍵維度。研究表明,EFL議論文中的產(chǎn)出單位長度(尤其是子句平均長度)和復(fù)雜名詞結(jié)構(gòu)指標(biāo)與寫作質(zhì)量密切相關(guān)(Kyle & Crossley 2018),但關(guān)于并列結(jié)構(gòu)和子句指標(biāo)的貢獻(xiàn)度,相關(guān)研究結(jié)果并不一致。另外,微觀層面的句法復(fù)雜度指標(biāo)和宏觀層面的句法復(fù)雜度指標(biāo)孰能更好地預(yù)測EFL 寫作質(zhì)量(Biber et al. 2020),子句復(fù)雜度與復(fù)雜名詞結(jié)構(gòu)指標(biāo)在二語寫作質(zhì)量評估上的共現(xiàn)和互動關(guān)系如何(Biber,Gray & Staples 2016)等問題還需進(jìn)一步研究。

2.2.3 語篇銜接性

有研究顯示,局部銜接性指標(biāo)(如連接詞、相鄰句子之間詞元的重復(fù)或語義復(fù)現(xiàn)等)和整體銜接性指標(biāo)(如詞語形符 / 類符比、代詞 / 名詞比、指示詞出現(xiàn)頻率等)或負(fù)向預(yù)測 EFL 議論文的語篇組織得分,或與語篇組織得分無關(guān)(Crossley,Kyle & McNamara 2016),但也有研究顯示部分局部銜接性指標(biāo)能正向預(yù)測語篇組織得分(Abdi Tabari,Johnson & Gao 2024)。對于中觀銜接性指標(biāo)(如相鄰段落之間詞元的重復(fù)或語義復(fù)現(xiàn)等),雖然相關(guān)研究發(fā)現(xiàn)其與語篇組織得分呈正相關(guān),但究竟是名詞、代詞詞元還是虛詞的重復(fù)使用具有指向作用,還需進(jìn)一步研究??偟膩碚f,語篇銜接性仍是一個關(guān)注不足的領(lǐng)域。

2.2.4 多層面綜合

上述研究都是考察EFL 議論文某一維度的語言特征與寫作質(zhì)量的關(guān)系,此外還有研究綜合多個維度的語言特征,考察它們對寫作質(zhì)量的貢獻(xiàn)度,如將詞匯復(fù)雜度與句法復(fù)雜度相結(jié)合,詞匯復(fù)雜度與語篇銜接性相結(jié)合,詞匯、句法復(fù)雜度與語篇銜接性相結(jié)合,在此不一一贅述。另外,二語產(chǎn)出研究常用的復(fù)雜度 -準(zhǔn)確度 - 流利度(CAF)框架下的準(zhǔn)確度和流利度也常與詞匯、句法復(fù)雜度或語篇銜接性相結(jié)合(Peng et al. 2023)。

由于研究所包含的語言特征維度不同,加之樣本特征、樣本量、處理工具等方面的差異,這類研究得出的結(jié)論有時差別較大。另外,就某一語言特征與文本質(zhì)量的關(guān)系而言,綜合多個維度的研究與聚焦單一維度的研究結(jié)果也有很大差異。例如,Peng et al.(同上)的研究顯示,與詞匯使用偏誤和文本長度相比,詞匯復(fù)雜度對 EFL 寫作整體得分變異的解釋作用很小,這與上文提到的僅關(guān)注詞匯復(fù)雜度的研究結(jié)果迥然不同。這些都值得在今后的研究中予以關(guān)注。

2.2.5 中介因素的影響

二語寫作的質(zhì)量不僅由二語寫作能力決定,還受到諸多中介因素的影響。通過自然語言處理工具,已有研究探討了在不同中介因素下不同語言特征指標(biāo)對寫作質(zhì)量預(yù)測的差異。這些中介因素包括不同的任務(wù)形式(如無材料獨(dú)立寫作、綜合性寫作)(Guo,Crossley & McNamara 2013;Kyle & Crossley 2016)、寫作體裁(如議論文、記敘文、說明文、書信)(Zhang,Lu & Li 2022)、話題或?qū)懽魈崾镜龋╕ang,Lu & Weigle 2015;何蓮珍、孫悠夏 2015)。上述研究表明,不同類型的二語寫作既具有共同的質(zhì)量預(yù)測指標(biāo)(如文本長度、句法復(fù)雜度下的復(fù)雜名詞結(jié)構(gòu)),也具有各自獨(dú)特且對評分敏感的特征性指標(biāo)。

盡管如此,還有幾個問題需要關(guān)注。第一,研究結(jié)果之間仍存在很多不一致之處。例如,Guo,Crossley & McNamara(2013)發(fā)現(xiàn)詞匯成熟度對于綜合性寫作和無材料寫作都是一項(xiàng)重要的質(zhì)量預(yù)測指標(biāo),而 Kyle & Crossley(2016)的研究卻表明,雖然綜合性寫作能使學(xué)習(xí)者產(chǎn)出更復(fù)雜的詞匯,但包括二元詞語組在內(nèi)的詞匯多樣性和成熟度并不能預(yù)測這類寫作的質(zhì)量;相反,這兩項(xiàng)指標(biāo)是無材料寫作質(zhì)量的重要預(yù)測指標(biāo)。第二,除了 Zhang,Lu & Li(2022),基于體裁因素考察多維度語言特征對寫作質(zhì)量的預(yù)測力的研究還不多見。此外,對議論文與其他體裁的預(yù)測指標(biāo)進(jìn)行比較的研究也很有限,這限制了相關(guān)結(jié)果的概推性。第三,話題因素如何影響語言特征對二語寫作質(zhì)量的貢獻(xiàn)度尚待進(jìn)一步探究。

2.3 二語習(xí)得或二語能力發(fā)展視角下的二語寫作語言特征研究

除了文本質(zhì)量評估的視角,還有研究從二語能力發(fā)展的視角出發(fā),通過自然語言處理工具動態(tài)追蹤二語寫作語言特征指標(biāo)的變化。需要說明的是,上文評述的一些研究結(jié)合了文本質(zhì)量評估和二語能力發(fā)展這兩種視角(如 Bestgen & Granger 2014;Abdi Tabari,Johnson & Gao 2024)。Yoon & Polio(2017)等研究則專門縱向分析了學(xué)習(xí)者在 EFL 寫作中某一或多個維度語言特征的動態(tài)發(fā)展情況,還考察了體裁、話題或任務(wù)形式等中介因素對語言特征發(fā)展的影響。這些研究主要有三個發(fā)現(xiàn)。第一,隨時間顯著發(fā)展的語言特征指標(biāo)與同質(zhì)量評分顯著相關(guān)的指標(biāo)有時并不一致(Crossley & McNamara 2014),因此,有效的發(fā)展性指標(biāo)并不一定能被假定為衡量寫作質(zhì)量的有效指標(biāo)(Lu 2011)。第二,語言特征的發(fā)展并不一定呈線性上升的態(tài)勢(Bulté & Housen 2014)。第三,體裁、話題或任務(wù)特征等中介因素對不同維度語言特征發(fā)展的影響不同,對詞匯和句法復(fù)雜度

指標(biāo)的影響總體較大(Yoon & Polio 2017);即便是在同一維度內(nèi),這些因素對具體語言特征發(fā)展的影響也不一致,如寫作體裁對句法復(fù)雜度下從屬或并列子句的發(fā)展就沒有明顯影響(同上)。需要注意的是,這些動態(tài)發(fā)展研究大多以句法復(fù)雜度為焦點(diǎn),對其他特征維度的關(guān)注度還不夠。另外,一些動態(tài)研究采用了類縱向(pseudo-longitudinal)方法,并非對同一批學(xué)習(xí)者群體展開持續(xù)追蹤,而是通過不同水平組之間的比較來模擬二語發(fā)展過程,這在一定程度上可能影響研究結(jié)論的效度,未來的研究需要更多地進(jìn)行純縱向研究,以增強(qiáng)結(jié)論的解釋力。

此外,還有研究關(guān)注的是語言特征指標(biāo)的變化或差異對二語習(xí)得理論的意義。例如,Lu & Ai(2015)通過對比不同母語背景的 EFL 寫作者在多個指標(biāo)上的表現(xiàn),驗(yàn)證了語言遷移理論;何蓮珍、姜子蕓(2023)通過考察考生的工作記憶容量差異與寫作文本特征的關(guān)系,進(jìn)一步加深了對認(rèn)知負(fù)荷假說的理解;王麗萍、吳紅云、Zhang(2020)通過分析不同任務(wù)復(fù)雜度下的文本語言特征,驗(yàn)證了“競爭假說”和“認(rèn)知假說”;還有研究通過探討二語發(fā)展過程中寫作文本流利度與語篇銜接性的多維交互(張超、梁文花 2022)以及句法和詞匯復(fù)雜度的發(fā)展(鄭詠滟、馮予力 2017),證實(shí)了動態(tài)系統(tǒng)理論的解釋力。此外,一些研究通過自然語言處理工具聚焦二語學(xué)習(xí)者對某一特定目標(biāo)語特征的習(xí)得,如定語從句(Alexopoulou et al. 2015)、次范疇結(jié)構(gòu)(Huang et al. 2021)、程度表達(dá)式(Cong 2024)等??傮w而言,這些研究展現(xiàn)了自然語言處理技術(shù)在服務(wù)理論探討和驗(yàn)證方面的重要作用。

3. 二語寫作語言特征研究的新進(jìn)展

3.1 語言特征指標(biāo)的拓展

近幾年來,自然語言處理工具與語言學(xué)理論的深度融合促進(jìn)了二語寫作語言特征指標(biāo)在詞匯、句法和語篇銜接等多個維度上的創(chuàng)新。例如,在構(gòu)式理論和基于使用的語言習(xí)得理論的基礎(chǔ)上,Kyle & Crossley(2017)提出了以大型本族語語料庫為參照的主動詞詞元出現(xiàn)頻率、動詞論元構(gòu)式(VAC)出現(xiàn)頻率、主動詞詞元與 VAC 組合的出現(xiàn)頻率、主動詞詞元與 VAC 的關(guān)聯(lián)強(qiáng)度這四項(xiàng)句法復(fù)雜度新指標(biāo)。他們發(fā)現(xiàn),基于使用的句法復(fù)雜度指標(biāo)能解釋比傳統(tǒng)指標(biāo)更多的 EFL 作文得分方差。另外,也有研究同樣以基于使用的語言習(xí)得理論為基礎(chǔ),但更關(guān)注句法構(gòu)式復(fù)雜度中的產(chǎn)出多樣性。例如 Hwang & Kim(2023)開發(fā)了基于依存句法分析的構(gòu)式多樣性分析器,他們的研究表明構(gòu)式的多樣性和特定構(gòu)式的出現(xiàn)比例也能有效預(yù)測 EFL 寫作文本的質(zhì)量。

除了基于使用的語言習(xí)得理論,以依存語法、分布語義等為代表的,本身就基于計算或自然語言處理的語言學(xué)理論,也為二語寫作的語言特征分析提供了新視角。以依存語法理論為例,它為評估二語寫作質(zhì)量和分析寫作能力發(fā)展提供了新的句法復(fù)雜度指標(biāo)。Ouyang & Jiang(2017)通過對 EFL 寫作文本進(jìn)行依存關(guān)系解析后發(fā)現(xiàn),從初中一年級到英語專業(yè)研究生九個不同階段寫作文本依存距離的概率分布較好地反映了學(xué)習(xí)者目標(biāo)語寫作能力的發(fā)展;Ouyang, Jiang & Liu(2022)的研究顯示,相較于傳統(tǒng)的基于句法結(jié)構(gòu)長度或數(shù)量的復(fù)雜度指標(biāo),平均依存距離能更好地區(qū)分初級、中級和高級階段的 EFL 寫作文本。另一方面,基于依存關(guān)系類符 / 形符比的句法多樣性指標(biāo)也進(jìn)一步拓展了句法復(fù)雜度的內(nèi)涵(Bi & Jiang 2020)。

語境在意義的生成和理解中起關(guān)鍵作用,基于分布語義的詞向量技術(shù)可以更精準(zhǔn)地識別多義詞在特定語境下的語義,為二語寫作質(zhì)量分析提供具有語義感知的特征指標(biāo)。例如,Lu & Hu(2022)使用 BERT 模型對參照詞典中多義詞的例句進(jìn)行詞義向量標(biāo)注,通過詞向量相似性計算確定 EFL 作文中多義詞的確切語義,進(jìn)而提出了具有語義感知的成熟詞形符根植比、具有語義感知的成熟詞類符根植比、單個詞語詞義數(shù)量的對數(shù)均值這三個詞匯成熟度指標(biāo);與傳統(tǒng)的 TAALES 指標(biāo)相比,前兩個新指標(biāo)與 EFL 寫作得分的相關(guān)性更強(qiáng)。類似地,Lu & Hu(2024)還提出了 34 個具有語義感知的語篇銜接詞詞形指標(biāo),如語篇銜接詞詞形的數(shù)量、密度、多樣性等,這些指標(biāo)不僅區(qū)分了某一詞形在上下文中是否真正具有話語銜接功能,還明確了它們在語境中所表達(dá)的特定銜接關(guān)系,如對比、因果、擴(kuò)展、時間關(guān)系等。此外,Monteiro et al.(2023)分別利用潛在語義分析

(Latent Semantic Analysis)和 Word2Vec 模型提出了一組基于參照語料庫中詞向量相似性計算的情境語義指標(biāo),用以衡量詞語的語義豐富度和獨(dú)特性。他們的研究發(fā)現(xiàn),EFL 高分作文中往往較少使用語義豐富度高的詞語,但較多使用語義獨(dú)特性高的詞語。

無論是上述哪一種新指標(biāo),其背后都反映了基于認(rèn)知的語言習(xí)得理論(Ellis 1999)的核心思想。該理論強(qiáng)調(diào)學(xué)習(xí)者通過基于經(jīng)驗(yàn)的統(tǒng)計學(xué)習(xí)機(jī)制,在具體語境中對語言輸入進(jìn)行信息加工并形成心理表征,從而為包括語言特征分析在內(nèi)的二語研究提供更為堅實(shí)的學(xué)理基礎(chǔ),不僅“體現(xiàn)了認(rèn)知心理學(xué)的經(jīng)驗(yàn)主義,即通過觀察和實(shí)驗(yàn)來探索關(guān)于世界的真理”,也“融合了認(rèn)知科學(xué)家的理性主義,即通過構(gòu)建數(shù)學(xué)、邏輯或計算模擬等形式系統(tǒng)來形成理論”(同上: 22)。從這個意義上說,自然語言處理技術(shù)與語言學(xué)理論完全契合,有力地推動了二語寫作語言特征的研究。

3.2 機(jī)器學(xué)習(xí)的深入運(yùn)用

機(jī)器學(xué)習(xí)指一系列基于已知數(shù)據(jù)對新數(shù)據(jù)進(jìn)行分類的廣泛技術(shù)。近年來,二語寫作特征研究所涉及的機(jī)器學(xué)習(xí)技術(shù)越來越先進(jìn)和多樣化,而且機(jī)器學(xué)習(xí)也日益走向前臺,研究者們不再滿足于僅僅使用現(xiàn)成的文本分析器,而是直接使用各種機(jī)器學(xué)習(xí)技術(shù)創(chuàng)建語言特征指標(biāo)或識別關(guān)鍵特征。上文提到的 Lu & Hu(2022,2024)、Monteiro et al.(2023)等研究就是典型的例子。又如,Ma, Wang & He(2024)運(yùn)用決策樹方法,識別出了能夠清晰區(qū)分“歐洲語言共同參考框架”下不同等級 EFL 寫作文本的 11 個 Coh-Metrix 指標(biāo),并且找出了每個決策點(diǎn)上影響分類的指標(biāo)閾值。Latifi & Gierl(2021)使用隨機(jī)森林算法對大批量作文進(jìn)行自動評分后發(fā)現(xiàn),不同任務(wù)形式寫作文本的語言特征的信息含量是不同的,如何保留自動化評分中的語言特征不僅取決于寫作文本本身,還取決于題目提示等特征。再如,Tang et al.(2024)通過結(jié)合多種自動化文本分析工具得出的語言特征指標(biāo)與各種常見機(jī)器學(xué)習(xí)算法,比較了這些算法在自動評分上與人工評分基準(zhǔn)的差異。他們的研究不僅評估了不同算法的性能,還通過線性和非線性模型,揭示了文本語言特征與整體評分及各分項(xiàng)評分之間的關(guān)系,雖然這一研究針對的是英語母語寫作,但同樣適用于二語寫作。

作為機(jī)器學(xué)習(xí)中日益發(fā)展的一個分支,包括大語言模型在內(nèi)的神經(jīng)網(wǎng)絡(luò)模型近年來也被引入二語寫作特征研究中 2。例如,Crossley & Holmes(2023)比較了三種 EFL 寫作語料的自然語言處理方法在預(yù)測學(xué)習(xí)者詞匯能力方面的表現(xiàn),它們分別是基于 TAALES 傳統(tǒng)語言特征指標(biāo)的線性回歸模型,基于 Word2Vec 的分布語義嵌入模型,以及基于 BERT 的語義嵌入深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型。他們的研究表明,BERT 模型在預(yù)測學(xué)習(xí)者詞匯能力方面表現(xiàn)最優(yōu)。這些研究凸顯了大語言模型在捕捉詞匯使用語境和語義精度方面的有效性。

比起傳統(tǒng)的自然語言處理工具,基于大語言模型的詞性標(biāo)注和句法解析工具已在二語寫作語言特征的研究中展現(xiàn)出優(yōu)勢,但這些工具的性能還依賴于訓(xùn)練數(shù)據(jù)的數(shù)量和質(zhì)量(Kyle & Eguchi 2024)。Kyle & Eguchi(同上)發(fā)現(xiàn),在本族語語料訓(xùn)練的基礎(chǔ)上,經(jīng)少量二語語料訓(xùn)練的詞性標(biāo)注和句法解析模型在二語語料的處理上優(yōu)于僅經(jīng)過本族語語料訓(xùn)練的模型。另外,通過 BERT、 ChatGPT 等大模型還可直接定制對包括指向話語功能在內(nèi)的語言特征的自動化標(biāo)注(Eguchi & Kyle 2024)。因此,對大模型工具進(jìn)行經(jīng)過高質(zhì)量標(biāo)注的目標(biāo)語語料訓(xùn)練或微調(diào),進(jìn)一步提升自然語言處理標(biāo)注的精準(zhǔn)度,可能是今后二語寫作語言特征研究的一個重要內(nèi)容。此外還有一個問題值得探索。雖然現(xiàn)在大語言模型能較準(zhǔn)確地識別學(xué)習(xí)者寫作中的錯誤(Mizumoto et al. 2024),但如何精準(zhǔn)定義語言準(zhǔn)確度并對錯誤類別分配權(quán)重仍是一個充滿爭議的問題。今后的研究應(yīng)在這方面有所突破,尤其是神經(jīng)網(wǎng)絡(luò)中的“自我注意”機(jī)制可以模擬評分員根據(jù)錯誤的性質(zhì)和上下文來分配注意力,通過調(diào)整權(quán)重來反映這種注意差異。

4. 進(jìn)一步思考與展望

進(jìn)入 21 世紀(jì)以來,二語寫作語言特征的研究呈現(xiàn)出蓬勃的發(fā)展態(tài)勢,學(xué)習(xí)者語料庫為這些研究提供了堅實(shí)的數(shù)據(jù)基礎(chǔ),而自然語言處理技術(shù)的進(jìn)步則為研究提供了強(qiáng)有力的技術(shù)支持。相關(guān)研究在深化理解二語寫作能力各分支構(gòu)念、完善評分量表、推進(jìn)評分自動化、優(yōu)化診斷性評估、追蹤二語學(xué)習(xí)者寫作能力發(fā)展軌跡,以及深入理解和驗(yàn)證二語習(xí)得理論等方面都提供了很有價值的信息。結(jié)合上文的梳理,今后研究的一個方向是,在已有的研究框架下,通過更大規(guī)模的學(xué)習(xí)者語料、更標(biāo)準(zhǔn)化的語言能力評估框架以及更精準(zhǔn)的自然語言處理方法進(jìn)行更多的復(fù)制研究,以進(jìn)一步厘清先前研究結(jié)果的不一致之處,或加強(qiáng)先前研究著力不足之處。更為重要的是關(guān)注如下兩點(diǎn)。

第一,理論框架的突破。當(dāng)前二語寫作語言特征研究大多假設(shè):寫作質(zhì)量或能力發(fā)展可以通過可量化的語言特征的線性組合加以預(yù)測或解釋。然而,這一假設(shè)在很大程度上簡化了二語寫作能力這一復(fù)雜構(gòu)念。未來研究有必要突破這種以單向預(yù)測或解釋為導(dǎo)向的視角,探討各類語言特征在構(gòu)建二語寫作能力中的互動關(guān)系及多元協(xié)同機(jī)制。正如 Ortega(2015:91)所言,“我們需要更有力的、包含更多變量并具有非線性特征的思維方式”,“必須在研究設(shè)計和統(tǒng)計分析方案的制定中,充分體現(xiàn)這些變量,并捕捉它們之間復(fù)雜的交互作用”。此外,在 CAF 框架尤其是在復(fù)雜性維度上,我們亟須將語言形式特征與其所服務(wù)的語義建構(gòu)和交際功能相連接。形式上的“更復(fù)雜”并不必然指向更高的二語能力(Yasuda 2024),準(zhǔn)確性、流利度和復(fù)雜性等局部波動也不能充分反映任務(wù)型二語習(xí)得的本質(zhì)(Lambert & Kormos 2014)。因此,應(yīng)重視研究不同能力階段的二語學(xué)習(xí)者在具體的寫作情境中,如何通過特定的語言資源完成任務(wù)且達(dá)到交際適切性(communicative adequacy),并追蹤其語言特征指標(biāo)如何隨交際需求和語境適應(yīng)能力的提高而演化。這種以意義和功能為驅(qū)動的視角,有望更全面地揭示文本語言特征與二語寫作能力構(gòu)念之間的動態(tài)關(guān)系。

第二,技術(shù)范式的更新。機(jī)器學(xué)習(xí)特別是深度學(xué)習(xí)為二語寫作語言特征研究提供了前所未有的建模能力。這些神經(jīng)網(wǎng)絡(luò)模型在捕捉語言使用的上下文敏感性、語義深度和結(jié)構(gòu)復(fù)雜性方面具有顯著優(yōu)勢。然而,其“黑箱”特性也引發(fā)了學(xué)界對可解釋性的擔(dān)憂。因此,將反映形式、意義、功能的語言特征指標(biāo)與神經(jīng)網(wǎng)絡(luò)模型相結(jié)合有望逐漸成為研究前沿。這一范式不僅可以拓展二語寫作語言特征的研究范圍,而且借助可解釋人工智能(explainable AI),研究者得以追蹤模型決策路徑,從而將數(shù)據(jù)驅(qū)動的預(yù)測 / 解釋與理論驅(qū)動的預(yù)測 / 解釋有效結(jié)合,“助力二語研究者構(gòu)建涉及意義、意圖、推理和語用等維度的二語知識與發(fā)展模型”(Crossley & Holmes 2023:22),拓展可與基于特定任務(wù)的分析性評分量表實(shí)現(xiàn)多維互通的二語寫作語言特征指標(biāo)體系。盡管這種結(jié)合可能頗具挑戰(zhàn),但神經(jīng)網(wǎng)絡(luò)模型的潛力不容忽視,期待大語言模型的應(yīng)用給二語寫作語言特征研究帶來新的突破。

免責(zé)聲明:原文載于《外語教學(xué)與研究》,2025(4),版權(quán)歸作者所有,如有侵權(quán),請及時聯(lián)系刪章。

轉(zhuǎn)載自外語教學(xué)與研究公眾號

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
斯諾克最新戰(zhàn)報!常冰玉、高陽晉級,范爭一造慘案,中國3勝1負(fù)

斯諾克最新戰(zhàn)報!常冰玉、高陽晉級,范爭一造慘案,中國3勝1負(fù)

阿友田侃故事
2026-01-10 21:54:00
世體:巴薩更衣室喜歡西超杯決賽打皇馬,擊敗皇馬更有滿足感

世體:巴薩更衣室喜歡西超杯決賽打皇馬,擊敗皇馬更有滿足感

懂球帝
2026-01-10 19:28:14
最新! 中國新增20.4萬顆衛(wèi)星申請,美國批準(zhǔn)SpaceX新增7500顆衛(wèi)星!下周商業(yè)航天還要沖?

最新! 中國新增20.4萬顆衛(wèi)星申請,美國批準(zhǔn)SpaceX新增7500顆衛(wèi)星!下周商業(yè)航天還要沖?

價值線傳媒
2026-01-10 18:23:19
16倍大牛股天普股份遭證監(jiān)會立案,公司市值已從不足17億增至292億元

16倍大牛股天普股份遭證監(jiān)會立案,公司市值已從不足17億增至292億元

紅星新聞
2026-01-10 15:59:11
韓國女星兒子上節(jié)目口無遮攔,曝光稱:“父母每晚睡覺都很熱鬧”

韓國女星兒子上節(jié)目口無遮攔,曝光稱:“父母每晚睡覺都很熱鬧”

獨(dú)舞獨(dú)舞
2026-01-08 20:46:56
突發(fā)公告炸場!12家A股上市公司發(fā)布重大利空消息,看看都有哪些?

突發(fā)公告炸場!12家A股上市公司發(fā)布重大利空消息,看看都有哪些?

股市皆大事
2026-01-10 09:12:39
血脈壓制,盤點(diǎn)夏洛特公主管教弟弟路易名場面,打扒踢踹一樣不少

血脈壓制,盤點(diǎn)夏洛特公主管教弟弟路易名場面,打扒踢踹一樣不少

生活魔術(shù)專家
2026-01-10 14:04:40
比亞迪唐9系、漢9系旗艦車型官宣

比亞迪唐9系、漢9系旗艦車型官宣

IT之家
2026-01-10 20:09:05
1949年六大名著改為四大名著,去掉的那兩本家喻戶曉,你可能想不到

1949年六大名著改為四大名著,去掉的那兩本家喻戶曉,你可能想不到

歷史回憶室
2026-01-09 20:33:14
據(jù)中央組織部任職決定,田宏斌同志任中石化副總經(jīng)理、黨組成員

據(jù)中央組織部任職決定,田宏斌同志任中石化副總經(jīng)理、黨組成員

新京報政事兒
2026-01-09 19:55:03
中央提級巡視昆明市反饋意見整改工作動員部署會召開

中央提級巡視昆明市反饋意見整改工作動員部署會召開

新京報政事兒
2026-01-10 14:44:58
A股:人民日報定調(diào)!釋放強(qiáng)烈信號,股民準(zhǔn)備好,下周要沖4200?

A股:人民日報定調(diào)!釋放強(qiáng)烈信號,股民準(zhǔn)備好,下周要沖4200?

云鵬敘事
2026-01-10 00:00:06
為河北農(nóng)民取暖發(fā)聲是順應(yīng)天理人心!農(nóng)民日報不該刪稿

為河北農(nóng)民取暖發(fā)聲是順應(yīng)天理人心!農(nóng)民日報不該刪稿

灰白筆記
2026-01-08 12:40:29
油輪被抓后,普京對美國發(fā)出通牒,不到48小時,特朗普對俄讓步

油輪被抓后,普京對美國發(fā)出通牒,不到48小時,特朗普對俄讓步

現(xiàn)代小青青慕慕
2026-01-10 23:44:08
前國腳定居西班牙多年,賣5套房花費(fèi)1000萬,如今沒有工作吃老本

前國腳定居西班牙多年,賣5套房花費(fèi)1000萬,如今沒有工作吃老本

素衣讀史
2025-12-30 18:06:27
19歲河南小伙在倫敦“撿”了個瑞士爺爺,回國后硬是把他接來鄭州養(yǎng)老,臨終前老人說了一句話,讓無數(shù)人破防

19歲河南小伙在倫敦“撿”了個瑞士爺爺,回國后硬是把他接來鄭州養(yǎng)老,臨終前老人說了一句話,讓無數(shù)人破防

源溯歷史
2026-01-09 18:47:21
曝濃眉交易已無法完成!獨(dú)行俠或因禍得福:效仿雷霆馬刺崛起之路

曝濃眉交易已無法完成!獨(dú)行俠或因禍得福:效仿雷霆馬刺崛起之路

羅說NBA
2026-01-10 22:31:22
我教練呢?喀麥隆出局姆伯莫提前回歸曼聯(lián),但主教練已經(jīng)下課

我教練呢?喀麥隆出局姆伯莫提前回歸曼聯(lián),但主教練已經(jīng)下課

懂球帝
2026-01-10 10:14:29
演員向涵之道歉:帶來了不好的示范,我會認(rèn)真反省

演員向涵之道歉:帶來了不好的示范,我會認(rèn)真反省

魯中晨報
2026-01-09 18:05:38
敘軍方:恢復(fù)轟炸,重啟戰(zhàn)斗

敘軍方:恢復(fù)轟炸,重啟戰(zhàn)斗

揚(yáng)子晚報
2026-01-10 23:34:38
2026-01-11 00:44:49
英語教學(xué) incentive-icons
英語教學(xué)
英語學(xué)習(xí),讀書進(jìn)步!
21346文章數(shù) 100832關(guān)注度
往期回顧 全部

教育要聞

248分美術(shù)聯(lián)考別慌!精準(zhǔn)定位升學(xué)路徑

頭條要聞

男子帶父母去四川"純玩" 不料消費(fèi)7萬連上廁所都收費(fèi)

頭條要聞

男子帶父母去四川"純玩" 不料消費(fèi)7萬連上廁所都收費(fèi)

體育要聞

怒摔水瓶!杜蘭特30+12 難阻火箭遭雙殺

娛樂要聞

吳速玲曝兒子Joe是戀愛腦

財經(jīng)要聞

這不算詐騙嗎?水滴保誘導(dǎo)扣款惹眾怒

科技要聞

必看 | 2026開年最頂格的AI對話

汽車要聞

寶馬25年全球銷量246.3萬臺 中國仍是第一大市場

態(tài)度原創(chuàng)

親子
本地
家居
公開課
軍事航空

親子要聞

方媛曬三個女兒:大寶趴地上畫畫。二寶讀英文書,三胎睡嬰兒車?yán)?/h3>

本地新聞

云游內(nèi)蒙|“包”你再來?一座在硬核里釀出詩意的城

家居要聞

木色留白 演繹現(xiàn)代自由

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

海空英雄高翔逝世 曾駕駛殲-6打爆美軍機(jī)

無障礙瀏覽 進(jìn)入關(guān)懷版