国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

杜月明 | 基于詞匯豐富性的漢語二語寫作質(zhì)量評估研究

0
分享至



基于詞匯豐富性的漢語二語寫作質(zhì)量評估研究

杜月明

南開大學(xué)

摘要

本文基于大規(guī)模二語寫作數(shù)據(jù),結(jié)合詞匯豐富性指標(biāo)體系和隨機(jī)森林算法,深入考察詞匯豐富性及各維度在漢語二語寫作質(zhì)量評估中的表現(xiàn)。研究發(fā)現(xiàn):1)基于特征重要性排序選取的前17項(xiàng)詞匯豐富性指標(biāo)能夠有效評估漢語二語寫作質(zhì)量,其準(zhǔn)確率、精確率、召回率和F1 值均達(dá)到0.642。2)詞匯多樣度在寫作質(zhì)量評估中的表現(xiàn)最優(yōu),詞匯復(fù)雜度次之,詞匯錯誤居第三位,詞匯密度表現(xiàn)相對較弱。3)各維度指標(biāo)在不同質(zhì)量組別中的預(yù)測能力存在差異。具體而言,詞匯多樣度在低中組、低高組中的區(qū)分力最強(qiáng),詞匯復(fù)雜度在中高組中的區(qū)分表現(xiàn)最佳。教師可據(jù)此調(diào)整寫作教學(xué)策略,輔助學(xué)習(xí)者提高寫作質(zhì)量。

關(guān)鍵詞:詞匯豐富性;寫作質(zhì)量;自動評估;隨機(jī)森林算法

01

引言

詞匯豐富性是衡量二語學(xué)習(xí)者語言產(chǎn)出質(zhì)量的重要標(biāo)準(zhǔn) (Laufer & Nation 1995; Read 2000)。作為一個多維度的復(fù)雜概念,詞匯豐富性通常包括詞匯多樣度 (lexical diversity)、詞匯復(fù)雜度 (lexical sophistication)、詞匯密度 (lexical density)和詞匯錯誤 (lexical error) 四個維度 (Lu 2012; De Wilde 2023)。然而,關(guān)于詞匯豐富性及各維度在二語寫作質(zhì)量評估中的表現(xiàn),學(xué)界仍存在一定爭議。McNamara et al. (2010) 認(rèn)為,詞匯多樣度和詞匯復(fù)雜度能顯著預(yù)測寫作成績,可解釋11%的寫作質(zhì)量變異。吳繼峰 (2016) 則發(fā)現(xiàn)詞匯錯誤和詞匯復(fù)雜度與寫作質(zhì)量的關(guān)系更為密切,能解釋寫作質(zhì)量總變異的46.2%。近期研究也表明,詞匯復(fù)雜度、詞匯多樣度和詞匯錯誤均能顯著預(yù)測寫作質(zhì)量,并可解釋寫作成績50%的變異 (De Wilde 2023)。

不同研究之所以存在較大差異,可能由多種因素造成。首先,測評指標(biāo)的選擇對評估結(jié)果有重大影響 (Alexopoulou et al. 2017)。盡管詞匯豐富性及其四維度概念在學(xué)界已得到普遍認(rèn)可,但鮮有研究對這四維度進(jìn)行綜合比較 (Fritz & Ruegg 2013)。例如,一些研究僅聚焦詞匯多樣度和詞匯復(fù)雜度對寫作質(zhì)量的影響(McNamara et al. 2010; Lee et al. 2021),而另外一些則專注于探究復(fù)雜度與寫作質(zhì)量的關(guān)系 (Kim et al. 2018)。即使研究選取的維度相同,所抽取的具體指標(biāo)也存在差異。以詞匯復(fù)雜度為例,前期多從詞匯難度入手,但從語言習(xí)得與測量角度來看,復(fù)雜度還應(yīng)包括詞匯習(xí)得年齡和詞頻概貌 (lexical frequency profile) 等指標(biāo) (Crossley et al. 2012; Lu 2022)。

其次,實(shí)驗(yàn)數(shù)據(jù)的差異也會影響詞匯豐富性在寫作質(zhì)量評估中的表現(xiàn)。以往研究多基于小樣本數(shù)據(jù),且研究對象在母語背景、寫作體裁及任務(wù)復(fù)雜度等方面存在諸多不同。如吳繼峰等 (2019) 以210篇韓國漢語學(xué)習(xí)者的記敘文為語料,發(fā)現(xiàn)詞匯錯誤對寫作質(zhì)量的預(yù)測效果最優(yōu),而Lee et al. (2021) 以60篇香港中學(xué)生的說明文和應(yīng)用文為數(shù)據(jù),指出匯復(fù)雜度在寫作質(zhì)量評估中的表現(xiàn)最佳。兩項(xiàng)研究均對學(xué)習(xí)者的母語背景和體裁進(jìn)行了不同限定,導(dǎo)致評估結(jié)果呈現(xiàn)出顯著差異。

可見,詞匯豐富性與寫作質(zhì)量間的關(guān)系受多種因素的影響。由于研究者在指標(biāo)選擇和數(shù)據(jù)選取上存在較大差異,且未對相關(guān)變量進(jìn)行嚴(yán)格控制,因此得出的結(jié)論不盡一致。此外,現(xiàn)有研究主要集中在英語二語領(lǐng)域,從漢語二語視角出發(fā),基于大規(guī)模作文數(shù)據(jù),結(jié)合多維度詞匯豐富性指標(biāo)展開的評估研究相對匱乏。同時,傳統(tǒng)評估方法多采用線性回歸模型,要求自變量與因變量之間具備線性關(guān)系。然而,隨著指標(biāo)維度的擴(kuò)展與數(shù)據(jù)規(guī)模的增長,這一假設(shè)往往難以成立。計(jì)算語言學(xué)的興起為語言特征的自動化提取提供了技術(shù)支撐,同時也推動了評估方法的更新迭代。以隨機(jī)森林算法 (random forest algorithm) 為代表的機(jī)器學(xué)習(xí)模型在處理大數(shù)據(jù)和多維度指標(biāo)方面展現(xiàn)出顯著優(yōu)勢,能夠有效克服傳統(tǒng)回歸模型的局限,為二語寫作質(zhì)量的評估提供了更為靈活和精準(zhǔn)的路徑(Crossley et al., 2022)。

有鑒于此,本研究以大規(guī)模漢語二語寫作數(shù)據(jù)為基礎(chǔ),構(gòu)建詞匯豐富性指標(biāo)體系,通過引入隨機(jī)森林算法,探究詞匯豐富性及各維度指標(biāo)在漢語二語寫作質(zhì)量評估中的表現(xiàn),以期為漢語二語寫作評估和教學(xué)提供支持。具體研究問題如下:

1) 詞匯豐富性在漢語二語寫作質(zhì)量評估中的整體表現(xiàn)如何?

2) 詞匯豐富性各維度在漢語二語寫作質(zhì)量評估中表現(xiàn)如何?

02

研究設(shè)計(jì)

2.1 實(shí)驗(yàn)數(shù)據(jù)

本研究所用語料來自北京語言大學(xué)“HSK動態(tài)作文語料庫2.0版1” (以下簡稱“HSK語料庫”)。該語料庫收錄了中高級漢語學(xué)習(xí)者參與漢語水平考試的命題作文。為探究詞匯豐富性在寫作質(zhì)量評估中的表現(xiàn),本文分別將80-95分、6075 分、40-55 分的作文定義為高分組、中分組和低分組,每種組別下隨機(jī)抽取1000 篇文本作為實(shí)驗(yàn)數(shù)據(jù)。該數(shù)據(jù)集涵蓋多種體裁,涉及的話題多元、學(xué)習(xí)者的母語背景多樣。

2.2 指標(biāo)選取本文綜合二語習(xí)得與評估領(lǐng)域研究成果,從詞匯多樣度、詞匯復(fù)雜度、詞匯密度、詞匯錯誤四個維度出發(fā),圍繞形符 (每篇作文中的總詞數(shù)) 和類符 (每篇作文中的詞種數(shù)),提出61項(xiàng)漢語二語詞匯豐富性測量指標(biāo) (見表1)

(1) 詞匯多樣度反映學(xué)習(xí)者心理詞庫中可提取的詞語的數(shù)量和范圍。本文首先計(jì)算每篇作文的全局詞匯多樣度,隨后計(jì)算特殊詞類 (動詞、名詞、形容詞、副詞以及修飾詞) 的變化度。詞類劃分標(biāo)準(zhǔn)參考《現(xiàn)代漢語》 (增訂六版) (2017),計(jì)算公式如表2所示。

(2) 詞匯復(fù)雜度指文本中復(fù)雜詞和高級詞的使用程度。本維度從詞匯難度、詞匯習(xí)得年齡和詞頻概貌3個層面出發(fā),提出36項(xiàng)適用漢語的復(fù)雜度指標(biāo)。其中,詞匯習(xí)得年齡指標(biāo)尚未出現(xiàn)于漢語二語寫作質(zhì)量研究中,詞頻概貌指標(biāo)在漢語二語中的使用也相對較少。具體計(jì)算方法如下:

1) 詞匯難度指不同等級詞語在作文中的分布情況。由于 《漢語水平詞匯與漢字等級大綱》(2001) (簡稱“《大綱》”) 的使用時間與HSK作文的產(chǎn)出時間相契合,因此基于 《大綱》 統(tǒng)計(jì)作文中詞語的難度具有適切性。這一層面將從形符、類符出發(fā),分別計(jì)算不同級別詞語比例等10項(xiàng)指標(biāo)。

2) 詞匯習(xí)得年齡指母語者習(xí)得某個詞匯的平均年齡 (Kyle et al. 2017)?!读x務(wù)教育常用詞表 (草案)》(2019) (簡稱“常用詞表”) 將15114個常用詞分為四個級別,本文以該表為依據(jù),基于形符和類符分別統(tǒng)計(jì)不同級別詞語的占比情況。3) 詞頻概貌指文本中不同詞頻等級的詞語的分布特征 (Laufer & Nation 1995)。本文依據(jù)BCC詞頻表與國家語委現(xiàn)代漢語平衡語料詞頻表,對作文中的詞頻信息進(jìn)行統(tǒng)計(jì)。首先分別計(jì)算兩個詞表中所有詞語的詞頻均值與標(biāo)準(zhǔn)差;隨后,以詞頻均值加減一個標(biāo)準(zhǔn)差為界,將詞匯劃分高、中、低三個等級。在此基礎(chǔ)上,提取每篇作文中不同詞頻等級詞語的占比等16項(xiàng)指標(biāo)。

(3) 詞匯密度反映信息負(fù)載的大小和語言表達(dá)的準(zhǔn)確性 (Biber et al. 2002)。研究認(rèn)為文中實(shí)詞越多,信息量越高,語言表達(dá)能力隨之越強(qiáng) (張會平 2020)。本文將實(shí)詞定義為名詞、動詞、形容詞、副詞、區(qū)別詞、數(shù)詞、量詞、代詞、嘆詞、擬聲詞,虛詞定義為介詞、連詞、助詞、語氣詞 (黃伯榮、廖序東 2017)。6項(xiàng)指標(biāo)和其計(jì)算公式見表2。

(4) 詞匯錯誤體現(xiàn)學(xué)習(xí)者語言產(chǎn)出的準(zhǔn)確性,是衡量學(xué)習(xí)者寫作質(zhì)量的重要指標(biāo)(Engber 1995; Laufer & Nation 1995; 張博 2008)。HSK語料庫將詞匯錯誤分為“錯詞錯誤”、“離合詞錯誤”、“外文詞錯誤”、“缺詞錯誤”和“多詞錯誤”五類。本文沿用此框架,分別統(tǒng)計(jì)每種錯誤類型的比例以及五種錯誤類型之和所占比例.



2.3 實(shí)驗(yàn)流程設(shè)置本文采用隨機(jī)森林算法探究詞匯豐富性在寫作質(zhì)量評估中的表現(xiàn)。首先,借助語言技術(shù)平臺 (language technology platform,LTP) 對作文文本進(jìn)行預(yù)處理,包括分句、分詞、詞性標(biāo)注等。隨后抽取并計(jì)算61項(xiàng)詞匯指標(biāo),并對所得數(shù)據(jù)進(jìn)行人工校驗(yàn),以確保結(jié)果的準(zhǔn)確性。上述實(shí)驗(yàn)流程由Python語言實(shí)現(xiàn)。

針對研究問題一,首先利用隨機(jī)森林算法計(jì)算61項(xiàng)指標(biāo)的重要性,隨后依據(jù)其重要程度將指標(biāo)逐一納入評估模型。通過繪制模型性能隨指標(biāo)數(shù)量變化的曲線圖,確定模型性能最優(yōu)時的指標(biāo)組合及其對應(yīng)的評估效果。

研究問題二的操作流程同研究問題一,即分別計(jì)算四個維度下各指標(biāo)重要性,再將其按重要性大小逐一加入模型,繪制性能變化圖,并比較四個維度的評估表現(xiàn)。此外,本文進(jìn)一步將數(shù)據(jù)劃分為“低中組”、“中高組”與“低高組” (低、中、高分別代表三種質(zhì)量),以比較四個維度指標(biāo)在不同質(zhì)量組別中的預(yù)測效果。最終通過精確率 (precision)、準(zhǔn)確率 (accuracy)、召回率 (recall) 和F1值衡量預(yù)測表現(xiàn)。

03

研究結(jié)果

3.1 詞匯豐富性在寫作質(zhì)量評估中的整體表現(xiàn)

本節(jié)展示了詞匯豐富性在漢語二語寫作質(zhì)量評估中的整體表現(xiàn)。受篇幅限制,圖1僅顯示該任務(wù)下重要性排名前20的指標(biāo)。圖2顯示將指標(biāo)按重要性程度加入后,模型性能變化情況。

據(jù)圖2可知,當(dāng)累加到第17項(xiàng)指標(biāo)時,模型預(yù)測表現(xiàn)最佳,其準(zhǔn)確率、精確率、召回率和F1值均為0.642。17項(xiàng)指標(biāo)包括詞匯多樣度下的9項(xiàng)指標(biāo),分別為形符數(shù)、類符數(shù)、CTTR、動詞變化度、RTTR、WQ TTR、TTR、BTTR、名詞變化度;詞匯復(fù)雜度下的6項(xiàng)指標(biāo),分別為甲級詞比例_類符、BCC低頻詞比例_類符、語委未收錄詞比例_類符、語委高頻詞比例_類符、一級詞比例_類符、超綱詞比例_類符;詞匯錯誤維度下的2項(xiàng)指標(biāo),分別為錯誤總占比、錯詞比例。

3.2 各維度指標(biāo)在寫作質(zhì)量評估中的表現(xiàn)

圖3分別呈現(xiàn)了四個維度下指標(biāo)在寫作質(zhì)量預(yù)測中的重要性。具體來看,詞匯多樣度中,類符數(shù)、形符數(shù)、動詞變化度的重要性排名居前;詞匯復(fù)雜度中,甲級詞比例_類符、語委高頻詞比例_類符、語委未收錄詞比例_類符的預(yù)測效度較高;詞匯密度中,Halliday_類符、Halliday_形符、虛詞實(shí)詞比_類符的排名靠前;詞匯錯誤中,錯誤總占比、錯詞比例、多詞錯誤比例對寫作質(zhì)量的解釋力較強(qiáng)。

隨后,分別將每個維度內(nèi)部的指標(biāo)按重要性依次納入評估模型,并繪制對應(yīng)性能變化圖 (見圖4)。結(jié)果顯示,當(dāng)詞匯多樣度、詞匯復(fù)雜度、詞匯密度與詞匯錯誤四個維度分別累加至第8項(xiàng)、第36項(xiàng)、第5項(xiàng)、第3項(xiàng)指標(biāo)時,模型性能達(dá)到最優(yōu),對應(yīng)的準(zhǔn)確率分別為0.576、0.565、0.411和0.456 (其他性能指標(biāo)詳見圖4)。綜合比較四個維度的最優(yōu)表現(xiàn)可知,詞匯多樣度的預(yù)測能力最強(qiáng),詞匯復(fù)雜度緊隨其后,詞匯錯誤位居第三位,而詞匯密度的表現(xiàn)相對較弱。

表3 進(jìn)一步展示了四個維度指標(biāo)在三個質(zhì)量組別中的預(yù)測準(zhǔn)確率。低中組和低高組中,四個維度的預(yù)測趨勢一致:詞匯多樣度表現(xiàn)最優(yōu),詞匯復(fù)雜度次之,詞匯錯誤居于第三,詞匯密度表現(xiàn)較差。然而,中高組中,詞匯復(fù)雜度表現(xiàn)突出,其后依次是詞匯多樣度、詞匯錯誤與詞匯密度。結(jié)果說明,詞匯多樣度在低中組、低高組間的區(qū)分能力更好,復(fù)雜度在中高組的區(qū)分表現(xiàn)更優(yōu),詞匯錯誤和詞匯密度指標(biāo)在各組間區(qū)分能力均較弱。




04

討論與分析

4.1 詞匯豐富性整體表現(xiàn)分析

以往二語寫作質(zhì)量評估多依賴小樣本語料和回歸分析,故僅能處理連續(xù)分布的線性數(shù)據(jù)。本文采用隨機(jī)森林算法,克服了傳統(tǒng)方法的局限。結(jié)果顯示,詞匯豐富性指標(biāo)在漢語二語寫作質(zhì)量評估中表現(xiàn)出色,準(zhǔn)確率、精確率、召回率和F1 值均達(dá)到0.642?;谥笜?biāo)重要性排序選取的前17項(xiàng)指標(biāo)構(gòu)建的模型,其預(yù)測性能最佳。其中包括詞匯多樣度下9項(xiàng)指標(biāo),詞匯復(fù)雜度下6項(xiàng)指標(biāo),詞匯錯誤下2項(xiàng)指標(biāo)。

詞匯多樣度下形符數(shù)、類符數(shù)、動詞變化度、CTTR、RTTR、WQ TTR、BTTR、TTR、名詞變化度在漢語二語寫作質(zhì)量評估中表現(xiàn)突出。首先,類符和形符作為反映學(xué)習(xí)者詞匯儲備的重要指標(biāo) (Crossley et al. 2014),能夠顯著預(yù)測寫作質(zhì)量,這一發(fā)現(xiàn)與吳繼峰、趙曉娜 (2020) 的研究結(jié)論一致。其次,動詞決定句子的基本結(jié)構(gòu)和意義,是句子的核心成分 (陸儉明 2013);而名詞作為意義的主要承載者,在表意過程中同樣發(fā)揮關(guān)鍵作用。因此,動詞和名詞的多樣性有助于提升語言表達(dá)的豐富性。然而,現(xiàn)有研究對動詞及名詞變化度的關(guān)注相對有限。本文基于大規(guī)模數(shù)據(jù),不僅驗(yàn)證了這兩類指標(biāo)的預(yù)測效度,也增強(qiáng)了“多樣度”在寫作評估中的表現(xiàn)力。最后,研究還發(fā)現(xiàn)相較于Uber index和TTR,CTTR、RTTR、WQ TTR、BTTR等經(jīng)過數(shù)學(xué)變換的詞匯多樣性指標(biāo)在整體寫作質(zhì)量預(yù)測中的貢獻(xiàn)更大,表明改良型TTR指標(biāo)在提升詞匯多樣度測量表現(xiàn)方面具有優(yōu)勢 (吳繼峰 2016; 鄭詠滟 2018)。

詞匯復(fù)雜度下甲級詞比例_類符、BCC低頻詞比例_類符、語委未收錄詞比例_類符、語委高頻詞比例_類符、一級詞比例_類符、超綱詞比例_類符在寫作質(zhì)量評估中較為關(guān)鍵。從語言屬性看,甲級詞、高頻詞和義務(wù)教育常用詞表中的一級詞均屬于簡單詞范疇,低頻詞、未收錄詞則可歸為復(fù)雜詞。已有研究指出,中高級學(xué)習(xí)者的書面表達(dá)仍以簡單詞為主,復(fù)雜詞的使用比例偏低 (張江麗 2018)。然而,高分作文的復(fù)雜詞比例顯著高于中低分組,簡單詞比例則相對較低,這就使得相關(guān)指標(biāo)具備較強(qiáng)的區(qū)分和預(yù)測能力。上述6項(xiàng)指標(biāo)均基于類符計(jì)算,進(jìn)一步表明在語言測量中區(qū)分類符和形符具有重要意義。

詞匯錯誤中,錯誤總占比和錯詞比例在寫作質(zhì)量評估中較為重要。已有研究表明,詞匯錯誤越少,作文分?jǐn)?shù)越高 (吳繼峰 2016)。其次,在不同類型的詞匯錯誤中,錯詞的預(yù)測效果最為顯著。這一結(jié)果可能與其在不同質(zhì)量作文中的分布差異有關(guān)。張博 (2017) 基于HSK語料庫的研究指出,錯詞是最常見的詞匯錯誤類型,其成因多與詞匯混淆有關(guān)。對于中高級學(xué)習(xí)者而言,隨著詞匯量的快速增長,易混淆詞的數(shù)量也同步增加。高分組學(xué)習(xí)者通常能較好地區(qū)分并準(zhǔn)確使用相關(guān)詞匯,而低分組則更容易出現(xiàn)誤用,從而導(dǎo)致錯詞在不同質(zhì)量組別中的分布呈現(xiàn)更明顯的區(qū)分特征。

4.2 詞匯豐富性各維度指標(biāo)評估能力對比

詞匯復(fù)雜度在漢語二語寫作質(zhì)量評估中貢獻(xiàn)較大,該結(jié)論與吳繼峰 (2016)的研究較為一致。Bulté et al. (2008) 指出詞匯復(fù)雜度與詞匯深度 (lexical width)密切相關(guān),反映學(xué)習(xí)者對語義、語用及搭配關(guān)系的掌握程度,因而能夠區(qū)分學(xué)習(xí)者的詞匯產(chǎn)出質(zhì)量。相較于僅從詞匯難度構(gòu)建詞匯復(fù)雜度指標(biāo)的研究,本研究綜合詞匯難度、詞匯習(xí)得年齡、詞頻概貌三個角度,能夠更為全面地捕捉詞匯層面的細(xì)微特征,提升詞匯復(fù)雜度在寫作評估中的作用。其次,吳繼峰 (2016)認(rèn)為詞匯多樣度對寫作質(zhì)量的預(yù)測貢獻(xiàn)較低,然而本文發(fā)現(xiàn)該維度的預(yù)測能力最強(qiáng),其原因可能與具體指標(biāo)的選取有關(guān)。吳文僅選用Uber Index一項(xiàng)指標(biāo)衡量詞匯多樣性,然而本文發(fā)現(xiàn)該指標(biāo)的重要性排名最低 (見圖3-1)??梢姡瑥亩Z習(xí)得和評估視角出發(fā),引入更為精細(xì)、更具操作性的指標(biāo)體系 (Norris & Ortega 2009),對提升寫作質(zhì)量評估尤為重要。

目前,圍繞詞匯錯誤與寫作質(zhì)量評估開展的研究相對較少。盡管吳繼峰 (2016)、王藝璇 (2017) 曾發(fā)現(xiàn)詞匯錯誤能顯著預(yù)測漢語二語寫作質(zhì)量,但上述研究僅在小規(guī)模數(shù)據(jù)上展開,研究結(jié)論是否具有普遍性有待驗(yàn)證。本文引入HSK語料庫中的錯誤標(biāo)簽,驗(yàn)證了詞匯錯誤在大規(guī)模寫作質(zhì)量評估中的有效性。此外,本文發(fā)現(xiàn),詞匯密度在寫作質(zhì)量評估中的表現(xiàn)雖低于其他維度,但準(zhǔn)確率依舊達(dá)0.411,表明該維度在寫作評估中具有一定貢獻(xiàn)。已有研究表明,詞匯密度不僅能夠衡量篇章信息含量,也能體現(xiàn)篇章難度。相較低分組,高分組作文往往立意深刻,能夠熟練運(yùn)用各類詞匯傳遞信息、論證觀點(diǎn)、表情達(dá)意。然而,部分研究卻發(fā)現(xiàn)詞匯密度與作文質(zhì)量無顯著相關(guān)性 (吳繼峰 2016; 王藝璇 2017)。究其原因,可能與語料規(guī)模有關(guān)。梁琳琳等 (2013) 曾提出,語料的規(guī)模與計(jì)量研究結(jié)果之間均存在一定關(guān)系,語料數(shù)目太少,會使樣本缺乏代表性而發(fā)生較大誤差。本研究極大擴(kuò)展作文數(shù)據(jù)規(guī)模,從而減少了因數(shù)據(jù)量不足可能帶來的誤差。

最后,本文將寫作質(zhì)量區(qū)分為低中組、中高組、低高組,發(fā)現(xiàn)詞匯豐富性各維度在不同組別間的評估能力存在差異。具體來看,詞匯多樣度在低中組、低高組的區(qū)分能力最強(qiáng),詞匯復(fù)雜度在中高組的區(qū)分能力最強(qiáng),這種差異可能與各維度間的資源競爭有關(guān)。詞匯豐富性屬于多維度構(gòu)念,在認(rèn)知資源有限的情況下,各維度會以競爭的方式爭取有限的注意力資源 (Skehan 1998),從而出現(xiàn)詞匯產(chǎn)出不均衡的現(xiàn)象。低分組學(xué)習(xí)者的詞匯知識相對薄弱,難以有效協(xié)調(diào)不同維度間的競爭關(guān)系。中分組的資源分配能力有所提升,但由于其對復(fù)雜詞和高級詞的掌握仍處于發(fā)展階段,為提高寫作質(zhì)量,只能將注意力資源集中于提升詞匯多樣度上。相較之下,高分組不僅在復(fù)雜詞和高級詞的掌握上更為熟練,且能將其靈活運(yùn)用于寫作實(shí)踐,因此能將更多注意力資源用于處理復(fù)雜的詞匯結(jié)構(gòu)中去,使得詞匯復(fù)雜度較中分組有顯著提升。因此,教師應(yīng)根據(jù)學(xué)習(xí)者的詞匯使用情況提供針對性指導(dǎo),對于低分組寫作者,應(yīng)優(yōu)先擴(kuò)大其基礎(chǔ)詞匯量以增強(qiáng)詞匯多樣性;對于中分組的寫作者,則應(yīng)更多關(guān)注復(fù)雜詞匯的使用,以進(jìn)一步提升詞匯的復(fù)雜度。

05

結(jié)論

本研究依托大規(guī)模HSK寫作數(shù)據(jù),構(gòu)建了系統(tǒng)的詞匯豐富性指標(biāo)體系,并引入隨機(jī)森林算法,系統(tǒng)考察了詞匯豐富性及其各維度指標(biāo)在漢語二語寫作評估中的表現(xiàn)。結(jié)果顯示,基于重要性排序選取的前17項(xiàng)指標(biāo)所構(gòu)建的模型能夠有效預(yù)測二語寫作質(zhì)量。進(jìn)一步分析發(fā)現(xiàn),各維度指標(biāo)在預(yù)測效能上存在顯著差異,其中詞匯多樣度的預(yù)測效果最為突出,詞匯復(fù)雜度次之,詞匯錯誤位居其后,詞匯密度表現(xiàn)最弱。此外,不同維度指標(biāo)在區(qū)分各質(zhì)量組別時的表現(xiàn)亦不相同,這可能與注意力資源競爭有關(guān)。具體而言,詞匯多樣度在低中組、低高組的區(qū)分能力最強(qiáng),詞匯復(fù)雜度在中高組的區(qū)分中更具優(yōu)勢。教師應(yīng)據(jù)此有針對性地設(shè)置寫作教學(xué)重點(diǎn),幫助學(xué)習(xí)者提高寫作質(zhì)量。同時,未來研究可進(jìn)一步融合詞匯豐富性、句法豐富性、篇章連貫性等特征,深入探討不同層面及維度的語言特征在寫作評估中的作用機(jī)制與表現(xiàn)差異。

文章來源:現(xiàn)代外語

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
1973年,曾志給毛主席寫信訴苦:我是最早的女紅軍,現(xiàn)在卻沒軍裝

1973年,曾志給毛主席寫信訴苦:我是最早的女紅軍,現(xiàn)在卻沒軍裝

歷史龍?jiān)w
2026-01-08 12:25:08
鄭欽文宣布:退出2026年澳網(wǎng) 經(jīng)評估未達(dá)到100%戰(zhàn)斗狀態(tài)

鄭欽文宣布:退出2026年澳網(wǎng) 經(jīng)評估未達(dá)到100%戰(zhàn)斗狀態(tài)

醉臥浮生
2026-01-08 15:56:12
陪睡陪玩只是冰山一角!萬達(dá)蒸發(fā)800億后,王思聰再次傳出大丑聞

陪睡陪玩只是冰山一角!萬達(dá)蒸發(fā)800億后,王思聰再次傳出大丑聞

阿器談史
2025-12-26 15:26:05
臺飛行員出事失蹤已15小時,妻子絕望崩潰!臺網(wǎng)友:這兵誰還敢當(dāng)

臺飛行員出事失蹤已15小時,妻子絕望崩潰!臺網(wǎng)友:這兵誰還敢當(dāng)

近史博覽
2026-01-08 12:59:22
日本高調(diào)報(bào)道開工建造亞洲第一巡洋艦,稱要全面碾壓055大驅(qū)

日本高調(diào)報(bào)道開工建造亞洲第一巡洋艦,稱要全面碾壓055大驅(qū)

張斌說
2026-01-06 18:06:32
人財(cái)兩空!河北29歲帥哥李晨鵬去世,結(jié)婚半年中招,錯診長達(dá)一年

人財(cái)兩空!河北29歲帥哥李晨鵬去世,結(jié)婚半年中招,錯診長達(dá)一年

鋭娛之樂
2025-10-17 11:50:47
3局激戰(zhàn)70分鐘!石宇奇拒絕冷門險(xiǎn)勝過關(guān),晉級大馬賽男單八強(qiáng)

3局激戰(zhàn)70分鐘!石宇奇拒絕冷門險(xiǎn)勝過關(guān),晉級大馬賽男單八強(qiáng)

全景體育V
2026-01-08 11:15:01
就換個LOGO?格力海報(bào)被抄襲,怒喊友商:“抄得挺像的,下次別抄了”

就換個LOGO?格力海報(bào)被抄襲,怒喊友商:“抄得挺像的,下次別抄了”

LOGO研究所
2026-01-08 09:32:19
弗格森親口蓋章!此人天生就是曼聯(lián)主帥的料 阿莫林真該學(xué)學(xué)

弗格森親口蓋章!此人天生就是曼聯(lián)主帥的料 阿莫林真該學(xué)學(xué)

瀾歸序
2026-01-08 04:23:26
“特朗普盯的還是中國,但人家有招”

“特朗普盯的還是中國,但人家有招”

觀察者網(wǎng)
2026-01-08 08:48:30
白宮:被扣油輪上船員 可能被帶到美國接受審判

白宮:被扣油輪上船員 可能被帶到美國接受審判

每日經(jīng)濟(jì)新聞
2026-01-08 07:40:58
高鐵上的仙女小姐姐,好有氣質(zhì),優(yōu)雅自然,讓人賞心悅目

高鐵上的仙女小姐姐,好有氣質(zhì),優(yōu)雅自然,讓人賞心悅目

動物奇奇怪怪
2026-01-07 08:29:02
有人問及如何評價周總理,黃永勝回憶:外交上是一把好手,搞內(nèi)政堪稱八級泥瓦

有人問及如何評價周總理,黃永勝回憶:外交上是一把好手,搞內(nèi)政堪稱八級泥瓦

源溯歷史
2025-12-22 12:14:13
白宮發(fā)出軍事威脅,丹麥希望“澄清誤解”,“美國需要格陵蘭島”令歐洲為難

白宮發(fā)出軍事威脅,丹麥希望“澄清誤解”,“美國需要格陵蘭島”令歐洲為難

環(huán)球網(wǎng)資訊
2026-01-08 07:11:06
安徽反腐:8人被查,1人被開除黨籍

安徽反腐:8人被查,1人被開除黨籍

網(wǎng)易安徽
2026-01-08 16:09:25
42歲曲婉婷現(xiàn)狀曝光!從豪宅搬到普通平房,男友卷走共同賬戶資金

42歲曲婉婷現(xiàn)狀曝光!從豪宅搬到普通平房,男友卷走共同賬戶資金

小徐講八卦
2026-01-08 09:56:21
A股:如果接下來迎來牛市,那就買這一種股票,賺到盆滿缽滿

A股:如果接下來迎來牛市,那就買這一種股票,賺到盆滿缽滿

股經(jīng)縱橫談
2026-01-08 12:07:59
兒子被同學(xué)打死,主犯僅被判賠3000元,父親在仇人家引爆炸彈!

兒子被同學(xué)打死,主犯僅被判賠3000元,父親在仇人家引爆炸彈!

極品小牛肉
2024-03-18 12:06:49
1945年重慶酒局,毛主席偶遇江青前夫,握手時說了3個字,讓張治中冷汗直流

1945年重慶酒局,毛主席偶遇江青前夫,握手時說了3個字,讓張治中冷汗直流

歷史回憶室
2026-01-05 11:05:14
特雷楊怒了!賽中慘遭交易直接爆發(fā),苦笑返場握手,原來詹皇沒錯

特雷楊怒了!賽中慘遭交易直接爆發(fā),苦笑返場握手,原來詹皇沒錯

嘴炮體壇
2026-01-08 11:17:26
2026-01-08 20:16:49
英語教學(xué) incentive-icons
英語教學(xué)
英語學(xué)習(xí),讀書進(jìn)步!
21343文章數(shù) 100832關(guān)注度
往期回顧 全部

教育要聞

不停糾正孩子,正一點(diǎn)點(diǎn)把孩子變笨

頭條要聞

女子取240萬現(xiàn)金"給外甥當(dāng)彩禮" 外甥:根本沒有對象

頭條要聞

女子取240萬現(xiàn)金"給外甥當(dāng)彩禮" 外甥:根本沒有對象

體育要聞

約基奇倒下后,一位故人邪魅一笑

娛樂要聞

抗戰(zhàn)劇《馬背搖籃》首播,獲觀眾好評

財(cái)經(jīng)要聞

微軟CTO韋青:未來人類會花錢"戒手機(jī)"

科技要聞

智譜拿下“全球大模型第一股”,憑什么

汽車要聞

從量變到"智"變 吉利在CES打出了五張牌

態(tài)度原創(chuàng)

本地
游戲
健康
手機(jī)
親子

本地新聞

1986-2026,一通電話的時空旅程

突發(fā)!《GTA6》部分劇情遭泄露

這些新療法,讓化療不再那么痛苦

手機(jī)要聞

榮耀V20感嘆號設(shè)計(jì)回歸,Magic8 Pro Air手機(jī)四配色外觀曝光

親子要聞

公婆帶不好娃影響事業(yè)

無障礙瀏覽 進(jìn)入關(guān)懷版