国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Nat Commun | 我們能精確測量“理解”嗎?基于文本嵌入的真實世界學(xué)習(xí)追蹤

0
分享至


認(rèn)知神經(jīng)科學(xué)前沿文獻(xiàn)分享


基本信息

Title:Text embedding models yield detailed conceptual knowledge maps derived from short multiple-choice quizzes

發(fā)表時間:2026-3-24

發(fā)表期刊:Nature Communications

影響因子:15.7

獲取原文:

1. 添加小助手:PSY-Brain-Frontier即可獲取PDF版本



研究背景

假設(shè)一位老師能夠擁有一張完整的、可視化的“知識地圖”,上面精確標(biāo)注了某個學(xué)生對所有概念的掌握程度,教育的效率將會發(fā)生怎樣的改變?


在現(xiàn)實中,我們評估學(xué)習(xí)效果的手段通常非常單一:給出一套測試題,計算正確率,最后得出一個分?jǐn)?shù)(比如85分或B+)。然而,這種單一維度的指標(biāo)犧牲了大量關(guān)鍵信息。兩個同樣考了85分的學(xué)生,可能在知識盲區(qū)上完全不同:一個是沒掌握某個核心概念,另一個則是對三個邊緣概念一知半解。傳統(tǒng)的實驗室記憶研究往往側(cè)重于信息的“編碼”與“提取”,難以區(qū)分機械記憶與真正的概念理解;而真實世界中的學(xué)習(xí),其核心恰恰在于將新信息編織進(jìn)已有的概念網(wǎng)絡(luò)中。

那么,我們能否從最常見的評估工具(如幾道簡單的選擇題)中,榨取出現(xiàn)實且高分辨率的認(rèn)知狀態(tài)信息?

近期發(fā)表在《Nature Communications》上的一項研究提出了一種全新的計算框架。研究者借助自然語言處理(NLP)中的文本嵌入模型,將真實的在線課程(可汗學(xué)院的物理講座)與隨堂測試題映射到同一個高維語義空間中。這篇工作不僅成功追蹤了學(xué)習(xí)者在觀看視頻前后的動態(tài)知識軌跡,還證明了我們完全可以通過極少量的測試,精準(zhǔn)預(yù)測個體對特定概念的理解程度。


研究核心總結(jié)

為了在真實學(xué)習(xí)場景中驗證這一框架,研究者讓50名參與者觀看了兩段可汗學(xué)院的科普視頻(《四種基本作用力》和《恒星的誕生》),并在觀看前、兩段視頻之間以及觀看后,分別完成了包含13道選擇題的簡短測試?;谶@些行為數(shù)據(jù),研究者得出了以下核心發(fā)現(xiàn)。

一、文本嵌入模型能精準(zhǔn)匹配測試題與課程的“高光時刻”

要評估學(xué)生學(xué)到了什么,首先需要量化課程本身的內(nèi)容。研究者沒有依賴人工標(biāo)注,而是使用主題模型(LDA)對視頻的自動生成字幕進(jìn)行了分析。他們將字幕切分為重疊的滑動窗口,提取出潛在的語義主題,從而將整段視頻轉(zhuǎn)化為一條在15維“主題空間”中隨時間移動的軌跡。

更有趣的是,當(dāng)研究者將測試題的文本也投入這個模型時,發(fā)現(xiàn)模型能夠自動識別出每道題目究竟在考察視頻哪一分哪一秒的內(nèi)容。盡管題目和字幕往往使用了完全不同的詞匯和句式,但它們在深層概念空間中的坐標(biāo)高度重合。這意味著,模型超越了表面的“詞匯匹配”,真正抓住了概念的語義關(guān)聯(lián)。


Fig 1. 實驗范式。參與者交替進(jìn)行三次包含13道選擇題的測驗和觀看兩段可汗學(xué)院的物理講座視頻。測驗題目涵蓋了講座1、講座2以及一般物理常識。


Fig 2. 課程內(nèi)容的建模過程。研究者將講座字幕分解為重疊的文本滑動窗口,利用主題模型將其轉(zhuǎn)化為高維語義空間中的軌跡,并將測試題也映射到同一共享空間中。
二、僅用少量題目即可估算“逐秒級”的動態(tài)知識軌跡

既然題目和課程時間點被映射到了同一個空間,研究者提出了一種巧妙的算法:利用參與者在某幾道題上的正確率,結(jié)合這些題目與課程各個時間點在語義空間中的距離(相關(guān)性),來反推參與者對課程每一秒內(nèi)容的掌握程度。

結(jié)果顯示,這種估算極其敏銳。在觀看《四種基本作用力》之前,參與者對該視頻內(nèi)容的知識估值很低;但觀看之后(測驗2和測驗3),對應(yīng)內(nèi)容的知識估值顯著躍升,且這種提升具有高度的內(nèi)容特異性:他們只在剛剛看過的概念區(qū)域表現(xiàn)出知識增長。


Fig 3. 講座與測試題的主題重疊度。條形圖展示了不同主題在講座時間點和測試題中的權(quán)重變異性,證明模型在粗粒度上成功捕捉了講座與對應(yīng)問題集之間的概念一致性。


Fig 4. 每道測試題捕捉了講座的哪些部分?時間序列圖顯示了具體某道題目的主題向量與視頻各個時間點主題向量的相關(guān)性,證明題目在時間線上具有高度的特異性。
三、語義空間中的知識具有“平滑性”與預(yù)測力

如果這個高維空間真的反映了人類組織知識的方式,那么它應(yīng)該具備預(yù)測能力。研究者使用廣義線性混合模型(GLMM)發(fā)現(xiàn),基于某幾個問題估算出的特定坐標(biāo)點的“知識水平”,能夠極其可靠地預(yù)測參與者能否答對該坐標(biāo)點附近的另一道陌生題目。

此外,研究者還計算了知識在語義空間中的衰減率。他們發(fā)現(xiàn),如果一個學(xué)生掌握了概念A(yù),那么他掌握概念A(yù)附近其他概念的概率會隨著語義距離的增加而平滑下降。這種“平滑性”證明了概念學(xué)習(xí)不是孤立的,理解一個概念自然會輻射到相關(guān)的概念網(wǎng)絡(luò)。


Fig 5. 逐秒估算學(xué)習(xí)者對講座內(nèi)容的掌握程度。曲線展示了在不同測驗階段,參與者對講座每一刻所呈現(xiàn)內(nèi)容的加權(quán)正確率估值,清晰反映了觀看視頻帶來的知識躍升。


Fig 6. 利用估算的知識預(yù)測對未知題目的解答成功率。模型結(jié)果表明,無論是在單次測驗內(nèi)部,還是跨越不同講座的內(nèi)容,特定坐標(biāo)的知識估值都能顯著預(yù)測參與者答對該區(qū)域題目的概率。
四、繪制可視化的二維“知識與學(xué)習(xí)地圖”

為了更直觀地展示學(xué)習(xí)成果,研究者將高維的主題空間降維投影到了二維平面上,生成了可視化的“知識地圖”(反映特定時刻懂了什么)和“學(xué)習(xí)地圖”(反映兩次測驗之間學(xué)到了什么)。

在這些地圖上,未受訓(xùn)前的區(qū)域是一片暗淡;而隨著視頻的播放,地圖上對應(yīng)講座軌跡的特定區(qū)域被依次“點亮”。這種地圖不僅能展示群體的學(xué)習(xí)軌跡,理論上也可以為每個個體生成專屬的認(rèn)知畫像,讓教育者一眼看出學(xué)生的知識盲區(qū)和優(yōu)勢所在。


Fig 7. 知識在文本嵌入空間中隨距離平滑衰減。圖表顯示,以某道答對或答錯的題目為中心,隨著語義距離的增加,參與者答對周圍題目的比例逐漸趨近于其整體平均水平。


Fig 8. 知識與學(xué)習(xí)的幾何形態(tài)映射。二維地圖直觀展示了參與者在三次測驗中的知識狀態(tài)分布(A),以及相鄰兩次測驗之間知識的動態(tài)增長區(qū)域(B),星號標(biāo)注了特定坐標(biāo)點對應(yīng)的核心詞匯云(C)。


研究意義

這項研究在理論與應(yīng)用層面都提供了重要的啟發(fā)。

在理論層面,它為“概念學(xué)習(xí)”提供了一個可計算的幾何框架。研究證實了人類的真實世界知識在語義空間中是連續(xù)且平滑的:我們并非像往硬盤里存文件那樣孤立地記憶知識點,而是以概念網(wǎng)絡(luò)的形式進(jìn)行理解。

在方法學(xué)與應(yīng)用層面,這項工作展示了如何從現(xiàn)有的、最基礎(chǔ)的教育評估工具(如選擇題)中提取出高維度的認(rèn)知狀態(tài)信息。它不需要復(fù)雜的腦機接口或冗長的一對一面試,僅靠自然語言處理模型和少量測試題,就能實現(xiàn)對學(xué)習(xí)過程的高精度追蹤。值得注意的是,研究者發(fā)現(xiàn)針對特定領(lǐng)域訓(xùn)練的輕量級主題模型(如LDA),在區(qū)分具體課程概念時,反而比龐大的通用大語言模型(如BERT)表現(xiàn)得更精準(zhǔn),這為未來開發(fā)垂直領(lǐng)域的教育AI提供了重要參考。

當(dāng)然,該研究也有其邊界。當(dāng)前的文本嵌入模型主要捕捉概念間的“語義相似度”,但尚未包含更復(fù)雜的知識圖譜結(jié)構(gòu)(如概念間的因果關(guān)系或先決條件依賴)。盡管如此,這種將抽象認(rèn)知狀態(tài)可視化的嘗試,已經(jīng)為未來的個性化自適應(yīng)教育系統(tǒng)打開了一扇極具潛力的大門。

分享人:飯鴿兒

審核:PsyBrain 腦心前沿編輯部

你好,這里是「PsyBrain 腦心前沿

專注追蹤全球認(rèn)知神經(jīng)科學(xué)的最尖端突破

視野直擊 Nature, Science, Cell 正刊 及核心子刊與頂級大刊

每日速遞「深度解讀」與「前沿快訊

科研是一場探索未知的長跑,但你無需獨行。歡迎加入PsyBrain 學(xué)術(shù)社群,和一群懂你的同行,共同丈量腦與心智的無垠前沿。

點擊卡片進(jìn)群,歡迎你的到來

一鍵關(guān)注,點亮星標(biāo) ? 前沿不走丟!


一鍵分享,讓更多人了解前沿

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
下令全面封鎖伊朗后,特朗普轉(zhuǎn)身喊話中國,就怕中國“忍無可忍”

下令全面封鎖伊朗后,特朗普轉(zhuǎn)身喊話中國,就怕中國“忍無可忍”

阿鉤科普記錄
2026-04-14 00:41:35
他是著名演員,從發(fā)病到去世僅20分鐘,主持人兒子比他更有名

他是著名演員,從發(fā)病到去世僅20分鐘,主持人兒子比他更有名

削桐作琴
2026-03-21 15:03:45
毛主席從不批評劉伯承和徐向前,一個是不忍批評,另一個無需批評

毛主席從不批評劉伯承和徐向前,一個是不忍批評,另一個無需批評

鶴羽說個事
2026-04-08 22:21:11
特朗普“反向封鎖”霍爾木茲海峽:伊朗搬起石頭砸了自己的腳

特朗普“反向封鎖”霍爾木茲海峽:伊朗搬起石頭砸了自己的腳

民間胡扯老哥
2026-04-13 19:07:02
研究表明:男性嫖娼率6.4%,女性出軌率15%,且越有錢越開放!

研究表明:男性嫖娼率6.4%,女性出軌率15%,且越有錢越開放!

黯泉
2026-04-01 17:28:39
一夜之間,中國網(wǎng)球連奪2冠!吳易昺破荒,張帥解鎖全新紀(jì)錄!

一夜之間,中國網(wǎng)球連奪2冠!吳易昺破荒,張帥解鎖全新紀(jì)錄!

劉姚堯的文字城堡
2026-04-13 10:12:02
深圳一樓盤開盤遭哄搶 保安向人群噴辣椒水 開發(fā)商甩鍋:是兼職保安私自攜帶使用

深圳一樓盤開盤遭哄搶 保安向人群噴辣椒水 開發(fā)商甩鍋:是兼職保安私自攜帶使用

閃電新聞
2026-04-13 23:32:27
伊朗能笑醒!特朗普下令封鎖霍爾木茲,并不許中國向伊朗提供武器

伊朗能笑醒!特朗普下令封鎖霍爾木茲,并不許中國向伊朗提供武器

徐醇老表哥
2026-04-13 23:18:53
爆單!問界M6預(yù)售不到20天預(yù)訂破10萬臺

爆單!問界M6預(yù)售不到20天預(yù)訂破10萬臺

快科技
2026-04-11 18:08:11
震驚!有人直接把月供干到了0.44元,直言在職場上徹底沒“弱點”

震驚!有人直接把月供干到了0.44元,直言在職場上徹底沒“弱點”

火山詩話
2026-03-19 08:38:38
勝山西更衣室!沈梓捷廖三寧直指金鑫重要性,朱松瑋寄語延續(xù)能量

勝山西更衣室!沈梓捷廖三寧直指金鑫重要性,朱松瑋寄語延續(xù)能量

籃球資訊達(dá)人
2026-04-14 00:35:11
翻盤難了?巴薩11次歐戰(zhàn)客場對同國球隊只贏過1場

翻盤難了?巴薩11次歐戰(zhàn)客場對同國球隊只贏過1場

懂球帝
2026-04-14 01:47:18
年薪3945萬,僅出戰(zhàn)20場!NBA最讓人失望球星,你要向胖虎學(xué)習(xí)

年薪3945萬,僅出戰(zhàn)20場!NBA最讓人失望球星,你要向胖虎學(xué)習(xí)

世界體育圈
2026-04-14 00:05:05
鄭麗文返臺,“三駕馬車”親自迎接、釋放2大信號!1人現(xiàn)身不簡單

鄭麗文返臺,“三駕馬車”親自迎接、釋放2大信號!1人現(xiàn)身不簡單

時尚的弄潮
2026-04-13 12:11:58
俄媒這句話直接封神,“只有把中國惹急了,世界才會安靜?!?>
    </a>
        <h3>
      <a href=流史歲月
2026-04-09 13:55:03
文強死了以后,他家里人日子過得怎么樣?

文強死了以后,他家里人日子過得怎么樣?

鑒史錄
2026-04-13 15:27:52
瓜帥:下周對陣阿森納很重要,如果我們贏不了那基本就結(jié)束了

瓜帥:下周對陣阿森納很重要,如果我們贏不了那基本就結(jié)束了

懂球帝
2026-04-13 03:25:12
氣質(zhì)貴婦穿搭:不是穿給誰看,是穿出自己

氣質(zhì)貴婦穿搭:不是穿給誰看,是穿出自己

疾跑的小蝸牛
2026-04-13 22:09:33
越發(fā)腮越帥的男星只服這5位,不整容,不油膩,連褶子都魅力十足

越發(fā)腮越帥的男星只服這5位,不整容,不油膩,連褶子都魅力十足

八斗小先生
2026-04-13 17:37:03
王立群教授:用權(quán)力泡女人,女人在你面前服服帖帖,用金錢泡女人,女人是滿臉不服氣,甚至討價還價...

王立群教授:用權(quán)力泡女人,女人在你面前服服帖帖,用金錢泡女人,女人是滿臉不服氣,甚至討價還價...

深度知局
2026-04-08 07:41:14
2026-04-14 02:08:49
PsyBrain腦心前沿
PsyBrain腦心前沿
追蹤腦科學(xué)新動態(tài),聚焦認(rèn)知與神經(jīng)新研究
306文章數(shù) 15關(guān)注度
往期回顧 全部

科技要聞

"抄作業(yè)"近四年,馬斯克版微信周五上線

頭條要聞

上海女子2個月內(nèi)結(jié)2次婚 生下的孩子卻是第3個男人的

頭條要聞

上海女子2個月內(nèi)結(jié)2次婚 生下的孩子卻是第3個男人的

體育要聞

一支球隊不夠爛,也是一種悲哀

娛樂要聞

初代“跑男團(tuán)”合體,鄧超、鹿晗缺席

財經(jīng)要聞

談判未完全關(guān)閉?3國力促美伊重啟談判

汽車要聞

不止命名更純粹 領(lǐng)克10/10+要做純電操控新王

態(tài)度原創(chuàng)

本地
數(shù)碼
藝術(shù)
旅游
公開課

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

數(shù)碼要聞

壹號本ONEXStation i1迷你主機發(fā)售,18999元

藝術(shù)要聞

你絕對想不到!這位美女畫家的夏天竟如此夢幻!

旅游要聞

“一站式”賞花

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版