国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AdaMCoT:讓大模型學(xué)會(huì)「看題下菜碟」,動(dòng)態(tài)選擇最佳思考語言

0
分享至



多語言大模型(MLLM)在面對(duì)多語言任務(wù)時(shí),往往面臨一個(gè)選擇難題:是用原來的語言直接回答,還是翻譯成高資源語言去推理?

實(shí)際上,不同的語言在模型內(nèi)部承載著不同的「特長(zhǎng)」。比如英語可能邏輯性強(qiáng),適合科學(xué)推理;而中文或印尼語在處理特定文化背景或押韻任務(wù)時(shí),可能比英語更具優(yōu)勢(shì)。

如何讓模型在面對(duì)不同任務(wù)時(shí),自動(dòng)選擇一條「最順手」的推理路徑?來自新加坡科技研究局(A*STAR)Nancy F. Chen 和 Ai Ti Aw 帶領(lǐng)的研究團(tuán)隊(duì),攜手新加坡科技設(shè)計(jì)大學(xué)(SUTD)Roy Ka-Wei Lee 教授團(tuán)隊(duì)共同推出了AdaMCoT(Adaptive Multilingual Chain-of-Thought)框架。AdaMCoT 的核心在于把 「用哪種語言思考」本身當(dāng)成一個(gè)可優(yōu)化的決策變量:通過自適應(yīng)地在多種語言間路由并組合鏈?zhǔn)剿伎?,再將推理結(jié)果映射回目標(biāo)語言,從而顯著提升跨語言的事實(shí)推理準(zhǔn)確性與一致性。該工作已被 AAAI 2026 主軌道接收為 Oral 論文。



  • 論文標(biāo)題: AdaMCoT: Rethinking Cross-Lingual Factual Reasoning through Adaptive Multilingual Chain-of-Thought
  • 論文鏈接: https://arxiv.org/abs/2501.16154
  • 作者單位: 新加坡 A*STAR Institute for Infocomm Research(I2R)、新加坡科技設(shè)計(jì)大學(xué)(SUTD)

研究背景與痛點(diǎn)

現(xiàn)有的跨語言推理方法通常存在「路徑依賴」:要么不做處理直接推理,容易導(dǎo)致低資源語言的幻覺;要么強(qiáng)制全部轉(zhuǎn)換成英語推理,這在處理需要保留原語言文化韻味或特定語義的任務(wù)(如寫詩、雙關(guān)語)時(shí),往往會(huì)弄巧成拙。

核心問題在于:沒有一種單一的語言適合所有的任務(wù)。

為了解決這一問題,研究團(tuán)隊(duì)提出了AdaMCoT框架。與其強(qiáng)制模型「說英語」,不如賦予模型一種自適應(yīng)的元認(rèn)知能力。AdaMCoT 能夠根據(jù)輸入問題的特性(是邏輯題、文化題還是常識(shí)題),動(dòng)態(tài)地從候選語言池(Thinking Languages)中「路由」出一條最佳的思維路徑。



方法與創(chuàng)新:讓模型「換種語言思考」


AdaMCoT 并不是「先翻譯再回答」,而是引入了一個(gè)自適應(yīng)路由機(jī)制(Adaptive Routing):模型會(huì)根據(jù)問題特性,選擇是直接用目標(biāo)語言推理,還是先在英語、中文等「思考語言」中展開鏈?zhǔn)剿伎?,再回到目?biāo)語言給出答案。



1. 雙路徑推理機(jī)制

AdaMCoT 設(shè)計(jì)了兩條主要的推理路徑:

  • 跨語言思維鏈(Cross-Lingual CoT):對(duì)于與提示語言不適配的任務(wù),模型將綜合考慮主題一致性、語言知識(shí)豐富程度等因素,選取一個(gè)合適的 “思考語言”。例如面對(duì)使用馬來文提問的數(shù)學(xué)題,模型可以選擇英文或者中文作為思考語言,利用這些語言豐富的邏輯和知識(shí)儲(chǔ)備完成推理步驟,最后將結(jié)果整合回目標(biāo)語言。
  • 直接生成(Direct Generation):對(duì)于模型本身擅長(zhǎng)的語言或特定任務(wù)(如寫詩、押韻),直接在源語言上進(jìn)行分析且生成答案,避免跨語言帶來的語義損耗。

2. 基于獎(jiǎng)勵(lì)的自適應(yīng)路由

為了讓模型「知道」何時(shí)該用哪種語言思考,研究團(tuán)隊(duì)引入了一個(gè)基于獎(jiǎng)勵(lì)的微調(diào)機(jī)制。利用 GPT-4o 作為獎(jiǎng)勵(lì)模型(Reward Model),從事實(shí)正確性、連貫性和指令遵循度等維度對(duì)不同推理路徑生成的答案進(jìn)行打分。

在訓(xùn)練階段,模型只學(xué)習(xí)那些得高分(分?jǐn)?shù) ≥ 9)的推理路徑。這種「優(yōu)勝劣汰」的機(jī)制使得 AdaMCoT 能夠根據(jù)問題類型自動(dòng)切換策略。例如,處理科學(xué)問題時(shí)可能傾向于用英語思考,而處理具有文化特色的問題時(shí)則可能保留原語言。

實(shí)驗(yàn)結(jié)果:全面超越傳統(tǒng)方法


研究團(tuán)隊(duì)在mTruthfulQA、CrossAlpaca-Eval 2.0、Cross-MMLU 和 Cross-LogiQA等多個(gè)多語言基準(zhǔn)上評(píng)估了 AdaMCoT,涵蓋了 LLaMA 3.1 和 Qwen 2.5 等主流開源模型。



1. 事實(shí)推理能力顯著提升

在 mTruthfulQA 數(shù)據(jù)集上,LLaMA3.1-8B-AdaMCoT 在 32 種語言中的 31 種上都取得了性能提升。

  • 對(duì)于中文,準(zhǔn)確率相對(duì)原模型提升9.0%;
  • 對(duì)于低資源語言如印度尼西亞語,相對(duì)提升高達(dá)12.7%;
  • 在匈牙利語、葡萄牙語和孟加拉語等語言上,更是實(shí)現(xiàn)了超過10%的絕對(duì)提升。

相比之下,傳統(tǒng)的 Prompt 工程方法(如 AutoCAP)和翻譯對(duì)齊方法在低資源語言上往往表現(xiàn)不佳,甚至出現(xiàn)倒退。

2. 跨語言一致性增強(qiáng)

實(shí)驗(yàn)表明,AdaMCoT 不僅提高了回答的準(zhǔn)確率,還顯著增強(qiáng)了跨語言的一致性。這意味著無論用戶用哪種語言提問,模型都能調(diào)用其內(nèi)部最一致的知識(shí)庫來回答,減少了「見人說人話,見鬼說鬼話」的幻覺現(xiàn)象 。



在 mTruthfulQA 數(shù)據(jù)集上的推理路徑選擇分布。大部分情況下,模型優(yōu)先選擇高資源語言(尤其是英語和中文)作為中間推理語種,從而顯著降低錯(cuò)誤率;其他語種約占 10%,主要用于提升特殊類別問題的回答準(zhǔn)確性。

深度解讀:為什么「換語言思考」有效?


為了揭示 AdaMCoT 的生效機(jī)理,研究團(tuán)隊(duì)利用Logit Lens和UMAP技術(shù)對(duì)模型的內(nèi)部狀態(tài)進(jìn)行了可視化分析。



1. Logit Lens:透視模型的思考過程

通過 Logit Lens 分析發(fā)現(xiàn),當(dāng)模型直接用低資源語言回答復(fù)雜問題時(shí),中間層的預(yù)測(cè)往往充滿噪聲和幻覺。而當(dāng) AdaMCoT 引導(dǎo)模型先用英語「思考」時(shí),模型在早期層級(jí)就能鎖定正確的事實(shí)路徑,最終生成的答案更加自信且準(zhǔn)確。



2. UMAP:語義空間的對(duì)齊

UMAP 可視化顯示,AdaMCoT 成功拉近了不同語言在語義空間中的距離。經(jīng)過微調(diào)后,非英語語言的嵌入向量(Embeddings)顯著向英語中心靠攏。同時(shí)并沒有破壞原有的語義結(jié)構(gòu),而是在保持整體分布的前提下,讓多語言在同一空間中更加對(duì)齊。 這表明 AdaMCoT 促進(jìn)了多語言知識(shí)在語義層面的深層融合,而非簡(jiǎn)單的表面翻譯。

總結(jié)


AdaMCoT 提出了一種全新的多語言推理范式:不改變模型參數(shù)規(guī)模,不依賴海量多語言預(yù)訓(xùn)練數(shù)據(jù),僅通過「學(xué)會(huì)如何選擇思考語言」,就能顯著釋放大模型的跨語言潛能。

這項(xiàng)工作不僅為提升低資源語言的 AI 性能提供了低成本的高效方案,也為理解大模型的跨語言對(duì)齊機(jī)制提供了新的視角。隨著 AI 全球化的推進(jìn),AdaMCoT 有望成為打破語言隔閡、實(shí)現(xiàn)「AI 普惠」的關(guān)鍵技術(shù)之一。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
江西少年葉文斌失聯(lián),僅19歲,聊天曝光,渾身是傷,母親闖柬埔寨

江西少年葉文斌失聯(lián),僅19歲,聊天曝光,渾身是傷,母親闖柬埔寨

鋭娛之樂
2026-01-01 01:12:33
醫(yī)學(xué)的盡頭真是玄學(xué)嗎?網(wǎng)友:國家不讓你迷信,沒說讓你不信

醫(yī)學(xué)的盡頭真是玄學(xué)嗎?網(wǎng)友:國家不讓你迷信,沒說讓你不信

帶你感受人間冷暖
2025-12-31 00:20:05
朱丹新年曬全家福,兒女都露正臉,倆孩子長(zhǎng)相很普通但看著好乖

朱丹新年曬全家福,兒女都露正臉,倆孩子長(zhǎng)相很普通但看著好乖

心靜物娛
2026-01-02 09:42:38
2026年田樸珺翻身,告別王石再釣大魚

2026年田樸珺翻身,告別王石再釣大魚

東方不敗然多多
2026-01-03 13:28:16
用力過猛!51歲林志玲打扮“日系”現(xiàn)身上海,網(wǎng)友:又老又年輕

用力過猛!51歲林志玲打扮“日系”現(xiàn)身上海,網(wǎng)友:又老又年輕

完善法
2025-12-31 11:05:31
朱可人:嫁給大47歲甲骨文總裁,生二胎保一生富貴,比鄧文迪高明

朱可人:嫁給大47歲甲骨文總裁,生二胎保一生富貴,比鄧文迪高明

牛牛叨史
2025-12-16 22:13:23
美媒稱馬杜羅系被美軍三角洲特種部隊(duì)抓獲

美媒稱馬杜羅系被美軍三角洲特種部隊(duì)抓獲

澎湃新聞
2026-01-03 18:29:03
大慶一男子吐槽鄰居小區(qū)內(nèi)遛藏獒等多條大型犬不牽繩,當(dāng)事人稱對(duì)方已承諾盡快將狗轉(zhuǎn)移,社區(qū)工作人員:已與狗主人當(dāng)面協(xié)商解決

大慶一男子吐槽鄰居小區(qū)內(nèi)遛藏獒等多條大型犬不牽繩,當(dāng)事人稱對(duì)方已承諾盡快將狗轉(zhuǎn)移,社區(qū)工作人員:已與狗主人當(dāng)面協(xié)商解決

極目新聞
2026-01-02 14:17:33
全世界都在過年,伊朗卻在鬧“改朝換代”,這場(chǎng)危機(jī)將如何收?qǐng)觯?>
    </a>
        <h3>
      <a href=北向財(cái)經(jīng)
2026-01-02 22:18:57
狐貍尾巴終究藏不住,他“妻妾成群”,大兒子和鞏俐越長(zhǎng)越像?

狐貍尾巴終究藏不住,他“妻妾成群”,大兒子和鞏俐越長(zhǎng)越像?

豐譚筆錄
2026-01-03 07:50:06
中國最后流失的領(lǐng)土,1994年正式脫離中國,如今風(fēng)景絕佳美女無數(shù)

中國最后流失的領(lǐng)土,1994年正式脫離中國,如今風(fēng)景絕佳美女無數(shù)

豐譚筆錄
2026-01-02 09:29:55
韓國女星張?jiān)⒄J(rèn)為香港是一個(gè)獨(dú)立的國家,網(wǎng)友扒出更多的黑料

韓國女星張?jiān)⒄J(rèn)為香港是一個(gè)獨(dú)立的國家,網(wǎng)友扒出更多的黑料

小徐講八卦
2025-12-29 09:41:28
“郭芙蓉”獲自由后攜“20年積蓄”到瑞蚨祥購物?店方回應(yīng):姚晨是1日來的,事前不知情

“郭芙蓉”獲自由后攜“20年積蓄”到瑞蚨祥購物?店方回應(yīng):姚晨是1日來的,事前不知情

極目新聞
2026-01-02 20:15:14
伊朗總統(tǒng)發(fā)表講話:“伊朗正處于一場(chǎng)全面戰(zhàn)爭(zhēng)之中”

伊朗總統(tǒng)發(fā)表講話:“伊朗正處于一場(chǎng)全面戰(zhàn)爭(zhēng)之中”

環(huán)球網(wǎng)資訊
2026-01-01 19:53:05
中央巡視組原副部級(jí)巡視專員,被中紀(jì)委帶走

中央巡視組原副部級(jí)巡視專員,被中紀(jì)委帶走

法律讀品
2026-01-03 16:41:00
印度批準(zhǔn)88億美元國防采購計(jì)劃

印度批準(zhǔn)88億美元國防采購計(jì)劃

參考消息
2026-01-02 17:13:05
南京地鐵玄武門站“扶梯塌了”?系乘客鑰匙卡進(jìn)扶梯致故障

南京地鐵玄武門站“扶梯塌了”?系乘客鑰匙卡進(jìn)扶梯致故障

現(xiàn)代快報(bào)
2026-01-03 12:05:05
不敢相信!中國游客的日本住宿預(yù)訂量,在春節(jié)期間同比增加六成!

不敢相信!中國游客的日本住宿預(yù)訂量,在春節(jié)期間同比增加六成!

扶蘇聊歷史
2026-01-03 13:39:11
蔣介石評(píng)1955年元帥名單:每人都評(píng)價(jià)不簡(jiǎn)單

蔣介石評(píng)1955年元帥名單:每人都評(píng)價(jià)不簡(jiǎn)單

梁岱愛玩車
2026-01-03 11:45:24
烏專家:中國“吸干”蘇聯(lián)遺產(chǎn),我們圖紙都沒看懂,他們?cè)斐?.0

烏專家:中國“吸干”蘇聯(lián)遺產(chǎn),我們圖紙都沒看懂,他們?cè)斐?.0

博覽歷史
2025-12-29 19:26:45
2026-01-03 19:28:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12033文章數(shù) 142527關(guān)注度
往期回顧 全部

教育要聞

山東省重點(diǎn)高中,校排名多少可以上985/211?

頭條要聞

美國突襲委內(nèi)瑞拉抓獲馬杜羅 多國強(qiáng)烈譴責(zé)

頭條要聞

美國突襲委內(nèi)瑞拉抓獲馬杜羅 多國強(qiáng)烈譴責(zé)

體育要聞

快船似乎又行了

娛樂要聞

“國服嫂子”司曉迪,曝與多位男星私照

財(cái)經(jīng)要聞

具身智能搶人大戰(zhàn):畢業(yè)一年 年薪300萬

科技要聞

比亞迪銷冠!特斯拉2025年交付量跌逾8%

汽車要聞

奕派科技全年銷量275,752輛 同比增長(zhǎng)28.3

態(tài)度原創(chuàng)

數(shù)碼
房產(chǎn)
家居
親子
軍事航空

數(shù)碼要聞

云端 GPU 高歌猛進(jìn),消費(fèi)級(jí) GPU 如何跟上步伐?

房產(chǎn)要聞

海大譽(yù)府新年家年華暨2號(hào)樓耀世加推發(fā)布會(huì)圓滿落幕

家居要聞

無形有行 自然與靈感詩意

親子要聞

寶藍(lán)叔叔爸爸扮演“廚師”做了很多美食,太有趣了,快來看看吧~

軍事要聞

特朗普稱將干涉伊朗騷亂事件 伊朗政府發(fā)聲明強(qiáng)烈譴責(zé)

無障礙瀏覽 進(jìn)入關(guān)懷版