網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

哈工大發(fā)現(xiàn)大模型「回聲思考」秘密：復(fù)述問題竟是推理神器！

2026-03-13 15:57:22　來(lái)源: 科技行者

北京舉報(bào)

分享至

這項(xiàng)由哈爾濱工業(yè)技術(shù)（深圳）、鵬城實(shí)驗(yàn)室和華中科技大學(xué)聯(lián)合完成的研究，發(fā)表于2026年國(guó)際學(xué)習(xí)表征會(huì)議（ICLR 2026），論文編號(hào)為arXiv:2602.06600v1。有興趣深入了解的讀者可以通過(guò)該編號(hào)查詢完整論文。

當(dāng)你向ChatGPT或其他大語(yǔ)言模型提出一個(gè)復(fù)雜的數(shù)學(xué)問題時(shí)，你可能會(huì)注意到一個(gè)有趣的現(xiàn)象：這些AI助手往往不會(huì)直接開始解題，而是先重復(fù)一遍你的問題，然后才開始真正的推理過(guò)程。比如你問"一個(gè)圓柱形容器的標(biāo)簽面積是多少"，AI會(huì)先說(shuō)"好的，這個(gè)問題是求圓柱形容器的標(biāo)簽面積..."然后才開始計(jì)算。

大多數(shù)人可能認(rèn)為這只是AI的一個(gè)小毛病，或者說(shuō)是訓(xùn)練過(guò)程中的無(wú)關(guān)緊要的副產(chǎn)品。但是，哈工大的研究團(tuán)隊(duì)卻從這個(gè)看似平常的現(xiàn)象中發(fā)現(xiàn)了驚人的秘密。他們通過(guò)深入研究發(fā)現(xiàn)，這種"回聲行為"——也就是模型重復(fù)用戶問題的傾向——實(shí)際上是一種極其聰明的認(rèn)知策略，就像人類在解決復(fù)雜問題前會(huì)默默重復(fù)題目要求一樣。

研究團(tuán)隊(duì)把這種現(xiàn)象稱為"提示回聲"（Echo of Prompt，簡(jiǎn)稱EOP）。他們發(fā)現(xiàn)，當(dāng)大語(yǔ)言模型自發(fā)地重復(fù)問題時(shí)，它們的推理準(zhǔn)確率會(huì)顯著提高。這就像一個(gè)學(xué)生在考試時(shí)，先仔細(xì)讀題、理解題意，然后再動(dòng)筆答題，往往比直接開始解題的成功率更高。

為了驗(yàn)證這個(gè)發(fā)現(xiàn)，研究團(tuán)隊(duì)進(jìn)行了一系列巧妙的實(shí)驗(yàn)。他們分析了數(shù)千個(gè)數(shù)學(xué)問題的解答過(guò)程，發(fā)現(xiàn)了一個(gè)令人震驚的規(guī)律：那些在開頭重復(fù)了問題的解答中，有超過(guò)60%都是正確的，而那些直接開始解題的答案中，正確率明顯較低。更有趣的是，研究團(tuán)隊(duì)還發(fā)現(xiàn)，即使是同一個(gè)模型在解決同一類問題時(shí)，如果開頭有"回聲"，答案準(zhǔn)確率也會(huì)大幅提升。

這個(gè)發(fā)現(xiàn)顛覆了人們對(duì)AI"廢話"的認(rèn)知。原來(lái)，那些看似冗余的重復(fù)，實(shí)際上是AI在給自己的大腦"熱身"，幫助自己更好地聚焦問題的核心。就像運(yùn)動(dòng)員在比賽前要做熱身運(yùn)動(dòng)一樣，AI通過(guò)重復(fù)問題來(lái)激活相關(guān)的"思維回路"。

更令人驚嘆的是，研究團(tuán)隊(duì)通過(guò)深入分析模型的內(nèi)部工作機(jī)制發(fā)現(xiàn)，當(dāng)模型進(jìn)行"回聲思考"時(shí)，它的注意力會(huì)更集中地放在問題的關(guān)鍵信息上。這就好比你在嘈雜的咖啡廳里，當(dāng)你專心聽某個(gè)朋友說(shuō)話時(shí)，會(huì)自動(dòng)過(guò)濾掉周圍的雜音，專注于朋友的聲音。AI的"回聲"就起到了這種"專注過(guò)濾器"的作用。

基于這些發(fā)現(xiàn)，研究團(tuán)隊(duì)開發(fā)了兩種實(shí)用的方法來(lái)利用這個(gè)"回聲效應(yīng)"。第一種叫做"回聲蒸餾訓(xùn)練"，就是專門訓(xùn)練AI模型養(yǎng)成"先復(fù)述再思考"的好習(xí)慣。第二種叫做"回聲提示"，是一種不需要額外訓(xùn)練的技巧，只需要在提問時(shí)加入一些引導(dǎo)詞，就能激發(fā)AI的回聲思考模式。

**一、深入理解"回聲現(xiàn)象"：AI的隱秘思考方式**

要理解AI的"回聲思考"，我們可以把大語(yǔ)言模型想象成一個(gè)博學(xué)但有些健忘的圖書管理員。當(dāng)你向這位管理員詢問一個(gè)復(fù)雜問題時(shí)，他不會(huì)立刻沖向書架尋找答案，而是會(huì)先在心里默念幾遍你的問題，確保自己完全理解了你的需求。這個(gè)默念的過(guò)程，就是我們所說(shuō)的"回聲"。

哈工大的研究團(tuán)隊(duì)在分析了大量AI對(duì)話數(shù)據(jù)后發(fā)現(xiàn)，這種回聲行為在不同的AI模型中都普遍存在。他們測(cè)試了包括Qwen3-8B、DeepSeek-8B等多個(gè)知名模型，發(fā)現(xiàn)回聲現(xiàn)象的出現(xiàn)頻率高達(dá)70%-86%。這說(shuō)明，這種行為并不是某個(gè)特定模型的特殊癖好，而是AI在處理復(fù)雜推理任務(wù)時(shí)的一種本能反應(yīng)。

研究團(tuán)隊(duì)進(jìn)一步分析發(fā)現(xiàn)，這些回聲通常包含200-240個(gè)詞匯單位，平均長(zhǎng)度約為219個(gè)單位。這個(gè)長(zhǎng)度恰好足夠AI完整地重述問題的核心要素，但又不會(huì)過(guò)于冗長(zhǎng)。就像人類在心里默念電話號(hào)碼時(shí)，既要完整又要簡(jiǎn)潔一樣，AI的回聲也有著精妙的平衡。

更有趣的是，研究團(tuán)隊(duì)發(fā)現(xiàn)，那些產(chǎn)生更詳細(xì)回聲的AI解答，往往具有更高的準(zhǔn)確率。這就好比一個(gè)廚師在烹飪前會(huì)仔細(xì)閱讀食譜，確保理解每一個(gè)步驟，而那些仔細(xì)閱讀的廚師往往能做出更美味的菜肴。AI的"仔細(xì)回聲"就相當(dāng)于這種認(rèn)真的準(zhǔn)備工作。

**二、揭秘回聲背后的工作原理：注意力的重新聚焦**

為了理解回聲為什么如此有效，研究團(tuán)隊(duì)深入AI的"大腦"內(nèi)部，觀察它在思考過(guò)程中的注意力分配模式。這就像給一個(gè)正在解題的學(xué)生安裝了腦電圖設(shè)備，觀察他的大腦在不同階段都在關(guān)注什么。

研究結(jié)果讓人大開眼界。當(dāng)AI進(jìn)行回聲思考時(shí)，它的注意力會(huì)經(jīng)歷一個(gè)奇妙的重組過(guò)程。在模型的中間層（大約第7-18層，可以理解為AI思維的"核心處理區(qū)域"），回聲會(huì)顯著增強(qiáng)AI對(duì)關(guān)鍵信息的關(guān)注度。具體來(lái)說(shuō)，正確答案的AI解答過(guò)程中，模型會(huì)將更多注意力（約13.69%）分配給自己重述的問題內(nèi)容，而錯(cuò)誤答案中這個(gè)比例只有10.41%。

這種注意力的差異非常關(guān)鍵。研究團(tuán)隊(duì)發(fā)現(xiàn)，成功解題的AI會(huì)在推理過(guò)程中不斷"回頭看"自己最初的理解，確保推理方向沒有偏離主題。這就像一個(gè)登山者會(huì)時(shí)不時(shí)地看看地圖和指南針，確保自己沒有走錯(cuò)路。而那些失敗的解答過(guò)程中，AI往往在推理中途就"迷失"了，忘記了原始問題的核心要求。

更進(jìn)一步的分析顯示，這種注意力重組主要發(fā)生在AI的中間層，這些層次相當(dāng)于人類大腦中負(fù)責(zé)復(fù)雜思維和推理的區(qū)域。在這些關(guān)鍵層次中，有回聲的解答過(guò)程比沒有回聲的過(guò)程顯示出更強(qiáng)的注意力聚焦能力，差異高達(dá)2.87個(gè)百分點(diǎn)。這個(gè)數(shù)字看似不大，但在AI的世界里，這樣的差異足以決定答案的對(duì)錯(cuò)。

**三、實(shí)踐驗(yàn)證：回聲效應(yīng)的神奇威力**

為了證實(shí)回聲思考的實(shí)際效果，研究團(tuán)隊(duì)設(shè)計(jì)了一個(gè)巧妙的對(duì)比實(shí)驗(yàn)。他們選擇了一些AI已經(jīng)回答錯(cuò)誤的數(shù)學(xué)題，然后在解答過(guò)程中途插入一段"現(xiàn)在我需要回頭看看原題"的提示，讓AI重新審視問題。結(jié)果令人震驚：原本錯(cuò)誤的解答過(guò)程中，有相當(dāng)比例轉(zhuǎn)向了正確答案。

具體來(lái)說(shuō)，在DeepSeek-R1-Distill-Llama-8B模型上，這種"中途回聲"策略將準(zhǔn)確率從15.85%提升到了26.22%，提升幅度超過(guò)10個(gè)百分點(diǎn)。在Qwen3-8B模型上，準(zhǔn)確率從21.34%提升到29.27%，提升近8個(gè)百分點(diǎn)。這就像給一個(gè)正在迷路的人突然提供了地圖和指南針，讓他能夠重新找到正確的方向。

有趣的是，研究團(tuán)隊(duì)還測(cè)試了一個(gè)沒有經(jīng)過(guò)推理訓(xùn)練的基礎(chǔ)模型。結(jié)果發(fā)現(xiàn)，同樣的回聲策略對(duì)這個(gè)模型幾乎沒有效果，準(zhǔn)確率維持在10.56%沒有變化。這說(shuō)明，回聲思考需要AI具備一定的推理能力才能發(fā)揮作用，就像只有會(huì)開車的人才能利用導(dǎo)航系統(tǒng)一樣。

這些實(shí)驗(yàn)結(jié)果證明了回聲不僅僅是相關(guān)性，而是真正的因果關(guān)系。AI的回聲行為確實(shí)能夠提升其推理能力，這為我們理解和改進(jìn)AI系統(tǒng)提供了新的思路。

**四、回聲蒸餾訓(xùn)練：讓AI養(yǎng)成好習(xí)慣**

既然回聲思考如此有效，研究團(tuán)隊(duì)自然想到：能否專門訓(xùn)練AI養(yǎng)成這種好習(xí)慣呢？于是他們開發(fā)了"回聲蒸餾訓(xùn)練"方法，就像給AI上了一堂"如何正確思考"的課程。

這個(gè)訓(xùn)練過(guò)程非常巧妙。研究團(tuán)隊(duì)首先收集了大量高質(zhì)量的數(shù)學(xué)解題過(guò)程，然后將其分為兩類：一類是自然包含回聲思考的解答，另一類是直接開始解題的解答。對(duì)于那些缺少回聲的解答，他們讓一個(gè)更強(qiáng)大的AI老師來(lái)"補(bǔ)課"，在解題開頭添加類似"好的，這個(gè)問題是求..."這樣的回聲片段。對(duì)于那些已經(jīng)有回聲的解答，則保持原樣。

最終，他們得到了兩個(gè)訓(xùn)練數(shù)據(jù)集：一個(gè)充滿回聲思考的"優(yōu)質(zhì)版本"，一個(gè)去除了所有回聲的"精簡(jiǎn)版本"。然后用這兩個(gè)數(shù)據(jù)集分別訓(xùn)練AI模型，看看哪種訓(xùn)練方式能產(chǎn)生更好的推理能力。

結(jié)果非常令人振奮。用"優(yōu)質(zhì)版本"訓(xùn)練出來(lái)的AI模型在各種數(shù)學(xué)測(cè)試中都表現(xiàn)更優(yōu)。在GSM8K測(cè)試中，回聲訓(xùn)練的模型比普通訓(xùn)練的模型準(zhǔn)確率高出2.8-3.4個(gè)百分點(diǎn)。更重要的是，這種提升不僅出現(xiàn)在訓(xùn)練時(shí)使用的題目類型上，在完全不同類型的數(shù)學(xué)題中也有顯著改善。比如在MathQA測(cè)試中提升了1.9個(gè)百分點(diǎn)，在更難的Hendrycks-MATH測(cè)試中提升了1.1-8.2個(gè)百分點(diǎn)。

這就像教會(huì)了一個(gè)學(xué)生良好的解題習(xí)慣后，他不僅在練習(xí)題上表現(xiàn)更好，在全新的考試題目上也能發(fā)揮得更出色。AI通過(guò)學(xué)會(huì)回聲思考，獲得了一種通用的推理技能提升。

**五、回聲提示法：無(wú)需訓(xùn)練的立竿見影技巧**

對(duì)于那些已經(jīng)部署的AI系統(tǒng)，重新訓(xùn)練并不現(xiàn)實(shí)。因此，研究團(tuán)隊(duì)還開發(fā)了一種更簡(jiǎn)便的方法——回聲提示法。這就像給AI一個(gè)小小的提醒，讓它主動(dòng)進(jìn)入回聲思考模式。

這種方法的核心是在AI解題過(guò)程中適時(shí)插入"讓我回頭看看原題"這樣的提示。當(dāng)AI在推理過(guò)程中可能偏離方向時(shí)，這個(gè)提示就像一個(gè)溫和的導(dǎo)航語(yǔ)音，提醒司機(jī)"前方路口請(qǐng)掉頭"。

研究團(tuán)隊(duì)將這種回聲提示法與目前流行的"思考令牌"方法進(jìn)行了對(duì)比。思考令牌方法是通過(guò)添加一些通用的思考詞匯（如"所以"、"嗯"）來(lái)促進(jìn)AI思考，而回聲提示法則是讓AI重新關(guān)注原始問題。測(cè)試結(jié)果顯示，回聲提示法的效果顯著優(yōu)于思考令牌方法。

在AIME24數(shù)學(xué)競(jìng)賽題目上，當(dāng)處理難度適中的問題時(shí)，回聲提示法將準(zhǔn)確率從約30%提升到了40%以上。在MATH-500測(cè)試集上，回聲提示法在各種難度級(jí)別上都表現(xiàn)出穩(wěn)定的優(yōu)勢(shì)，準(zhǔn)確率普遍提升5-10個(gè)百分點(diǎn)。這種提升看似不大，但在AI推理任務(wù)中，每一個(gè)百分點(diǎn)的提升都來(lái)之不易。

**六、深度機(jī)制分析：AI注意力的奧秘**

為了更深入地理解回聲思考的工作機(jī)制，研究團(tuán)隊(duì)進(jìn)行了詳細(xì)的注意力分析。他們發(fā)現(xiàn)，AI的注意力系統(tǒng)在處理回聲時(shí)會(huì)發(fā)生一系列精妙的調(diào)整，就像一個(gè)復(fù)雜的交響樂團(tuán)在指揮的引導(dǎo)下重新調(diào)整演奏重點(diǎn)。

在AI的32層處理層中，第7-18層（相當(dāng)于中間的"思考核心區(qū)域"）是回聲效應(yīng)最明顯的區(qū)域。在這些層次中，正確解答的AI會(huì)將更多注意力分配給自己重述的問題內(nèi)容。具體來(lái)說(shuō)，正確答案中AI對(duì)回聲內(nèi)容的注意力比錯(cuò)誤答案高出2.87個(gè)百分點(diǎn)，而對(duì)原始問題的注意力差異只有0.66個(gè)百分點(diǎn)。

這個(gè)發(fā)現(xiàn)非常有趣。它說(shuō)明AI的回聲不僅僅是簡(jiǎn)單的重復(fù)，而是創(chuàng)造了一個(gè)"注意力錨點(diǎn)"。就像船只需要拋錨來(lái)保持穩(wěn)定一樣，AI通過(guò)回聲為自己的推理過(guò)程提供了一個(gè)穩(wěn)定的參考點(diǎn)。在復(fù)雜的推理過(guò)程中，當(dāng)AI可能迷失方向時(shí)，這個(gè)錨點(diǎn)幫助它重新找到正確的航向。

研究團(tuán)隊(duì)還進(jìn)行了逐個(gè)詞匯的注意力分析。他們發(fā)現(xiàn)，在回聲思考過(guò)程中，AI會(huì)特別關(guān)注問題中的關(guān)鍵數(shù)值和約束條件。比如在一個(gè)關(guān)于鴨子產(chǎn)蛋的數(shù)學(xué)題中，AI會(huì)在回聲階段特別注意"16個(gè)"、"雞蛋"、"3個(gè)"、"13個(gè)"這些關(guān)鍵信息，而對(duì)"the"、"and"這樣的功能詞匯關(guān)注度較低。這說(shuō)明AI的回聲不是機(jī)械的重復(fù)，而是有選擇性的智能篩選。

**七、實(shí)際應(yīng)用效果驗(yàn)證**

研究團(tuán)隊(duì)在多個(gè)數(shù)學(xué)推理數(shù)據(jù)集上驗(yàn)證了回聲思考的效果，包括GSM8K（小學(xué)數(shù)學(xué)應(yīng)用題）、MathQA（多選數(shù)學(xué)題）、Hendrycks-MATH（競(jìng)賽數(shù)學(xué)題）、AIME24（美國(guó)數(shù)學(xué)邀請(qǐng)賽題目）和MATH-500（高難度數(shù)學(xué)題集）。這些測(cè)試覆蓋了從基礎(chǔ)算術(shù)到高級(jí)數(shù)學(xué)推理的各個(gè)層次。

在GSM8K測(cè)試中，回聲蒸餾訓(xùn)練將不同模型的準(zhǔn)確率提升了2.8-3.4個(gè)百分點(diǎn)。更令人印象深刻的是，即使是基礎(chǔ)版本的Qwen3-8B模型，通過(guò)回聲訓(xùn)練也獲得了3.4個(gè)百分點(diǎn)的提升，準(zhǔn)確率從87.49%上升到93.1%。這樣的提升在AI領(lǐng)域是相當(dāng)顯著的。

在更具挑戰(zhàn)性的Hendrycks-MATH測(cè)試中，回聲訓(xùn)練的效果更加突出。對(duì)于基礎(chǔ)版Qwen3-8B模型，準(zhǔn)確率從極低的0.76%大幅提升到10.0%，提升幅度超過(guò)8個(gè)百分點(diǎn)。雖然絕對(duì)準(zhǔn)確率仍然不高，但這種大幅度的相對(duì)提升表明，回聲思考在處理高難度問題時(shí)特別有效。

跨數(shù)據(jù)集的測(cè)試結(jié)果更加令人鼓舞。所有模型都表現(xiàn)出了良好的泛化能力，即在GSM8K上訓(xùn)練的回聲思考技能能夠很好地遷移到其他類型的數(shù)學(xué)題目上。這說(shuō)明回聲思考確實(shí)是一種通用的認(rèn)知增強(qiáng)技能，而不僅僅是針對(duì)特定題型的技巧。

**八、對(duì)比驗(yàn)證與消融研究**

為了確?；芈曅?yīng)不是偶然現(xiàn)象，研究團(tuán)隊(duì)進(jìn)行了大量的對(duì)比實(shí)驗(yàn)和消融研究。他們特別關(guān)注一個(gè)問題：回聲的效果是否僅僅來(lái)自于增加了解答長(zhǎng)度？為了排除這種可能性，他們控制了解答長(zhǎng)度，只比較那些長(zhǎng)度相似但有無(wú)回聲的解答過(guò)程。

結(jié)果表明，即使在控制了長(zhǎng)度因素后，回聲效應(yīng)依然顯著存在。研究團(tuán)隊(duì)還測(cè)試了不同長(zhǎng)度的回聲前綴（32、64、128個(gè)詞匯單位），發(fā)現(xiàn)無(wú)論回聲長(zhǎng)度如何變化，有回聲的解答都比無(wú)回聲的解答表現(xiàn)更好。這進(jìn)一步證實(shí)了回聲的作用不在于長(zhǎng)度，而在于其認(rèn)知功能。

另一個(gè)重要的驗(yàn)證是"信息流分析"。研究團(tuán)隊(duì)追蹤了AI在推理過(guò)程中的信息傳遞路徑，發(fā)現(xiàn)在正確的解答中，信息會(huì)頻繁地從后續(xù)推理過(guò)程"回流"到回聲部分，然后再傳遞到最終答案。這就像一個(gè)復(fù)雜的思維網(wǎng)絡(luò)，回聲部分充當(dāng)了信息整合的中心樞紐。而在錯(cuò)誤的解答中，這種回流現(xiàn)象明顯較少，信息傳遞更加線性和孤立。

研究團(tuán)隊(duì)還進(jìn)行了邏輯回歸分析，量化了回聲對(duì)正確率的預(yù)測(cè)能力。結(jié)果顯示，回聲的概率成本（即AI為生成回聲所付出的"計(jì)算代價(jià)"）與解答正確性呈顯著正相關(guān)關(guān)系。每增加1.0單位的回聲概率成本，正確答案的幾率就會(huì)增加約27%。這提供了強(qiáng)有力的統(tǒng)計(jì)學(xué)證據(jù)，證明回聲思考確實(shí)是有益的認(rèn)知策略。

說(shuō)到底，哈工大團(tuán)隊(duì)的這項(xiàng)研究徹底改變了我們對(duì)AI"廢話"的認(rèn)知。那些看似多余的重復(fù)，實(shí)際上是AI在進(jìn)行精妙的認(rèn)知調(diào)整。就像人類學(xué)者在深入思考前會(huì)仔細(xì)閱讀題目一樣，AI的回聲思考也是一種自我調(diào)節(jié)和注意力聚焦的過(guò)程。

這項(xiàng)研究不僅在理論上具有重要意義，在實(shí)際應(yīng)用中也提供了立即可用的改進(jìn)方法。無(wú)論是通過(guò)專門的訓(xùn)練來(lái)培養(yǎng)AI的回聲思考習(xí)慣，還是通過(guò)巧妙的提示來(lái)激發(fā)這種行為，我們都有了具體可行的技術(shù)手段來(lái)提升AI的推理能力。

更令人興奮的是，這種改進(jìn)是"免費(fèi)的"——它不需要更大的模型、更多的計(jì)算資源或者全新的算法架構(gòu)，而只需要調(diào)整AI的"思考方式"。這就像教會(huì)一個(gè)學(xué)生良好的學(xué)習(xí)習(xí)慣，不需要讓他更聰明，只需要讓他更有方法。

展望未來(lái)，這項(xiàng)研究為AI系統(tǒng)的設(shè)計(jì)和優(yōu)化開啟了一個(gè)全新的方向。也許在不久的將來(lái)，所有的AI助手都會(huì)養(yǎng)成"先思考再回答"的好習(xí)慣，為用戶提供更準(zhǔn)確、更可靠的幫助。而我們?nèi)祟悾材軓倪@種AI的"思考藝術(shù)"中學(xué)到一些關(guān)于自己認(rèn)知過(guò)程的新知識(shí)。畢竟，最好的技術(shù)進(jìn)步往往是相互啟發(fā)的結(jié)果。

Q&A

Q1：什么是大語(yǔ)言模型的"回聲思考"現(xiàn)象？

A：回聲思考是指大語(yǔ)言模型在解決復(fù)雜問題時(shí)，會(huì)先重復(fù)或復(fù)述用戶的問題，然后再開始推理的行為。比如你問AI一個(gè)數(shù)學(xué)題，它會(huì)先說(shuō)"這個(gè)問題是求..."然后才開始計(jì)算。研究發(fā)現(xiàn)這不是AI的毛病，而是一種提高推理準(zhǔn)確率的認(rèn)知策略，就像人類在解題前會(huì)仔細(xì)讀題一樣。

Q2：回聲蒸餾訓(xùn)練方法是如何提升AI推理能力的？

A：回聲蒸餾訓(xùn)練是專門培養(yǎng)AI養(yǎng)成"先復(fù)述再思考"習(xí)慣的訓(xùn)練方法。研究團(tuán)隊(duì)創(chuàng)建了包含回聲思考的高質(zhì)量訓(xùn)練數(shù)據(jù)，讓AI學(xué)會(huì)在解題前先重述問題要點(diǎn)。實(shí)驗(yàn)證明，這種訓(xùn)練方式能將AI在各種數(shù)學(xué)測(cè)試中的準(zhǔn)確率提升2.8-8.2個(gè)百分點(diǎn)，且這種能力能遷移到不同類型的問題上。

Q3：普通用戶如何利用回聲提示法提升AI的推理效果？

A：回聲提示法是一種無(wú)需重新訓(xùn)練AI就能立即使用的技巧。當(dāng)向AI提問復(fù)雜問題時(shí)，可以在對(duì)話中加入"讓我重新看看這個(gè)問題"或"現(xiàn)在回頭檢查一下題目要求"這樣的提示詞，引導(dǎo)AI進(jìn)行回聲思考。研究顯示這種方法能顯著提升AI的解題準(zhǔn)確率，比簡(jiǎn)單添加"所以"、"嗯"等思考詞匯更有效。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.