国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

哈工大發(fā)現(xiàn)大模型「回聲思考」秘密:復(fù)述問題竟是推理神器!

0
分享至


這項(xiàng)由哈爾濱工業(yè)技術(shù)(深圳)、鵬城實(shí)驗(yàn)室和華中科技大學(xué)聯(lián)合完成的研究,發(fā)表于2026年國(guó)際學(xué)習(xí)表征會(huì)議(ICLR 2026),論文編號(hào)為arXiv:2602.06600v1。有興趣深入了解的讀者可以通過(guò)該編號(hào)查詢完整論文。

當(dāng)你向ChatGPT或其他大語(yǔ)言模型提出一個(gè)復(fù)雜的數(shù)學(xué)問題時(shí),你可能會(huì)注意到一個(gè)有趣的現(xiàn)象:這些AI助手往往不會(huì)直接開始解題,而是先重復(fù)一遍你的問題,然后才開始真正的推理過(guò)程。比如你問"一個(gè)圓柱形容器的標(biāo)簽面積是多少",AI會(huì)先說(shuō)"好的,這個(gè)問題是求圓柱形容器的標(biāo)簽面積..."然后才開始計(jì)算。

大多數(shù)人可能認(rèn)為這只是AI的一個(gè)小毛病,或者說(shuō)是訓(xùn)練過(guò)程中的無(wú)關(guān)緊要的副產(chǎn)品。但是,哈工大的研究團(tuán)隊(duì)卻從這個(gè)看似平常的現(xiàn)象中發(fā)現(xiàn)了驚人的秘密。他們通過(guò)深入研究發(fā)現(xiàn),這種"回聲行為"——也就是模型重復(fù)用戶問題的傾向——實(shí)際上是一種極其聰明的認(rèn)知策略,就像人類在解決復(fù)雜問題前會(huì)默默重復(fù)題目要求一樣。

研究團(tuán)隊(duì)把這種現(xiàn)象稱為"提示回聲"(Echo of Prompt,簡(jiǎn)稱EOP)。他們發(fā)現(xiàn),當(dāng)大語(yǔ)言模型自發(fā)地重復(fù)問題時(shí),它們的推理準(zhǔn)確率會(huì)顯著提高。這就像一個(gè)學(xué)生在考試時(shí),先仔細(xì)讀題、理解題意,然后再動(dòng)筆答題,往往比直接開始解題的成功率更高。

為了驗(yàn)證這個(gè)發(fā)現(xiàn),研究團(tuán)隊(duì)進(jìn)行了一系列巧妙的實(shí)驗(yàn)。他們分析了數(shù)千個(gè)數(shù)學(xué)問題的解答過(guò)程,發(fā)現(xiàn)了一個(gè)令人震驚的規(guī)律:那些在開頭重復(fù)了問題的解答中,有超過(guò)60%都是正確的,而那些直接開始解題的答案中,正確率明顯較低。更有趣的是,研究團(tuán)隊(duì)還發(fā)現(xiàn),即使是同一個(gè)模型在解決同一類問題時(shí),如果開頭有"回聲",答案準(zhǔn)確率也會(huì)大幅提升。

這個(gè)發(fā)現(xiàn)顛覆了人們對(duì)AI"廢話"的認(rèn)知。原來(lái),那些看似冗余的重復(fù),實(shí)際上是AI在給自己的大腦"熱身",幫助自己更好地聚焦問題的核心。就像運(yùn)動(dòng)員在比賽前要做熱身運(yùn)動(dòng)一樣,AI通過(guò)重復(fù)問題來(lái)激活相關(guān)的"思維回路"。

更令人驚嘆的是,研究團(tuán)隊(duì)通過(guò)深入分析模型的內(nèi)部工作機(jī)制發(fā)現(xiàn),當(dāng)模型進(jìn)行"回聲思考"時(shí),它的注意力會(huì)更集中地放在問題的關(guān)鍵信息上。這就好比你在嘈雜的咖啡廳里,當(dāng)你專心聽某個(gè)朋友說(shuō)話時(shí),會(huì)自動(dòng)過(guò)濾掉周圍的雜音,專注于朋友的聲音。AI的"回聲"就起到了這種"專注過(guò)濾器"的作用。

基于這些發(fā)現(xiàn),研究團(tuán)隊(duì)開發(fā)了兩種實(shí)用的方法來(lái)利用這個(gè)"回聲效應(yīng)"。第一種叫做"回聲蒸餾訓(xùn)練",就是專門訓(xùn)練AI模型養(yǎng)成"先復(fù)述再思考"的好習(xí)慣。第二種叫做"回聲提示",是一種不需要額外訓(xùn)練的技巧,只需要在提問時(shí)加入一些引導(dǎo)詞,就能激發(fā)AI的回聲思考模式。

**一、深入理解"回聲現(xiàn)象":AI的隱秘思考方式**

要理解AI的"回聲思考",我們可以把大語(yǔ)言模型想象成一個(gè)博學(xué)但有些健忘的圖書管理員。當(dāng)你向這位管理員詢問一個(gè)復(fù)雜問題時(shí),他不會(huì)立刻沖向書架尋找答案,而是會(huì)先在心里默念幾遍你的問題,確保自己完全理解了你的需求。這個(gè)默念的過(guò)程,就是我們所說(shuō)的"回聲"。

哈工大的研究團(tuán)隊(duì)在分析了大量AI對(duì)話數(shù)據(jù)后發(fā)現(xiàn),這種回聲行為在不同的AI模型中都普遍存在。他們測(cè)試了包括Qwen3-8B、DeepSeek-8B等多個(gè)知名模型,發(fā)現(xiàn)回聲現(xiàn)象的出現(xiàn)頻率高達(dá)70%-86%。這說(shuō)明,這種行為并不是某個(gè)特定模型的特殊癖好,而是AI在處理復(fù)雜推理任務(wù)時(shí)的一種本能反應(yīng)。

研究團(tuán)隊(duì)進(jìn)一步分析發(fā)現(xiàn),這些回聲通常包含200-240個(gè)詞匯單位,平均長(zhǎng)度約為219個(gè)單位。這個(gè)長(zhǎng)度恰好足夠AI完整地重述問題的核心要素,但又不會(huì)過(guò)于冗長(zhǎng)。就像人類在心里默念電話號(hào)碼時(shí),既要完整又要簡(jiǎn)潔一樣,AI的回聲也有著精妙的平衡。

更有趣的是,研究團(tuán)隊(duì)發(fā)現(xiàn),那些產(chǎn)生更詳細(xì)回聲的AI解答,往往具有更高的準(zhǔn)確率。這就好比一個(gè)廚師在烹飪前會(huì)仔細(xì)閱讀食譜,確保理解每一個(gè)步驟,而那些仔細(xì)閱讀的廚師往往能做出更美味的菜肴。AI的"仔細(xì)回聲"就相當(dāng)于這種認(rèn)真的準(zhǔn)備工作。

**二、揭秘回聲背后的工作原理:注意力的重新聚焦**

為了理解回聲為什么如此有效,研究團(tuán)隊(duì)深入AI的"大腦"內(nèi)部,觀察它在思考過(guò)程中的注意力分配模式。這就像給一個(gè)正在解題的學(xué)生安裝了腦電圖設(shè)備,觀察他的大腦在不同階段都在關(guān)注什么。

研究結(jié)果讓人大開眼界。當(dāng)AI進(jìn)行回聲思考時(shí),它的注意力會(huì)經(jīng)歷一個(gè)奇妙的重組過(guò)程。在模型的中間層(大約第7-18層,可以理解為AI思維的"核心處理區(qū)域"),回聲會(huì)顯著增強(qiáng)AI對(duì)關(guān)鍵信息的關(guān)注度。具體來(lái)說(shuō),正確答案的AI解答過(guò)程中,模型會(huì)將更多注意力(約13.69%)分配給自己重述的問題內(nèi)容,而錯(cuò)誤答案中這個(gè)比例只有10.41%。

這種注意力的差異非常關(guān)鍵。研究團(tuán)隊(duì)發(fā)現(xiàn),成功解題的AI會(huì)在推理過(guò)程中不斷"回頭看"自己最初的理解,確保推理方向沒有偏離主題。這就像一個(gè)登山者會(huì)時(shí)不時(shí)地看看地圖和指南針,確保自己沒有走錯(cuò)路。而那些失敗的解答過(guò)程中,AI往往在推理中途就"迷失"了,忘記了原始問題的核心要求。

更進(jìn)一步的分析顯示,這種注意力重組主要發(fā)生在AI的中間層,這些層次相當(dāng)于人類大腦中負(fù)責(zé)復(fù)雜思維和推理的區(qū)域。在這些關(guān)鍵層次中,有回聲的解答過(guò)程比沒有回聲的過(guò)程顯示出更強(qiáng)的注意力聚焦能力,差異高達(dá)2.87個(gè)百分點(diǎn)。這個(gè)數(shù)字看似不大,但在AI的世界里,這樣的差異足以決定答案的對(duì)錯(cuò)。

**三、實(shí)踐驗(yàn)證:回聲效應(yīng)的神奇威力**

為了證實(shí)回聲思考的實(shí)際效果,研究團(tuán)隊(duì)設(shè)計(jì)了一個(gè)巧妙的對(duì)比實(shí)驗(yàn)。他們選擇了一些AI已經(jīng)回答錯(cuò)誤的數(shù)學(xué)題,然后在解答過(guò)程中途插入一段"現(xiàn)在我需要回頭看看原題"的提示,讓AI重新審視問題。結(jié)果令人震驚:原本錯(cuò)誤的解答過(guò)程中,有相當(dāng)比例轉(zhuǎn)向了正確答案。

具體來(lái)說(shuō),在DeepSeek-R1-Distill-Llama-8B模型上,這種"中途回聲"策略將準(zhǔn)確率從15.85%提升到了26.22%,提升幅度超過(guò)10個(gè)百分點(diǎn)。在Qwen3-8B模型上,準(zhǔn)確率從21.34%提升到29.27%,提升近8個(gè)百分點(diǎn)。這就像給一個(gè)正在迷路的人突然提供了地圖和指南針,讓他能夠重新找到正確的方向。

有趣的是,研究團(tuán)隊(duì)還測(cè)試了一個(gè)沒有經(jīng)過(guò)推理訓(xùn)練的基礎(chǔ)模型。結(jié)果發(fā)現(xiàn),同樣的回聲策略對(duì)這個(gè)模型幾乎沒有效果,準(zhǔn)確率維持在10.56%沒有變化。這說(shuō)明,回聲思考需要AI具備一定的推理能力才能發(fā)揮作用,就像只有會(huì)開車的人才能利用導(dǎo)航系統(tǒng)一樣。

這些實(shí)驗(yàn)結(jié)果證明了回聲不僅僅是相關(guān)性,而是真正的因果關(guān)系。AI的回聲行為確實(shí)能夠提升其推理能力,這為我們理解和改進(jìn)AI系統(tǒng)提供了新的思路。

**四、回聲蒸餾訓(xùn)練:讓AI養(yǎng)成好習(xí)慣**

既然回聲思考如此有效,研究團(tuán)隊(duì)自然想到:能否專門訓(xùn)練AI養(yǎng)成這種好習(xí)慣呢?于是他們開發(fā)了"回聲蒸餾訓(xùn)練"方法,就像給AI上了一堂"如何正確思考"的課程。

這個(gè)訓(xùn)練過(guò)程非常巧妙。研究團(tuán)隊(duì)首先收集了大量高質(zhì)量的數(shù)學(xué)解題過(guò)程,然后將其分為兩類:一類是自然包含回聲思考的解答,另一類是直接開始解題的解答。對(duì)于那些缺少回聲的解答,他們讓一個(gè)更強(qiáng)大的AI老師來(lái)"補(bǔ)課",在解題開頭添加類似"好的,這個(gè)問題是求..."這樣的回聲片段。對(duì)于那些已經(jīng)有回聲的解答,則保持原樣。

最終,他們得到了兩個(gè)訓(xùn)練數(shù)據(jù)集:一個(gè)充滿回聲思考的"優(yōu)質(zhì)版本",一個(gè)去除了所有回聲的"精簡(jiǎn)版本"。然后用這兩個(gè)數(shù)據(jù)集分別訓(xùn)練AI模型,看看哪種訓(xùn)練方式能產(chǎn)生更好的推理能力。

結(jié)果非常令人振奮。用"優(yōu)質(zhì)版本"訓(xùn)練出來(lái)的AI模型在各種數(shù)學(xué)測(cè)試中都表現(xiàn)更優(yōu)。在GSM8K測(cè)試中,回聲訓(xùn)練的模型比普通訓(xùn)練的模型準(zhǔn)確率高出2.8-3.4個(gè)百分點(diǎn)。更重要的是,這種提升不僅出現(xiàn)在訓(xùn)練時(shí)使用的題目類型上,在完全不同類型的數(shù)學(xué)題中也有顯著改善。比如在MathQA測(cè)試中提升了1.9個(gè)百分點(diǎn),在更難的Hendrycks-MATH測(cè)試中提升了1.1-8.2個(gè)百分點(diǎn)。

這就像教會(huì)了一個(gè)學(xué)生良好的解題習(xí)慣后,他不僅在練習(xí)題上表現(xiàn)更好,在全新的考試題目上也能發(fā)揮得更出色。AI通過(guò)學(xué)會(huì)回聲思考,獲得了一種通用的推理技能提升。

**五、回聲提示法:無(wú)需訓(xùn)練的立竿見影技巧**

對(duì)于那些已經(jīng)部署的AI系統(tǒng),重新訓(xùn)練并不現(xiàn)實(shí)。因此,研究團(tuán)隊(duì)還開發(fā)了一種更簡(jiǎn)便的方法——回聲提示法。這就像給AI一個(gè)小小的提醒,讓它主動(dòng)進(jìn)入回聲思考模式。

這種方法的核心是在AI解題過(guò)程中適時(shí)插入"讓我回頭看看原題"這樣的提示。當(dāng)AI在推理過(guò)程中可能偏離方向時(shí),這個(gè)提示就像一個(gè)溫和的導(dǎo)航語(yǔ)音,提醒司機(jī)"前方路口請(qǐng)掉頭"。

研究團(tuán)隊(duì)將這種回聲提示法與目前流行的"思考令牌"方法進(jìn)行了對(duì)比。思考令牌方法是通過(guò)添加一些通用的思考詞匯(如"所以"、"嗯")來(lái)促進(jìn)AI思考,而回聲提示法則是讓AI重新關(guān)注原始問題。測(cè)試結(jié)果顯示,回聲提示法的效果顯著優(yōu)于思考令牌方法。

在AIME24數(shù)學(xué)競(jìng)賽題目上,當(dāng)處理難度適中的問題時(shí),回聲提示法將準(zhǔn)確率從約30%提升到了40%以上。在MATH-500測(cè)試集上,回聲提示法在各種難度級(jí)別上都表現(xiàn)出穩(wěn)定的優(yōu)勢(shì),準(zhǔn)確率普遍提升5-10個(gè)百分點(diǎn)。這種提升看似不大,但在AI推理任務(wù)中,每一個(gè)百分點(diǎn)的提升都來(lái)之不易。

**六、深度機(jī)制分析:AI注意力的奧秘**

為了更深入地理解回聲思考的工作機(jī)制,研究團(tuán)隊(duì)進(jìn)行了詳細(xì)的注意力分析。他們發(fā)現(xiàn),AI的注意力系統(tǒng)在處理回聲時(shí)會(huì)發(fā)生一系列精妙的調(diào)整,就像一個(gè)復(fù)雜的交響樂團(tuán)在指揮的引導(dǎo)下重新調(diào)整演奏重點(diǎn)。

在AI的32層處理層中,第7-18層(相當(dāng)于中間的"思考核心區(qū)域")是回聲效應(yīng)最明顯的區(qū)域。在這些層次中,正確解答的AI會(huì)將更多注意力分配給自己重述的問題內(nèi)容。具體來(lái)說(shuō),正確答案中AI對(duì)回聲內(nèi)容的注意力比錯(cuò)誤答案高出2.87個(gè)百分點(diǎn),而對(duì)原始問題的注意力差異只有0.66個(gè)百分點(diǎn)。

這個(gè)發(fā)現(xiàn)非常有趣。它說(shuō)明AI的回聲不僅僅是簡(jiǎn)單的重復(fù),而是創(chuàng)造了一個(gè)"注意力錨點(diǎn)"。就像船只需要拋錨來(lái)保持穩(wěn)定一樣,AI通過(guò)回聲為自己的推理過(guò)程提供了一個(gè)穩(wěn)定的參考點(diǎn)。在復(fù)雜的推理過(guò)程中,當(dāng)AI可能迷失方向時(shí),這個(gè)錨點(diǎn)幫助它重新找到正確的航向。

研究團(tuán)隊(duì)還進(jìn)行了逐個(gè)詞匯的注意力分析。他們發(fā)現(xiàn),在回聲思考過(guò)程中,AI會(huì)特別關(guān)注問題中的關(guān)鍵數(shù)值和約束條件。比如在一個(gè)關(guān)于鴨子產(chǎn)蛋的數(shù)學(xué)題中,AI會(huì)在回聲階段特別注意"16個(gè)"、"雞蛋"、"3個(gè)"、"13個(gè)"這些關(guān)鍵信息,而對(duì)"the"、"and"這樣的功能詞匯關(guān)注度較低。這說(shuō)明AI的回聲不是機(jī)械的重復(fù),而是有選擇性的智能篩選。

**七、實(shí)際應(yīng)用效果驗(yàn)證**

研究團(tuán)隊(duì)在多個(gè)數(shù)學(xué)推理數(shù)據(jù)集上驗(yàn)證了回聲思考的效果,包括GSM8K(小學(xué)數(shù)學(xué)應(yīng)用題)、MathQA(多選數(shù)學(xué)題)、Hendrycks-MATH(競(jìng)賽數(shù)學(xué)題)、AIME24(美國(guó)數(shù)學(xué)邀請(qǐng)賽題目)和MATH-500(高難度數(shù)學(xué)題集)。這些測(cè)試覆蓋了從基礎(chǔ)算術(shù)到高級(jí)數(shù)學(xué)推理的各個(gè)層次。

在GSM8K測(cè)試中,回聲蒸餾訓(xùn)練將不同模型的準(zhǔn)確率提升了2.8-3.4個(gè)百分點(diǎn)。更令人印象深刻的是,即使是基礎(chǔ)版本的Qwen3-8B模型,通過(guò)回聲訓(xùn)練也獲得了3.4個(gè)百分點(diǎn)的提升,準(zhǔn)確率從87.49%上升到93.1%。這樣的提升在AI領(lǐng)域是相當(dāng)顯著的。

在更具挑戰(zhàn)性的Hendrycks-MATH測(cè)試中,回聲訓(xùn)練的效果更加突出。對(duì)于基礎(chǔ)版Qwen3-8B模型,準(zhǔn)確率從極低的0.76%大幅提升到10.0%,提升幅度超過(guò)8個(gè)百分點(diǎn)。雖然絕對(duì)準(zhǔn)確率仍然不高,但這種大幅度的相對(duì)提升表明,回聲思考在處理高難度問題時(shí)特別有效。

跨數(shù)據(jù)集的測(cè)試結(jié)果更加令人鼓舞。所有模型都表現(xiàn)出了良好的泛化能力,即在GSM8K上訓(xùn)練的回聲思考技能能夠很好地遷移到其他類型的數(shù)學(xué)題目上。這說(shuō)明回聲思考確實(shí)是一種通用的認(rèn)知增強(qiáng)技能,而不僅僅是針對(duì)特定題型的技巧。

**八、對(duì)比驗(yàn)證與消融研究**

為了確?;芈曅?yīng)不是偶然現(xiàn)象,研究團(tuán)隊(duì)進(jìn)行了大量的對(duì)比實(shí)驗(yàn)和消融研究。他們特別關(guān)注一個(gè)問題:回聲的效果是否僅僅來(lái)自于增加了解答長(zhǎng)度?為了排除這種可能性,他們控制了解答長(zhǎng)度,只比較那些長(zhǎng)度相似但有無(wú)回聲的解答過(guò)程。

結(jié)果表明,即使在控制了長(zhǎng)度因素后,回聲效應(yīng)依然顯著存在。研究團(tuán)隊(duì)還測(cè)試了不同長(zhǎng)度的回聲前綴(32、64、128個(gè)詞匯單位),發(fā)現(xiàn)無(wú)論回聲長(zhǎng)度如何變化,有回聲的解答都比無(wú)回聲的解答表現(xiàn)更好。這進(jìn)一步證實(shí)了回聲的作用不在于長(zhǎng)度,而在于其認(rèn)知功能。

另一個(gè)重要的驗(yàn)證是"信息流分析"。研究團(tuán)隊(duì)追蹤了AI在推理過(guò)程中的信息傳遞路徑,發(fā)現(xiàn)在正確的解答中,信息會(huì)頻繁地從后續(xù)推理過(guò)程"回流"到回聲部分,然后再傳遞到最終答案。這就像一個(gè)復(fù)雜的思維網(wǎng)絡(luò),回聲部分充當(dāng)了信息整合的中心樞紐。而在錯(cuò)誤的解答中,這種回流現(xiàn)象明顯較少,信息傳遞更加線性和孤立。

研究團(tuán)隊(duì)還進(jìn)行了邏輯回歸分析,量化了回聲對(duì)正確率的預(yù)測(cè)能力。結(jié)果顯示,回聲的概率成本(即AI為生成回聲所付出的"計(jì)算代價(jià)")與解答正確性呈顯著正相關(guān)關(guān)系。每增加1.0單位的回聲概率成本,正確答案的幾率就會(huì)增加約27%。這提供了強(qiáng)有力的統(tǒng)計(jì)學(xué)證據(jù),證明回聲思考確實(shí)是有益的認(rèn)知策略。

說(shuō)到底,哈工大團(tuán)隊(duì)的這項(xiàng)研究徹底改變了我們對(duì)AI"廢話"的認(rèn)知。那些看似多余的重復(fù),實(shí)際上是AI在進(jìn)行精妙的認(rèn)知調(diào)整。就像人類學(xué)者在深入思考前會(huì)仔細(xì)閱讀題目一樣,AI的回聲思考也是一種自我調(diào)節(jié)和注意力聚焦的過(guò)程。

這項(xiàng)研究不僅在理論上具有重要意義,在實(shí)際應(yīng)用中也提供了立即可用的改進(jìn)方法。無(wú)論是通過(guò)專門的訓(xùn)練來(lái)培養(yǎng)AI的回聲思考習(xí)慣,還是通過(guò)巧妙的提示來(lái)激發(fā)這種行為,我們都有了具體可行的技術(shù)手段來(lái)提升AI的推理能力。

更令人興奮的是,這種改進(jìn)是"免費(fèi)的"——它不需要更大的模型、更多的計(jì)算資源或者全新的算法架構(gòu),而只需要調(diào)整AI的"思考方式"。這就像教會(huì)一個(gè)學(xué)生良好的學(xué)習(xí)習(xí)慣,不需要讓他更聰明,只需要讓他更有方法。

展望未來(lái),這項(xiàng)研究為AI系統(tǒng)的設(shè)計(jì)和優(yōu)化開啟了一個(gè)全新的方向。也許在不久的將來(lái),所有的AI助手都會(huì)養(yǎng)成"先思考再回答"的好習(xí)慣,為用戶提供更準(zhǔn)確、更可靠的幫助。而我們?nèi)祟悾材軓倪@種AI的"思考藝術(shù)"中學(xué)到一些關(guān)于自己認(rèn)知過(guò)程的新知識(shí)。畢竟,最好的技術(shù)進(jìn)步往往是相互啟發(fā)的結(jié)果。

Q&A

Q1:什么是大語(yǔ)言模型的"回聲思考"現(xiàn)象?

A:回聲思考是指大語(yǔ)言模型在解決復(fù)雜問題時(shí),會(huì)先重復(fù)或復(fù)述用戶的問題,然后再開始推理的行為。比如你問AI一個(gè)數(shù)學(xué)題,它會(huì)先說(shuō)"這個(gè)問題是求..."然后才開始計(jì)算。研究發(fā)現(xiàn)這不是AI的毛病,而是一種提高推理準(zhǔn)確率的認(rèn)知策略,就像人類在解題前會(huì)仔細(xì)讀題一樣。

Q2:回聲蒸餾訓(xùn)練方法是如何提升AI推理能力的?

A:回聲蒸餾訓(xùn)練是專門培養(yǎng)AI養(yǎng)成"先復(fù)述再思考"習(xí)慣的訓(xùn)練方法。研究團(tuán)隊(duì)創(chuàng)建了包含回聲思考的高質(zhì)量訓(xùn)練數(shù)據(jù),讓AI學(xué)會(huì)在解題前先重述問題要點(diǎn)。實(shí)驗(yàn)證明,這種訓(xùn)練方式能將AI在各種數(shù)學(xué)測(cè)試中的準(zhǔn)確率提升2.8-8.2個(gè)百分點(diǎn),且這種能力能遷移到不同類型的問題上。

Q3:普通用戶如何利用回聲提示法提升AI的推理效果?

A:回聲提示法是一種無(wú)需重新訓(xùn)練AI就能立即使用的技巧。當(dāng)向AI提問復(fù)雜問題時(shí),可以在對(duì)話中加入"讓我重新看看這個(gè)問題"或"現(xiàn)在回頭檢查一下題目要求"這樣的提示詞,引導(dǎo)AI進(jìn)行回聲思考。研究顯示這種方法能顯著提升AI的解題準(zhǔn)確率,比簡(jiǎn)單添加"所以"、"嗯"等思考詞匯更有效。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
6999元!新機(jī)官宣:3月20日,正式開售!

6999元!新機(jī)官宣:3月20日,正式開售!

科技堡壘
2026-03-14 11:48:32
伊朗軍方宣布打擊美國(guó)多處基地

伊朗軍方宣布打擊美國(guó)多處基地

參考消息
2026-03-13 21:22:35
“美軍紅線”哈爾克島:美伊合資打造的伊朗“王冠明珠”,關(guān)鍵、強(qiáng)韌,也脆弱

“美軍紅線”哈爾克島:美伊合資打造的伊朗“王冠明珠”,關(guān)鍵、強(qiáng)韌,也脆弱

紅星新聞
2026-03-14 15:58:37
順產(chǎn)分娩手術(shù)時(shí)直腸被切漏,女子:手術(shù)操作失誤引發(fā)直腸陰道瘺,醫(yī)院隱瞞術(shù)中損傷事實(shí),追責(zé)兩年無(wú)果,涉事醫(yī)院因未履行告知義務(wù)被處罰

順產(chǎn)分娩手術(shù)時(shí)直腸被切漏,女子:手術(shù)操作失誤引發(fā)直腸陰道瘺,醫(yī)院隱瞞術(shù)中損傷事實(shí),追責(zé)兩年無(wú)果,涉事醫(yī)院因未履行告知義務(wù)被處罰

極目新聞
2026-03-14 17:27:32
字節(jié)辟謠「武漢全部被裁」:超2000人base武漢,將加大對(duì)湖北投入

字節(jié)辟謠「武漢全部被裁」:超2000人base武漢,將加大對(duì)湖北投入

鞭牛士
2026-03-14 12:04:14
隨著上海申花1-1,山東泰山2-1,中超最新積分榜出爐:還有8隊(duì)負(fù)分

隨著上海申花1-1,山東泰山2-1,中超最新積分榜出爐:還有8隊(duì)負(fù)分

側(cè)身凌空斬
2026-03-14 17:48:06
伊朗稱哈爾克島局勢(shì)已得到控制

伊朗稱哈爾克島局勢(shì)已得到控制

界面新聞
2026-03-14 18:35:14
河南女子拍到大雁排成“ETC”陣型遷徙,場(chǎng)面震撼,當(dāng)事人:從來(lái)沒見過(guò),大家都在歡呼

河南女子拍到大雁排成“ETC”陣型遷徙,場(chǎng)面震撼,當(dāng)事人:從來(lái)沒見過(guò),大家都在歡呼

臺(tái)州交通廣播
2026-03-14 08:59:12
外地人去301醫(yī)院看病,水太深!這份避坑指南能幫你省下一半時(shí)間

外地人去301醫(yī)院看病,水太深!這份避坑指南能幫你省下一半時(shí)間

牛鍋巴小釩
2026-03-14 09:52:49
無(wú)錫至成都航班在地面滑行時(shí),一旅客隨身充電寶突發(fā)自燃

無(wú)錫至成都航班在地面滑行時(shí),一旅客隨身充電寶突發(fā)自燃

都市快報(bào)橙柿互動(dòng)
2026-03-14 13:18:38
主動(dòng)辭職女籃?宮魯鳴發(fā)聲,耐人尋味,籃協(xié)回應(yīng),媒體人怒了

主動(dòng)辭職女籃?宮魯鳴發(fā)聲,耐人尋味,籃協(xié)回應(yīng),媒體人怒了

萌蘭聊個(gè)球
2026-03-14 14:28:11
其實(shí)人根本不用養(yǎng)老,為什么呢?看到此文,你就會(huì)豁然開朗

其實(shí)人根本不用養(yǎng)老,為什么呢?看到此文,你就會(huì)豁然開朗

暖風(fēng)吹過(guò)竹林
2026-03-14 10:23:30
日本大師在中國(guó)代表作,耗資30億的地標(biāo),怎么就成了“鬼城”?

日本大師在中國(guó)代表作,耗資30億的地標(biāo),怎么就成了“鬼城”?

GA環(huán)球建筑
2026-03-13 17:27:01
鎮(zhèn)江市委常委會(huì)召開會(huì)議 堅(jiān)決擁護(hù)省委對(duì)許文涉嫌嚴(yán)重違紀(jì)違法進(jìn)行紀(jì)律審查和監(jiān)察調(diào)查的決定

鎮(zhèn)江市委常委會(huì)召開會(huì)議 堅(jiān)決擁護(hù)省委對(duì)許文涉嫌嚴(yán)重違紀(jì)違法進(jìn)行紀(jì)律審查和監(jiān)察調(diào)查的決定

環(huán)球網(wǎng)資訊
2026-03-14 13:18:09
84比56大勝19分!女籃勁敵爆冷掀翻世界第9:中國(guó)晉級(jí)世界杯穩(wěn)了

84比56大勝19分!女籃勁敵爆冷掀翻世界第9:中國(guó)晉級(jí)世界杯穩(wěn)了

籃球快餐車
2026-03-14 16:48:34
中國(guó)女足為何戰(zhàn)勝中國(guó)臺(tái)北賽后王霜毫不客氣說(shuō)出原因 說(shuō)的很實(shí)在

中國(guó)女足為何戰(zhàn)勝中國(guó)臺(tái)北賽后王霜毫不客氣說(shuō)出原因 說(shuō)的很實(shí)在

籃球看比賽
2026-03-14 17:06:54
中超巨大爭(zhēng)議!楊皓宇染紅離場(chǎng),媒體人集體開炮:主裁莫名其妙

中超巨大爭(zhēng)議!楊皓宇染紅離場(chǎng),媒體人集體開炮:主裁莫名其妙

奧拜爾
2026-03-14 17:40:57
馬克龍:黎巴嫩稱愿與以色列直接對(duì)話,法國(guó)愿提供平臺(tái),以方應(yīng)“抓住機(jī)會(huì)”

馬克龍:黎巴嫩稱愿與以色列直接對(duì)話,法國(guó)愿提供平臺(tái),以方應(yīng)“抓住機(jī)會(huì)”

環(huán)球網(wǎng)資訊
2026-03-14 19:42:07
七旬翁直播間買了81箱酒,支付113筆花掉8.3萬(wàn),還收到7部手機(jī)認(rèn)為是“三無(wú)”產(chǎn)品,要求“退一賠三”

七旬翁直播間買了81箱酒,支付113筆花掉8.3萬(wàn),還收到7部手機(jī)認(rèn)為是“三無(wú)”產(chǎn)品,要求“退一賠三”

大風(fēng)新聞
2026-03-14 10:10:23
王霜停賽!中國(guó)女足3月17日18點(diǎn)對(duì)陣東道主澳大利亞 勝者將進(jìn)決賽

王霜停賽!中國(guó)女足3月17日18點(diǎn)對(duì)陣東道主澳大利亞 勝者將進(jìn)決賽

風(fēng)過(guò)鄉(xiāng)
2026-03-14 16:00:51
2026-03-14 20:04:50
科技行者 incentive-icons
科技行者
科技正在如何變革商業(yè)世界
7585文章數(shù) 555關(guān)注度
往期回顧 全部

科技要聞

xAI創(chuàng)始伙伴只剩兩人!馬斯克“痛改前非”

頭條要聞

霍爾木茲海峽上周末僅4艘船通過(guò) 繞行要多走5500公里

頭條要聞

霍爾木茲海峽上周末僅4艘船通過(guò) 繞行要多走5500公里

體育要聞

NBA唯一巴西球員,增重20KG頂內(nèi)線

娛樂要聞

張藝興,犯了大忌

財(cái)經(jīng)要聞

3·15影子暗訪|神秘的“特供酒”

汽車要聞

吉利銀河M7技術(shù)首秀 實(shí)力重構(gòu)主流電混SUV

態(tài)度原創(chuàng)

本地
親子
教育
藝術(shù)
公開課

本地新聞

坐標(biāo)北京,過(guò)敏季反向遷徒

親子要聞

萌娃為何覺得自己和大人一樣?聽到答案的大人們繃不住了

教育要聞

“十五五”規(guī)劃綱要明確,有序推進(jìn)小班化教學(xué)

藝術(shù)要聞

李建鵬:90后第四屆“中國(guó)美術(shù)獎(jiǎng)”銅獎(jiǎng)獲得者

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版