網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

薩皮恩扎大學(xué)團(tuán)隊(duì)揭示AI語(yǔ)言模型的"能量泄漏"現(xiàn)象

2026-03-10 16:49:12　來(lái)源: 科技行者

北京舉報(bào)

分享至

當(dāng)我們和ChatGPT或者其他AI聊天機(jī)器人對(duì)話時(shí)，有沒(méi)有想過(guò)它們是否知道自己在說(shuō)假話？這個(gè)問(wèn)題聽起來(lái)很科幻，但薩皮恩扎大學(xué)的研究團(tuán)隊(duì)最近發(fā)表在2026年ICLR會(huì)議上的一項(xiàng)突破性研究，給出了令人驚訝的答案。這項(xiàng)由意大利薩皮恩扎大學(xué)和OmnAI實(shí)驗(yàn)室合作完成的研究，首次發(fā)現(xiàn)了AI語(yǔ)言模型內(nèi)部存在的一種"能量泄漏"現(xiàn)象，就像汽車發(fā)動(dòng)機(jī)的性能問(wèn)題一樣，能夠幫助我們判斷AI是否在"撒謊"。

研究團(tuán)隊(duì)開發(fā)了一種完全不需要額外訓(xùn)練的檢測(cè)方法，能夠直接通過(guò)分析AI模型的內(nèi)部"能量狀態(tài)"來(lái)判斷其輸出是否存在錯(cuò)誤。這種方法不僅在多種不同的AI模型上都表現(xiàn)出色，還能跨越不同類型的任務(wù)進(jìn)行準(zhǔn)確檢測(cè)，為AI的可信度評(píng)估提供了全新的視角。

研究的核心發(fā)現(xiàn)是，當(dāng)AI模型生成錯(cuò)誤信息時(shí)，其內(nèi)部會(huì)出現(xiàn)一種可以被量化的"能量不一致"現(xiàn)象。通過(guò)監(jiān)測(cè)這種現(xiàn)象，我們可以在不需要知道正確答案的情況下，就判斷出AI的回答是否可信。這項(xiàng)研究不僅為AI安全領(lǐng)域帶來(lái)了重要突破，也為普通用戶提供了一個(gè)潛在的工具，幫助我們更好地評(píng)估AI輸出的可靠性。

一、AI語(yǔ)言模型的內(nèi)在"能量系統(tǒng)"

要理解這項(xiàng)研究的核心發(fā)現(xiàn)，我們首先需要了解AI語(yǔ)言模型的工作原理。當(dāng)前主流的AI語(yǔ)言模型，如ChatGPT、LLaMA等，都采用了一種叫做"自回歸"的工作方式。這個(gè)過(guò)程就像一個(gè)經(jīng)驗(yàn)豐富的作家在寫小說(shuō)，每寫完一個(gè)詞，就要根據(jù)前面的所有內(nèi)容來(lái)決定下一個(gè)詞應(yīng)該是什么。

研究團(tuán)隊(duì)的關(guān)鍵洞察在于，他們重新理解了AI模型內(nèi)部的數(shù)學(xué)結(jié)構(gòu)。傳統(tǒng)上，我們把AI模型的最后一層看作是一個(gè)簡(jiǎn)單的分類器，就像一個(gè)多選題答題器，在眾多詞匯中選出概率最高的那一個(gè)。但是這項(xiàng)研究提出了一個(gè)全新的視角：將這個(gè)分類器重新理解為一個(gè)"能量系統(tǒng)"。

在物理學(xué)中，能量守恒是一個(gè)基本原理。同樣地，在理想情況下，AI模型在生成序列文本時(shí)，其內(nèi)部的"能量"也應(yīng)該保持一種平衡狀態(tài)。具體來(lái)說(shuō)，當(dāng)模型在時(shí)間步驟i生成某個(gè)詞時(shí)，有兩個(gè)能量值理論上應(yīng)該相等：一個(gè)是該詞在當(dāng)前上下文中的"局部能量"，另一個(gè)是考慮了所有可能詞匯的"邊際能量"。

研究團(tuán)隊(duì)發(fā)現(xiàn)，當(dāng)AI模型運(yùn)行正常、生成正確信息時(shí)，這兩個(gè)能量值基本保持一致。但是當(dāng)模型開始"胡說(shuō)八道"或產(chǎn)生錯(cuò)誤時(shí)，這兩個(gè)值之間就會(huì)出現(xiàn)顯著的差異，就像一臺(tái)運(yùn)轉(zhuǎn)不良的發(fā)動(dòng)機(jī)會(huì)出現(xiàn)能量損失一樣。

研究人員將這種差異命名為"泄漏能量"（Spilled Energy）。這個(gè)名字很形象：就像水桶有了裂縫會(huì)漏水一樣，AI模型在產(chǎn)生錯(cuò)誤時(shí)也會(huì)"漏掉"一些應(yīng)該保持平衡的能量。

二、無(wú)需訓(xùn)練的智能檢測(cè)方法

傳統(tǒng)的AI錯(cuò)誤檢測(cè)方法通常需要針對(duì)每種特定任務(wù)訓(xùn)練專門的檢測(cè)器，就像為不同品牌的汽車配備不同的診斷工具一樣。這種方法不僅成本高昂，而且適應(yīng)性差。一旦遇到新的任務(wù)類型，就需要重新訓(xùn)練檢測(cè)器。

這項(xiàng)研究的革命性突破在于開發(fā)了一種"免訓(xùn)練"的檢測(cè)方法。研究團(tuán)隊(duì)設(shè)計(jì)了兩個(gè)互補(bǔ)的能量指標(biāo)來(lái)捕捉AI模型的"健康狀態(tài)"。

第一個(gè)指標(biāo)被稱為"泄漏能量"，它直接測(cè)量前面提到的那兩個(gè)理論上應(yīng)該相等的能量值之間的差異。當(dāng)這個(gè)差異很小時(shí)，說(shuō)明模型運(yùn)行正常；當(dāng)差異較大時(shí)，就預(yù)示著可能出現(xiàn)了錯(cuò)誤。

第二個(gè)指標(biāo)叫做"邊際能量"，它關(guān)注的是模型在做決策時(shí)的整體不確定性。高不確定性往往與錯(cuò)誤輸出相關(guān)聯(lián)，就像一個(gè)猶豫不決的學(xué)生更容易答錯(cuò)題一樣。

研究團(tuán)隊(duì)還提出了一個(gè)組合指標(biāo)，將泄漏能量乘以邊際能量的絕對(duì)值，形成"縮放泄漏能量"。這種組合方法能夠更靈敏地捕捉到模型的異常狀態(tài)。

這種方法的最大優(yōu)勢(shì)是其通用性。無(wú)論是回答事實(shí)性問(wèn)題、進(jìn)行數(shù)學(xué)計(jì)算，還是處理語(yǔ)言推理任務(wù)，同一套檢測(cè)方法都能有效工作，就像一臺(tái)萬(wàn)能診斷儀可以檢測(cè)各種不同類型的機(jī)械故障一樣。

三、從人工數(shù)據(jù)到真實(shí)世界的驗(yàn)證

為了驗(yàn)證這種能量檢測(cè)方法的有效性，研究團(tuán)隊(duì)設(shè)計(jì)了一系列巧妙的實(shí)驗(yàn)，從簡(jiǎn)單可控的人工場(chǎng)景逐步擴(kuò)展到復(fù)雜的真實(shí)世界應(yīng)用。

首先，他們創(chuàng)建了一個(gè)完全可控的實(shí)驗(yàn)環(huán)境：多位數(shù)加法運(yùn)算。研究人員讓AI模型計(jì)算超過(guò)14位數(shù)字的加法題，這對(duì)大多數(shù)模型來(lái)說(shuō)都是一個(gè)挑戰(zhàn)。然后，他們?nèi)斯ぶ圃戾e(cuò)誤答案，將正確結(jié)果隨機(jī)調(diào)整不同的幅度，模擬AI可能出現(xiàn)的各種錯(cuò)誤類型。

這個(gè)實(shí)驗(yàn)設(shè)計(jì)非常聰明。研究團(tuán)隊(duì)將錯(cuò)誤分為三個(gè)難度等級(jí)：容易檢測(cè)的錯(cuò)誤（偏差在1000到10000之間），中等難度的錯(cuò)誤（偏差在100到1000之間），和很難檢測(cè)的錯(cuò)誤（偏差僅在1到10之間）。最后一類錯(cuò)誤特別狡猾，因?yàn)樗鼈兛雌饋?lái)非常合理，很容易誤導(dǎo)人類判斷。

實(shí)驗(yàn)結(jié)果令人印象深刻。能量泄漏指標(biāo)在所有三種錯(cuò)誤類型中都表現(xiàn)出色，能夠清晰地區(qū)分正確和錯(cuò)誤的答案。特別是在最困難的情況下，當(dāng)傳統(tǒng)的置信度方法（基于輸出概率的簡(jiǎn)單判斷）幾乎無(wú)法區(qū)分對(duì)錯(cuò)時(shí)，能量泄漏方法仍然保持著可靠的判別能力。

這種效果在多個(gè)不同的AI模型上都得到了驗(yàn)證，包括LLaMA-3 8B、Qwen-3 8B和Mistral-7B等主流模型，證明了方法的通用性。

接下來(lái)，研究團(tuán)隊(duì)將驗(yàn)證范圍擴(kuò)展到九個(gè)真實(shí)世界的基準(zhǔn)測(cè)試數(shù)據(jù)集，涵蓋了數(shù)學(xué)推理、事實(shí)問(wèn)答、閱讀理解、常識(shí)推理等多個(gè)領(lǐng)域。這些數(shù)據(jù)集包括TriviaQA（知識(shí)問(wèn)答）、HotpotQA（多步推理）、Math（數(shù)學(xué)問(wèn)題）、Winogrande（常識(shí)推理）等，基本覆蓋了AI語(yǔ)言模型的主要應(yīng)用場(chǎng)景。

四、跨任務(wù)泛化能力的驚人表現(xiàn)

這項(xiàng)研究最引人注目的發(fā)現(xiàn)之一是其出色的跨任務(wù)泛化能力。傳統(tǒng)的AI錯(cuò)誤檢測(cè)方法往往存在嚴(yán)重的"偏科"問(wèn)題：在某個(gè)特定任務(wù)上訓(xùn)練的檢測(cè)器，換到其他任務(wù)時(shí)性能會(huì)急劇下降。

為了測(cè)試這一點(diǎn)，研究團(tuán)隊(duì)進(jìn)行了一個(gè)comprehensive的交叉驗(yàn)證實(shí)驗(yàn)。他們將九個(gè)數(shù)據(jù)集兩兩配對(duì)，用其中一個(gè)數(shù)據(jù)集訓(xùn)練傳統(tǒng)的探測(cè)分類器，然后在另一個(gè)數(shù)據(jù)集上測(cè)試性能。結(jié)果顯示，傳統(tǒng)方法的性能在跨數(shù)據(jù)集測(cè)試時(shí)普遍下降到接近隨機(jī)猜測(cè)的水平，大約只有62-64%的準(zhǔn)確率。

相比之下，能量泄漏方法由于不需要訓(xùn)練，在所有任務(wù)上都保持了一致的性能水平。更令人驚訝的是，在許多情況下，這種無(wú)需訓(xùn)練的方法甚至超越了專門訓(xùn)練的檢測(cè)器在同一任務(wù)上的表現(xiàn)。

研究團(tuán)隊(duì)發(fā)現(xiàn)，指令調(diào)優(yōu)（instruction tuning）對(duì)能量泄漏方法的效果有顯著的積極影響。經(jīng)過(guò)指令調(diào)優(yōu)的模型，如LLaMA-3-Instruct，在使用能量檢測(cè)方法時(shí)表現(xiàn)更好。這種現(xiàn)象的背后原因可能是指令調(diào)優(yōu)改善了模型內(nèi)部表示的質(zhì)量，使得能量泄漏現(xiàn)象更加明顯和可靠。

有趣的是，研究還發(fā)現(xiàn)了不同模型之間的細(xì)微差異。在經(jīng)過(guò)指令調(diào)優(yōu)的模型中，能量泄漏方法通常表現(xiàn)最佳；而在基礎(chǔ)模型中，邊際能量指標(biāo)有時(shí)會(huì)略勝一籌。這種差異為我們理解不同訓(xùn)練策略對(duì)模型內(nèi)部結(jié)構(gòu)的影響提供了新的視角。

五、精確定位關(guān)鍵答案位置

在實(shí)際應(yīng)用中，AI模型生成的回答通常包含很多無(wú)關(guān)緊要的詞匯，如連接詞、修飾語(yǔ)等。能量檢測(cè)的關(guān)鍵在于準(zhǔn)確識(shí)別那些承載核心語(yǔ)義信息的"精確答案"部分。

研究團(tuán)隊(duì)采用了一種巧妙的兩步策略來(lái)解決這個(gè)問(wèn)題。首先，他們使用啟發(fā)式匹配方法處理那些答案選項(xiàng)有限的任務(wù)，比如多選題或分類問(wèn)題。對(duì)于這類任務(wù)，檢測(cè)器只需要在生成的文本中尋找預(yù)定義的標(biāo)簽詞匯即可。

對(duì)于開放式問(wèn)答任務(wù)，情況就復(fù)雜得多。研究團(tuán)隊(duì)借助另一個(gè)AI模型（Mistral-7B-Instruct）來(lái)提取精確答案。他們?cè)O(shè)計(jì)了一個(gè)巧妙的提示模板，要求輔助模型從長(zhǎng)篇回答中提取出最關(guān)鍵的答案部分。如果模型無(wú)法找到有效答案，或者提取過(guò)程失敗，該樣本就會(huì)被排除在分析之外。

這種答案提取策略的成功率相當(dāng)高，在大多數(shù)數(shù)據(jù)集上都能達(dá)到87%以上的提取成功率。這確保了能量檢測(cè)方法能夠?qū)Ｗ⒂谧钪匾恼Z(yǔ)義內(nèi)容，避免被無(wú)關(guān)信息干擾。

實(shí)驗(yàn)結(jié)果顯示，準(zhǔn)確定位答案位置對(duì)檢測(cè)效果有巨大影響。當(dāng)將檢測(cè)范圍限制在精確答案區(qū)間時(shí)，能量泄漏方法的性能提升了約24%，而傳統(tǒng)logit方法的提升幅度僅為9%。這個(gè)差異說(shuō)明了能量檢測(cè)方法對(duì)語(yǔ)義內(nèi)容的敏感性更高。

六、池化策略的優(yōu)化選擇

由于精確答案往往包含多個(gè)詞匯，研究團(tuán)隊(duì)需要決定如何將多個(gè)詞匯位置的能量值合并為單一的判斷指標(biāo)。他們測(cè)試了多種池化策略，包括取最小值、最大值、平均值等。

實(shí)驗(yàn)結(jié)果顯示，最小值池化策略表現(xiàn)最佳。這個(gè)發(fā)現(xiàn)很有趣：它意味著在一串詞匯中，能量泄漏的"最弱環(huán)節(jié)"往往最能反映整體的正確性。這就像鏈條的強(qiáng)度取決于最薄弱的一環(huán)一樣，AI輸出的可信度也主要由最不確定的那個(gè)詞匯決定。

這種現(xiàn)象可能反映了語(yǔ)言的一個(gè)基本特性：在表達(dá)一個(gè)完整概念時(shí)，如果其中任何一個(gè)關(guān)鍵組成部分出現(xiàn)問(wèn)題，整個(gè)表達(dá)都可能變得不可靠。

七、局限性與改進(jìn)方向

盡管能量泄漏方法表現(xiàn)優(yōu)異，研究團(tuán)隊(duì)也誠(chéng)實(shí)地指出了其局限性。最主要的問(wèn)題是假陽(yáng)性率：有時(shí)候在語(yǔ)義上不重要的位置（如標(biāo)點(diǎn)符號(hào)、句首詞匯）也會(huì)出現(xiàn)高能量泄漏值，導(dǎo)致錯(cuò)誤警報(bào)。

這種現(xiàn)象的出現(xiàn)有其合理性。在這些位置，模型面臨著眾多合理的選擇，自然的概率分布會(huì)比較平均，從而導(dǎo)致能量泄漏值升高。但這種升高與真正的語(yǔ)義錯(cuò)誤不同，不應(yīng)該被視為問(wèn)題信號(hào)。

研究團(tuán)隊(duì)發(fā)現(xiàn)，準(zhǔn)確識(shí)別精確答案位置對(duì)緩解這個(gè)問(wèn)題至關(guān)重要。當(dāng)檢測(cè)范圍被正確限制在承載核心語(yǔ)義的詞匯上時(shí)，假陽(yáng)性問(wèn)題會(huì)顯著減輕。

另一個(gè)局限性是方法對(duì)不同任務(wù)領(lǐng)域的敏感性存在差異。在某些任務(wù)上（如數(shù)學(xué)計(jì)算和事實(shí)問(wèn)答），能量泄漏現(xiàn)象非常明顯；而在另一些任務(wù)上（如情感分析），信號(hào)可能相對(duì)微弱。

八、理論基礎(chǔ)與數(shù)學(xué)原理

從理論角度看，這項(xiàng)研究的核心洞察基于概率論中的鏈?zhǔn)椒▌t。在理想的語(yǔ)言建模中，序列概率應(yīng)該通過(guò)條件概率的乘積來(lái)計(jì)算。這個(gè)過(guò)程中，相鄰時(shí)間步驟的某些項(xiàng)理論上應(yīng)該相互抵消，保持?jǐn)?shù)學(xué)上的一致性。

但在實(shí)際的AI模型實(shí)現(xiàn)中，這種理論上的平衡并不完美。模型的訓(xùn)練過(guò)程主要優(yōu)化的是交叉熵?fù)p失，關(guān)注單個(gè)詞匯的預(yù)測(cè)準(zhǔn)確性，而不會(huì)顯式地強(qiáng)制整個(gè)序列的能量一致性。

研究團(tuán)隊(duì)通過(guò)重新解釋軟最大分類器為能量基模型，建立了一個(gè)數(shù)學(xué)框架來(lái)量化這種不一致性。他們證明了在溫度參數(shù)為無(wú)限大時(shí)（對(duì)應(yīng)完全隨機(jī)輸出），能量泄漏會(huì)收斂到詞匯表大小的對(duì)數(shù)值，這為方法提供了理論邊界。

這種數(shù)學(xué)框架不僅解釋了為什么能量泄漏與錯(cuò)誤相關(guān)，也為未來(lái)的模型設(shè)計(jì)提供了新的思路：如果我們能在訓(xùn)練過(guò)程中顯式地約束能量一致性，或許能夠開發(fā)出內(nèi)在更加可靠的AI模型。

九、與現(xiàn)有方法的比較優(yōu)勢(shì)

與傳統(tǒng)的置信度方法相比，能量檢測(cè)有幾個(gè)顯著優(yōu)勢(shì)。首先是免訓(xùn)練特性：傳統(tǒng)方法需要為每個(gè)任務(wù)收集大量標(biāo)注數(shù)據(jù)來(lái)訓(xùn)練檢測(cè)器，而能量方法可以直接應(yīng)用到任何新任務(wù)上。

其次是跨模型的一致性。研究顯示，同樣的能量檢測(cè)方法在不同架構(gòu)的AI模型上都表現(xiàn)出相似的有效性，這意味著我們可能發(fā)現(xiàn)了AI語(yǔ)言模型的某種內(nèi)在規(guī)律，而不僅僅是特定模型的偶然特征。

第三是對(duì)指令調(diào)優(yōu)的積極響應(yīng)。傳統(tǒng)置信度方法在模型經(jīng)過(guò)指令調(diào)優(yōu)后通常表現(xiàn)會(huì)下降，因?yàn)檎{(diào)優(yōu)過(guò)程可能導(dǎo)致過(guò)度自信。但能量檢測(cè)方法卻從指令調(diào)優(yōu)中獲益，表現(xiàn)出更好的檢測(cè)能力。

在計(jì)算效率方面，能量檢測(cè)也具有優(yōu)勢(shì)。它不需要額外的神經(jīng)網(wǎng)絡(luò)計(jì)算，只需要對(duì)模型輸出的logits進(jìn)行簡(jiǎn)單的數(shù)學(xué)運(yùn)算即可。這使得它可以很容易地集成到現(xiàn)有的AI系統(tǒng)中，不會(huì)帶來(lái)顯著的性能開銷。

十、實(shí)際應(yīng)用前景與社會(huì)影響

這項(xiàng)研究的實(shí)用價(jià)值是顯而易見(jiàn)的。隨著AI語(yǔ)言模型在教育、醫(yī)療、法律等關(guān)鍵領(lǐng)域的應(yīng)用日益廣泛，準(zhǔn)確判斷AI輸出可靠性的需求變得越來(lái)越迫切。

在教育領(lǐng)域，教師可以使用這種技術(shù)來(lái)評(píng)估AI助手提供的答案的可靠性，避免向?qū)W生傳遞錯(cuò)誤信息。在醫(yī)療咨詢中，這種技術(shù)可以幫助識(shí)別AI建議中的潛在錯(cuò)誤，為醫(yī)生的決策提供額外的保障。

從技術(shù)發(fā)展角度看，這項(xiàng)研究開辟了一個(gè)新的研究方向：通過(guò)分析AI模型的內(nèi)在數(shù)學(xué)結(jié)構(gòu)來(lái)理解其行為。這種"白盒"分析方法可能會(huì)催生更多類似的技術(shù)，幫助我們更深入地理解和改善AI系統(tǒng)。

對(duì)于普通用戶而言，這種技術(shù)的普及可能會(huì)改變我們與AI交互的方式。未來(lái)的AI系統(tǒng)可能會(huì)自帶"可信度指示器"，實(shí)時(shí)顯示其回答的可靠程度，讓用戶在使用AI建議時(shí)更加謹(jǐn)慎和明智。

研究還可能對(duì)AI監(jiān)管產(chǎn)生影響。監(jiān)管機(jī)構(gòu)可以要求AI服務(wù)提供商集成類似的可靠性檢測(cè)技術(shù)，作為保護(hù)用戶利益的基本要求。這種技術(shù)標(biāo)準(zhǔn)化可能會(huì)推動(dòng)整個(gè)行業(yè)向更負(fù)責(zé)任的AI發(fā)展方向前進(jìn)。

歸根結(jié)底，這項(xiàng)研究向我們展示了一個(gè)重要事實(shí)：AI模型內(nèi)部包含著豐富的信息，等待我們?nèi)グl(fā)現(xiàn)和利用。通過(guò)巧妙的數(shù)學(xué)分析，我們不僅可以讓AI變得更可靠，也能更深入地理解這些強(qiáng)大系統(tǒng)的工作原理。正如研究團(tuán)隊(duì)在論文中所說(shuō)，這種"能量泄漏"現(xiàn)象為我們打開了一扇觀察AI內(nèi)心世界的新窗口，讓我們能夠在某種程度上"讀懂"AI的想法，判斷它是否在真誠(chéng)地與我們對(duì)話。

這項(xiàng)由薩皮恩扎大學(xué)等機(jī)構(gòu)完成的研究，發(fā)表在2026年的國(guó)際學(xué)習(xí)表征會(huì)議（ICLR 2026）上。感興趣的讀者可以通過(guò)論文編號(hào)arXiv:2602.18671v4查詢完整的技術(shù)細(xì)節(jié)。隨著這一技術(shù)的進(jìn)一步發(fā)展和應(yīng)用，我們有理由相信，未來(lái)的AI系統(tǒng)將變得更加透明、可靠和值得信任。

Q&A

Q1：什么是AI語(yǔ)言模型的"能量泄漏"現(xiàn)象？

A："能量泄漏"是指AI語(yǔ)言模型在生成文本時(shí)，內(nèi)部?jī)蓚€(gè)理論上應(yīng)該相等的能量值出現(xiàn)不一致的現(xiàn)象。就像汽車發(fā)動(dòng)機(jī)故障時(shí)會(huì)出現(xiàn)能量損失一樣，當(dāng)AI模型產(chǎn)生錯(cuò)誤信息時(shí)，其內(nèi)部的數(shù)學(xué)計(jì)算會(huì)出現(xiàn)這種可檢測(cè)的"泄漏"。研究發(fā)現(xiàn)這種泄漏程度與輸出錯(cuò)誤有強(qiáng)相關(guān)性，可以用來(lái)判斷AI回答的可靠性。

Q2：這種檢測(cè)方法比傳統(tǒng)方法有什么優(yōu)勢(shì)？

A：最大優(yōu)勢(shì)是完全免訓(xùn)練且具有通用性。傳統(tǒng)方法需要針對(duì)每種任務(wù)專門訓(xùn)練檢測(cè)器，成本高且適應(yīng)性差，而能量泄漏方法可以直接應(yīng)用到任何新任務(wù)上。實(shí)驗(yàn)顯示，在跨任務(wù)測(cè)試中，傳統(tǒng)方法性能會(huì)降到接近隨機(jī)水平，但能量泄漏方法保持一致的高性能，甚至在某些情況下超越了專門訓(xùn)練的檢測(cè)器。

Q3：普通用戶什么時(shí)候能用上這項(xiàng)技術(shù)？

A：目前這還是一項(xiàng)前沿研究成果，需要進(jìn)一步的工程化開發(fā)才能普及。但由于該技術(shù)不需要額外訓(xùn)練且計(jì)算簡(jiǎn)單，集成到現(xiàn)有AI系統(tǒng)中相對(duì)容易。未來(lái)的AI助手可能會(huì)內(nèi)置類似的可信度指示器，實(shí)時(shí)顯示回答的可靠程度，幫助用戶更明智地使用AI建議。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.