国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

復(fù)旦突破:先驗知識引導(dǎo)提升AI推理準(zhǔn)確率

0
分享至


這項突破性研究由復(fù)旦大學(xué)計算機(jī)科學(xué)學(xué)院的王宇昕、方世城、王博等研究團(tuán)隊完成,研究成果發(fā)表于2025年12月的arXiv預(yù)印本平臺,論文編號為arXiv:2512.20144v1。有興趣深入了解的讀者可以通過該編號查詢完整論文。

當(dāng)前的人工智能系統(tǒng)在回答復(fù)雜問題時,就像一個學(xué)生在考試時只能憑記憶答題,無法翻閱參考資料。這種局限性使得AI在面對需要多步推理的復(fù)雜問題時經(jīng)常出錯。復(fù)旦大學(xué)的研究團(tuán)隊提出了一種名為"早期知識對齊"的全新方法,讓AI在開始思考之前先獲取相關(guān)資料,就如同讓學(xué)生在答題前可以先瀏覽教科書。這個看似簡單的改變,卻帶來了顯著的性能提升。

現(xiàn)有的AI問答系統(tǒng)通常采用"檢索增強(qiáng)生成"技術(shù),也就是讓AI可以查閱外部資料庫來獲取信息。然而,當(dāng)面對復(fù)雜的多步推理問題時,傳統(tǒng)系統(tǒng)往往在沒有充分了解背景信息的情況下就開始制定解題策略,這就好比一個人在不了解題目背景的情況下就開始盲目搜索答案,導(dǎo)致搜索方向錯誤,最終得出錯誤結(jié)論。

研究團(tuán)隊發(fā)現(xiàn),問題的根源在于AI系統(tǒng)的"計劃失敗"。就像一個探險者在不了解地形的情況下制定路線,往往會走很多彎路甚至迷路。傳統(tǒng)的AI系統(tǒng)會先根據(jù)問題進(jìn)行思考,然后再去搜索相關(guān)信息,但由于缺乏背景知識,這種思考往往是沒有方向的。

一、核心創(chuàng)新:讓AI先"預(yù)習(xí)"再思考

復(fù)旦大學(xué)團(tuán)隊提出的"早期知識對齊"方法,核心思想就是改變AI的工作順序。傳統(tǒng)方法是"思考-搜索-回答",而新方法是"搜索-思考-再搜索-回答"。這種改變看似微小,但效果顯著。

具體來說,當(dāng)AI接收到一個問題時,系統(tǒng)會先進(jìn)行一次初始搜索,獲取與問題相關(guān)的背景知識。有了這些"預(yù)習(xí)資料",AI再開始進(jìn)行思考和推理。這就好比學(xué)生在做作業(yè)前先翻閱相關(guān)章節(jié),了解基本概念和背景信息,然后再開始解題。

舉個具體例子,當(dāng)AI需要回答"哪部電影的導(dǎo)演出生更晚,《I'll Tell The World》還是《Saranggola》?"這樣的問題時,傳統(tǒng)方法會讓AI先思考"我需要找到這兩部電影的導(dǎo)演信息,然后比較他們的出生年份",然后再去搜索。但這種思考往往過于寬泛,搜索效果不佳。

而使用早期知識對齊方法,AI會先根據(jù)問題搜索相關(guān)信息,比如獲取到"《I'll Tell The World》是1945年的美國喜劇片,由萊斯利·古德溫斯執(zhí)導(dǎo)"和"《Saranggola》是1999年的菲律賓劇情片,由吉爾·波特斯執(zhí)導(dǎo)"這樣的背景信息。有了這些具體信息,AI就能制定更精確的搜索策略,比如專門搜索"萊斯利·古德溫斯的出生年份"和"吉爾·波特斯的出生年份"。

二、技術(shù)原理:從熵的角度解讀AI的"專注度"

從技術(shù)角度來看,研究團(tuán)隊從信息論的"熵"概念出發(fā),分析了AI在學(xué)習(xí)過程中的"專注度"問題。熵在信息論中代表不確定性,熵越高表示系統(tǒng)越混亂、越不專注,熵越低表示系統(tǒng)越有序、越專注。

研究發(fā)現(xiàn),當(dāng)AI沒有預(yù)先獲得背景知識時,在強(qiáng)化學(xué)習(xí)訓(xùn)練過程中會表現(xiàn)出高熵狀態(tài),也就是說AI的注意力很分散,會在各種可能的搜索方向上"胡亂探索"。這就像一個沒有地圖的旅行者,可能會在各個路口隨意選擇方向,浪費(fèi)大量時間和精力。

而當(dāng)AI通過早期知識對齊獲得背景信息后,其熵值顯著降低,表明AI的注意力更加集中,能夠更有針對性地進(jìn)行搜索和推理。這種"專注度"的提升,直接轉(zhuǎn)化為了性能的改善。

實驗數(shù)據(jù)證實了這一理論。在訓(xùn)練過程中,使用早期知識對齊的AI系統(tǒng)在回答、思考和搜索各個環(huán)節(jié)的熵值都明顯低于傳統(tǒng)方法,這意味著AI的行為更加確定和高效。

三、實驗驗證:多個數(shù)據(jù)集上的顯著提升

研究團(tuán)隊在六個標(biāo)準(zhǔn)的問答數(shù)據(jù)集上進(jìn)行了全面測試,這些數(shù)據(jù)集包括HotpotQA、2WikiHop、Musique、Natural Questions、PopQA和TriviaQA,涵蓋了從簡單事實查詢到復(fù)雜多步推理的各種問題類型。

在Graph-R1方法的基礎(chǔ)上,早期知識對齊技術(shù)帶來了平均3個F1分?jǐn)?shù)點的提升。更令人驚喜的是,在Search-R1方法上,這種提升達(dá)到了平均11個F1分?jǐn)?shù)點。這種改進(jìn)幅度在AI領(lǐng)域可以說是相當(dāng)顯著的。

更有趣的是,研究團(tuán)隊發(fā)現(xiàn)使用早期知識對齊的AI系統(tǒng)平均減少了約1個搜索回合,這意味著AI能夠更快地找到正確答案,提高了效率。這種效率提升不僅體現(xiàn)在速度上,更重要的是減少了無效搜索帶來的"噪音",讓AI能夠更專注于真正有用的信息。

為了驗證方法的魯棒性,研究團(tuán)隊還進(jìn)行了各種"刁鉆"的測試。比如,他們故意使用包含大量無關(guān)信息的維基百科全文作為搜索源,模擬現(xiàn)實世界中信息嘈雜的情況。結(jié)果顯示,即使在這種"噪聲"環(huán)境下,早期知識對齊方法仍然能夠保持性能優(yōu)勢。

研究團(tuán)隊還測試了不同檢索器的兼容性,使用BGE和E5兩種不同的檢索模型,結(jié)果表明早期知識對齊方法對檢索器類型并不敏感,具有很好的通用性。

四、實用價值:無需重新訓(xùn)練的即插即用方案

這項技術(shù)的一個重要優(yōu)勢是它的實用性。早期知識對齊可以作為一個"即插即用"的模塊,應(yīng)用到現(xiàn)有的AI系統(tǒng)中,而無需重新訓(xùn)練整個模型。這就好比給現(xiàn)有的汽車加裝一個導(dǎo)航系統(tǒng),不需要換車,就能大幅提升駕駛體驗。

研究團(tuán)隊在大規(guī)模模型上進(jìn)行了測試,包括Qwen2.5-32B和Qwen3-235-A30B這樣的超大規(guī)模模型。結(jié)果顯示,即使是這些已經(jīng)相當(dāng)強(qiáng)大的模型,在使用早期知識對齊技術(shù)后仍然能夠獲得顯著的性能提升。這說明"計劃失敗"問題并不會因為模型規(guī)模增大而自動解決,而早期知識對齊提供了一個有效的解決方案。

從產(chǎn)業(yè)應(yīng)用的角度來看,這種技術(shù)可以廣泛應(yīng)用于各種需要復(fù)雜推理的AI應(yīng)用場景。比如,在智能客服系統(tǒng)中,AI可以先搜索相關(guān)的產(chǎn)品信息和用戶歷史記錄,然后再制定回答策略。在教育輔導(dǎo)系統(tǒng)中,AI可以先了解學(xué)生的知識背景,然后再設(shè)計個性化的教學(xué)方案。

五、理論貢獻(xiàn):重新思考AI的學(xué)習(xí)策略

這項研究不僅在技術(shù)上有所突破,更重要的是提供了新的理論視角。傳統(tǒng)的AI系統(tǒng)設(shè)計往往假設(shè)模型應(yīng)該先思考再行動,但這項研究表明,在信息獲取成本較低的現(xiàn)代環(huán)境中,"先獲取信息再思考"可能是更優(yōu)的策略。

從認(rèn)知科學(xué)的角度來看,這種方法也更符合人類的學(xué)習(xí)模式。人類在解決復(fù)雜問題時,通常會先收集相關(guān)信息,然后基于這些信息進(jìn)行推理。早期知識對齊技術(shù)讓AI的工作方式更接近人類的認(rèn)知過程。

研究團(tuán)隊通過嚴(yán)格的數(shù)學(xué)推導(dǎo)證明了早期知識對齊的理論優(yōu)勢。他們從信息論的角度證明了,在相同的計算預(yù)算下,早期知識對齊能夠獲得更多的信息增益,從而實現(xiàn)更準(zhǔn)確的推理。

這種理論貢獻(xiàn)可能會影響未來AI系統(tǒng)的設(shè)計思路。傳統(tǒng)上,研究者們更多關(guān)注如何讓AI"更聰明地思考",而這項研究提醒我們,有時候"更聰明地獲取信息"可能同樣重要。

六、案例分析:從失敗到成功的轉(zhuǎn)變

研究團(tuán)隊提供了一個生動的案例來說明早期知識對齊的效果。在回答"哪部電影的導(dǎo)演出生更晚"這個問題時,傳統(tǒng)的AI系統(tǒng)會陷入一個典型的"計劃失敗"陷阱。

沒有使用早期知識對齊的AI會這樣思考:"我需要找到這兩部電影的導(dǎo)演信息,然后比較他們的出生年份。"然后AI會搜索"兩部電影的導(dǎo)演出生年份",但由于搜索查詢過于寬泛且格式錯誤,無法獲得有效信息。AI會反復(fù)嘗試同樣的搜索策略,最終獲得一些不相關(guān)的信息,導(dǎo)致錯誤的結(jié)論。

而使用早期知識對齊的AI會有完全不同的表現(xiàn)。由于預(yù)先獲得了兩部電影的基本信息,AI能夠制定精確的搜索策略。它會分別搜索"Leslie Goodwins birth year"和"Gil Portes birth year",獲得準(zhǔn)確的出生年份信息(1899年和1945年),最終得出正確答案。

這個案例清晰地展示了背景知識如何幫助AI制定更好的搜索策略,避免無效的探索,提高推理的準(zhǔn)確性。

七、局限性與未來展望

盡管早期知識對齊技術(shù)表現(xiàn)出色,研究團(tuán)隊也誠實地指出了其局限性。目前的研究主要聚焦于多步問答任務(wù),對于更復(fù)雜的深度研究場景(如科學(xué)發(fā)現(xiàn)、長期規(guī)劃等)的效果還有待驗證。

此外,雖然早期知識對齊在各種測試中都表現(xiàn)良好,但其在極端情況下的魯棒性仍需進(jìn)一步研究。比如,當(dāng)初始搜索獲得的信息完全錯誤時,系統(tǒng)的表現(xiàn)如何,這些都是未來研究的重要方向。

從技術(shù)發(fā)展的角度來看,這項研究開啟了一個新的研究方向。未來的AI系統(tǒng)可能會更加重視信息獲取策略的優(yōu)化,而不僅僅是推理算法的改進(jìn)。這可能會催生出更多創(chuàng)新的信息獲取和處理技術(shù)。

研究團(tuán)隊已經(jīng)將代碼開源,這將有助于學(xué)術(shù)界和產(chǎn)業(yè)界進(jìn)一步驗證和改進(jìn)這項技術(shù)?梢灶A(yù)期,在未來幾年中,我們會看到更多基于早期知識對齊思想的AI系統(tǒng)出現(xiàn)在實際應(yīng)用中。

說到底,這項研究提醒我們,有時候解決復(fù)雜問題的關(guān)鍵不在于擁有更強(qiáng)大的思考能力,而在于在思考之前獲得正確的信息。就像古人說的"知己知彼,百戰(zhàn)不殆",讓AI在"作戰(zhàn)"前先了解"戰(zhàn)場"情況,往往能事半功倍。這種看似簡單但卻深刻的洞察,可能會改變我們設(shè)計和使用AI系統(tǒng)的方式,讓人工智能變得更加智能和高效。對于普通用戶而言,這意味著未來的AI助手將能更準(zhǔn)確地回答復(fù)雜問題,無論是學(xué)術(shù)研究、商業(yè)決策還是日常生活中的疑問,都能得到更可靠的答案。

Q&A

Q1:早期知識對齊技術(shù)是什么?

A:早期知識對齊是讓AI在開始思考前先搜索相關(guān)背景資料的技術(shù)。就像學(xué)生做題前先看教科書一樣,AI先獲取相關(guān)信息,再制定解題策略,避免盲目搜索導(dǎo)致的錯誤。

Q2:這項技術(shù)能提升多少AI回答準(zhǔn)確率?

A:根據(jù)復(fù)旦大學(xué)的測試結(jié)果,早期知識對齊技術(shù)能帶來平均3-11個F1分?jǐn)?shù)點的提升,同時減少約1個搜索回合,讓AI回答更準(zhǔn)確也更高效。

Q3:普通用戶能用上這項技術(shù)嗎?

A:可以的。這項技術(shù)是"即插即用"型的,不需要重新訓(xùn)練AI模型,可以直接應(yīng)用到現(xiàn)有的AI助手和問答系統(tǒng)中,讓它們在處理復(fù)雜問題時表現(xiàn)更好。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
最低9℃ 廣州元旦假期迎新冷空氣

最低9℃ 廣州元旦假期迎新冷空氣

魯中晨報
2025-12-28 13:49:02
警惕!2026年銀行存款改革,7萬以上儲戶必看這兩個關(guān)鍵點!

警惕!2026年銀行存款改革,7萬以上儲戶必看這兩個關(guān)鍵點!

復(fù)轉(zhuǎn)這些年
2025-12-28 16:42:02
多地醫(yī)院開始降薪!

多地醫(yī)院開始降薪!

黯泉
2025-12-28 14:36:43
“嘎子”演員謝孟偉,被鄭州市管城回族區(qū)人民法院列為失信人

“嘎子”演員謝孟偉,被鄭州市管城回族區(qū)人民法院列為失信人

草莓解說體育
2025-12-28 10:46:52
搶中國原油的美軍,意識到玩砸了,收到最新命令,60天內(nèi)不能動手

搶中國原油的美軍,意識到玩砸了,收到最新命令,60天內(nèi)不能動手

阿器談史
2025-12-26 20:55:00
豐田汽車重大轉(zhuǎn)折!

豐田汽車重大轉(zhuǎn)折!

電動知家
2025-12-26 14:44:13
18家大國企全軍覆沒!昔日世界第一的中國機(jī)床,現(xiàn)還有翻身機(jī)會嗎

18家大國企全軍覆沒!昔日世界第一的中國機(jī)床,現(xiàn)還有翻身機(jī)會嗎

牛牛叨史
2025-12-20 21:06:35
李宗仁歸國之后,希望能出任人大副委員長一職,毛主席卻給出了三條關(guān)鍵理由,直言此事并不合適

李宗仁歸國之后,希望能出任人大副委員長一職,毛主席卻給出了三條關(guān)鍵理由,直言此事并不合適

史海孤雁
2025-12-25 16:48:16
摩根士丹預(yù)測:2026年1季度汽車銷量 下跌30%-35%

摩根士丹預(yù)測:2026年1季度汽車銷量 下跌30%-35%

網(wǎng)上車市
2025-12-26 15:38:06
日本的第二大強(qiáng)援出現(xiàn)!高市早苗拍板,要在中國周邊打造一張巨網(wǎng)

日本的第二大強(qiáng)援出現(xiàn)!高市早苗拍板,要在中國周邊打造一張巨網(wǎng)

時時有聊
2025-12-28 12:23:00
臺海一旦爆發(fā)戰(zhàn)爭,9國或?qū)⒕砣牖鞈?zhàn),中俄朝將對陣“七國聯(lián)軍”

臺海一旦爆發(fā)戰(zhàn)爭,9國或?qū)⒕砣牖鞈?zhàn),中俄朝將對陣“七國聯(lián)軍”

起喜電影
2025-12-28 17:02:23
1960年代,許世友想要安徽一個湖,省委書記拍桌子:手伸太長!結(jié)局誰也沒想到

1960年代,許世友想要安徽一個湖,省委書記拍桌子:手伸太長!結(jié)局誰也沒想到

源溯歷史
2025-12-22 12:14:11
孟小冬究竟有多漂亮?一嫁梅蘭芳二嫁杜月笙,美得讓人移不開眼!

孟小冬究竟有多漂亮?一嫁梅蘭芳二嫁杜月笙,美得讓人移不開眼!

阿胂是吃瓜群眾
2025-12-26 15:46:17
男子發(fā)現(xiàn)妻子胸口有可疑痕跡,到醫(yī)院檢查后,醫(yī)生:立即聯(lián)系警察

男子發(fā)現(xiàn)妻子胸口有可疑痕跡,到醫(yī)院檢查后,醫(yī)生:立即聯(lián)系警察

眼淚博物
2025-08-07 16:47:38
山西省司法廳原一級巡視員周濤接受審查調(diào)查

山西省司法廳原一級巡視員周濤接受審查調(diào)查

界面新聞
2025-12-28 11:31:42
菲律賓通過85號決議,向中國索賠3960億,不到一天,中方反將一軍

菲律賓通過85號決議,向中國索賠3960億,不到一天,中方反將一軍

阿器談史
2025-12-28 09:58:34
他比黎智英更“毒”!潛伏30年,用510萬策劃香港暴亂,結(jié)局如何

他比黎智英更“毒”!潛伏30年,用510萬策劃香港暴亂,結(jié)局如何

云舟史策
2025-12-22 07:04:23
雄鹿終結(jié)公牛5連勝:字母哥復(fù)出29+8爭議暴扣引沖突 吉迪13+7+9

雄鹿終結(jié)公牛5連勝:字母哥復(fù)出29+8爭議暴扣引沖突 吉迪13+7+9

醉臥浮生
2025-12-28 11:30:16
【解局】被中方最新制裁的美國軍工企業(yè)和個人,都是什么來頭?

【解局】被中方最新制裁的美國軍工企業(yè)和個人,都是什么來頭?

環(huán)球網(wǎng)資訊
2025-12-26 22:56:11
人民幣持續(xù)升值,會引發(fā)全球金融海嘯

人民幣持續(xù)升值,會引發(fā)全球金融海嘯

何毅商業(yè)財經(jīng)
2025-12-27 20:10:50
2025-12-28 20:03:00
科技行者 incentive-icons
科技行者
科技正在如何變革商業(yè)世界
6680文章數(shù) 544關(guān)注度
往期回顧 全部

科技要聞

特斯拉將在華布局自動駕駛?記者求證→

頭條要聞

臺媒體人:賴清德彈劾案通過 對賴是一個很大的侮辱

頭條要聞

臺媒體人:賴清德彈劾案通過 對賴是一個很大的侮辱

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂要聞

白敬亭現(xiàn)身冰雪大世界 拍視頻還翻車了

財經(jīng)要聞

英偉達(dá)的收購史

汽車要聞

理想的2026:L9不容有失,i9再戰(zhàn)純電?

態(tài)度原創(chuàng)

房產(chǎn)
旅游
時尚
教育
軍事航空

房產(chǎn)要聞

降維打擊!三亞CBD驚現(xiàn)“豪宅新王”,高端局要變天了!

旅游要聞

自貢地區(qū)現(xiàn)存有多少座南華宮,你了解嗎?

瑞典拉普蘭:凜冽北境的萬物平衡之道

教育要聞

低情商校長的5種行為,希望你一個也沒有

軍事要聞

與特朗普會晤前 澤連斯基亮明“紅線”

無障礙瀏覽 進(jìn)入關(guān)懷版