国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

微信AI團隊創(chuàng)新突破:像人類一樣"記憶"全局的智能問答系統(tǒng)

0
分享至


這項由中科院信息工程研究所、騰訊微信AI團隊、香港科技大學等多家機構聯(lián)合開展的研究,于2024年12月發(fā)表在計算語言學頂級會議上,論文編號為arXiv:2512.17220v1。研究團隊首次提出了一種模仿人類"全局記憶"機制的智能問答系統(tǒng),徹底改變了傳統(tǒng)AI閱讀長文檔的方式。

當我們閱讀一本厚厚的小說時,大腦會自動形成一幅關于整個故事的"心智地圖"。這張地圖包含了主要人物、關鍵事件和故事脈絡,幫助我們理解每個新情節(jié)在整個故事中的位置。然而,目前的AI系統(tǒng)在處理長文檔時,就像一個患有嚴重健忘癥的讀者,只能專注于眼前的幾行文字,無法把握文章的整體框架。

研究團隊觀察到這個問題后,決定讓AI學會像人類一樣構建"全局記憶"。他們將這種全局記憶稱為"Mindscape",中文可以理解為"心智景觀"。就像人類在閱讀時會在大腦中形成一個關于整篇文章的概覽圖一樣,這個系統(tǒng)也會為每份長文檔創(chuàng)建一個全局摘要,作為AI的"記憶支架"。

傳統(tǒng)的檢索增強生成系統(tǒng)就像是一個只會查字典的學生。當遇到問題時,它會在文檔中搜索相關片段,然后基于這些片段回答問題。這種方法的問題在于,AI無法理解這些片段在整個文檔中的意義,也不知道它們彼此之間的關聯(lián)。研究團隊的新方法則讓AI既能查找具體信息,又能始終保持對整個文檔的全局理解。

一、構建AI的"全局記憶庫"

研究團隊設計的全局記憶構建過程就像制作一份精美的文檔摘要。首先,系統(tǒng)會將長文檔切分成許多小段落,然后為每個段落生成一個簡潔的總結。接著,系統(tǒng)會將所有這些段落總結組合起來,再次進行提煉,最終形成一個完整的全局摘要。

這個過程類似于一個資深編輯閱讀一本書后寫書評的過程。編輯會先理解每個章節(jié)的要點,然后綜合所有章節(jié)的內容,寫出一份既全面又簡潔的書評。這份書評就成了整本書的"全局記憶"。

研究團隊使用GPT-4o作為"編輯"來完成這個摘要過程。系統(tǒng)首先會提示AI總結每個文檔片段,要求保留重要情節(jié)信息,確保摘要連貫且長度適中。然后,系統(tǒng)會將所有片段摘要按順序連接起來,再次要求AI生成一個整體摘要,就像從多個章節(jié)摘要中提煉出一個完整的故事梗概。

這種分層摘要的方法確保了全局記憶既包含了重要細節(jié),又保持了整體的連貫性。最終產生的全局摘要就像是一張文檔的"導航地圖",為后續(xù)的信息檢索和問題回答提供了重要的全局背景。

二、讓AI檢索更聰明的"全局感知"技術

傳統(tǒng)的AI檢索系統(tǒng)就像一個只看得見手電筒照亮范圍的夜間搜救員。當需要尋找信息時,它只能根據問題本身的關鍵詞在文檔中盲目搜索,經常會錯過真正相關的內容,或者找到表面相關但實際無用的信息。

研究團隊開發(fā)的"全局感知檢索器"則像是一個配備了夜視儀和地圖的專業(yè)搜救員。在接收到問題后,這個檢索器不僅會分析問題本身,還會結合整個文檔的全局摘要來理解問題的真實意圖。

具體來說,當系統(tǒng)收到一個問題時,它會將問題和全局摘要組合在一起,形成一個"增強版問題"。這就像是給原始問題添加了背景信息和上下文線索。例如,如果有人問"主角為什么做出這個決定?",傳統(tǒng)系統(tǒng)只能搜索包含"決定"等關鍵詞的片段。而新系統(tǒng)則會結合全局摘要,理解這個問題是在特定故事背景下詢問特定角色的特定行為動機,從而能夠更準確地定位相關信息。

為了訓練這個聰明的檢索器,研究團隊創(chuàng)建了一個大規(guī)模的訓練數(shù)據集。他們從NarrativeQA等長文本理解數(shù)據集出發(fā),通過自動化方法為每個問題標注了相關的文檔片段。這個過程包括問題擴展、多模型投票和語言模型篩選等步驟,最終產生了包含27,117個問題的訓練集,每個問題平均對應2.3個相關文檔片段。

三、融合全局理解的智能回答生成

即使檢索器變得更聰明,如果負責生成答案的模塊仍然缺乏全局視野,整個系統(tǒng)的效果仍然會大打折扣。這就像一個偵探收集到了準確的證據,但分析證據的專家卻不了解整個案件的背景,很可能得出錯誤的結論。

研究團隊因此開發(fā)了"全局感知生成器",確保AI在回答問題時始終保持對整個文檔的全局理解。這個生成器在接收檢索到的文檔片段時,同時也會獲得全局摘要作為背景信息。

這種設計的巧妙之處在于創(chuàng)造了檢索器和生成器之間的"信息對稱"。當檢索器基于全局摘要找到相關片段時,生成器也能訪問同樣的全局信息,從而理解這些片段為什么被選中,以及它們在整個文檔中的意義。

為了訓練這個生成器,研究團隊構建了專門的訓練數(shù)據,其中包含了全局摘要、檢索到的文檔片段和問題。訓練過程模擬了真實的檢索場景,將相關片段和無關片段混合在一起,讓生成器學會在嘈雜環(huán)境中識別有用信息并結合全局背景給出準確答案。

四、多維度實驗驗證系統(tǒng)效能

研究團隊在五個不同的長文本理解數(shù)據集上測試了新系統(tǒng)的效果,這些數(shù)據集涵蓋了英文和中文,包括故事理解、多選推理、聲明驗證等多種任務類型。測試文檔的平均長度都超過了10萬字符,遠超普通AI系統(tǒng)的處理能力。

實驗結果顯示,新系統(tǒng)在所有測試中都顯著超越了傳統(tǒng)方法。最引人注目的是,僅有140億參數(shù)的新系統(tǒng)居然超越了擁有720億參數(shù)的傳統(tǒng)系統(tǒng),這就像一個裝備精良的小團隊打敗了人數(shù)眾多但裝備落后的大軍團。

在NarrativeQA故事理解任務中,新系統(tǒng)的F1分數(shù)達到了53.56,比傳統(tǒng)方法提高了超過8個百分點。在中英雙語的DetectiveQA推理任務中,新系統(tǒng)的準確率分別達到了81.83%(中文)和75.50%(英文),比基線方法提高了約15個百分點。

研究團隊還通過多個控制實驗驗證了系統(tǒng)各個組件的貢獻。結果顯示,全局感知檢索器平均提升了7.55%的性能,而全局感知生成器則額外貢獻了3.79%的提升。當兩者結合時,總體提升達到了11.16%,證明了全局記憶機制的有效性。

五、深入解析AI的"全局思考"機制

為了理解新系統(tǒng)為什么如此有效,研究團隊進行了一系列深入的分析實驗,就像醫(yī)生用各種儀器檢查病人的身體狀況一樣。

他們首先分析了AI在處理問題時的"注意力模式"。傳統(tǒng)AI就像一個只會盯著眼前文字的近視眼,而新系統(tǒng)則展現(xiàn)出了類似人類的"全局注意力"。當遇到問題時,新系統(tǒng)會自動關注全局摘要中與問題相關的部分,然后將這些信息整合到問題理解中。

研究團隊還創(chuàng)造了一個叫做"全局一致性證據對齊"的新指標來衡量系統(tǒng)的全局理解能力。這個指標測量的是AI是否能夠優(yōu)先關注那些與全局摘要一致的證據片段。結果顯示,新系統(tǒng)確實展現(xiàn)出了這種"全局一致性偏好",證明它真正學會了利用全局信息指導局部推理。

通過可視化分析,研究團隊發(fā)現(xiàn)新系統(tǒng)的問題表示在幾何空間中更接近對應文檔的語義區(qū)域。這就像是問題在語義地圖上找到了正確的"坐標位置",從而能夠更準確地檢索相關信息。

六、系統(tǒng)的穩(wěn)健性和適應性驗證

考慮到實際應用中可能面臨的各種挑戰(zhàn),研究團隊還測試了系統(tǒng)在不同條件下的表現(xiàn)。他們發(fā)現(xiàn),即使使用質量較低的摘要(比如用較小的模型生成),系統(tǒng)仍然能夠保持良好的性能。這說明系統(tǒng)對全局信息的質量要求并不苛刻,只要摘要能夠捕捉文檔的基本結構和主要內容,就足以發(fā)揮作用。

研究團隊還測試了不同規(guī)模模型的表現(xiàn)。令人驚訝的是,即使是僅有6億參數(shù)的小規(guī)模新系統(tǒng)也能夠超越80億參數(shù)的傳統(tǒng)系統(tǒng)。這證明了"全局感知"這一設計理念的威力,表明在AI系統(tǒng)中,架構創(chuàng)新往往比單純的規(guī)模擴大更為重要。

在多語言測試中,系統(tǒng)在中文和英文文檔上都表現(xiàn)出了穩(wěn)定的性能提升,說明這種全局記憶機制具有跨語言的普適性。這為系統(tǒng)的國際化應用奠定了基礎。

七、技術突破的深層意義

這項研究的意義遠遠超出了技術本身的改進。它首次在計算機系統(tǒng)中實現(xiàn)了類似人類"全局感知"的認知能力,這是人工智能向更高層次智能邁進的重要一步。

從認知科學的角度來看,人類的閱讀理解能力很大程度上依賴于構建和維護全局認知圖式的能力。當我們閱讀時,大腦會不斷更新對整個文本的理解框架,并用這個框架來指導對新信息的處理。這項研究成功地將這一人類認知機制轉化為可計算的算法,為構建更加智能的AI系統(tǒng)提供了新的思路。

從實際應用的角度來看,這種技術有望顯著改善AI在法律文檔分析、醫(yī)學文獻理解、學術研究支持等領域的表現(xiàn)。在這些場景中,準確理解長篇復雜文檔的全局結構和局部細節(jié)同樣重要,傳統(tǒng)的片段式檢索往往難以勝任。

這項研究也為未來的AI系統(tǒng)設計提供了重要啟示。它表明,簡單地擴大模型規(guī)模并不是提升AI能力的唯一路徑,通過模仿人類認知機制來改進AI的信息處理方式,可能是一條更加有效和可持續(xù)的發(fā)展道路。

說到底,這項研究告訴我們,讓AI變得更聰明的關鍵不在于填鴨式地增加更多數(shù)據或參數(shù),而在于讓它學會像人類一樣思考。當AI能夠像熟練的讀者一樣構建和利用全局理解時,它就能在復雜的信息處理任務中展現(xiàn)出接近人類的智能水平。這不僅是技術上的進步,更是我們對智能本質理解的深化。對于普通用戶而言,這意味著未來的AI助手將能更好地理解我們的復雜需求,在處理長篇文檔、分析復雜情況時提供更加精準和有用的幫助。有興趣深入了解這項技術細節(jié)的讀者可以通過論文編號arXiv:2512.17220v1查詢完整的研究報告。

Q&A

Q1:Mindscape-Aware RAG系統(tǒng)與傳統(tǒng)AI問答系統(tǒng)有什么區(qū)別?

A:傳統(tǒng)AI問答系統(tǒng)就像患有健忘癥的讀者,只能專注于眼前的文字片段,無法把握文章整體框架。而Mindscape-Aware RAG系統(tǒng)能夠像人類一樣構建"全局記憶",為每份長文檔創(chuàng)建全局摘要作為記憶支架,既能查找具體信息,又能始終保持對整個文檔的理解。

Q2:這個系統(tǒng)在實際測試中表現(xiàn)如何?

A:系統(tǒng)在五個長文本理解數(shù)據集上的測試結果非常優(yōu)異。140億參數(shù)的新系統(tǒng)超越了720億參數(shù)的傳統(tǒng)系統(tǒng),在故事理解任務中F1分數(shù)達到53.56,在中英雙語推理任務中準確率分別達到81.83%和75.50%,比傳統(tǒng)方法提高了約15個百分點。

Q3:普通用戶什么時候能體驗到這項技術?

A:該技術目前還處于研究階段,但研究團隊已經在Hugging Face平臺開源了相關模型。未來這種全局感知技術有望應用于法律文檔分析、醫(yī)學文獻理解、學術研究支持等領域,讓AI助手能更好地理解復雜需求,處理長篇文檔時提供更精準的幫助。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
許光達愧受大將軍銜,他對賀老總說:段師長才是實至名歸的大將

許光達愧受大將軍銜,他對賀老總說:段師長才是實至名歸的大將

健康快樂丁
2026-01-01 19:11:26
我是河南人,從臺灣回來,實在忍不住想說:臺灣給我的5點印象

我是河南人,從臺灣回來,實在忍不住想說:臺灣給我的5點印象

i書與房
2026-01-01 16:58:55
僅12天丟掉冠軍,《阿凡達3》被黃曉明打敗,210億票房夢徹底碎了

僅12天丟掉冠軍,《阿凡達3》被黃曉明打敗,210億票房夢徹底碎了

影視高原說
2026-01-01 09:21:50
2026年開始,為什么建議大家盡量使用現(xiàn)金支付,原因很現(xiàn)實

2026年開始,為什么建議大家盡量使用現(xiàn)金支付,原因很現(xiàn)實

李博世財經
2026-01-01 17:03:43
美國提醒日本,小心被中國揍!日本天皇急召高市早苗:有要事交代

美國提醒日本,小心被中國揍!日本天皇急召高市早苗:有要事交代

興史興談
2025-12-31 18:51:20
房貸利率1月1日起下調

房貸利率1月1日起下調

財聞
2026-01-01 15:17:51
停工450天,訂單銳減40%!外資集體“大撤離”,世界工廠時代結束了?

停工450天,訂單銳減40%!外資集體“大撤離”,世界工廠時代結束了?

劉曠
2026-01-01 20:01:47
小米 17 Ultra的最強賣點,卻成了用戶退貨的理由

小米 17 Ultra的最強賣點,卻成了用戶退貨的理由

藍字計劃
2025-12-31 16:28:39
最低溫-11℃!小雪局部中雪、小雨或雨夾雪,陣風7~8級,山東最新元旦假期天氣→

最低溫-11℃!小雪局部中雪、小雨或雨夾雪,陣風7~8級,山東最新元旦假期天氣→

魯中晨報
2026-01-01 16:25:12
摔毛巾+提前離場!名嘴炮轟華子無領袖擔當 狼媒卻直指管理層摳門

摔毛巾+提前離場!名嘴炮轟華子無領袖擔當 狼媒卻直指管理層摳門

顏小白的籃球夢
2026-01-01 19:04:23
CBA最新消息!廣東男籃又傷主力,遼寧無換外援計劃 新疆官宣裁員

CBA最新消息!廣東男籃又傷主力,遼寧無換外援計劃 新疆官宣裁員

中國籃壇快訊
2026-01-01 15:51:34
喜訊!國足最強歸化來了?當事人親承確有其事,單賽季21球7助攻

喜訊!國足最強歸化來了?當事人親承確有其事,單賽季21球7助攻

羅掌柜體育
2026-01-01 10:38:06
馬克龍:將確保法國總統(tǒng) 選舉不受外國干預

馬克龍:將確保法國總統(tǒng) 選舉不受外國干預

每日經濟新聞
2026-01-01 09:47:14
一九七六年元旦社論 1976年1月1日《人民日報》

一九七六年元旦社論 1976年1月1日《人民日報》

那些看得見的老照片
2026-01-01 16:37:37
深夜!茅臺放大招:1499買飛天,每人每日限購12瓶!

深夜!茅臺放大招:1499買飛天,每人每日限購12瓶!

中國基金報
2026-01-01 00:13:38
劉伯承逝世后,有人建議照顧其后人,鄧小平當即拒絕:我們不能幫

劉伯承逝世后,有人建議照顧其后人,鄧小平當即拒絕:我們不能幫

歷史龍元閣
2025-12-30 13:35:08
國乒傳喜訊!24歲主力戀情曝光,女友是日本主力,跨國戀情引熱議

國乒傳喜訊!24歲主力戀情曝光,女友是日本主力,跨國戀情引熱議

體育就你秀
2026-01-01 09:17:30
給2025最好的10部國產劇排名:《生萬物》僅排第2,第1名沒有爭議

給2025最好的10部國產劇排名:《生萬物》僅排第2,第1名沒有爭議

小老頭奇聞
2026-01-01 19:28:01
朱元璋逃難到寡婦家,臨走前寡婦害怕懷孕,朱元璋的做法令人敬佩

朱元璋逃難到寡婦家,臨走前寡婦害怕懷孕,朱元璋的做法令人敬佩

銘記歷史呀
2025-12-29 02:30:03
2025年有一種痛苦叫搬進了“大平層”,不好住不好賣,已淪不動產

2025年有一種痛苦叫搬進了“大平層”,不好住不好賣,已淪不動產

巢客HOME
2025-12-25 07:25:03
2026-01-01 20:48:49
至頂AI實驗室 incentive-icons
至頂AI實驗室
一個專注于探索生成式AI前沿技術及其應用的實驗室。
896文章數(shù) 151關注度
往期回顧 全部

科技要聞

特斯拉Model 3車主首度全程自駕橫穿美國

頭條要聞

女子稱奶奶去世公司不批假被逼離職 公司法人:害群之馬

頭條要聞

女子稱奶奶去世公司不批假被逼離職 公司法人:害群之馬

體育要聞

2026,這些英超紀錄可能會被打破

娛樂要聞

跨年零點時刻好精彩!何炅飛奔擁抱

財經要聞

巴菲特「身退,權還在」

汽車要聞

一汽-大眾2025年整車銷量超158萬輛 燃油車市占率創(chuàng)新高

態(tài)度原創(chuàng)

本地
手機
旅游
公開課
軍事航空

本地新聞

即將過去的2025年,對重慶的影響竟然如此深遠

手機要聞

疑似麒麟9050爆料:1+7+2十核架構加持,多核跑分突破9200!

旅游要聞

黑龍江方正:360°玩轉冰雪

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

澤連斯基新年致辭:不要"烏克蘭的終結"

無障礙瀏覽 進入關懷版