国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

香港中文大學(xué)團(tuán)隊(duì)破解AI"記憶缺失"難題

0
分享至


這項(xiàng)由香港中文大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)系的杜一鳴教授聯(lián)合華為技術(shù)有限公司、香港科技大學(xué)和愛丁堡大學(xué)的研究團(tuán)隊(duì)合作完成的突破性研究,于2025年12月發(fā)表在計(jì)算機(jī)科學(xué)頂級會議論文集中,論文編號為arXiv:2512.20092v1。這項(xiàng)名為"MEMORY-T1: 多會話智能代理時序推理的強(qiáng)化學(xué)習(xí)"的研究,首次解決了人工智能系統(tǒng)在處理長時間對話時的"記憶困難癥",讓AI能夠像人類一樣準(zhǔn)確記住并運(yùn)用歷史對話信息進(jìn)行時間推理。

當(dāng)我們與朋友聊天時,能夠輕松地回憶起"上周二你提到的那家餐廳"或者"三個月前我們討論的那個項(xiàng)目現(xiàn)在怎么樣了"。這種跨越時間的對話記憶對人類來說再自然不過,但對AI系統(tǒng)卻是一個巨大挑戰(zhàn)。目前的AI助手就像一個患有短期失憶癥的人,每次對話都像第一次見面,無法準(zhǔn)確回憶和運(yùn)用之前的對話內(nèi)容,特別是涉及時間順序和時間關(guān)系的復(fù)雜推理。

研究團(tuán)隊(duì)發(fā)現(xiàn),現(xiàn)有的AI系統(tǒng)在處理長篇對話歷史時會出現(xiàn)嚴(yán)重的"迷失"現(xiàn)象。當(dāng)對話歷史積累到數(shù)萬字甚至更多時,AI就像在一個巨大的圖書館里尋找特定信息,卻沒有索引系統(tǒng)的幫助,經(jīng)常找錯書架或者拿錯書籍。更糟糕的是,當(dāng)涉及時間推理時,AI需要理解"昨天"、"上周"、"三個月前"這些相對時間概念,并將它們準(zhǔn)確映射到具體的時間點(diǎn),這對現(xiàn)有技術(shù)來說幾乎是不可能完成的任務(wù)。

為了解決這個問題,研究團(tuán)隊(duì)開發(fā)了一套名為"MEMORY-T1"的創(chuàng)新框架。這個框架可以比作一個精明的圖書管理員,不僅能夠快速定位相關(guān)信息,還能理解時間關(guān)系并做出準(zhǔn)確判斷。整個系統(tǒng)的工作過程就像一個經(jīng)驗(yàn)豐富的偵探破案一樣,分為兩個主要階段:初步篩選和精確定位。

在初步篩選階段,系統(tǒng)首先像一個時間偵探一樣分析用戶的問題,預(yù)測這個問題可能涉及的時間范圍。比如當(dāng)用戶問"艾米什么時候提到《金裝律師》的角色在金球獎頒獎典禮上碰面的"時,系統(tǒng)會智能地識別出這個問題涉及的大致時間范圍。接著,系統(tǒng)會根據(jù)這個時間范圍,從龐大的對話歷史中篩選出可能相關(guān)的對話片段,就像在圖書館中先找到正確的樓層和區(qū)域。

這個初步篩選過程非常高效,能夠?qū)⒃究赡馨瑪?shù)百個對話片段的歷史記錄快速縮減到十幾個高度相關(guān)的候選片段。系統(tǒng)使用了時間過濾器和相關(guān)性過濾器兩道關(guān)卡,時間過濾器確保選中的對話片段在時間上與問題相關(guān),相關(guān)性過濾器則保證內(nèi)容上的匹配度。

在精確定位階段,系統(tǒng)采用了一種被稱為"強(qiáng)化學(xué)習(xí)"的高級訓(xùn)練方法。這個過程就像訓(xùn)練一個專業(yè)的時間推理專家,通過大量的練習(xí)和反饋來提高準(zhǔn)確率。系統(tǒng)不僅要學(xué)會選擇正確的對話片段作為證據(jù),還要學(xué)會生成準(zhǔn)確的答案,更重要的是要保證時間邏輯的一致性。

強(qiáng)化學(xué)習(xí)訓(xùn)練的關(guān)鍵在于設(shè)計(jì)了一個多層次的獎勵機(jī)制。這個獎勵系統(tǒng)就像一個嚴(yán)格但公平的老師,會從三個維度來評判系統(tǒng)的表現(xiàn)。首先是答案準(zhǔn)確性,系統(tǒng)給出的最終答案必須完全正確;其次是證據(jù)選擇的準(zhǔn)確性,系統(tǒng)必須選擇正確的對話片段作為推理依據(jù);最后是時間一致性,這是最具創(chuàng)新性的部分,系統(tǒng)必須確保所選擇的證據(jù)在時間邏輯上與問題保持一致。

時間一致性獎勵機(jī)制包含兩個精巧的子組件。第一個是時序接近度評估,它會檢查所選對話片段的時間戳是否與問題涉及的時間范圍接近,就像檢查證人的在場證明是否與案發(fā)時間吻合。第二個是時序真實(shí)性評估,它會深入分析對話片段內(nèi)部的具體內(nèi)容,確保片段中提到的事件確實(shí)發(fā)生在問題詢問的時間范圍內(nèi),就像驗(yàn)證證詞的真實(shí)性和時間準(zhǔn)確性。

這種精細(xì)的獎勵設(shè)計(jì)解決了AI訓(xùn)練中的一個核心難題:稀疏獎勵問題。傳統(tǒng)的訓(xùn)練方法只能告訴系統(tǒng)最終答案是對是錯,就像只告訴學(xué)生考試成績而不指出具體錯誤一樣。而MEMORY-T1的多層次獎勵系統(tǒng)能夠在整個推理過程中提供詳細(xì)的指導(dǎo),幫助系統(tǒng)更快更好地學(xué)習(xí)時間推理技能。

研究團(tuán)隊(duì)在Time-Dialog基準(zhǔn)測試數(shù)據(jù)集上進(jìn)行了大規(guī)模實(shí)驗(yàn)驗(yàn)證。這個數(shù)據(jù)集包含了4716個復(fù)雜的時間推理問題,涵蓋了11種不同類型的時間推理任務(wù),從簡單的時間定位到復(fù)雜的事件排序和反事實(shí)推理。實(shí)驗(yàn)結(jié)果令人印象深刻,MEMORY-T1系統(tǒng)在各項(xiàng)測試中都表現(xiàn)出色,整體準(zhǔn)確率達(dá)到67.0%,創(chuàng)下了開源模型的最佳記錄。

更令人驚喜的是,研究團(tuán)隊(duì)發(fā)現(xiàn)僅有30億參數(shù)的小型模型在使用MEMORY-T1框架后,竟然超越了140億參數(shù)的大型基礎(chǔ)模型。這就像一個經(jīng)過專業(yè)訓(xùn)練的輕量級拳手擊敗了體重更大但缺乏訓(xùn)練的重量級選手,證明了精巧的訓(xùn)練方法比單純的模型規(guī)模更為重要。

系統(tǒng)在處理超長對話歷史時表現(xiàn)出了驚人的穩(wěn)定性。當(dāng)對話長度從8000字?jǐn)U展到128000字時,傳統(tǒng)AI系統(tǒng)的表現(xiàn)會急劇下降,準(zhǔn)確率可能降低30%以上,就像人在信息過載時會變得混亂一樣。但MEMORY-T1系統(tǒng)始終保持穩(wěn)定的高性能,證明了其出色的抗干擾能力和信息處理能力。

在實(shí)際應(yīng)用測試中,研究團(tuán)隊(duì)還驗(yàn)證了系統(tǒng)的泛化能力。他們在完全不同的LoCoMo數(shù)據(jù)集上測試MEMORY-T1,這個數(shù)據(jù)集專門設(shè)計(jì)用來評估AI的長期對話記憶能力。結(jié)果顯示,MEMORY-T1在這個跨領(lǐng)域測試中也取得了顯著的性能提升,準(zhǔn)確率從33.5%提升到37.7%,證明了系統(tǒng)學(xué)到的時間推理技能具有很強(qiáng)的通用性。

研究團(tuán)隊(duì)還進(jìn)行了詳細(xì)的消融實(shí)驗(yàn)來驗(yàn)證各個組件的重要性。實(shí)驗(yàn)發(fā)現(xiàn),如果移除時間一致性獎勵機(jī)制,系統(tǒng)的整體性能會下降15%,這證明了時間推理在長對話理解中的關(guān)鍵作用。如果移除證據(jù)選擇獎勵機(jī)制,系統(tǒng)在定位和提取任務(wù)上的表現(xiàn)會顯著下降,說明精確的信息檢索同樣重要。

從計(jì)算效率的角度來看,MEMORY-T1系統(tǒng)的設(shè)計(jì)非常實(shí)用。整個推理過程的平均延遲僅為1.26秒,與傳統(tǒng)方法相當(dāng),而信息檢索的額外開銷幾乎可以忽略不計(jì)。這意味著系統(tǒng)在提供更好性能的同時,并沒有增加明顯的計(jì)算負(fù)擔(dān),具備了實(shí)際部署的可行性。

研究團(tuán)隊(duì)還測試了系統(tǒng)對時間標(biāo)簽噪聲的魯棒性。在現(xiàn)實(shí)應(yīng)用中,對話的時間戳可能存在各種誤差,就像手表可能有快慢一樣。實(shí)驗(yàn)顯示,即使在20%的時間標(biāo)簽存在錯誤的情況下,MEMORY-T1系統(tǒng)仍能保持60%的準(zhǔn)確率,在較為現(xiàn)實(shí)的5%錯誤率下,系統(tǒng)準(zhǔn)確率保持在67%的高水平,證明了其在實(shí)際應(yīng)用中的穩(wěn)定性。

這項(xiàng)研究的意義遠(yuǎn)不止技術(shù)突破本身。它為AI系統(tǒng)處理復(fù)雜時序信息提供了全新的思路和方法,就像為AI裝上了"時間記憶"模塊。在實(shí)際應(yīng)用中,這種技術(shù)可以讓AI助手變得更加智能和可靠。用戶可以自然地詢問"我們上次討論的項(xiàng)目進(jìn)展如何"或"你還記得我三周前提到的那個想法嗎",AI助手能夠準(zhǔn)確理解并提供有用的回應(yīng)。

對于企業(yè)級應(yīng)用來說,這種技術(shù)更具革命性意義。在客服系統(tǒng)中,AI可以記住客戶的歷史問題和解決方案,提供更連貫的服務(wù)體驗(yàn)。在項(xiàng)目管理中,AI助手可以跟蹤項(xiàng)目的時間線,理解各個事件之間的時間關(guān)系,提供更準(zhǔn)確的進(jìn)度分析和預(yù)測。在教育領(lǐng)域,AI導(dǎo)師可以根據(jù)學(xué)生的學(xué)習(xí)歷史,理解知識點(diǎn)的掌握時間和遺忘曲線,提供個性化的復(fù)習(xí)建議。

研究團(tuán)隊(duì)還公開了完整的代碼和數(shù)據(jù)集,為整個學(xué)術(shù)界和工業(yè)界提供了寶貴的資源。這種開源精神不僅推動了技術(shù)的普及和發(fā)展,也為后續(xù)研究奠定了堅(jiān)實(shí)的基礎(chǔ)。其他研究團(tuán)隊(duì)可以在此基礎(chǔ)上進(jìn)一步改進(jìn)和擴(kuò)展,推動整個領(lǐng)域的發(fā)展。

說到底,MEMORY-T1的成功在于它從根本上改變了AI處理時間信息的方式。傳統(tǒng)的AI系統(tǒng)就像一個只能看到當(dāng)下的近視眼,而MEMORY-T1給AI裝上了"時間望遠(yuǎn)鏡",讓它能夠清晰地看到過去,理解事件的時間脈絡(luò),做出準(zhǔn)確的時間推理。這種能力對于構(gòu)建真正智能的AI系統(tǒng)至關(guān)重要,因?yàn)闀r間是人類認(rèn)知和交流的基礎(chǔ)維度之一。

從技術(shù)發(fā)展的角度來看,這項(xiàng)研究代表了AI從簡單的問答系統(tǒng)向真正的智能對話伙伴的重要進(jìn)展。它不僅解決了一個具體的技術(shù)難題,更重要的是為AI系統(tǒng)賦予了"記憶"和"時間感知"這兩個關(guān)鍵的智能特征。這些特征是構(gòu)建下一代AI系統(tǒng)的基礎(chǔ),將推動整個人工智能領(lǐng)域向更高層次的智能發(fā)展。

歸根結(jié)底,MEMORY-T1的突破意義在于它證明了通過精巧的設(shè)計(jì)和訓(xùn)練,AI系統(tǒng)可以獲得類似人類的時間記憶和推理能力。這不僅是技術(shù)上的進(jìn)步,更是AI向人類智能邁進(jìn)的重要一步。雖然距離真正的人工通用智能還有很長的路要走,但MEMORY-T1為我們展示了一個充滿希望的方向:讓AI不僅能夠理解語言,更能夠理解時間,記住歷史,連接過去、現(xiàn)在和未來。有興趣深入了解技術(shù)細(xì)節(jié)的讀者可以通過論文編號arXiv:2512.20092v1查詢完整的研究報(bào)告。

Q&A

Q1:MEMORY-T1是什么技術(shù)?

A:MEMORY-T1是由香港中文大學(xué)聯(lián)合華為等機(jī)構(gòu)開發(fā)的AI記憶框架,專門解決AI在長對話中的時間推理問題。它讓AI能夠像人類一樣記住對話歷史并準(zhǔn)確處理時間相關(guān)問題,比如"上周提到的事情"或"三個月前討論的話題"。

Q2:MEMORY-T1比現(xiàn)有AI技術(shù)強(qiáng)在哪里?

A:現(xiàn)有AI在處理長對話時會"迷失",特別是涉及時間推理時表現(xiàn)很差。MEMORY-T1采用兩階段設(shè)計(jì):先快速篩選相關(guān)信息,再精確定位答案,還有獨(dú)特的時間一致性獎勵機(jī)制。實(shí)驗(yàn)顯示30億參數(shù)的小模型用了這個框架后,竟然超越了140億參數(shù)的大模型。

Q3:MEMORY-T1可以用在什么地方?

A:主要應(yīng)用在智能客服、AI助手、項(xiàng)目管理和教育等領(lǐng)域。比如客服AI可以記住用戶歷史問題,AI助手可以理解"上次討論的項(xiàng)目進(jìn)展",教育AI可以根據(jù)學(xué)生的學(xué)習(xí)時間線提供個性化建議。技術(shù)已開源,企業(yè)可以直接使用。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
1956年毛主席罕見發(fā)問:東來順羊肉咋回事?陳云一查,根子不在師傅,問題出在“新規(guī)矩”

1956年毛主席罕見發(fā)問:東來順羊肉咋回事?陳云一查,根子不在師傅,問題出在“新規(guī)矩”

歷史回憶室
2025-12-23 10:19:17
志愿軍首戰(zhàn)殲滅美軍一萬五,主席卻提筆改成六千,麥克阿瑟看完戰(zhàn)報(bào)笑得合不攏嘴,結(jié)果幾十萬大軍一頭扎進(jìn)死胡同,這招示弱太絕了

志愿軍首戰(zhàn)殲滅美軍一萬五,主席卻提筆改成六千,麥克阿瑟看完戰(zhàn)報(bào)笑得合不攏嘴,結(jié)果幾十萬大軍一頭扎進(jìn)死胡同,這招示弱太絕了

歷史回憶室
2025-12-26 11:42:28
為啥"唐氏兒"都長著同一張臉?醫(yī)生一般不說,父母最好要知道

為啥"唐氏兒"都長著同一張臉?醫(yī)生一般不說,父母最好要知道

大果小果媽媽
2025-12-28 11:33:24
孟村殺妻案結(jié)果公布,判決前金昊母子照片曝光,兩人狀態(tài)截然不同

孟村殺妻案結(jié)果公布,判決前金昊母子照片曝光,兩人狀態(tài)截然不同

歷史偉人錄
2025-12-27 21:34:16
袁天罡農(nóng)家躲雨,主人只掃屋心,他面色驟變:三代之內(nèi)必出大人物

袁天罡農(nóng)家躲雨,主人只掃屋心,他面色驟變:三代之內(nèi)必出大人物

小豫講故事
2025-12-28 06:00:08
李瑞環(huán)說:葉選平是葉帥的兒子,但水平比我高,為什么不能當(dāng)省長

李瑞環(huán)說:葉選平是葉帥的兒子,但水平比我高,為什么不能當(dāng)省長

章荳解說體育
2025-12-11 21:56:41
柬埔寨國王,72歲了,沒錢沒權(quán),沒結(jié)婚沒孩子,和老母親相依為命

柬埔寨國王,72歲了,沒錢沒權(quán),沒結(jié)婚沒孩子,和老母親相依為命

趣文說娛
2025-12-23 17:34:34
童瑤胸貼露出來了

童瑤胸貼露出來了

手工制作阿殲
2025-12-15 12:20:21
中山一商場展車撞入手機(jī)店,車企工作人員:小孩誤觸所致,無人受傷

中山一商場展車撞入手機(jī)店,車企工作人員:小孩誤觸所致,無人受傷

極目新聞
2025-12-28 13:48:03
錢再多也沒用!向太曝馬伊琍已再婚,原來當(dāng)年文章過不了心里那關(guān)

錢再多也沒用!向太曝馬伊琍已再婚,原來當(dāng)年文章過不了心里那關(guān)

一娛三分地
2025-12-15 13:26:07
一個男人如果不正經(jīng),通過這2個模樣,一看便知!

一個男人如果不正經(jīng),通過這2個模樣,一看便知!

加油丁小文
2025-12-01 08:00:12
殲-15幾乎全部退役,淪為全球最短命艦載機(jī)!它究竟有哪些短板?

殲-15幾乎全部退役,淪為全球最短命艦載機(jī)!它究竟有哪些短板?

小莜讀史
2025-12-27 14:55:11
201米!40億!騰訊西南總部,世界“第一扭”摩天樓

201米!40億!騰訊西南總部,世界“第一扭”摩天樓

GA環(huán)球建筑
2025-12-25 23:00:32
原來他早已去世,15歲演戲44歲走紅,47歲患癌離世,哥哥是熟面孔

原來他早已去世,15歲演戲44歲走紅,47歲患癌離世,哥哥是熟面孔

故事講電影
2025-12-28 20:01:41
“后悔來清華參觀,自取其辱”,母親帶娃游清華,被食堂氣到失控

“后悔來清華參觀,自取其辱”,母親帶娃游清華,被食堂氣到失控

詩意世界
2025-11-30 11:04:47
馬卡:弗洛倫蒂諾使巴薩財(cái)務(wù)難題徹底解決,應(yīng)拿巴薩金質(zhì)勛章

馬卡:弗洛倫蒂諾使巴薩財(cái)務(wù)難題徹底解決,應(yīng)拿巴薩金質(zhì)勛章

懂球帝
2025-12-28 20:59:23
溥儀9歲仍在吃奶,給他當(dāng)乳娘有2規(guī)矩:一是喂奶,另一個毫無人性

溥儀9歲仍在吃奶,給他當(dāng)乳娘有2規(guī)矩:一是喂奶,另一個毫無人性

小豫講故事
2025-12-27 06:00:06
中國股市:炒股成功的人到底有多可怕?從窮人到富人的全過程!

中國股市:炒股成功的人到底有多可怕?從窮人到富人的全過程!

股經(jīng)縱橫談
2025-12-28 18:53:25
天氣預(yù)報(bào)丨新一輪降溫即將到來 重慶高海拔地區(qū)有雪

天氣預(yù)報(bào)丨新一輪降溫即將到來 重慶高海拔地區(qū)有雪

上游新聞
2025-12-28 17:24:02
廣東vs山西,對抗強(qiáng)度拉滿,胡明軒奎因表現(xiàn)糟糕,杜鋒投訴迪亞洛

廣東vs山西,對抗強(qiáng)度拉滿,胡明軒奎因表現(xiàn)糟糕,杜鋒投訴迪亞洛

鄒維體育
2025-12-28 20:06:15
2025-12-28 21:20:49
科技行者 incentive-icons
科技行者
科技正在如何變革商業(yè)世界
6680文章數(shù) 544關(guān)注度
往期回顧 全部

科技要聞

特斯拉將在華布局自動駕駛?記者求證→

頭條要聞

新華社發(fā)文:積蓄統(tǒng)一大勢

頭條要聞

新華社發(fā)文:積蓄統(tǒng)一大勢

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂要聞

白敬亭現(xiàn)身冰雪大世界 拍視頻還翻車了

財(cái)經(jīng)要聞

英偉達(dá)的收購史

汽車要聞

理想的2026:L9不容有失,i9再戰(zhàn)純電?

態(tài)度原創(chuàng)

本地
親子
藝術(shù)
時尚
公開課

本地新聞

云游安徽|踏訪池州,讀懂山水間的萬年史書

親子要聞

原來真的有學(xué)霸父母“學(xué)渣”娃的情況!網(wǎng)友:看完瞬間心理平衡!

藝術(shù)要聞

驚艷!陳紅20年前沙發(fā)照曝光,宛如人間尤物!

2026年了,最好看還是這件大衣!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版