国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

北大林宙辰團隊:從最優(yōu)傳輸角度訓(xùn)練時序預(yù)測模型 丨ICLR 2026

0
分享至


DistDF:從點對點誤差轉(zhuǎn)向聯(lián)合分布對齊,重構(gòu)時間序列預(yù)測的損失函數(shù)。

作者丨鄭佳美

編輯丨岑 峰

在時間序列預(yù)測研究中,一個耐人尋味的現(xiàn)象長期存在:

一方面,模型結(jié)構(gòu)不斷演進,從循環(huán)網(wǎng)絡(luò)到 Transformer,再到頻域與混合結(jié)構(gòu);另一方面,幾乎所有方法在訓(xùn)練階段依賴同一類損失函數(shù),即以均方誤差(MSE)為代表的點對點誤差。

這使得時間序列預(yù)測在方法論層面呈現(xiàn)出一種隱性的停滯,即研究重心持續(xù)向模型表達能力傾斜,而對損失函數(shù)所隱含的統(tǒng)計假設(shè)缺乏系統(tǒng)反思

點對點誤差的核心假設(shè)在于,標簽序列中的各時間步可被視為給定歷史條件下相互獨立的預(yù)測對象。然而,這一假設(shè)與時間序列數(shù)據(jù)的生成機制之間始終存在偏差。

真實世界中的時間序列由隨機過程演化而來,不同時間點之間存在顯著的相關(guān)關(guān)系。將多步預(yù)測問題拆解為一組獨立的回歸任務(wù),不可避免地為損失函數(shù)引入了結(jié)構(gòu)性偏差,使模型難以學(xué)習(xí)標簽序列的整體形態(tài)、相關(guān)結(jié)構(gòu)以及條件依賴關(guān)系。

針對這一問題,北京大學(xué)林宙辰團隊深入剖析了此類結(jié)構(gòu)性偏差的成因。在此基礎(chǔ)上,團隊提出了 DistDF:一種通過聯(lián)合分布對齊訓(xùn)練預(yù)測模型的損失函數(shù)。DistDF 的提出不僅為時間序列預(yù)測提供了一種新的損失函數(shù)設(shè)計思路,也在更一般的意義上,對序列建模中“應(yīng)當(dāng)優(yōu)化什么”這一長期被忽視的問題給出了新的回答。


論文地址:https://arxiv.org/pdf/2510.24574v1

01


當(dāng)獨立性假設(shè)被實驗證偽之后

當(dāng)前時間序列預(yù)測領(lǐng)域的主流方法普遍采用逐時間點的均方誤差(MSE)作為損失函數(shù):

隱式地做了獨立性假設(shè):在給定歷史序列的條件下,標簽序列各時間點的觀測相互獨立。然而,真實時間序列存在顯著的標簽自相關(guān):標簽序列各時間點的觀測往往存在顯著的相關(guān)性。因此,的獨立性假設(shè)與時間序列數(shù)據(jù)的生成機制相悖,導(dǎo)致其作為損失函數(shù)是有偏的(具體見定理1)。

[定理1]考慮單變量標簽序列 ,其條件自相關(guān)矩陣為 ,則標簽序列的實用負對數(shù)似然可表示為: 。顯然,僅當(dāng)是單位陣,即標簽自相關(guān)不存在時,才有。

研究團隊通過實證分析驗證了這一矛盾:在給定歷史序列的條件下,標簽序列仍呈現(xiàn)顯著的條件相關(guān)結(jié)構(gòu),從而在實證意義上證偽了獨立性假設(shè)。實驗進一步表明,即使采用頻域變換或主成分分解等標簽變換方法,變換后的標簽序列依然存在殘余相關(guān)性;因此,在變換后的標簽應(yīng)用均方誤差作為損失函數(shù)仍會導(dǎo)致結(jié)構(gòu)性偏差。


02


DistDF:基于分布對齊的時間序列損失函數(shù)

為規(guī)避傳統(tǒng)方法中的獨立性假設(shè),DistDF 提出直接對齊預(yù)測序列的條件分布與真實標簽的條件分布 。直觀上,該目標可通過最小化兩個條件分布間的距離 來實現(xiàn)。

然而,直接將其作為損失函數(shù)面臨嚴重的樣本稀缺問題。對于給定的歷史序列 ,時間序列數(shù)據(jù)集通常僅包含唯一的標簽序列 ,模型也僅產(chǎn)生單一預(yù)測 。這種“單樣本”情形導(dǎo)致直接估計條件分布距離 在統(tǒng)計上不可靠。

為解決這一難題,我們利用概率恒等式 。因為邊緣分布 是共享的,若聯(lián)合分布對齊,則條件分布必然對齊。基于此,我們將條件分布匹配問題轉(zhuǎn)化為聯(lián)合分布匹配問題。

進一步結(jié)合最優(yōu)傳輸理論,本文證明了聯(lián)合分布的 Wasserstein 距離構(gòu)成了條件分布 Wasserstein 距離期望的上界:

因此,通過最小化歷史-預(yù)測聯(lián)合分布 與歷史-標簽聯(lián)合分布 之間的 Wasserstein 距離,可有效實現(xiàn)條件分布對齊,進一步實現(xiàn)預(yù)測模型的無偏訓(xùn)練。同時,這一轉(zhuǎn)換允許利用整個數(shù)據(jù)集的樣本來估計聯(lián)合分布距離,顯著提升了分布距離估計的可靠性。

DistDF 的實現(xiàn)流程如下:

首先,構(gòu)造聯(lián)合序列: 和 ;

接著,計算兩個聯(lián)合序列之間的Wasserstein距離: ,

最后,與 MSE 損失加權(quán)融合:

DistDF 作為模型無關(guān)的損失函數(shù),可適配各類預(yù)測模型架構(gòu)。

03


在大量實驗中,一致驗證優(yōu)勢

論文首先將DistDF與現(xiàn)有損失函數(shù)進行了比較,包括通過標簽變換削弱標簽相關(guān)性的 FreDF 和 Time-o1。結(jié)果表明,這些方法雖然減少了似然估計的偏差并提升了性能,但殘差偏差仍然存在,因此性能仍有改進空間。而DistDF通過最小化條件分布之間的距離,實現(xiàn)了預(yù)測模型的無偏訓(xùn)練,取得了最佳的預(yù)測性能。


其次,論文通過消融實驗對兩個關(guān)鍵因素進行了驗證;分別考察在DF的基礎(chǔ)上,僅對齊均值、僅對齊協(xié)方差以及同時對齊二者的情形。結(jié)果表明,兩種因素單獨對齊時均能帶來性能提升,而二者同時對齊時效果最為顯著。


接著,論文也對模型輸出的預(yù)測序列進行了可視化分析。結(jié)果表明,采用 DistDF 訓(xùn)練的模型能夠較好地跟隨序列中的突發(fā)變化,使得預(yù)測序列在整體形態(tài)上更加接近真實數(shù)據(jù)。這進一步表明,DistDF 的作用不僅體現(xiàn)在降低數(shù)值誤差上,更重要的是在訓(xùn)練過程中引導(dǎo)模型學(xué)習(xí)到了真實未來時間序列的整體分布形態(tài)。


最后,論文對DistDF與不同預(yù)測模型的兼容性進行了驗證。結(jié)果表明,無論模型本身的復(fù)雜度和建模方式如何,引入 DistDF 訓(xùn)練策略后,模型預(yù)測性能幾乎都能夠獲得進一步提升。這一結(jié)果表明,DistDF 的作用并非彌補模型結(jié)構(gòu)本身的不足,而是提供了更好的訓(xùn)練信號。


04


「多任務(wù)學(xué)習(xí)」需要分布對齊

整體來看,這項研究重新審視了多任務(wù)學(xué)習(xí)場景中的損失函數(shù)設(shè)計。研究團隊強調(diào):多任務(wù)學(xué)習(xí)的核心目標不應(yīng)局限于對 T個標簽的逐點建模,而應(yīng)轉(zhuǎn)向?qū)σ粋€在任務(wù)維度上具有內(nèi)在相關(guān)結(jié)構(gòu)的隨機過程進行整體建模。

在這一視角下,傳統(tǒng)損失函數(shù)(如MSE)隱含了“給定輸入條件下各任務(wù)標簽相互獨立”的假設(shè),從而將一個高維、相關(guān)的隨機過程建模任務(wù)退化為一組彼此獨立的標量回歸任務(wù)。因該假設(shè)忽略標簽序列的內(nèi)生結(jié)構(gòu),這些損失函數(shù)往往是有偏的。

DistDF 通過將預(yù)測序列與真標簽建模為概率分布,實現(xiàn)對任務(wù)維度上相關(guān)結(jié)構(gòu)的整體建模。通過優(yōu)化基于分布對齊的損失函數(shù),模型能夠顯式學(xué)習(xí)標簽序列的整體形態(tài)、相關(guān)結(jié)構(gòu)以及條件依賴關(guān)系。

進一步看,該研究揭示的問題具有廣泛的普適性。只要學(xué)習(xí)任務(wù)的輸出構(gòu)成具有顯著相關(guān)性的序列(如語音、圖像、文本或用戶行為),若仍沿用基于獨立性假設(shè)的損失函數(shù)(如 MSE),則必然會引入結(jié)構(gòu)性偏差。因此,DistDF 所倡導(dǎo)的聯(lián)合分布對齊思想,不僅適用于時間序列預(yù)測,也同樣適用于語音合成、軌跡預(yù)測等任務(wù)。它并非針對時間序列任務(wù)的特定技巧,而是為多任務(wù)學(xué)習(xí)問題提供了一種更為通用的損失函數(shù)構(gòu)造范式。

05


作者信息

論文第一作者王浩,現(xiàn)為浙江大學(xué)控制學(xué)院博士研究生,研究方向聚焦于因果推斷、多任務(wù)學(xué)習(xí)技術(shù)及其在大語言模型中的應(yīng)用。2022 年- 2023 年,他曾在螞蟻金服、微軟亞洲研究院科研實習(xí),從事推薦系統(tǒng)理論研究。2025 年起,他在小紅書參加 RedStar 實習(xí)項目,進行大語言模型、可信獎勵模型領(lǐng)域的研究工作。


論文通訊作者林宙辰,現(xiàn)任北京大學(xué)智能學(xué)院、通用人工智能全國重點實驗室教授。他的研究領(lǐng)域包括機器學(xué)習(xí)和數(shù)值優(yōu)化。他已發(fā)表論文360余篇,谷歌學(xué)術(shù)引用超過42,000次。他是IAPR、IEEE、AAIA、CCF和CSIG會士,多次擔(dān)任CVPR、NeurIPS、ICML等會議的Senior Area Chair,現(xiàn)任ICML Board Member。


參考鏈接:https://zhouchenlin.github.io/

本工作得到了北京市科學(xué)技術(shù)委員會、中關(guān)村科技園區(qū)管理委員會的大力支持,在此深表感謝。

未經(jīng)「AI科技評論」授權(quán),嚴禁以任何方式在網(wǎng)頁、論壇、社區(qū)進行轉(zhuǎn)載!

公眾號轉(zhuǎn)載請先在「AI科技評論」后臺留言取得授權(quán),轉(zhuǎn)載時需標注來源并插入本公眾號名片。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
駐韓美軍部分“薩德”反導(dǎo)系統(tǒng)轉(zhuǎn)往中東

駐韓美軍部分“薩德”反導(dǎo)系統(tǒng)轉(zhuǎn)往中東

環(huán)球網(wǎng)資訊
2026-03-10 13:06:08
人在庫姆卻被拒之門外!伊朗選舉鬧劇,選出哈梅內(nèi)伊“太子”

人在庫姆卻被拒之門外!伊朗選舉鬧劇,選出哈梅內(nèi)伊“太子”

老馬拉車莫少裝
2026-03-09 19:03:45
新歡上位成功?買超又曝喜當(dāng)?shù)?,新歡似是當(dāng)年那個女大學(xué)生

新歡上位成功?買超又曝喜當(dāng)?shù)?,新歡似是當(dāng)年那個女大學(xué)生

悅君兮君不知
2026-03-09 21:42:31
A股:不出意外 明天周三 牛市很有可能會迎大級別的反彈!

A股:不出意外 明天周三 牛市很有可能會迎大級別的反彈!

夜深愛雜談
2026-03-10 20:50:27
只有一個女兒的父母千萬記住:女婿對你啥樣,都別交這五樣底

只有一個女兒的父母千萬記住:女婿對你啥樣,都別交這五樣底

楓紅染山徑
2026-03-06 00:41:37
為什么有人會信命?網(wǎng)友講述神奇遭遇,讓我也不得不信了

為什么有人會信命?網(wǎng)友講述神奇遭遇,讓我也不得不信了

侃神評故事
2026-03-09 11:15:03
粟裕一度鎮(zhèn)不住許世友,四大野戰(zhàn)軍的幾位首長,有幾人能鎮(zhèn)住他?

粟裕一度鎮(zhèn)不住許世友,四大野戰(zhàn)軍的幾位首長,有幾人能鎮(zhèn)住他?

浩渺青史
2026-03-10 18:31:00
眾星送別袁惟仁,前妻陸元琪露面表示不再怨恨,Ella哭到說不出話

眾星送別袁惟仁,前妻陸元琪露面表示不再怨恨,Ella哭到說不出話

萌神木木
2026-03-10 11:43:57
滅國級絞殺!伊朗新領(lǐng)袖剛上臺,美軍基地全面開放,這要徹底亡國

滅國級絞殺!伊朗新領(lǐng)袖剛上臺,美軍基地全面開放,這要徹底亡國

東極妙嚴
2026-03-09 17:19:50
伊各方誓言贏得戰(zhàn)爭,美總統(tǒng)發(fā)出矛盾信息,哈梅內(nèi)伊次子當(dāng)選伊朗最高領(lǐng)袖

伊各方誓言贏得戰(zhàn)爭,美總統(tǒng)發(fā)出矛盾信息,哈梅內(nèi)伊次子當(dāng)選伊朗最高領(lǐng)袖

環(huán)球網(wǎng)資訊
2026-03-10 06:43:10
身價僅80萬!前皇馬7號沉淪:西甲10場0球 球隊瀕臨降級區(qū)

身價僅80萬!前皇馬7號沉淪:西甲10場0球 球隊瀕臨降級區(qū)

葉青足球世界
2026-03-10 15:18:17
48歲中科院美女博導(dǎo)在中東突然去世:死因披露,給兒子留言曝光

48歲中科院美女博導(dǎo)在中東突然去世:死因披露,給兒子留言曝光

博士觀察
2026-03-09 16:22:08
追覓手機外觀確認:奢華設(shè)計叫板華為小米 三分天下

追覓手機外觀確認:奢華設(shè)計叫板華為小米 三分天下

快科技
2026-03-09 16:32:10
48小時生成500萬字小說?AI侵襲網(wǎng)文圈,有編輯稱四成收稿來自AI

48小時生成500萬字小說?AI侵襲網(wǎng)文圈,有編輯稱四成收稿來自AI

藍鯨新聞
2026-03-09 12:14:45
為面子與左翎離婚29年,前妻幸福美滿他卻銷聲匿跡

為面子與左翎離婚29年,前妻幸福美滿他卻銷聲匿跡

心靈的觸動a
2026-03-09 22:33:30
伊朗駐華大使館發(fā)文挑撥中美關(guān)系,估計難奏效

伊朗駐華大使館發(fā)文挑撥中美關(guān)系,估計難奏效

深度財線
2026-03-10 15:46:07
2026中國高端手機最新銷量:iPhone 17以2383.97萬臺登頂榜首

2026中國高端手機最新銷量:iPhone 17以2383.97萬臺登頂榜首

PChome電腦之家
2026-03-09 15:16:03
外媒:法國要求聯(lián)合國安理會召開緊急會議,討論黎巴嫩當(dāng)前局勢

外媒:法國要求聯(lián)合國安理會召開緊急會議,討論黎巴嫩當(dāng)前局勢

環(huán)球網(wǎng)資訊
2026-03-09 19:57:22
巴薩棄將巴甲閃耀 計劃世界杯后離開帕爾梅拉斯 標價超5000萬歐

巴薩棄將巴甲閃耀 計劃世界杯后離開帕爾梅拉斯 標價超5000萬歐

智道足球
2026-03-10 19:16:51
寶馬銷售直播狂踩小米汽車!小米高管回應(yīng)

寶馬銷售直播狂踩小米汽車!小米高管回應(yīng)

鞭牛士
2026-03-10 14:32:06
2026-03-10 23:15:00
AI科技評論 incentive-icons
AI科技評論
點評學(xué)術(shù),服務(wù)AI
7111文章數(shù) 20739關(guān)注度
往期回顧 全部

科技要聞

全民"養(yǎng)蝦"背后:大廠集體下場瘋狂賣Token

頭條要聞

小伙輾轉(zhuǎn)8天回國:后悔賺錢賺到伊朗 赴死的心都有了

頭條要聞

小伙輾轉(zhuǎn)8天回國:后悔賺錢賺到伊朗 赴死的心都有了

體育要聞

加蘭沒那么差,但鱸魚會用嗎?

娛樂要聞

《逐玉》注水風(fēng)波升級!315評論區(qū)淪陷

財經(jīng)要聞

“龍蝦補貼”密集出爐 最高1000萬!

汽車要聞

MG4有SUV衍生 上汽乘用車多款新車規(guī)劃曝光

態(tài)度原創(chuàng)

教育
游戲
房產(chǎn)
公開課
軍事航空

教育要聞

近10年,全國普通高校畢業(yè)生規(guī)模連年增長!

羨慕嗎?國外圖書館都能借上3A大作了

房產(chǎn)要聞

信號!千億巨頭入局,三亞開啟新一輪大征拆!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

剛說完戰(zhàn)爭很快結(jié)束 特朗普改口

無障礙瀏覽 進入關(guān)懷版