網易首頁 > 網易號 > 正文申請入駐

深度｜阿里?ICLR 255?篇霸榜！基座是明牌，系統(tǒng)是暗牌，做實比做強更狠

2026-03-24 17:35:23　來源: ZFinance

北京舉報

分享至

Z Highlights

從論文分布上看，基座大模型吃掉51.8%的份額，多模態(tài)感知再切走 20.8%。光是這兩個方向，就卷走了超過七成的火力。
如果說基座大模型是明牌，那計算機系統(tǒng)就是阿里的暗牌。表面上看，系統(tǒng)方向只有 5 篇論文，數量少得可憐。但整個 ICLR 2026 在系統(tǒng)方向的占比僅 0.8%，阿里的偏好指數高達 2.44，重倉程度甚至超過基座大模型。
誰能解決泛化問題，誰能壓縮系統(tǒng)成本，誰能打通模型落地的最后一公里，誰才是下一個時代的贏家。阿里系的研究重心，已經從做強轉向做實。

AI 頂會江湖，風向正在悄然生變。

當全球 5340 篇論文涌入 ICLR 2026，阿里系以 255 篇接收論文、10 篇 Oral 的硬核戰(zhàn)績，拿下 4.8%的全球份額。這不是簡單的數字堆砌，在這份成績單背后，藏著阿里 AI 戰(zhàn)略的深層邏輯：從單兵突進轉向生態(tài)作戰(zhàn)，從論文工廠轉向產業(yè)閉環(huán)。

關于 ICLR：國際表征學習大會（ICLR）是深度學習領域頂級會議，與 NeurIPS、ICML 并稱機器學習三大頂會，近期被 CCF 評為 A 類會議。2026 年 ICLR 覆蓋大語言模型、生成模型、多模態(tài)學習、AI 安全、機器學習系統(tǒng)等多個前沿方向。

255篇背后：一場產學研的鐵三角實驗

翻開阿里系的論文版圖，一個反常識的數據炸場：96.1% 的論文依賴外部合作，純阿里獨立完成的僅占 2.7%。但一個細節(jié)更值得玩味：這份龐大的合作名單里，海外高校幾乎缺席。

這不是能力短板，而是一場更為極致的本土化閉環(huán)實驗——阿里正在把自己變成一塊磁石，不玩閉門造車的原創(chuàng)神話，而是搭建產業(yè)平臺 + 國內高校網絡的新范式。純阿里獨立完成的論文，只有 7 篇，占比 2.7%。剩下的 97.3%呢？

阿里-高校合作 168 篇（65.9%）

阿里-高校-企業(yè)混合 77 篇（30.2%）

純阿里-企業(yè)合作 3 篇（1.2%）

圖 7 阿里系論文合作版圖分布

本土 AI 全明星陣容包括：

浙江大學 51 篇

清華大學 43 篇

香港科技大學 31 篇

北京大學 29 篇

中科院自動化所 20 篇

甚至連字節(jié)跳動（13 篇）、騰訊（9 篇）這些友商，都在阿里系的合作網絡里刷臉。在頂會賽場上，競合關系的邊界正在模糊——今天的對手，明天的合作者。

0% 的海外依賴，2.7% 的獨舞，96.1% 的群像，阿里在用數據證明：在這個時代，做平臺比做孤島更有殺傷力。這些頭部高校不僅是論文產出機器，更是阿里的人才蓄水池和技術風向標。

基座大模型吃掉半壁江山，多模態(tài)感知緊追不舍

如果說論文數量是面子，那研究方向就是里子。阿里系的火力高度集中在兩大高地：基座大模型（51.8%）和多模態(tài)感知（20.8%）。光是這兩個方向，就吞掉了超過七成的彈藥。

這與 ICLR 的整體趨勢同頻共振，但阿里的打法更重——當行業(yè)還在卷參數規(guī)模，他們已經開始死磕可用性重構。10 篇 Oral 論文透露了研究重心正從能力突破轉向場景閉環(huán)：泛化、推理、效率、落地這四個關鍵詞，構成了阿里 AI 的新坐標系。

過去兩年，大模型賽道充斥著大力出奇跡的狂熱。但阿里系在 ICLR 2026 的選題，明顯冷靜了下來。

他們不再只關心模型能做什么，而是追問模型在真實世界怎么用得起來。系統(tǒng)效率優(yōu)化、復雜環(huán)境泛化、推理可靠性保障，這些聽起來不那么性感的方向，正在成為新的技術高地。這種轉向，與阿里的產業(yè)基因密不可分。作為年研發(fā)投入超 15%、坐擁數萬塊 GPU 集群和數十億級真實業(yè)務數據的云服務商，阿里比純研究機構更清楚：技術價值最終要在產業(yè)閉環(huán)里兌現。依托 7000 余名技術人才（含 2000+博士）和魔搭社區(qū)等開放平臺，阿里已經構建起全球領先的 AI 全棧能力。

但 255 篇論文也拋出了一個新命題：當外部合作成為主流產出模式，如何在工程能力、場景需求與學術原創(chuàng)之間找到更深層的平衡？這不僅是阿里的挑戰(zhàn)，也是中國產業(yè) AI 的集體課題。畢竟，頂會論文只是入場券，定義下一代 AI 基礎設施的能力，才是真正的終局之戰(zhàn)。

計算機系統(tǒng)方向偷偷發(fā)力，全力押注工程可落地

255 篇論文背后，阿里系的彈藥到底投向了哪里？

圖 1 阿里系論文數量概覽

基座大模型：阿里的超配戰(zhàn)略

數據不會說謊。ICLR 2026 整體接收論文中，基座大模型方向占 33.2%，而阿里系在這一方向的占比高達 51.8%——偏好指數 1.56，超配幅度接近六成。這意味著當行業(yè)還在均衡布局時，阿里選擇了把雞蛋放在最重的籃子里。

圖 2 阿里系論文研究領域大類分布

更細顆粒度地看，阿里系在 foundation or frontier models（含 LLM）方向砸了 72 篇論文，占總量 28.2%；多模態(tài)應用 47 篇、數據集與評測基準 30 篇、生成模型 30 篇——從底層架構到上層應用，從訓練數據到評測標準，阿里正在構建一套完整的技術閉環(huán)。

圖 3 阿里系論文一級研究方向 Top 10

一個值得玩味的細節(jié)是Junyang Lin（林俊旸）一人署名 8 篇論文，其中 1 篇 Oral。這位阿里大模型骨干的選題清單，堪稱阿里技術路線的縮影——多模態(tài)推理、軟件工程智能體、推測式解碼、全模態(tài)感知...清一色的大模型+多模態(tài)主線。

系統(tǒng)方向是被忽視的隱形重倉

圖 4 阿里與整體 ICLR 方向分布對比

圖 5 阿里方向偏好指數

如果說基座大模型是明牌，那計算機系統(tǒng)方向就是阿里的暗牌。表面上看，系統(tǒng)方向只有 5 篇論文，數量少得可憐。但別忘了，整個 ICLR 2026 在系統(tǒng)方向的占比僅 0.8%——阿里的偏好指數高達 2.44，重倉程度甚至超過基座大模型。

這透露了一個關鍵信號：當所有人都在卷模型能力，阿里已經開始死磕底層基礎設施。畢竟，對于手握數萬塊 GPU 集群的云服務商來說，系統(tǒng)效率才是真正的護城河。

Oral 質量占比：與大盤持平，未見明顯超車

圖 6 阿里與整體 ICLR Oral 占比對比

最后看一個硬核指標：Oral 占比。阿里系 Oral 論文 10 篇，占比 3.9%；ICLR 整體 Oral 占比 4.2%。-0.3 個百分點的差距，說明阿里在論文質量上穩(wěn)住了基本盤，但并未形成顯著的精品優(yōu)勢。

換句話說，相比頂級突破性成果，阿里更擅長規(guī)模化產出，把三個特征串起來看，阿里在 ICLR 2026 的打法已經非常清晰：

1.方向聚焦：基座大模型絕對重倉，多模態(tài)緊隨其后，系統(tǒng)方向暗中發(fā)力

2.生態(tài)作戰(zhàn)：96%的論文依賴外部合作，把自己變成產業(yè)研究平臺

3.工程導向：偏好指數顯示，阿里明顯回避純理論方向，全力押注工程可落地領域

這不是傳統(tǒng)意義上的學術機構打法，而是平臺型科技公司的典型策略——用產業(yè)資源換學術影響力，用合作網絡換規(guī)模效應，最終目標不是頂會獎杯，而是 AI 基礎設施的定義權。

注：

偏好指數 = 阿里在某方向的論文占比 / 整體 ICLR 在該方向的論文占比。偏好指數大于 1 表示阿里在該方向相對超配，小于 1 表示相對低配。

占比差值 = 阿里在某方向的論文占比 - 整體 ICLR 在該方向的論文占比，用于直觀看結構差異。

本文新增的這些指標都屬于描述性統(tǒng)計，用于說明方向結構，不做顯著性檢驗。

10篇Oral看阿里系ICLR 2026的真正重心

我們聚焦在阿里系在 ICLR 上的 10 篇Oral文章，相關研究大致沿著泛化性、推理可靠性、計算效率以及對齊與交互能力四條主線展開，并逐步形成了從數據構建、模型設計、先驗注入、推理增強到評測范式重構的多層次研究圖景。

首先，在泛化能力方面，現有工作已不再滿足于封閉分布下的性能提升，而是更加關注模型在未見偽造類型、跨域場景以及復雜真實環(huán)境中的魯棒性。一類研究從數據與基準構建入手，試圖通過更貼近實際應用條件的訓練與評測設置縮小實驗環(huán)境與工業(yè)場景之間的差距。例如，HydraFake 強調多樣化偽造技術、真實世界 forgery 以及嚴格的 out-of-domain 協議，從數據層面推動深偽檢測研究由“同分布識別”轉向“面向開放場景的泛化檢測”；另一類工作從模型機制本身出發(fā)增強泛化能力。以 Camera-Aware MLLM 為代表的研究指出，僅依賴 RGB 輸入的空間智能建模容易將幾何屬性與相機成像條件混合編碼，導致模型過擬合于訓練相機分布，因此有必要將相機內參顯式納入視覺 token 的條件建模之中，并輔以相機感知的數據增強策略與幾何先驗蒸餾，以提升跨相機條件下的空間推理能力。

在推理能力與可靠性方面，一條重要方向是通過結構化推理機制增強模型的中間決策質量。Veritas 通過在傳統(tǒng) chain-of-thought 之外引入 planning 與 self-reflection 等關鍵模式，使模型能夠以更接近人工鑒偽流程的方式逐步分析偽造線索；VC-STaR 從視覺對比的角度出發(fā)，利用對比式 VQA 樣本幫助模型更準確地定位判別性視覺證據，并在此基礎上生成質量更高、幻覺更少的視覺推理路徑，進而實現視覺推理能力的自我提升。

VERITAS

在效率與優(yōu)化方面，相關研究主要覆蓋訓練階段與推理階段兩個層面。訓練階段的工作更多關注如何在不犧牲最終性能的前提下降低傳統(tǒng)優(yōu)化范式中的冗余設計。WSM 即代表了一類重新審視學習率衰減機制的研究，其核心觀點在于通過 checkpoint merging 建立學習率調度與模型平均之間的形式聯系，從而以一種 decay-free 的方式近似或替代常見的 cosine decay、linear decay 等退火策略。該類方法的意義不僅在于優(yōu)化效率本身，也在于其為長期預訓練和后續(xù)監(jiān)督微調提供了更統(tǒng)一的訓練動力學解釋。

在對齊、交互與決策能力方面，研究關注點則進一步擴展至模型如何在開放環(huán)境中適應用戶偏好、完成動態(tài)任務并實現可擴展的行為優(yōu)化。P-GenRM 代表了個性化對齊方向的重要進展，其通過將用戶偏好表征為結構化評價鏈，并在測試階段引入基于個體與原型的雙粒度縮放機制，使獎勵模型不僅能夠適配特定用戶的細粒度偏好，還能借助相似用戶群體的原型知識增強對新用戶的泛化能力。

P-GenRM

綜合來看，一方面，研究者通過更真實的數據分布、動態(tài)交互環(huán)境和更嚴格的評測協議不斷暴露現有模型在開放世界中的能力缺口；另一方面，又通過結構化推理、先驗知識注入、訓練與解碼機制優(yōu)化以及個性化對齊等方法，系統(tǒng)性地彌補模型在泛化性、可靠性、效率和實用性上的不足。

作者: Cheng Gao, Shi Yuchen, Wang Shijie

*排名不分先后，按照首字母排序

Ref.

https://arxiv.org/pdf/2602.12116

https://arxiv.org/pdf/2508.21048

https://papercopilot.com/statistics/iclr-statistics/

數據來自 openreview 公開信息

加入ZF討論群，請先添加小助手微信

我們相信認知能夠跨越階層，

致力于為年輕人提供高質量的科技和財經內容。

稿件經采用可獲邀進入Z Finance內部社群，優(yōu)秀者將成為簽約作者，00后更有機會成為Z Finance的早期共創(chuàng)成員。

我們正在招募新一期的實習生

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.