国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

深度|阿里?ICLR 255?篇霸榜!基座是明牌,系統(tǒng)是暗牌,做實比做強更狠

0
分享至


Z Highlights

  • 從論文分布上看,基座大模型吃掉51.8%的份額,多模態(tài)感知再切走 20.8%。光是這兩個方向,就卷走了超過七成的火力。

  • 如果說基座大模型是明牌,那計算機系統(tǒng)就是阿里的暗牌。表面上看,系統(tǒng)方向只有 5 篇論文,數量少得可憐。但整個 ICLR 2026 在系統(tǒng)方向的占比僅 0.8%,阿里的偏好指數高達 2.44,重倉程度甚至超過基座大模型。

  • 誰能解決泛化問題,誰能壓縮系統(tǒng)成本,誰能打通模型落地的最后一公里,誰才是下一個時代的贏家。阿里系的研究重心,已經從做強轉向做實。

AI 頂會江湖,風向正在悄然生變。

當全球 5340 篇論文涌入 ICLR 2026,阿里系以 255 篇接收論文、10 篇 Oral 的硬核戰(zhàn)績,拿下 4.8%的全球份額。這不是簡單的數字堆砌,在這份成績單背后,藏著阿里 AI 戰(zhàn)略的深層邏輯:從單兵突進轉向生態(tài)作戰(zhàn),從論文工廠轉向產業(yè)閉環(huán)。


關于 ICLR:國際表征學習大會(ICLR)是深度學習領域頂級會議,與 NeurIPS、ICML 并稱機器學習三大頂會,近期被 CCF 評為 A 類會議。2026 年 ICLR 覆蓋大語言模型、生成模型、多模態(tài)學習、AI 安全、機器學習系統(tǒng)等多個前沿方向。


255篇背后:一場產學研的鐵三角實驗

翻開阿里系的論文版圖,一個反常識的數據炸場:96.1% 的論文依賴外部合作,純阿里獨立完成的僅占 2.7%但一個細節(jié)更值得玩味:這份龐大的合作名單里,海外高校幾乎缺席。

這不是能力短板,而是一場更為極致的本土化閉環(huán)實驗——阿里正在把自己變成一塊磁石,不玩閉門造車的原創(chuàng)神話,而是搭建產業(yè)平臺 + 國內高校網絡的新范式。純阿里獨立完成的論文,只有 7 篇,占比 2.7%。剩下的 97.3%呢?

  • 阿里-高校合作 168 篇(65.9%)

  • 阿里-高校-企業(yè)混合 77 篇(30.2%)

  • 純阿里-企業(yè)合作 3 篇(1.2%)


圖 7 阿里系論文合作版圖分布

本土 AI 全明星陣容包括:

  • 浙江大學 51 篇

  • 清華大學 43 篇

  • 香港科技大學 31 篇

  • 北京大學 29 篇

  • 中科院自動化所 20 篇

甚至連字節(jié)跳動(13 篇)、騰訊(9 篇)這些友商,都在阿里系的合作網絡里刷臉。在頂會賽場上,競合關系的邊界正在模糊——今天的對手,明天的合作者。

0% 的海外依賴,2.7% 的獨舞,96.1% 的群像,阿里在用數據證明:在這個時代,做平臺比做孤島更有殺傷力。這些頭部高校不僅是論文產出機器,更是阿里的人才蓄水池和技術風向標。

基座大模型吃掉半壁江山,多模態(tài)感知緊追不舍

如果說論文數量是面子,那研究方向就是里子。阿里系的火力高度集中在兩大高地:基座大模型(51.8%)和多模態(tài)感知(20.8%)。光是這兩個方向,就吞掉了超過七成的彈藥。

這與 ICLR 的整體趨勢同頻共振,但阿里的打法更重——當行業(yè)還在卷參數規(guī)模,他們已經開始死磕可用性重構。10 篇 Oral 論文透露了研究重心正從能力突破轉向場景閉環(huán):泛化、推理、效率、落地這四個關鍵詞,構成了阿里 AI 的新坐標系。

過去兩年,大模型賽道充斥著大力出奇跡的狂熱。但阿里系在 ICLR 2026 的選題,明顯冷靜了下來。

他們不再只關心模型能做什么,而是追問模型在真實世界怎么用得起來。系統(tǒng)效率優(yōu)化、復雜環(huán)境泛化、推理可靠性保障,這些聽起來不那么性感的方向,正在成為新的技術高地。這種轉向,與阿里的產業(yè)基因密不可分。作為年研發(fā)投入超 15%、坐擁數萬塊 GPU 集群和數十億級真實業(yè)務數據的云服務商,阿里比純研究機構更清楚:技術價值最終要在產業(yè)閉環(huán)里兌現。依托 7000 余名技術人才(含 2000+博士)和魔搭社區(qū)等開放平臺,阿里已經構建起全球領先的 AI 全棧能力。

但 255 篇論文也拋出了一個新命題:當外部合作成為主流產出模式,如何在工程能力、場景需求與學術原創(chuàng)之間找到更深層的平衡?這不僅是阿里的挑戰(zhàn),也是中國產業(yè) AI 的集體課題。畢竟,頂會論文只是入場券,定義下一代 AI 基礎設施的能力,才是真正的終局之戰(zhàn)。

計算機系統(tǒng)方向偷偷發(fā)力,全力押注工程可落地

255 篇論文背后,阿里系的彈藥到底投向了哪里?


圖 1 阿里系論文數量概覽

基座大模型:阿里的超配戰(zhàn)略

數據不會說謊。ICLR 2026 整體接收論文中,基座大模型方向占 33.2%,而阿里系在這一方向的占比高達 51.8%——偏好指數 1.56,超配幅度接近六成。這意味著當行業(yè)還在均衡布局時,阿里選擇了把雞蛋放在最重的籃子里。


圖 2 阿里系論文研究領域大類分布

更細顆粒度地看,阿里系在 foundation or frontier models(含 LLM)方向砸了 72 篇論文,占總量 28.2%;多模態(tài)應用 47 篇、數據集與評測基準 30 篇、生成模型 30 篇——從底層架構到上層應用,從訓練數據到評測標準,阿里正在構建一套完整的技術閉環(huán)。


圖 3 阿里系論文一級研究方向 Top 10

一個值得玩味的細節(jié)是Junyang Lin(林俊旸)一人署名 8 篇論文,其中 1 篇 Oral。這位阿里大模型骨干的選題清單,堪稱阿里技術路線的縮影——多模態(tài)推理、軟件工程智能體、推測式解碼、全模態(tài)感知...清一色的大模型+多模態(tài)主線。

系統(tǒng)方向是被忽視的隱形重倉


圖 4 阿里與整體 ICLR 方向分布對比


圖 5 阿里方向偏好指數

如果說基座大模型是明牌,那計算機系統(tǒng)方向就是阿里的暗牌。表面上看,系統(tǒng)方向只有 5 篇論文,數量少得可憐。但別忘了,整個 ICLR 2026 在系統(tǒng)方向的占比僅 0.8%——阿里的偏好指數高達 2.44,重倉程度甚至超過基座大模型。

這透露了一個關鍵信號:當所有人都在卷模型能力,阿里已經開始死磕底層基礎設施。畢竟,對于手握數萬塊 GPU 集群的云服務商來說,系統(tǒng)效率才是真正的護城河。

Oral 質量占比:與大盤持平,未見明顯超車


圖 6 阿里與整體 ICLR Oral 占比對比

最后看一個硬核指標:Oral 占比。阿里系 Oral 論文 10 篇,占比 3.9%;ICLR 整體 Oral 占比 4.2%。-0.3 個百分點的差距,說明阿里在論文質量上穩(wěn)住了基本盤,但并未形成顯著的精品優(yōu)勢。

換句話說,相比頂級突破性成果,阿里更擅長規(guī)模化產出,把三個特征串起來看,阿里在 ICLR 2026 的打法已經非常清晰:

1.方向聚焦:基座大模型絕對重倉,多模態(tài)緊隨其后,系統(tǒng)方向暗中發(fā)力

2.生態(tài)作戰(zhàn):96%的論文依賴外部合作,把自己變成產業(yè)研究平臺

3.工程導向:偏好指數顯示,阿里明顯回避純理論方向,全力押注工程可落地領域

這不是傳統(tǒng)意義上的學術機構打法,而是平臺型科技公司的典型策略——用產業(yè)資源換學術影響力,用合作網絡換規(guī)模效應,最終目標不是頂會獎杯,而是 AI 基礎設施的定義權。

注:

  • 偏好指數 = 阿里在某方向的論文占比 / 整體 ICLR 在該方向的論文占比。偏好指數大于 1 表示阿里在該方向相對超配,小于 1 表示相對低配。

  • 占比差值 = 阿里在某方向的論文占比 - 整體 ICLR 在該方向的論文占比,用于直觀看結構差異。

  • 本文新增的這些指標都屬于描述性統(tǒng)計,用于說明方向結構,不做顯著性檢驗。

10篇Oral看阿里系ICLR 2026的真正重心


我們聚焦在阿里系在 ICLR 上的 10 篇Oral文章,相關研究大致沿著泛化性、推理可靠性、計算效率以及對齊與交互能力四條主線展開,并逐步形成了從數據構建、模型設計、先驗注入、推理增強到評測范式重構的多層次研究圖景。

首先,在泛化能力方面,現有工作已不再滿足于封閉分布下的性能提升,而是更加關注模型在未見偽造類型、跨域場景以及復雜真實環(huán)境中的魯棒性。一類研究從數據與基準構建入手,試圖通過更貼近實際應用條件的訓練與評測設置縮小實驗環(huán)境與工業(yè)場景之間的差距。例如,HydraFake 強調多樣化偽造技術、真實世界 forgery 以及嚴格的 out-of-domain 協議,從數據層面推動深偽檢測研究由“同分布識別”轉向“面向開放場景的泛化檢測”;另一類工作從模型機制本身出發(fā)增強泛化能力。以 Camera-Aware MLLM 為代表的研究指出,僅依賴 RGB 輸入的空間智能建模容易將幾何屬性與相機成像條件混合編碼,導致模型過擬合于訓練相機分布,因此有必要將相機內參顯式納入視覺 token 的條件建模之中,并輔以相機感知的數據增強策略與幾何先驗蒸餾,以提升跨相機條件下的空間推理能力。

推理能力與可靠性方面,一條重要方向是通過結構化推理機制增強模型的中間決策質量。Veritas 通過在傳統(tǒng) chain-of-thought 之外引入 planning 與 self-reflection 等關鍵模式,使模型能夠以更接近人工鑒偽流程的方式逐步分析偽造線索;VC-STaR 從視覺對比的角度出發(fā),利用對比式 VQA 樣本幫助模型更準確地定位判別性視覺證據,并在此基礎上生成質量更高、幻覺更少的視覺推理路徑,進而實現視覺推理能力的自我提升。


VERITAS

效率與優(yōu)化方面,相關研究主要覆蓋訓練階段與推理階段兩個層面。訓練階段的工作更多關注如何在不犧牲最終性能的前提下降低傳統(tǒng)優(yōu)化范式中的冗余設計。WSM 即代表了一類重新審視學習率衰減機制的研究,其核心觀點在于通過 checkpoint merging 建立學習率調度與模型平均之間的形式聯系,從而以一種 decay-free 的方式近似或替代常見的 cosine decay、linear decay 等退火策略。該類方法的意義不僅在于優(yōu)化效率本身,也在于其為長期預訓練和后續(xù)監(jiān)督微調提供了更統(tǒng)一的訓練動力學解釋。

對齊、交互與決策能力方面,研究關注點則進一步擴展至模型如何在開放環(huán)境中適應用戶偏好、完成動態(tài)任務并實現可擴展的行為優(yōu)化。P-GenRM 代表了個性化對齊方向的重要進展,其通過將用戶偏好表征為結構化評價鏈,并在測試階段引入基于個體與原型的雙粒度縮放機制,使獎勵模型不僅能夠適配特定用戶的細粒度偏好,還能借助相似用戶群體的原型知識增強對新用戶的泛化能力。


P-GenRM

綜合來看,一方面,研究者通過更真實的數據分布、動態(tài)交互環(huán)境和更嚴格的評測協議不斷暴露現有模型在開放世界中的能力缺口;另一方面,又通過結構化推理、先驗知識注入、訓練與解碼機制優(yōu)化以及個性化對齊等方法,系統(tǒng)性地彌補模型在泛化性、可靠性、效率和實用性上的不足。

作者: Cheng Gao, Shi Yuchen, Wang Shijie

*排名不分先后,按照首字母排序

Ref.

https://arxiv.org/pdf/2602.12116

https://arxiv.org/pdf/2508.21048

https://papercopilot.com/statistics/iclr-statistics/

數據來自 openreview 公開信息

加入ZF討論群,請先添加小助手微信

我們相信認知能夠跨越階層,

致力于為年輕人提供高質量的科技和財經內容。

稿件經采用可獲邀進入Z Finance內部社群,優(yōu)秀者將成為簽約作者,00后更有機會成為Z Finance的早期共創(chuàng)成員。

我們正在招募新一期的實習生

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
張雪峰多張靈堂照曝出,遺像身穿西裝顯帥氣,11歲獨生女首次發(fā)聲

張雪峰多張靈堂照曝出,遺像身穿西裝顯帥氣,11歲獨生女首次發(fā)聲

博士觀察
2026-03-27 14:55:58
蜜雪的零售邊界,不止于一杯杯奶茶、咖啡、或啤酒

蜜雪的零售邊界,不止于一杯杯奶茶、咖啡、或啤酒

晚點LatePost
2026-03-26 18:50:35
張本智和回擊中國網友:我是自愿加入日本籍的,憑啥讓我滾出四川?哭訴:那是我老家

張本智和回擊中國網友:我是自愿加入日本籍的,憑啥讓我滾出四川?哭訴:那是我老家

乒乓網國球匯
2026-03-27 00:03:40
重磅!證監(jiān)會調整股市安排,理性應對本周變局

重磅!證監(jiān)會調整股市安排,理性應對本周變局

慧眼看世界哈哈
2026-03-27 13:28:50
張雪峰公司員工曝現狀:辦公室錦旗被打包,家長擔心卷錢跑路

張雪峰公司員工曝現狀:辦公室錦旗被打包,家長擔心卷錢跑路

一盅情懷
2026-03-27 16:19:26
全球唯一雙座隱身戰(zhàn)機!殲-20S跨界作戰(zhàn)有多震撼?專家解析

全球唯一雙座隱身戰(zhàn)機!殲-20S跨界作戰(zhàn)有多震撼?專家解析

齊魯壹點
2026-03-27 06:56:45
浙江宣傳批《逐玉》男主演“粉底液將軍”:肌膚細膩、形象輕佻

浙江宣傳批《逐玉》男主演“粉底液將軍”:肌膚細膩、形象輕佻

互聯網大觀
2026-03-27 10:39:27
豪華C級車的正確打開方式,被全新奧迪A6L玩明白了

豪華C級車的正確打開方式,被全新奧迪A6L玩明白了

汽車預言家
2026-03-27 17:39:30
廣州市委原書記郭永航被查,曾長期在深圳工作

廣州市委原書記郭永航被查,曾長期在深圳工作

觀察者網
2026-03-27 18:27:06
一覺醒來,愛吃活魚的人天塌了,央視曝光的內幕真可怕!

一覺醒來,愛吃活魚的人天塌了,央視曝光的內幕真可怕!

濤哥銳評
2026-03-26 17:57:04
剛從伊朗回來,說點不中聽的:伊朗的真實面目,可能讓你很意外

剛從伊朗回來,說點不中聽的:伊朗的真實面目,可能讓你很意外

復轉這些年
2026-03-27 11:24:59
越南成品油價格大幅下調

越南成品油價格大幅下調

緬甸中文網
2026-03-27 13:37:49
周口一油菜花田打卡地被推土機鏟平,當地:系拆遷征收用地,居民不能私自種植

周口一油菜花田打卡地被推土機鏟平,當地:系拆遷征收用地,居民不能私自種植

極目新聞
2026-03-27 14:54:50
打虎!郭永航被查

打虎!郭永航被查

新京報
2026-03-27 18:25:25
10余個氣瓶爆炸,20輛車燒損!調查報告公布

10余個氣瓶爆炸,20輛車燒損!調查報告公布

環(huán)球網資訊
2026-03-27 08:37:11
中國證監(jiān)會原發(fā)行審核委員會主任委員郭旭東涉嫌職務犯罪被移送檢察機關審查起訴

中國證監(jiān)會原發(fā)行審核委員會主任委員郭旭東涉嫌職務犯罪被移送檢察機關審查起訴

界面新聞
2026-03-27 15:34:18
人民幣用不了多久就會重新回到5.0時代,甚至是4.0。

人民幣用不了多久就會重新回到5.0時代,甚至是4.0。

玉辭心
2026-03-27 13:07:40
涉嫌嚴重違紀違法,張智舟被查

涉嫌嚴重違紀違法,張智舟被查

都市快報橙柿互動
2026-03-27 17:32:30
法國發(fā)布重磅提醒?美軍若強行插手臺海,法國軍事分析做出推演

法國發(fā)布重磅提醒?美軍若強行插手臺海,法國軍事分析做出推演

安安說
2026-03-27 12:18:51
關于伊朗的十大虛假敘事——你是如何被網軍欺騙的?

關于伊朗的十大虛假敘事——你是如何被網軍欺騙的?

楓嶺社
2026-03-27 10:49:09
2026-03-27 19:32:49
ZFinance
ZFinance
Z世代的一站式AI、科技和財經資訊
155文章數 13關注度
往期回顧 全部

科技要聞

楊植麟張鵬夏立雪羅福莉,聊龍蝦、聊漲價

頭條要聞

美方稱在美軍事基地裝爆炸物的男子逃往中國 中方回應

頭條要聞

美方稱在美軍事基地裝爆炸物的男子逃往中國 中方回應

體育要聞

邵佳一:足球就像一場馬拉松

娛樂要聞

張雪峰靈堂內景曝光,四周擺滿了鮮花

財經要聞

我在小吃培訓機構學習“科技與狠活”

汽車要聞

與眾08,金標大眾不能輸的一戰(zhàn)

態(tài)度原創(chuàng)

時尚
健康
游戲
旅游
手機

從50塊到5w,她們過去一年最愛的包是這些

干細胞抗衰4大誤區(qū),90%的人都中招

科樂美旗下電競學院新增學科 培育網絡直播人材

旅游要聞

春滿京城 | 日壇玉蘭,紅墻一隅的春日清雅

手機要聞

消息稱某廠新機測試2K+185Hz顯示屏,預計為榮耀

無障礙瀏覽 進入關懷版