網易首頁 > 網易號 > 正文申請入駐

大模型競爭的下半場開啟了？

2026-03-19 12:23:33　來源: 智能相對論

湖南舉報

分享至

文 | 智能相對論

作者 | 陳泊丞

今年整個AI圈最熱鬧的事件莫過于全民“養(yǎng)龍蝦”——OpenClaw的走紅，讓大家終于看到了AGI落地的具象化可能。

然而，當業(yè)界為Agent“手腳”的日益靈活而歡呼時，一個更根本的問題卻被暫時掩蓋了——真正決定OpenClaw行動價值的“大腦”，也就是它背后的大模型底座，似乎正走在一條不可持續(xù)的道路上。

過去兩年，大模型行業(yè)奉行的是典型的“暴力美學”，即參數越多代表智能越高，思維鏈越長代表推理越深。萬億參數模型接連登場，長思維鏈成為技術先進性的標配。但在這股狂熱之下，一個尷尬的事實逐漸浮出水面——大量參數只是“吃算力”的擺設，超過70%的Token消耗發(fā)生在模型“已經答對、仍在反思”的無效階段。

推理Token消耗分布示意

因此，當OpenClaw這樣的執(zhí)行端已經準備好進入工廠、倉庫、辦公室，我們才發(fā)現(xiàn)，驅動它的“大腦”要么昂貴到企業(yè)用不起，要么為了省錢而被迫“降智”。這或許是2026年AI產業(yè)化最核心的悖論——手腳已經就位，大腦卻還在“算力通脹”的泥潭中掙扎。

這一困局如何打破？就在前不久，YuanLab.ai團隊開源了Yuan 3.0 Ultra萬億參數模型，以一套截然不同的、更務實的技術路線，也在試圖解答當前行業(yè)的這一根本性問題：當模型規(guī)模的擴張已觸及收益遞減的臨界點，大模型的下一場競賽，究竟應該比什么？

Yuan3.0 Ultra在面向企業(yè)應用的表現(xiàn)

如果OpenClaw的大腦困于“昂貴”與“降智”的兩難，那么，整個行業(yè)就必須重新審視那個曾被奉為圭臬的增長邏輯。

算力通脹時代，市場渴望一場“價值回歸”

過去兩年，行業(yè)經歷了一場深刻的認知撕裂。

撕裂的一邊是技術供給側的狂歡。萬億參數模型接連登場，推理模型追逐越來越長的思維鏈，仿佛“想得越多”就等于“想得越對”。在國際AI頂會上，論文的核心賣點往往是“我們的模型又大了多少億”“我們的思維鏈又長了多少步”。

撕裂的另一邊是企業(yè)需求側的清醒。當技術營銷的喧囂褪去，企業(yè)客戶在采購時開始用最樸素也最殘酷的ROI邏輯發(fā)問：每一次API調用支付的Token費用，究竟有多少轉化為真正的業(yè)務價值？

事實上，研究顯示，在復雜推理任務中，模型超過70%的Token消耗發(fā)生在“已經答對”后的自我驗證階段。這意味著，企業(yè)每為模型智能支付10元錢，有7元是在為它的“過度思考”買單。

與此同時，更隱蔽的浪費還藏在模型結構本身。MoE（混合專家）架構在預訓練中會自發(fā)形成專家分化，負載最高的專家與最低的專家差距可達500倍。這意味著，大量長期閑置的“僵尸專家”成了模型參數虛高的主要推手——它們幾乎不干活，卻依然在每一次推理中被加載、被維護、被計費。

MoE模型訓練過程中存在專家訓練不均衡問題

由此，“算力通脹”問題就不得不重視起來。參數規(guī)模在膨脹，推理鏈條在拉長，但單位算力產出的真實智能卻在稀釋。當OpenClaw這樣的執(zhí)行端開始規(guī)?；渴?，這種“通脹”帶來的成本壓力被成倍放大——每一次物理動作背后，都是大量的Token在燃燒。

今天，YuanLab.ai團隊已經敏銳地捕捉到這一趨勢的不可持續(xù)性。在此前發(fā)布的Yuan 3.0 Flash中，他們就首次驗證了“反過度思考”的技術可行性，通過RIRM（Reflection Inhibition Reward Mechanism，反思抑制獎勵）機制讓模型學會在恰當的時候停下來。直到Yuan 3.0 Ultra的開源，這一理念進一步從“效率優(yōu)化”升維為“范式定義”——當行業(yè)還在比拼誰能堆出更大模型時，真正的競爭已悄然轉向誰能用更少的算力提煉出更有效的智能。

是時候對“萬億參數”祛魅了

客觀而言，Yuan 3.0 Ultra的突破性，不在于它邁入了萬億俱樂部，而在于它對“萬億參數”這一概念本身完成了一次徹底的“祛魅”。

其一，對“參數規(guī)?！钡撵铟龋篖AEP算法讓模型學會“精簡”。

行業(yè)長期存在一個思維定式：參數越多，模型越強。這一認知如此根深蒂固，以至于每當有廠商發(fā)布更大參數的模型，資本市場都會給出積極反饋。

Yuan 3.0 Ultra用自適應專家裁剪算法（Layer-Adaptive Expert Pruning，LAEP）戳破了這一神話。研究團隊發(fā)現(xiàn)，MoE模型在預訓練中會自然形成專家功能分化，但分化不等于優(yōu)化——大量低貢獻專家長期閑置，卻依然消耗著寶貴的算力資源。LAEP算法的精妙之處，就在于它像一位清醒的“組織優(yōu)化顧問”，在訓練過程中動態(tài)識別冗余專家并予以裁剪，將初始1515B參數優(yōu)化至1010B，參數規(guī)模減小33.3%，預訓練算力效率反而提升49%。

Yuan3.0 Ultra采用LAEP顯著提升預訓練效率

對于企業(yè)而言，這意味著可以用更低的硬件門檻、更少的GPU租賃開支，獲得與1515B參數模型同等的旗艦級智能支撐。那么，當別人還在為參數規(guī)模競賽買單時，Yuan 3.0 Ultra的用戶就已經在享受“減重”后的成本紅利了。

二、對“思維鏈長度”的祛魅：RIRM機制讓模型懂得“停”的智慧。

當全行業(yè)沉迷于“讓模型想得更久”，一個根本性問題卻被忽略了：什么時候該停下來？——這不僅是效率問題，更是安全問題。

試想一下，一個由OpenClaw驅動的工業(yè)機器人，如果它的“大腦”在識別到安全隱患后還要反復思考、再三確認，哪怕只是幾秒鐘的延遲，都可能釀成事故。在真實世界中，“想太多”和“想錯”一樣危險。

對此，Yuan 3.0 Ultra引入的反思抑制獎勵機制（RIRM），恰恰是對“長思維鏈崇拜”的一次精準糾偏。它不是簡單粗暴地截斷輸出，而是通過強化學習訓練，讓模型學會區(qū)分兩種狀態(tài)：什么時候需要繼續(xù)推理，什么時候已經可以停止。研究團隊將最大可接受反思步數設為3，理想狀態(tài)下鼓勵直接響應，復雜問題允許適度反思，但一旦超過閾值，獎勵機制就會啟動抑制。

RIRM工作流程示意

由此，訓練準確率提升16.33%，同時平均響應長度縮短14.38%。在MATH-500基準上，反思階段的Token消耗顯著降低。這種“該停就停”的能力，在企業(yè)高頻調用場景中產生的價值，遠大于在單一benchmark上刷出0.1%的提升。當每一次API調用都在為企業(yè)省錢，而不是為模型的“內心戲”買單，規(guī)?；瘧貌耪嬲蔀榭赡?。

RIRM訓練前后Token消耗對比

三、對“多模態(tài)”的祛魅：LFA機制讓模型專注“有效關聯(lián)”。

多模態(tài)是AI行業(yè)長期以來的另一大熱詞。但多模態(tài)不是簡單的圖文拼接，更不是把圖片和文字扔進同一個模型就萬事大吉。企業(yè)在真實業(yè)務場景中的多模態(tài)，往往是財報里圖文混排的復雜表格，是合同中穿插的掃描件和手寫批注，是技術文檔里跨頁面關聯(lián)的圖表和數據。因此，處理這些信息，需要的不是“什么都能看”的泛泛能力，而是“能看懂重點”的精準穿透力。

Yuan 3.0 Ultra引入的局部過濾注意力機制（Localized Filtering-based Attention，LFA），正是為此而生。它通過強化對核心語義的聚焦，精準過濾無效注意力干擾，使模型在處理復雜文檔時，不再被噪聲信息誤導。這種對“有效信息”的聚焦能力，讓OpenClaw這樣的Agent在執(zhí)行具體任務時，能夠真正理解“該看什么”“該忽略什么”，從而實現(xiàn)“眼睛”與“大腦”的協(xié)同進化。

總的來說，這三重“祛魅”共同指向的，正是Yuan 3.0 Ultra的核心主張：有效智能。站在企業(yè)的視角，“有效智能”不是一句口號，而是可以量化的ROI，接下來可以用更低的成本投入來獲取更好的AI智能服務。這意味著，企業(yè)不再需要為“聽起來很牛”的參數買單，而是為“用得上”的智能付費。

大模型競爭的下半場已經開啟了

隨著市場對“有效智能”的聚焦，就意味著大模型競爭的下半場已經拉開序幕。那么，當頭部廠商紛紛收緊模型權限、構建封閉生態(tài)時，YuanLab.ai團隊卻選擇以開放姿態(tài)貢獻出萬億級核心模型，其背后的本質則是在參與定義大模型競爭的下半場。

回顧上半場，核心是“參數競賽”——誰先達到千億、萬億，誰就是技術領先者。誰在榜單上刷出更高分數，誰就能獲得資本和市場的追捧。

這一階段的邏輯簡單直接，但也迅速觸及天花板——參數堆砌的邊際收益遞減，而邊際成本（算力、能耗、部署難度）卻在指數級上升。2025年底開始，越來越多的從業(yè)者意識到，單純比拼參數規(guī)模，已經難以為繼。

展望下半場，核心則是“效率競賽”——誰能用更少的算力實現(xiàn)同等的智能，誰能用更可控的成本支撐復雜的Agent任務，誰才是真正的產業(yè)賦能者。這場競賽不再有簡單的量化指標，而是考驗對模型架構的深刻理解、對算法效率的系統(tǒng)優(yōu)化、對企業(yè)場景的精準適配。

Yuan 3.0整體架構和基于MoE的語言主干

在下半場，智能的純度，遠比參數的個數更重要；思考的效率，遠比思考的長度更值錢。由此，Yuan 3.0 Ultra通過LAEP、RIRM、LFA等創(chuàng)新，系統(tǒng)性地解答了“智能的效率”這一核心命題，為行業(yè)樹立了有效智能的新標桿。

更深層看，Yuan 3.0 Ultra開源的戰(zhàn)略價值還在于，為中小企業(yè)、研究機構和行業(yè)開發(fā)者提供了一個旗艦級、可定制、不鎖死的模型底座選擇?，F(xiàn)如今，開發(fā)者們已經可以在github項目開源地址https://github.com/Yuan-lab-LLM/Yuan3.0獲取相應的能力。

當OpenClaw這樣的Agent框架日益成熟，企業(yè)最需要的恰恰是一個能夠深度適配自身業(yè)務且成本可控的“大腦”。Yuan 3.0 Ultra的開源，本質上是在為下一波Agent應用大爆發(fā)鋪設基礎設施——讓所有想要“養(yǎng)龍蝦”的企業(yè)甚至是個人，都能負擔得起一個聰明的大腦。

結語

2026年，當“養(yǎng)龍蝦”成為全民話題，當Agent開始真正進入千行百業(yè)，我們比任何時候都更需要回答那個根本問題：什么樣的智能，才是值得企業(yè)付費的智能？

答案是，有效的智能。當行業(yè)終于意識到，真正的智能，不是無限燃燒算力的能力，而是善用算力的智慧——這時候，大模型的下半場就算真正開始了。新的增長邏輯，正在被重新定義，并主導下半場的競爭。

*本文圖片均來源于網絡

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.