国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

大模型競爭的下半場開啟了?

0
分享至



文 | 智能相對論

作者 | 陳泊丞

今年整個AI圈最熱鬧的事件莫過于全民“養(yǎng)龍蝦”——OpenClaw的走紅,讓大家終于看到了AGI落地的具象化可能。

然而,當業(yè)界為Agent“手腳”的日益靈活而歡呼時,一個更根本的問題卻被暫時掩蓋了——真正決定OpenClaw行動價值的“大腦”,也就是它背后的大模型底座,似乎正走在一條不可持續(xù)的道路上。

過去兩年,大模型行業(yè)奉行的是典型的“暴力美學”,即參數越多代表智能越高,思維鏈越長代表推理越深。萬億參數模型接連登場,長思維鏈成為技術先進性的標配。但在這股狂熱之下,一個尷尬的事實逐漸浮出水面——大量參數只是“吃算力”的擺設,超過70%的Token消耗發(fā)生在模型“已經答對、仍在反思”的無效階段。



推理Token消耗分布示意

因此,當OpenClaw這樣的執(zhí)行端已經準備好進入工廠、倉庫、辦公室,我們才發(fā)現(xiàn),驅動它的“大腦”要么昂貴到企業(yè)用不起,要么為了省錢而被迫“降智”。這或許是2026年AI產業(yè)化最核心的悖論——手腳已經就位,大腦卻還在“算力通脹”的泥潭中掙扎。

這一困局如何打破?就在前不久,YuanLab.ai團隊開源了Yuan 3.0 Ultra萬億參數模型,以一套截然不同的、更務實的技術路線,也在試圖解答當前行業(yè)的這一根本性問題:當模型規(guī)模的擴張已觸及收益遞減的臨界點,大模型的下一場競賽,究竟應該比什么?



Yuan3.0 Ultra在面向企業(yè)應用的表現(xiàn)

如果OpenClaw的大腦困于“昂貴”與“降智”的兩難,那么,整個行業(yè)就必須重新審視那個曾被奉為圭臬的增長邏輯。

算力通脹時代,市場渴望一場“價值回歸”

過去兩年,行業(yè)經歷了一場深刻的認知撕裂。

撕裂的一邊是技術供給側的狂歡。萬億參數模型接連登場,推理模型追逐越來越長的思維鏈,仿佛“想得越多”就等于“想得越對”。在國際AI頂會上,論文的核心賣點往往是“我們的模型又大了多少億”“我們的思維鏈又長了多少步”。

撕裂的另一邊是企業(yè)需求側的清醒。當技術營銷的喧囂褪去,企業(yè)客戶在采購時開始用最樸素也最殘酷的ROI邏輯發(fā)問:每一次API調用支付的Token費用,究竟有多少轉化為真正的業(yè)務價值?

事實上,研究顯示,在復雜推理任務中,模型超過70%的Token消耗發(fā)生在“已經答對”后的自我驗證階段。這意味著,企業(yè)每為模型智能支付10元錢,有7元是在為它的“過度思考”買單。

與此同時,更隱蔽的浪費還藏在模型結構本身。MoE(混合專家)架構在預訓練中會自發(fā)形成專家分化,負載最高的專家與最低的專家差距可達500倍。這意味著,大量長期閑置的“僵尸專家”成了模型參數虛高的主要推手——它們幾乎不干活,卻依然在每一次推理中被加載、被維護、被計費。



MoE模型訓練過程中存在專家訓練不均衡問題

由此,“算力通脹”問題就不得不重視起來。參數規(guī)模在膨脹,推理鏈條在拉長,但單位算力產出的真實智能卻在稀釋。當OpenClaw這樣的執(zhí)行端開始規(guī)?;渴?,這種“通脹”帶來的成本壓力被成倍放大——每一次物理動作背后,都是大量的Token在燃燒。

今天,YuanLab.ai團隊已經敏銳地捕捉到這一趨勢的不可持續(xù)性。在此前發(fā)布的Yuan 3.0 Flash中,他們就首次驗證了“反過度思考”的技術可行性,通過RIRM(Reflection Inhibition Reward Mechanism,反思抑制獎勵)機制讓模型學會在恰當的時候停下來。直到Yuan 3.0 Ultra的開源,這一理念進一步從“效率優(yōu)化”升維為“范式定義”——當行業(yè)還在比拼誰能堆出更大模型時,真正的競爭已悄然轉向誰能用更少的算力提煉出更有效的智能。



是時候對“萬億參數”祛魅了

客觀而言,Yuan 3.0 Ultra的突破性,不在于它邁入了萬億俱樂部,而在于它對“萬億參數”這一概念本身完成了一次徹底的“祛魅”。

其一,對“參數規(guī)?!钡撵铟龋篖AEP算法讓模型學會“精簡”。

行業(yè)長期存在一個思維定式:參數越多,模型越強。這一認知如此根深蒂固,以至于每當有廠商發(fā)布更大參數的模型,資本市場都會給出積極反饋。

Yuan 3.0 Ultra用自適應專家裁剪算法(Layer-Adaptive Expert Pruning,LAEP)戳破了這一神話。研究團隊發(fā)現(xiàn),MoE模型在預訓練中會自然形成專家功能分化,但分化不等于優(yōu)化——大量低貢獻專家長期閑置,卻依然消耗著寶貴的算力資源。LAEP算法的精妙之處,就在于它像一位清醒的“組織優(yōu)化顧問”,在訓練過程中動態(tài)識別冗余專家并予以裁剪,將初始1515B參數優(yōu)化至1010B,參數規(guī)模減小33.3%,預訓練算力效率反而提升49%。



Yuan3.0 Ultra采用LAEP顯著提升預訓練效率

對于企業(yè)而言,這意味著可以用更低的硬件門檻、更少的GPU租賃開支,獲得與1515B參數模型同等的旗艦級智能支撐。那么,當別人還在為參數規(guī)模競賽買單時,Yuan 3.0 Ultra的用戶就已經在享受“減重”后的成本紅利了。

二、對“思維鏈長度”的祛魅:RIRM機制讓模型懂得“停”的智慧。

當全行業(yè)沉迷于“讓模型想得更久”,一個根本性問題卻被忽略了:什么時候該停下來?——這不僅是效率問題,更是安全問題。

試想一下,一個由OpenClaw驅動的工業(yè)機器人,如果它的“大腦”在識別到安全隱患后還要反復思考、再三確認,哪怕只是幾秒鐘的延遲,都可能釀成事故。在真實世界中,“想太多”和“想錯”一樣危險。

對此,Yuan 3.0 Ultra引入的反思抑制獎勵機制(RIRM),恰恰是對“長思維鏈崇拜”的一次精準糾偏。它不是簡單粗暴地截斷輸出,而是通過強化學習訓練,讓模型學會區(qū)分兩種狀態(tài):什么時候需要繼續(xù)推理,什么時候已經可以停止。研究團隊將最大可接受反思步數設為3,理想狀態(tài)下鼓勵直接響應,復雜問題允許適度反思,但一旦超過閾值,獎勵機制就會啟動抑制。



RIRM工作流程示意

由此,訓練準確率提升16.33%,同時平均響應長度縮短14.38%。在MATH-500基準上,反思階段的Token消耗顯著降低。這種“該停就停”的能力,在企業(yè)高頻調用場景中產生的價值,遠大于在單一benchmark上刷出0.1%的提升。當每一次API調用都在為企業(yè)省錢,而不是為模型的“內心戲”買單,規(guī)?;瘧貌耪嬲蔀榭赡?。



RIRM訓練前后Token消耗對比

三、對“多模態(tài)”的祛魅:LFA機制讓模型專注“有效關聯(lián)”。

多模態(tài)是AI行業(yè)長期以來的另一大熱詞。但多模態(tài)不是簡單的圖文拼接,更不是把圖片和文字扔進同一個模型就萬事大吉。企業(yè)在真實業(yè)務場景中的多模態(tài),往往是財報里圖文混排的復雜表格,是合同中穿插的掃描件和手寫批注,是技術文檔里跨頁面關聯(lián)的圖表和數據。因此,處理這些信息,需要的不是“什么都能看”的泛泛能力,而是“能看懂重點”的精準穿透力。

Yuan 3.0 Ultra引入的局部過濾注意力機制(Localized Filtering-based Attention,LFA),正是為此而生。它通過強化對核心語義的聚焦,精準過濾無效注意力干擾,使模型在處理復雜文檔時,不再被噪聲信息誤導。這種對“有效信息”的聚焦能力,讓OpenClaw這樣的Agent在執(zhí)行具體任務時,能夠真正理解“該看什么”“該忽略什么”,從而實現(xiàn)“眼睛”與“大腦”的協(xié)同進化。

總的來說,這三重“祛魅”共同指向的,正是Yuan 3.0 Ultra的核心主張:有效智能。站在企業(yè)的視角,“有效智能”不是一句口號,而是可以量化的ROI,接下來可以用更低的成本投入來獲取更好的AI智能服務。這意味著,企業(yè)不再需要為“聽起來很牛”的參數買單,而是為“用得上”的智能付費。

大模型競爭的下半場已經開啟了

隨著市場對“有效智能”的聚焦,就意味著大模型競爭的下半場已經拉開序幕。那么,當頭部廠商紛紛收緊模型權限、構建封閉生態(tài)時,YuanLab.ai團隊卻選擇以開放姿態(tài)貢獻出萬億級核心模型,其背后的本質則是在參與定義大模型競爭的下半場。

回顧上半場,核心是“參數競賽”——誰先達到千億、萬億,誰就是技術領先者。誰在榜單上刷出更高分數,誰就能獲得資本和市場的追捧。

這一階段的邏輯簡單直接,但也迅速觸及天花板——參數堆砌的邊際收益遞減,而邊際成本(算力、能耗、部署難度)卻在指數級上升。2025年底開始,越來越多的從業(yè)者意識到,單純比拼參數規(guī)模,已經難以為繼。

展望下半場,核心則是“效率競賽”——誰能用更少的算力實現(xiàn)同等的智能,誰能用更可控的成本支撐復雜的Agent任務,誰才是真正的產業(yè)賦能者。這場競賽不再有簡單的量化指標,而是考驗對模型架構的深刻理解、對算法效率的系統(tǒng)優(yōu)化、對企業(yè)場景的精準適配。



Yuan 3.0整體架構和基于MoE的語言主干

在下半場,智能的純度,遠比參數的個數更重要;思考的效率,遠比思考的長度更值錢。由此,Yuan 3.0 Ultra通過LAEP、RIRM、LFA等創(chuàng)新,系統(tǒng)性地解答了“智能的效率”這一核心命題,為行業(yè)樹立了有效智能的新標桿。

更深層看,Yuan 3.0 Ultra開源的戰(zhàn)略價值還在于,為中小企業(yè)、研究機構和行業(yè)開發(fā)者提供了一個旗艦級、可定制、不鎖死的模型底座選擇?,F(xiàn)如今,開發(fā)者們已經可以在github項目開源地址https://github.com/Yuan-lab-LLM/Yuan3.0獲取相應的能力。

當OpenClaw這樣的Agent框架日益成熟,企業(yè)最需要的恰恰是一個能夠深度適配自身業(yè)務且成本可控的“大腦”。Yuan 3.0 Ultra的開源,本質上是在為下一波Agent應用大爆發(fā)鋪設基礎設施——讓所有想要“養(yǎng)龍蝦”的企業(yè)甚至是個人,都能負擔得起一個聰明的大腦。

結語

2026年,當“養(yǎng)龍蝦”成為全民話題,當Agent開始真正進入千行百業(yè),我們比任何時候都更需要回答那個根本問題:什么樣的智能,才是值得企業(yè)付費的智能?

答案是,有效的智能。當行業(yè)終于意識到,真正的智能,不是無限燃燒算力的能力,而是善用算力的智慧——這時候,大模型的下半場就算真正開始了。新的增長邏輯,正在被重新定義,并主導下半場的競爭。

*本文圖片均來源于網絡

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
跌落神壇的北極神話:少走一萬公里的代價,是隨時沉入冰海

跌落神壇的北極神話:少走一萬公里的代價,是隨時沉入冰海

環(huán)球格局觀
2026-04-02 21:53:51
陳光標第一次碰到鋼板,在張雪的陽謀前招架不住

陳光標第一次碰到鋼板,在張雪的陽謀前招架不住

一莎觀察
2026-04-03 15:36:41
頭部達播集體翻車“優(yōu)思益”:保健品賣100含淚抽傭50

頭部達播集體翻車“優(yōu)思益”:保健品賣100含淚抽傭50

界面新聞
2026-04-03 17:42:07
人民日報13字評全紅嬋事件,體育總局嚴肅處理

人民日報13字評全紅嬋事件,體育總局嚴肅處理

李橑在北漂
2026-04-03 18:53:26
一覺醒來伊朗最大橋梁被炸!特朗普再發(fā)通牒,伊朗:打到美以投降

一覺醒來伊朗最大橋梁被炸!特朗普再發(fā)通牒,伊朗:打到美以投降

近史博覽
2026-04-03 13:53:14
辛棄疾鎖死詞牌名的七大巔峰之作

辛棄疾鎖死詞牌名的七大巔峰之作

長風文史
2026-04-02 12:45:46
剛剛,中東形勢逆轉,戰(zhàn)爭進入全新格局!以色列重大調整!

剛剛,中東形勢逆轉,戰(zhàn)爭進入全新格局!以色列重大調整!

一個壞土豆
2026-04-03 19:41:11
銀行不會直說的潛規(guī)則:存款滿50萬,你就有資格提條件

銀行不會直說的潛規(guī)則:存款滿50萬,你就有資格提條件

王二哥老搞笑
2026-04-03 01:16:36
董宇輝道歉沖上熱搜,被全網審判

董宇輝道歉沖上熱搜,被全網審判

電商派Pro
2026-04-03 09:51:12
原廣東省省長馬興瑞被查

原廣東省省長馬興瑞被查

觀點機構
2026-04-03 19:13:07
45歲鄭智瞪眼+臉色鐵青!開局4輪3負丟11球 遭質疑:竟和蓉城對攻

45歲鄭智瞪眼+臉色鐵青!開局4輪3負丟11球 遭質疑:竟和蓉城對攻

我愛英超
2026-04-03 21:58:19
葉檀迎來今年第一次復查,直言自己害怕死,即使擁有腫瘤頂級團隊

葉檀迎來今年第一次復查,直言自己害怕死,即使擁有腫瘤頂級團隊

白面書誏
2026-04-03 16:39:03
伊朗確認:雷扎伊身亡

伊朗確認:雷扎伊身亡

第一財經資訊
2026-04-03 19:42:25
54歲王學兵現(xiàn)狀:胖到認不出,三婚兩離兒子是美籍,酷愛跑馬拉松

54歲王學兵現(xiàn)狀:胖到認不出,三婚兩離兒子是美籍,酷愛跑馬拉松

冷紫葉
2026-04-03 16:22:15
東亞正掉入“人口消亡賽”,問題不只是養(yǎng)不起孩子,社會契約已出現(xiàn)裂縫

東亞正掉入“人口消亡賽”,問題不只是養(yǎng)不起孩子,社會契約已出現(xiàn)裂縫

風向觀察
2026-04-03 08:45:52
美官員證實一架美軍戰(zhàn)斗機在伊朗境內被擊落 

美官員證實一架美軍戰(zhàn)斗機在伊朗境內被擊落 

新華社
2026-04-03 22:09:54
中超第一人!費利佩生日夜戴帽,三年第一次,兩創(chuàng)中超神紀錄

中超第一人!費利佩生日夜戴帽,三年第一次,兩創(chuàng)中超神紀錄

奧拜爾
2026-04-03 21:45:42
廣東女車主眼睜睜看著搖中的“3333”號牌逾期作廢 原因是買的吉利星愿公告過期無法上牌

廣東女車主眼睜睜看著搖中的“3333”號牌逾期作廢 原因是買的吉利星愿公告過期無法上牌

信網
2026-04-03 14:01:04
伊朗議長稱一周內已動員700萬人為國而戰(zhàn),哈爾克島加強防御應對美軍地面戰(zhàn)

伊朗議長稱一周內已動員700萬人為國而戰(zhàn),哈爾克島加強防御應對美軍地面戰(zhàn)

紅星新聞
2026-04-03 16:36:19
“看站姿就不像當過兵的!”家長炫耀特種兵兒子,敗露后慘遭打臉

“看站姿就不像當過兵的!”家長炫耀特種兵兒子,敗露后慘遭打臉

妍妍教育日記
2026-04-02 12:29:05
2026-04-04 00:16:49
智能相對論 incentive-icons
智能相對論
智能和車,邊評邊測;未來和家,且品且鑒
2489文章數 2411關注度
往期回顧 全部

科技要聞

5萬輛庫存車,給了特斯拉一記重拳

頭條要聞

伊朗:美飛行員跳傘在伊境內落地 美方曾試圖營救未果

頭條要聞

伊朗:美飛行員跳傘在伊境內落地 美方曾試圖營救未果

體育要聞

被NBA選中20年后,他重新回到籃球場

娛樂要聞

夏克立官宣再婚當爸?否認婚內出軌

財經要聞

專家稱長期攝入“飄香劑”存在健康隱患

汽車要聞

你介意和遠房親戚長得很像嗎?

態(tài)度原創(chuàng)

房產
藝術
時尚
旅游
本地

房產要聞

小陽春全面啟動!現(xiàn)房,才是這波行情里最穩(wěn)的上車票

藝術要聞

吳昌碩『扇畫』老辣古拙

春天外套完全沒必要買太多,長風衣要準備好,簡單百搭又高級

旅游要聞

百年古樹梨花開,繁花新葉詩情畫意

本地新聞

跟著歌聲游安徽,聽古村回響

無障礙瀏覽 進入關懷版