国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

1年智力成本暴跌128倍,2026萬物皆可Agent,人類還能做什么?

0
分享至


新智元報(bào)道

編輯:元宇

【新智元導(dǎo)讀】當(dāng)AI智力成本一年暴跌128倍、代碼開始「自主打工」……2026,你準(zhǔn)備好把自己和公司交給Agent了嗎?

幾個(gè)月前,Artificial Analysis還在提醒人們注意,關(guān)于AI進(jìn)展放緩的謠言被嚴(yán)重夸大了!

但到了2026年初,相信幾乎沒有人再相信「AI進(jìn)展放緩」這樣觀點(diǎn),因?yàn)樗恢倍荚诩铀侔l(fā)展。

2025年年初,那時(shí)的世界上甚至還不存在真正意義上的「代碼Agent」。

但僅僅到了年底,軟件工程這個(gè)古老的職業(yè)就被「氛圍編程」(Vibe Coding)永遠(yuǎn)地改變了。

程序員們不再把代碼機(jī)械地復(fù)制粘貼到ChatGPT或者CursorChat里,而是開始熟練地向Agent下達(dá)指令,看著它們連續(xù)幾分鐘甚至更長時(shí)間地自主埋頭苦干。

這就是Artificial Analysis剛剛發(fā)布的《2025全球AI年終報(bào)告》為我們揭示的瘋狂現(xiàn)實(shí)的一個(gè)側(cè)面。


在過去的一年里,全球AI軍備競賽不僅沒有絲毫降溫,反而徹底白熱化。

當(dāng)然,這樣殘酷的競爭,對于AI使用者們也帶來了一個(gè)令人極其振奮的利好:

各個(gè)智力層級的AI使用成本正在以不可思議的速度跳水。

AI實(shí)驗(yàn)室們死磕強(qiáng)化學(xué)習(xí),在大規(guī)模稀疏混合專家(MoE)架構(gòu)上瘋狂內(nèi)卷,再加上英偉達(dá)Blackwell硬件的王者降臨,共同推高了這場技術(shù)海嘯的浪潮。


Artificial Analysis的這份報(bào)告認(rèn)為,2025年,5大核心趨勢徹底重塑了整個(gè)AI行業(yè)的骨架:

競爭極度擁擠:賽道變得空前激烈,新玩家與國際巨頭貼身肉搏。

推理成為絕對標(biāo)配:思考型模型一統(tǒng)天下。

Agent迎來全面爆發(fā):從單一指令走向長周期的自主任務(wù)。

多模態(tài)跨越奇點(diǎn):視頻生成與圖像編輯殺入主流認(rèn)知。

原生語音覺醒:端到端語音大模型賦予了語音Agent真正的靈魂。

「思考」成為絕對標(biāo)配

同級推理成本暴跌128倍!

僅僅在2025年初,OpenAI的o1還在孤獨(dú)領(lǐng)跑,是市面上唯一的推理型選手。

但到了年底,畫風(fēng)突變,幾乎所有的頂級AI實(shí)驗(yàn)室全部拿出了自己的「思考型」推理模型。

這個(gè)范式轉(zhuǎn)移,直接霸占了人類所能見到的最高智力榜單。

OpenAI依然以GPT-5.2(xhigh)在年初和歲末都保住了「最聰明大腦」的桂冠。

但這家昔日霸主的領(lǐng)先優(yōu)勢正被極速壓縮。

Anthropic帶著Claude4.5Opus(Reasoning)緊追不舍,谷歌拿出了Gemini3Pro,xAI也毫不示弱。

AI軍備競賽,對普通用戶帶來的好消息就是:聰明不再等同于昂貴。

由于模型體積的不斷縮小、軟硬件效率的極致提升,我們在2025年初還要頂禮膜拜的o1級別智力,其每Token的使用成本,在短短一年內(nèi)發(fā)生了自由落體般的墜落,整整降了128倍


現(xiàn)在,我們可以在同樣的預(yù)算下召喚出遠(yuǎn)超以往的超級大腦,或者用極低的成本普及過去的頂級智力。


從「復(fù)制粘貼」到「自主打工」

2025,Agent終于落地了

2025年,Agent完成了從單一測試玩具到企業(yè)級核心生產(chǎn)力的躍升。

也是在這一年,我們對AI的期待,終于從「你給我答案,我來干活」變成了「你直接把活干完」。

這一切的引爆點(diǎn),是代碼Agent的大放異彩,長周期編程任務(wù)成了這場生產(chǎn)力革命最大的受益者

大廠和初創(chuàng)團(tuán)隊(duì)都在瘋狂發(fā)布代碼Agent,如今的模型不僅出廠自帶極其熟練的工具調(diào)用能力,更被強(qiáng)化學(xué)習(xí)深深地注入了自主執(zhí)行長周期任務(wù)的本能。

Artificial Analysis在報(bào)告中提到一個(gè)變化:

在Agent的漫長工作流里,并不是模型吐出的Token越多,智力就越高。


真正的頂級高手,贏在能巧妙且高效地使用各種外部工具。

在這張殘酷的帕累托前沿圖表上,谷歌和Anthropic的旗艦?zāi)P统蔀榱巳珗鲂逝c智力平衡的絕對王者。

由于2025年是代碼Agent大獲全勝的一年,Artificial Analysis據(jù)此斷言:2026年,將徹底成為「萬物皆可Agent(Agents for everything)」的元年


原生多模態(tài)大爆發(fā)

視頻模型進(jìn)入「帶聲時(shí)代」

2025年,大模型迎來了原生多模態(tài)的大爆發(fā)。

視頻模型,在這一年徹底撕掉了「實(shí)驗(yàn)品」的標(biāo)簽,真正走向了主流可用。

年初還在被頂禮膜拜的Sora,到了年底已經(jīng)被RunwayGen-4.5超越了近200個(gè)ELO積分。

更重要的一個(gè)變化是,視頻模型不再是「啞巴」了。

2025年5月發(fā)布的Veo3,是第一個(gè)在極高畫質(zhì)下原生支持音頻生成的視頻大模型。

緊接著,全行業(yè)集體爆發(fā),OpenAI的Sora2、Lightricks的LTX-2等,讓「自帶BGM和環(huán)境音的視頻生成」成為了主流標(biāo)配。

這份報(bào)告還給出了一個(gè)重磅結(jié)論:在圖像與視頻生成領(lǐng)域,中國和美國已經(jīng)完全處于同等水平!


端到端S2S推理大爆發(fā)

語音與音樂AI的全面進(jìn)化

2025年第四季度,語音與音樂AI圈經(jīng)歷了一場真正的底層革命。

以前的語音助手為什么總顯得有些遲鈍和機(jī)械?因?yàn)樗鼈冊谀X子里要走一條極其繁瑣的「翻譯」流水線:

先把聽到的語音轉(zhuǎn)成文字(STT),然后把文字交給大語言模型去思考(LLM),最后再把思考出的文字轉(zhuǎn)回語音(TTS)讀出來。

這種級聯(lián)拼接模式不僅延遲高,還會(huì)把人類語氣中的情緒、嘆息、重音過濾掉。

但在2025年,原生音頻推理(Nativeaudioreasoning)技術(shù)讓模型學(xué)會(huì)了直接用聲波的形狀去思考,它們摒棄了文字這個(gè)「中間商」,開始端到端地處理音頻。

這場技術(shù)革命,直接引發(fā)了榜單的大洗牌。

四季度,xAI憑借極快的響應(yīng)速度和恐怖的原生聽覺理解力,強(qiáng)勢掀翻了前任霸主谷歌Gemini2.5NativeAudioThinking,登頂了BigBenchAudio評測榜首;而亞馬遜的Nova2.0Sonic則極其精準(zhǔn)地踩中了市場的痛點(diǎn),加冕性價(jià)比之王。


在語音轉(zhuǎn)文本(STT)的戰(zhàn)場上,單項(xiàng)選手正被全能學(xué)霸降維打擊。

像AWS的Nova2Omni這類多模態(tài)大模型,現(xiàn)在做起語音轉(zhuǎn)文字,簡直就像是接了個(gè)順手的「兼職」。

它們甚至都不需要專門去練聽寫,準(zhǔn)確率就已經(jīng)能和專業(yè)軟件打個(gè)平手了。

與此同時(shí),為了解決語音助手總是慢半拍的毛病,ElevenLabsScribev2Realtime和英偉達(dá)ParakeetRealtime這種專門死磕超低延遲的模型也出來了。

有了它們,語音智能體真正落地到現(xiàn)實(shí)場景里的絆腳石也被搬開了。

現(xiàn)在的頂級模型不僅聲音好聽,甚至能在指令下完美控制情感基調(diào)、語速、重音,還能極其自然地插入笑聲、嘆息聲和呼吸聲。

過去總讓人覺得有些別扭的AI味兒,現(xiàn)在已經(jīng)基本消失了。

隨著SunoV4.5和ElevenLabsMusic這些工具開始在大眾里普及,現(xiàn)在只要花上極底成本,就能輕松合成出足夠以假亂真的人聲或樂曲。

當(dāng)然,這種擬真也引發(fā)了極大的恐慌,聲音克隆的泛濫,直接倒逼全行業(yè)開始把音頻水印和出處驗(yàn)證系統(tǒng)當(dāng)成了最高優(yōu)先級的安全限制。

報(bào)告也極其克制地指出了當(dāng)下的局限:

雖然語音Agent在諸如客服、預(yù)訂等結(jié)構(gòu)化交互中已經(jīng)表現(xiàn)得像個(gè)真人,但一旦遇上模糊不清的語境、需要長線邏輯推導(dǎo)的多輪對話,或者嘈雜惡劣的錄音環(huán)境,它們依然會(huì)露出機(jī)器的笨拙底色。

算力權(quán)力的游戲

英偉達(dá)大規(guī)模交付與200億美元的「終局豪賭」

2025年的底層硬件基礎(chǔ)設(shè)施,經(jīng)歷了一次脫胎換骨的成熟進(jìn)化。

英偉達(dá)的Blackwell芯片,B200和GB200NVL72機(jī)架級系統(tǒng)在2025年全線鋪開,進(jìn)入了真實(shí)生產(chǎn)環(huán)境。

像IBM的Granite4系列和OpenAI的GPT-5.3Codex,就成了最早一批公開宣布用上GB200集群的頭部大模型。

隨后在第三季度,英偉達(dá)又順勢發(fā)布了B300和GB300。

這次的硬件升級非常直接:在B200的基礎(chǔ)上,不僅HBM3e顯存增加了50%(達(dá)到288GB),F(xiàn)P4精度下的算力也隨之提高到了14PFLOPs。

但英偉達(dá)的野心遠(yuǎn)不止于賣芯片。

在2025年12月,整個(gè)科技圈被一筆交易徹底引爆:英偉達(dá)豪擲約200億美元天價(jià)收購了Groq。


這筆交易極其聰明地被包裝成「IP授權(quán)加人才收購(acqui-hire)」的模式。

英偉達(dá)看中的,是將Groq的LPU推理技術(shù)直接內(nèi)嵌到自己的算力帝國中,試圖徹底鎖死AI推理市場的咽喉。

然而,權(quán)力的游戲里從來不缺野心家。

谷歌的TPUv6(Trillium)在2024年底已經(jīng)全面鋪開,它支撐了Gemini2.5Pro和Gemini3Pro的龐大需求。

Anthropic也在2025年同時(shí)牽起了谷歌與亞馬遜的手,將TPU和Trainium一并接入自己的訓(xùn)練與推理矩陣。

而一直被低估的Cerebras則是聯(lián)手AMD和博通,與OpenAI簽下了一紙多年期的極速推理巨額合同。

在這場算力狂飆的背后,推理端的工作流也在悄然發(fā)生著劇變。

因?yàn)锳gent時(shí)代的到來,過去那種堆在一臺機(jī)器上傻跑的模式已經(jīng)行不通了。

分布式推理優(yōu)化成了2025年的一個(gè)明顯趨勢。

靠著英偉達(dá)Dynamo生態(tài)和開源社區(qū)的推動(dòng),過去那些只有頂級大廠才玩得轉(zhuǎn)的技術(shù),現(xiàn)在普通開發(fā)團(tuán)隊(duì)也能用上了。

現(xiàn)在的做法是把Prefill(預(yù)填充)和Decode(解碼)這兩個(gè)環(huán)節(jié)直接拆開,讓幾十甚至上百張GPU分工合作,一起做專家并行計(jì)算。

在這個(gè)過程中,之前五花八門的推理框架也慢慢收斂,最后大家的選擇基本都穩(wěn)定在了vLLM、SGLang以及英偉達(dá)「親兒子」TensorRT-LLM這三個(gè)主流框架上。

擁抱即將到來的零邊際成本智力

看完Artificial Analysis的這份年終報(bào)告,最直觀的感受就是,AI發(fā)展的倒計(jì)時(shí)真的就在耳邊了。

現(xiàn)在的AI早就不是剛出來時(shí)大家拿來嘗鮮的聊天玩具,它已經(jīng)實(shí)打?qū)嵉刈兂闪烁餍懈鳂I(yè)都在用的核心生產(chǎn)力。

當(dāng)o1這種級別的聰明大腦,使用成本在一年里真真切切地降了128倍;當(dāng)原本只能聽口令做簡單操作的Agent,現(xiàn)在已經(jīng)可以自己埋頭寫上幾十分鐘的代碼;當(dāng)多模態(tài)讓機(jī)器真正像人一樣,能用耳朵聽、用眼睛看去理解這個(gè)世界——

無論是創(chuàng)業(yè)者、開發(fā)者還是企業(yè)主管,可能都需要停下來認(rèn)真想一個(gè)問題:目前的業(yè)務(wù)模式,還能適應(yīng)接下來這個(gè)「萬物皆可Agent」的新階段嗎?

到了2026年,隨著機(jī)器智力的獲取成本越來越低,所有的公司、團(tuán)隊(duì)、產(chǎn)品甚至我們每一個(gè)普通人,都需要盡早去適應(yīng)Agent化的工作方式。

2026年2月,理想汽車基座模型MindVLA團(tuán)隊(duì)與國創(chuàng)決策智能技術(shù)研究所聯(lián)合發(fā)布了一篇論文——

提出了面向端側(cè)大語言模型的「硬件協(xié)同設(shè)計(jì)擴(kuò)展定律」。

論文直面了當(dāng)前最核心的挑戰(zhàn)之一:

如何將越來越強(qiáng)大的大語言模型高效地部署在資源受限的「端側(cè)設(shè)備」(如汽車、手機(jī)、機(jī)器人)上。

理想正在從一家以增程技術(shù)見長的汽車公司,蛻變?yōu)橐患乙灾悄荞{駛和具身智能為核心的AI公司。

而這篇?jiǎng)倓偘l(fā)布的論文,是理解這場轉(zhuǎn)型最好的注腳。

提前規(guī)劃和擁抱這些新工具,才能在下一波技術(shù)浪潮中站穩(wěn)腳跟。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
1-2!亞洲杯3冠王提前回家,首個(gè)四強(qiáng)已出爐,中國隊(duì)沖冠軍更難了

1-2!亞洲杯3冠王提前回家,首個(gè)四強(qiáng)已出爐,中國隊(duì)沖冠軍更難了

侃球熊弟
2026-03-13 20:00:02
網(wǎng)易回應(yīng)蘋果傭金下調(diào)

網(wǎng)易回應(yīng)蘋果傭金下調(diào)

界面新聞
2026-03-13 12:11:44
美議員要求防長因伊朗小學(xué)遭襲辭職

美議員要求防長因伊朗小學(xué)遭襲辭職

新華社
2026-03-13 15:13:03
越吃眼睛越亮菜!中老年使勁吃,一健脾胃、二養(yǎng)肝明目、三強(qiáng)免疫

越吃眼睛越亮菜!中老年使勁吃,一健脾胃、二養(yǎng)肝明目、三強(qiáng)免疫

阿龍美食記
2026-03-12 14:02:55
坎通納:我希望制定一項(xiàng)國際法,發(fā)動(dòng)戰(zhàn)爭的總統(tǒng)需第一個(gè)上前線

坎通納:我希望制定一項(xiàng)國際法,發(fā)動(dòng)戰(zhàn)爭的總統(tǒng)需第一個(gè)上前線

懂球帝
2026-03-13 14:28:30
你見過哪些婚前作死行為?網(wǎng)友:新娘不出聲,視為默認(rèn)、贊同

你見過哪些婚前作死行為?網(wǎng)友:新娘不出聲,視為默認(rèn)、贊同

解讀熱點(diǎn)事件
2026-03-13 00:05:08
理記曝光張藝興在國家關(guān)鍵時(shí)期不報(bào)備出國且毫無悔改對抗組織

理記曝光張藝興在國家關(guān)鍵時(shí)期不報(bào)備出國且毫無悔改對抗組織

魔都囡
2026-03-13 11:31:56
14年過去了,再看“癩蛤蟆吃到天鵝肉”的王大治,如今怎么樣了?

14年過去了,再看“癩蛤蟆吃到天鵝肉”的王大治,如今怎么樣了?

以茶帶書
2026-03-12 18:13:51
功耗直降96%!三星和英偉達(dá)聯(lián)手研發(fā)新閃存,AI驅(qū)動(dòng)擊碎傳統(tǒng)模式

功耗直降96%!三星和英偉達(dá)聯(lián)手研發(fā)新閃存,AI驅(qū)動(dòng)擊碎傳統(tǒng)模式

爆角追蹤
2026-03-13 14:12:59
武漢同濟(jì)核磁事件,荒唐的不止是兩名醫(yī)生...

武漢同濟(jì)核磁事件,荒唐的不止是兩名醫(yī)生...

聽風(fēng)聽你
2026-03-13 12:06:05
國運(yùn)來了誰也擋不住!儲(chǔ)量44億噸大礦直運(yùn)中國,澳美礦牌大勢已去

國運(yùn)來了誰也擋不住!儲(chǔ)量44億噸大礦直運(yùn)中國,澳美礦牌大勢已去

塔子山評說
2026-03-13 11:32:57
特朗普鼓動(dòng)油輪“拿出膽量”通過霍爾木茲海峽:不用怕,伊朗沒有海軍!美國宣布放寬對俄石油制裁,俄羅斯兩周已大賺475億元額外收入

特朗普鼓動(dòng)油輪“拿出膽量”通過霍爾木茲海峽:不用怕,伊朗沒有海軍!美國宣布放寬對俄石油制裁,俄羅斯兩周已大賺475億元額外收入

每日經(jīng)濟(jì)新聞
2026-03-13 20:00:07
一場戰(zhàn)爭逼出一個(gè)技術(shù)強(qiáng)國烏克蘭

一場戰(zhàn)爭逼出一個(gè)技術(shù)強(qiáng)國烏克蘭

難得君
2026-03-12 09:28:43
沉迷養(yǎng)豬的丁磊,去年賺了338億

沉迷養(yǎng)豬的丁磊,去年賺了338億

大佬灼見
2026-03-13 12:21:50
這一次的伊朗戰(zhàn)爭,是軍事史上的里程碑!

這一次的伊朗戰(zhàn)爭,是軍事史上的里程碑!

從前這些事
2026-03-11 07:32:06
伊朗新領(lǐng)袖官方照翻車:AI修圖露馬腳,權(quán)力門面藏不住破綻

伊朗新領(lǐng)袖官方照翻車:AI修圖露馬腳,權(quán)力門面藏不住破綻

老馬拉車莫少裝
2026-03-13 07:43:05
央視怒批!“絕望的文盲”丟臉到國外,馮遠(yuǎn)征的話終于有人信了

央視怒批!“絕望的文盲”丟臉到國外,馮遠(yuǎn)征的話終于有人信了

人間無味啊
2026-03-13 03:17:17
注意!違章漲保費(fèi)全面實(shí)行,闖紅燈3次保費(fèi)上浮20%,跑車成本要漲了

注意!違章漲保費(fèi)全面實(shí)行,闖紅燈3次保費(fèi)上浮20%,跑車成本要漲了

網(wǎng)約車觀察室
2026-03-13 09:52:28
馬筱梅的體面被戳破,小楊阿姨終于說實(shí)話,家沒喜事,是被辭了

馬筱梅的體面被戳破,小楊阿姨終于說實(shí)話,家沒喜事,是被辭了

非常先生看娛樂
2026-03-13 15:54:16
西安不倒翁小姐姐離職:沒嫁入豪門,七年沒拿到編制,壓力太大!

西安不倒翁小姐姐離職:沒嫁入豪門,七年沒拿到編制,壓力太大!

眼光很亮
2026-03-12 19:25:00
2026-03-13 20:59:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時(shí)代
14711文章數(shù) 66687關(guān)注度
往期回顧 全部

科技要聞

龍蝦熱卷到AI硬件 “無腦”硬件或被淘汰

頭條要聞

特朗普鼓動(dòng)油輪"大膽"過霍爾木茲海峽:伊朗沒有海軍

頭條要聞

特朗普鼓動(dòng)油輪"大膽"過霍爾木茲海峽:伊朗沒有海軍

體育要聞

叕戰(zhàn)奧運(yùn),張雨霏要做回“小將”

娛樂要聞

小S復(fù)工錄制 感謝賈永婕陪大S走到最后

財(cái)經(jīng)要聞

中小銀行定存利率落入“1”時(shí)代

汽車要聞

置換補(bǔ)貼價(jià)8.68萬 五菱繽果S 525km旗艦款上市

態(tài)度原創(chuàng)

游戲
房產(chǎn)
旅游
數(shù)碼
軍事航空

一個(gè)月就打折?《仁王3》開啟首場促銷 光榮吆喝宣傳

房產(chǎn)要聞

不容易。『?诮K于又要賣地了!

旅游要聞

F1期間限定!來安亭老街“逛吃逛吃”→(附美食購物娛樂攻略)

數(shù)碼要聞

海爾×支付寶重磅聯(lián)動(dòng) 碰一下就能操作家電

軍事要聞

伊朗稱襲擊"林肯"號航母致其撤走

無障礙瀏覽 進(jìn)入關(guān)懷版