国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

智譜GLM-5強(qiáng)調(diào)的Agentic Engineering能力是什么?|甲子光年

0
分享至



智譜GLM-5驗(yàn)證了Agentic Engineering的可行性,但成本正在變得更顯性。

作者|周悅

編輯|王博

今天,智譜上線并開源GLM-5,其在Coding與Agent能力上,取得開源SOTA表現(xiàn),在真實(shí)編程場景的使用體感逼近 Claude Opus 4.5,擅長復(fù)雜系統(tǒng)工程與長程Agent任務(wù)。


在全球權(quán)威的Artificial Analysis榜單中,GLM-5位居全球第四、開源第一,圖片來源:智譜

這一發(fā)布直接刺激了資本市場,智譜股價(jià)一度漲超41%。截至收盤,智譜股價(jià)報(bào)402港元/股,漲幅為28.68%,市值為1792.3億港元。

值得注意的是,智譜稱GLM-5為“Agentic Engineering時(shí)代最好的開源模型”。

什么是Agentic Engineering?為什么智譜要強(qiáng)調(diào)這個(gè)概念呢?

1.從“氛圍”到“工程”

如果說AI行業(yè)需要尋找一位能精準(zhǔn)捕捉技術(shù)風(fēng)向的觀測者,特斯拉前AI總監(jiān)、OpenAI創(chuàng)始成員Andrej Karpathy無疑是最佳人選。

2025年2月,他提出Vibe Coding(氛圍編碼)概念。開發(fā)者不再逐行寫代碼,而是用自然語言描述意圖,讓模型在一種更像即興創(chuàng)作的狀態(tài)里生成實(shí)現(xiàn)。這種體驗(yàn)帶來了一段明顯的“編程蜜月期”:生成更快、試錯(cuò)更便宜、上手更輕松。

但一年后,Karpathy拋出了一個(gè)更現(xiàn)實(shí)的概念:Agentic Engineering(代理工程)。他的關(guān)注點(diǎn)不再是單純地追求生成代碼,而是試圖讓AI交付完整的工程閉環(huán)。

從“氛圍”到“工程”的轉(zhuǎn)變,折射出一個(gè)更直觀的行業(yè)變化:寫代碼的門檻在降低,但讓模型跑完工程的門檻并沒有同步下降。

在「甲子光年」看來,要讓Agentic Engineering真的跑起來,需要滿足兩個(gè)條件:模型能力強(qiáng),成本可接受。

我們把它粗略概括為一個(gè)便于理解的表達(dá):Agentic Engineering的擴(kuò)散性 ≈ 能力閾值 × 成本閾值。

前者決定可行性,后者決定普及率。沒有足夠的智能,循環(huán)會放大錯(cuò)誤;能力足夠時(shí),成本會變成新的瓶頸。這種范式往往會更早落在預(yù)算更充足、對收斂速度更敏感的團(tuán)隊(duì)里。

今天,智譜GLM-5的發(fā)布與GLM Coding Plan價(jià)格體系調(diào)整,讓這兩個(gè)變量在同一個(gè)時(shí)間點(diǎn)上顯得更清晰。


Andrej Karpathy發(fā)布博文,圖片來源:X平臺

理解這次轉(zhuǎn)變,需要還原開發(fā)者的真實(shí)工作流。

在Vibe Coding時(shí)代,一個(gè)后端開發(fā)者使用Cursor等編程工具時(shí),典型循環(huán)往往是:人類輸入—模型輸出—人類驗(yàn)證—模型修改——人類確認(rèn)。它提高了生成效率,但沒有消除人工介入的難題。

Karpathy對此的總結(jié)很精準(zhǔn):“很好、很有趣,而且幾乎能行得通。(It was good and fun and it almost worked)”

關(guān)鍵就在“幾乎”。

當(dāng)任務(wù)開始變長、上下文變復(fù)雜、回歸測試變多時(shí),人類介入的頻率并不會下降,開發(fā)者依然需要反復(fù)確認(rèn)。瓶頸逐漸從代碼生成速度轉(zhuǎn)向開發(fā)者的驗(yàn)證速度。

Agentic Engineering試圖打破的,正是這種線性依賴,讓模型把“找—改—測—再改—再測”的閉環(huán)盡量跑完,人類更多在關(guān)鍵節(jié)點(diǎn)介入,最終對結(jié)果負(fù)責(zé)。開發(fā)者的角色也隨之變化,從寫代碼的人變成更像“監(jiān)督者”。

在這樣的語境下,GLM-5之所以值得被討論,是因?yàn)?strong>它為開源模型能否更接近代碼代理工作流,提供了一個(gè)可觀察樣本,也就是把公式左側(cè)的變量(能力閾值)推到了一個(gè)更高的位置。

根據(jù)智譜披露的結(jié)果,在衡量AI解決真實(shí)GitHub問題能力的權(quán)威榜單SWE-bench Verified上,GLM-5取得了77.8的成績,這一數(shù)據(jù)逼近了閉源模型的第一梯隊(duì)。與此同時(shí),在部分第三方公開榜單下,GLM-5也處于開源模型的前列。

這些分?jǐn)?shù)當(dāng)然不是全部意義,但它們至少指向一個(gè)變化:在給定代碼倉庫、給定驗(yàn)證條件的任務(wù)設(shè)定下,開源模型完成更長程的規(guī)劃、反思與自我修正,正在變得更可行。


大模型評估結(jié)果,圖片來源:智譜

從智譜披露的技術(shù)路徑來看,GLM-5在幾個(gè)關(guān)鍵維度上做了面向長流程任務(wù)的強(qiáng)化:

  • 參數(shù)規(guī)模擴(kuò)展:參數(shù)規(guī)模擴(kuò)展至744B(激活40B),預(yù)訓(xùn)練數(shù)據(jù)量提升,增強(qiáng)了通用智能;

  • 異步強(qiáng)化學(xué)習(xí):引入“Slime”框架和異步智能體強(qiáng)化學(xué)習(xí)算法,使模型能夠從長程交互中持續(xù)學(xué)習(xí);

  • 稀疏注意力機(jī)制:集成DeepSeek Sparse Attention,保證了在處理長上下文時(shí)的效果無損,提升token效率。

更值得注意的是,智譜表示,GLM-5已完成與華為昇騰、摩爾線程、寒武紀(jì)、昆侖芯、沐曦、燧原、海光等多家國產(chǎn)算力平臺的深度推理適配與優(yōu)化。這說明,在部署路徑上,它正在探索一種更可落地的工程組合方式。

這共同指向了一個(gè)結(jié)論:開源模型在“更接近工程閉環(huán)”這一維度上,正在跨過更高的能力門檻。

2.現(xiàn)實(shí)的成本問題

當(dāng)能力門檻被抬上去之后,公式右側(cè)的變量“成本閾值”會更快變成現(xiàn)實(shí)問題。

Agentic Engineering的核心邏輯是“循環(huán)”。一次真實(shí)的修復(fù)任務(wù)往往并不是一問一答,而是多輪定位、修改、測試與復(fù)盤。在這種模式下,Token消耗與推理時(shí)長通常會顯著高于普通對話。

換句話說,它不是“更省錢地寫代碼”,而是用更密集的算力去置換人類的時(shí)間。

2月12日,智譜發(fā)布價(jià)格調(diào)整說明,宣布 GLM Coding Plan取消首購優(yōu)惠,整體價(jià)格上調(diào),漲幅自30%起,將原因歸于需求增長與高負(fù)載下的穩(wěn)定性與服務(wù)質(zhì)量保障。

這些信息共同指向一個(gè)更明確的現(xiàn)實(shí):當(dāng)模型開始被更頻繁地當(dāng)作生產(chǎn)力工具使用,成本會更早變成賬單。

因此,“漲價(jià)”本身不必被簡化為單一結(jié)論。更準(zhǔn)確的說法是:能力閾值在上升,成本閾值也更顯性。

GLM-5的案例一定程度說明,未來的軟件工程可能會呈現(xiàn)出一種分層態(tài)勢

  • Vibe Coding層,對于日常、短程的輔助開發(fā),低成本、快響應(yīng)的模型依然是主流;

  • Agentic Engineering層,面向關(guān)鍵任務(wù)、復(fù)雜架構(gòu)調(diào)整或必須快速收斂的問題,更強(qiáng)的代理工程能力,更像一種需要付費(fèi)的“加速券”——用更高的推理預(yù)算,換取更快的工程收斂。

對大公司和追求極致效率的團(tuán)隊(duì)來說,這是一筆算得過來的投入;而對于更廣泛的個(gè)人開發(fā)者,這或許意味著需要更精細(xì)地計(jì)算 ROI(投資回報(bào)率)。

我們或許已經(jīng)看到了一個(gè)更接近現(xiàn)實(shí)的結(jié)論:模型能力決定Agentic Engineering正在走向現(xiàn)實(shí);成本,決定它能擴(kuò)散到多遠(yuǎn)。

(封面圖來源:AI生成)

聲明:包含AI生成內(nèi)容

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
3月2日消息!大滿貫落幕 國乒275萬獎金分配:王楚欽68萬,鰻魚34萬

3月2日消息!大滿貫落幕 國乒275萬獎金分配:王楚欽68萬,鰻魚34萬

皮皮觀天下
2026-03-02 03:45:55
第6波打擊!伊朗斬首行動起作用,以總參被炸,特朗普開始急了

第6波打擊!伊朗斬首行動起作用,以總參被炸,特朗普開始急了

近史談
2026-03-02 10:06:37
伊朗的援軍到了!以色列再征兵10萬,關(guān)鍵時(shí)刻,普京對中國做承諾

伊朗的援軍到了!以色列再征兵10萬,關(guān)鍵時(shí)刻,普京對中國做承諾

軍機(jī)Talk
2026-03-02 09:50:33
央視主持人鄭麗:我這輩子最正確的決定,就是為普通丈夫生下孩子

央視主持人鄭麗:我這輩子最正確的決定,就是為普通丈夫生下孩子

鄉(xiāng)野小珥
2026-02-26 08:41:32
臺關(guān)注我軍機(jī)活動“斷崖式銳減”動因

臺關(guān)注我軍機(jī)活動“斷崖式銳減”動因

沃德輿情觀察
2026-02-28 23:26:00
男演員長相多重要?把34歲黃景瑜和25歲陳飛宇對比,高下立判

男演員長相多重要?把34歲黃景瑜和25歲陳飛宇對比,高下立判

看盡落塵花q
2026-03-02 05:17:23
戴旭:中美一旦發(fā)生戰(zhàn)爭,美國有實(shí)力將中國沿海城市打得稀巴爛?

戴旭:中美一旦發(fā)生戰(zhàn)爭,美國有實(shí)力將中國沿海城市打得稀巴爛?

二大爺觀世界
2026-01-16 03:04:40
輔導(dǎo)員,全部入編

輔導(dǎo)員,全部入編

山東教育
2026-03-01 17:59:48
奇怪的現(xiàn)象:多數(shù)中年人一旦失業(yè),手里有存款,第一件事竟是躺平

奇怪的現(xiàn)象:多數(shù)中年人一旦失業(yè),手里有存款,第一件事竟是躺平

木言觀
2026-03-01 21:41:55
全體起立!替補(bǔ)席上無索帥不曼聯(lián),謝什科詮釋卡里克用兵如神

全體起立!替補(bǔ)席上無索帥不曼聯(lián),謝什科詮釋卡里克用兵如神

籃球看比賽
2026-03-01 15:39:29
再吹捧這種國產(chǎn)爛片,內(nèi)娛真沒救了

再吹捧這種國產(chǎn)爛片,內(nèi)娛真沒救了

娛樂圈十三太保
2026-02-28 17:22:44
可打美航母!英媒:中國或違反聯(lián)合國規(guī)定,運(yùn)超高音速導(dǎo)彈去伊朗

可打美航母!英媒:中國或違反聯(lián)合國規(guī)定,運(yùn)超高音速導(dǎo)彈去伊朗

通鑒史智
2026-02-26 09:20:17
迻譯 | 哈梅內(nèi)伊人生最后的外訪:一個(gè)伊朗高官的平壤回憶

迻譯 | 哈梅內(nèi)伊人生最后的外訪:一個(gè)伊朗高官的平壤回憶

雜鈔與拾零
2026-03-01 20:26:34
“我就是她取精生子的工具”清華學(xué)霸哭訴,撕開了女富豪的遮羞布

“我就是她取精生子的工具”清華學(xué)霸哭訴,撕開了女富豪的遮羞布

北緯的咖啡豆
2026-02-20 19:12:17
美媒感慨:若不是中國還在反抗特朗普,幾乎全世界都向他投降了

美媒感慨:若不是中國還在反抗特朗普,幾乎全世界都向他投降了

悅心知足
2026-02-21 23:03:46
美國發(fā)出警告:中國不還100年前的舊債,美國絕不承認(rèn)欠中國的錢

美國發(fā)出警告:中國不還100年前的舊債,美國絕不承認(rèn)欠中國的錢

霽寒飄雪
2026-01-26 16:18:59
《飛馳人生3》資本版圖:已盈利超6億,韓寒公平分給24家資方

《飛馳人生3》資本版圖:已盈利超6億,韓寒公平分給24家資方

光影新天地
2026-03-01 16:34:52
我不關(guān)心伊朗高層,只關(guān)心伊朗人民

我不關(guān)心伊朗高層,只關(guān)心伊朗人民

濤哥銳評
2026-03-02 07:45:48
整容成癮、拋妻娶粉?“消失”的宋小寶,終究為曾經(jīng)的荒唐買了單

整容成癮、拋妻娶粉?“消失”的宋小寶,終究為曾經(jīng)的荒唐買了單

啟迪你的思維
2026-02-02 20:56:29
“母子落魄吃蛋糕”視頻火了,獲贊過百萬:誰不羨慕這樣的父母?

“母子落魄吃蛋糕”視頻火了,獲贊過百萬:誰不羨慕這樣的父母?

妍妍教育日記
2026-02-25 20:58:43
2026-03-02 10:44:49
甲子光年
甲子光年
中國科技產(chǎn)業(yè)化前沿智庫
3354文章數(shù) 9261關(guān)注度
往期回顧 全部

科技要聞

榮耀發(fā)布機(jī)器人手機(jī)、折疊屏、人形機(jī)器人

頭條要聞

牛彈琴:伊朗之戰(zhàn)比俄烏之戰(zhàn)更生猛 給世界5個(gè)深刻教訓(xùn)

頭條要聞

牛彈琴:伊朗之戰(zhàn)比俄烏之戰(zhàn)更生猛 給世界5個(gè)深刻教訓(xùn)

體育要聞

卡里克主場5連勝!隊(duì)史第2人通過最大考驗(yàn)

娛樂要聞

美伊以沖突爆發(fā),多位明星被困中東

財(cái)經(jīng)要聞

中東局勢影響如何?十大券商策略來了

汽車要聞

小米發(fā)布超跑! 游戲中對標(biāo)布加迪法拉利

態(tài)度原創(chuàng)

游戲
教育
旅游
健康
公開課

知名可靠消息人士談《巫師3》DLC:它確實(shí)存在!

教育要聞

2027–28申請季:當(dāng)背景趨同、高分扎堆,你還能靠什么贏得offer?

旅游要聞

2月大事件集錦 | 一文讀遍旅游行業(yè)“新鮮事”!

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版