国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

大模型實(shí)現(xiàn)“8小時工作制” !智譜GLM-5.1大幅提升長程任務(wù)能力

0
分享至

《科創(chuàng)板日報》4月10日訊(記者 李明明)智譜發(fā)布其迄今最智能的模型。

近日,智譜發(fā)布并開源新一代旗艦?zāi)P虶LM-5.1。據(jù)介紹,其是唯一達(dá)到8小時級持續(xù)工作的開源模型,在最接近真實(shí)軟件開發(fā)的SWE-bench Pro基準(zhǔn)測試中,GLM-5.1實(shí)現(xiàn)國產(chǎn)模型首次超越Opus 4.6。

OpenRouter顯示,伴隨此次發(fā)布,智譜GLM再度提價10%。

《科創(chuàng)板日報》記者從相關(guān)方獲悉,與過去一年行業(yè)主旋律“降價”截然相反,智譜本次提價,編碼場景定價首次追平海外頭部廠商Anthropic。這也寓示著國產(chǎn)大模型從價格戰(zhàn)、低價換量轉(zhuǎn)向性能溢價。

實(shí)測GLM-5.1

關(guān)于GLM-5.1的智能水平,智譜團(tuán)隊告訴《科創(chuàng)板日報》記者,GLM-5.1提高了代碼能力,在完成長程任務(wù)方面提升尤為顯著。和此前分鐘級交互的模型不同,它能夠在一次任務(wù)中獨(dú)立、持續(xù)工作超過8小時,期間自主規(guī)劃、執(zhí)行、自我進(jìn)化,最終交付完整的工程級成果。

代碼能力是模型智能水平進(jìn)一步提升的關(guān)鍵。據(jù)悉,在業(yè)內(nèi)最具代表性的三個代碼評測基準(zhǔn)的平均結(jié)果中,包括衡量模型專業(yè)軟件開發(fā)工作的SWE-Bench Pro、操作命令行解決問題的Terminal-Bench 2.0、從零構(gòu)建完整代碼倉庫的NL2Repo,GLM-5.1取得全球模型第三、國產(chǎn)模型第一、開源模型第一。

這也代表了大模型演進(jìn)到現(xiàn)在的趨勢之一,過去兩年,行業(yè)用Benchmark衡量模型有多智能。上述智譜團(tuán)隊向《科創(chuàng)板日報》記者判斷,下一階段的衡量標(biāo)準(zhǔn)應(yīng)該是“能工作多久”,即模型在Long-Horizon Task中的表現(xiàn),能獨(dú)立完成多長時間的人類任務(wù)。

業(yè)內(nèi)也形成了共識,2025年3月,AI安全研究機(jī)構(gòu)METR提出了一個改變行業(yè)認(rèn)知的指標(biāo):任務(wù)完成時間線(Task-Completion Time Horizon)——不再衡量模型"多聰明",而是衡量它能獨(dú)立完成多長時間的人類任務(wù)。研究顯示,前沿模型的時間線每7個月翻一倍。這條指數(shù)曲線被MIT Technology Review稱為"AI領(lǐng)域最重要的一張圖",Sequoia Capital據(jù)此在2026年初宣告"這就是AGI"。

在長程任務(wù)中保持穩(wěn)定輸出,模型面對的不只是更大代碼量,而是一連串復(fù)雜的工程決策點(diǎn):主動跑benchmark、定位瓶頸、修改方案、再跑測試。這對模型提出更高的要求,需要像人類工程師一樣,形成“實(shí)驗(yàn)→分析→優(yōu)化”的完整閉環(huán),而不是寫完代碼停下來等人打分。

《科創(chuàng)板日報》記者用開發(fā)者工具實(shí)測了GLM-5.1,測試案例如下:有一個專門考驗(yàn)AI編程能力的測試,任務(wù)是讓AI做出一個能快速檢索海量數(shù)據(jù)的系統(tǒng),當(dāng)時最強(qiáng)的成績是Claude Opus 4.6創(chuàng)造的。

實(shí)測顯示,智譜GLM-5.1在持續(xù)進(jìn)行六百多次優(yōu)化、六千多次操作后,性能還在不斷提升,最終速度達(dá)到了之前最好成績的6倍。



據(jù)了解,GLM-5.1也刷新了國產(chǎn)開源模型的成績。

長期以來,全球大模型賽道始終存在一條難以逾越的鴻溝:開源模型與頂尖閉源模型之間存在肉眼可見的能力代差,而中國開源模型更是長期被貼上追趕者的標(biāo)簽,在國際公認(rèn)的通用能力榜單上,始終與Claude、GPT系列的頂級閉源產(chǎn)品有明顯差距。

而在最貼近真實(shí)軟件開發(fā)場景的SWE-bench Pro基準(zhǔn)測試中,GLM-5.1實(shí)現(xiàn)國產(chǎn)模型對Claude Opus 4.6的首次超越。

智譜GLM再度提價10%

性能提升的同時,智譜在價格層面也與海外廠商看齊,這也是國產(chǎn)模型價格首次對齊海外,模型聚合平臺OpenRouter顯示,智譜GLM再度提價10%。調(diào)價后,GLM-5.1在Coding場景的緩存命中Token價格已接近Anthropic旗下Claude Sonnet 4.6。

這不是智譜第一次漲價,此前,智譜2月12日發(fā)布GLM Coding Plan 價格調(diào)整函稱, GLM Coding Plan市場需求持續(xù)強(qiáng)勁增長,用戶規(guī)模與調(diào)用量快速提升。公司決定對GLM Coding Plan套餐價格進(jìn)行結(jié)構(gòu)性調(diào)整,整體漲幅自30%起。

《科創(chuàng)板日報》記者此前獨(dú)家獲悉,海外版GLM-5定價漲幅高于國內(nèi):Coding plan訂閱價格提高30%-60%,API調(diào)用價格提升67%-100%。

此舉為國產(chǎn)大模型2026年以來首次大幅提價。

一年前,行業(yè)還深陷“價格戰(zhàn)”,普遍降價九成以上爭奪份額。智譜為何敢于反向操作?

從核心動因看,需求端爆發(fā)是直接推手。GLM Coding Plan聚焦開發(fā)者代碼生成、編程輔助場景,市場需求持續(xù)旺盛,用戶規(guī)模、接口調(diào)用量雙雙快速攀升,平臺長期處于高負(fù)載運(yùn)行狀態(tài),對算力調(diào)度、服務(wù)穩(wěn)定性、響應(yīng)效率的要求顯著提高,需求增速超出原有資源規(guī)劃與承載能力。

在智譜2025年業(yè)績說明會上,智譜CEO張鵬對《科創(chuàng)板日報》記者介紹,一季度智譜的API調(diào)用定價提升83%,即便如此,市場依然呈現(xiàn)出供不應(yīng)求的情況,調(diào)用量增長400%。當(dāng)前,智譜已成為國內(nèi)付費(fèi)Token消耗量最高的廠商之一。

關(guān)于漲價,張鵬此前在中關(guān)村論壇上回應(yīng)稱,長期依賴低價競爭不利于行業(yè)發(fā)展,調(diào)價旨在將價格拉回正常的商業(yè)價值區(qū)間?!巴瓿梢粋€長程任務(wù)所需要的Token量可能是回答一個簡單問題時的十倍甚至百倍,價格調(diào)整本質(zhì)上是價值變化的自然結(jié)果。”

據(jù)張鵬介紹,智譜已經(jīng)實(shí)現(xiàn)了Token在全球范圍內(nèi)的價值變現(xiàn)。目前,GLM模型已全面部署于Google Vertex AI、AWS Bedrock等全球云服務(wù)商,并入駐OpenRouter、Vercel等國際主流模型聚合平臺。

智譜MaaS商業(yè)化方面,MaaS API平臺實(shí)現(xiàn)ARR 約17億元(約2.5億美金),同比提升60倍。

此外,《科創(chuàng)板日報》記者注意到,2026年開年以來,國內(nèi)AI行業(yè)已從過去的“價格戰(zhàn)”轉(zhuǎn)向“價值定價”,一些底層算力與模型服務(wù)集體調(diào)價,主要包括:

騰訊云:3月11日對自研混元HY2.0系列模型大幅調(diào)價, 4月9日再次宣布5月9日起AI算力、容器服務(wù)等產(chǎn)品統(tǒng)一上調(diào)5%。

阿里云:3月18日宣布4月18日起,AI算力相關(guān)產(chǎn)品價格上調(diào)5%-34%,智算版存儲產(chǎn)品上漲30%。

百度智能云:3月18日發(fā)布AI算力、存儲等產(chǎn)品調(diào)價公告,AI算力相關(guān)產(chǎn)品服務(wù)上調(diào)5%-30%,并行文件存儲價格上調(diào)約30%。

(科創(chuàng)板日報記者 李明明)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
三野名將不聽粟裕調(diào)遣,出言不遜后甩手離去,主席:立刻撤職?

三野名將不聽粟裕調(diào)遣,出言不遜后甩手離去,主席:立刻撤職?

紀(jì)實(shí)文錄
2025-05-10 17:45:35
馬斯克:西方不搞電車,歐日韓集體擁抱氫能,中國電動車真的錯了

馬斯克:西方不搞電車,歐日韓集體擁抱氫能,中國電動車真的錯了

史行途
2026-04-08 15:27:19
破案!盧鵬羽故意當(dāng)裁判面撞翻張寧真正原因找到,球迷說出大實(shí)話

破案!盧鵬羽故意當(dāng)裁判面撞翻張寧真正原因找到,球迷說出大實(shí)話

后仰大風(fēng)車
2026-04-10 08:10:23
辛納硬扛3小時窒息鏖戰(zhàn),法網(wǎng)冠軍被拖到抽筋退場

辛納硬扛3小時窒息鏖戰(zhàn),法網(wǎng)冠軍被拖到抽筋退場

熱血體育社
2026-04-10 11:59:53
女優(yōu)玥伶揭麻豆傳媒內(nèi)幕逼演毀三觀劇本:亂倫還涉未成年

女優(yōu)玥伶揭麻豆傳媒內(nèi)幕逼演毀三觀劇本:亂倫還涉未成年

孤獨(dú)的獨(dú)角獸影視
2026-04-10 10:10:16
73歲遲重瑞近況:賣故宮旁自家房子,均價15萬,陳麗華嫁他好福氣

73歲遲重瑞近況:賣故宮旁自家房子,均價15萬,陳麗華嫁他好福氣

一娛三分地
2026-02-19 17:04:30
《穿普拉達(dá)的女王2》海報撞臉《小時代》,網(wǎng)友:好差的美工,災(zāi)難級海報!

《穿普拉達(dá)的女王2》海報撞臉《小時代》,網(wǎng)友:好差的美工,災(zāi)難級海報!

品牌新
2026-04-08 16:38:02
拜仁造神運(yùn)動引爭議,英媒德媒隔空掐架

拜仁造神運(yùn)動引爭議,英媒德媒隔空掐架

茅塞盾開本尊
2026-04-10 12:44:50
鄭麗文抵達(dá)北京,入住酒店與馬英九待遇一致,兩岸關(guān)系開啟新時代

鄭麗文抵達(dá)北京,入住酒店與馬英九待遇一致,兩岸關(guān)系開啟新時代

徐慍解說
2026-04-10 08:33:48
43歲謝婷婷狂攬第5個網(wǎng)球冠軍!小7歲男友曝光,顧家?guī)奕ν信e

43歲謝婷婷狂攬第5個網(wǎng)球冠軍!小7歲男友曝光,顧家?guī)奕ν信e

阿鳧愛吐槽
2026-04-10 12:46:56
臺灣地區(qū)前領(lǐng)導(dǎo)人馬英九:我不希望臺灣成為第二個香港!

臺灣地區(qū)前領(lǐng)導(dǎo)人馬英九:我不希望臺灣成為第二個香港!

時負(fù)相知
2026-04-10 10:38:17
上半年北京小客車指標(biāo)資格審核結(jié)果公布,無車家庭積分本月發(fā)布

上半年北京小客車指標(biāo)資格審核結(jié)果公布,無車家庭積分本月發(fā)布

新京報
2026-04-09 14:20:06
特朗普:所有美國艦船、飛機(jī)和軍事人員將繼續(xù)留在伊朗周圍

特朗普:所有美國艦船、飛機(jī)和軍事人員將繼續(xù)留在伊朗周圍

新京報
2026-04-09 12:12:05
惹了事還惡人先告狀?眼見事鬧大,巴拿馬找補(bǔ):無意與中國摩擦

惹了事還惡人先告狀?眼見事鬧大,巴拿馬找補(bǔ):無意與中國摩擦

清沐執(zhí)筆
2026-04-10 12:54:10
張雪終于把碎屏手機(jī)換了!用上榮耀折疊屏手機(jī) 豎大拇指:好輕啊

張雪終于把碎屏手機(jī)換了!用上榮耀折疊屏手機(jī) 豎大拇指:好輕啊

念洲
2026-04-10 08:41:40
教育部:人工智能將納入教師資格考試和認(rèn)證內(nèi)容

教育部:人工智能將納入教師資格考試和認(rèn)證內(nèi)容

界面新聞
2026-04-10 10:11:27
俄寡頭:普京將在一月內(nèi)對烏發(fā)動核打擊,發(fā)射一枚2萬噸當(dāng)量核彈

俄寡頭:普京將在一月內(nèi)對烏發(fā)動核打擊,發(fā)射一枚2萬噸當(dāng)量核彈

梁濆愛玩車
2026-04-09 16:04:48
軍事專家戴旭:目前世界沒有一個國家,在軍事方面,敢和我們較量

軍事專家戴旭:目前世界沒有一個國家,在軍事方面,敢和我們較量

音樂時光的娛樂
2026-04-10 00:23:22
26582輛!鴻蒙智行3月銷量數(shù)據(jù)曝光

26582輛!鴻蒙智行3月銷量數(shù)據(jù)曝光

鞭牛士
2026-04-09 20:31:06
盛李豪世界杯西班牙站連奪兩金:比拼技術(shù)很有意思

盛李豪世界杯西班牙站連奪兩金:比拼技術(shù)很有意思

體壇周報
2026-04-10 09:51:31
2026-04-10 13:35:00
財聯(lián)社 incentive-icons
財聯(lián)社
以“準(zhǔn)確、快速、權(quán)威、專業(yè)”為新聞準(zhǔn)則,為投資者提供專業(yè)的投資資訊。
706018文章數(shù) 1019862關(guān)注度
往期回顧 全部

科技要聞

程序員驚喜,每月100美元!OpenAI推新套餐

頭條要聞

再次"一肩挑"的蘇林 將中國作為出訪的首個國家

頭條要聞

再次"一肩挑"的蘇林 將中國作為出訪的首個國家

體育要聞

17歲賺了一百萬美元,25歲被CBA裁員

娛樂要聞

夏克立婚內(nèi)出軌 曾參加《爸爸去哪兒》

財經(jīng)要聞

愛爾眼科一院長被指猥褻 總部:已被停職

汽車要聞

全新一代理想 L8 五座旗艦+5C增程系統(tǒng) 三季度交付

態(tài)度原創(chuàng)

教育
數(shù)碼
房產(chǎn)
親子
手機(jī)

教育要聞

公共俄語四級詞匯與語法技巧,僅3招拿下20分!

數(shù)碼要聞

2026年第一季度全球PC出貨量增長3% 聯(lián)想份額破25%

房產(chǎn)要聞

2400畝!大三亞又一個濱海度假區(qū),規(guī)劃曝光!

親子要聞

阿金哥小時候的照片,銳銳像左邊的阿金,霖霖像右邊的阿金

手機(jī)要聞

摩托羅拉Edge 70 Pro手機(jī)渲染圖曝光:3種配色,6500mAh電池

無障礙瀏覽 進(jìn)入關(guān)懷版