国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Z.ai發(fā)布GLM-5.1編程模型,可連續(xù)運(yùn)行數(shù)小時(shí)自主作業(yè)

0
分享至


中國(guó)AI公司Z.ai近日推出GLM-5.1,這是一款專為智能體軟件工程場(chǎng)景設(shè)計(jì)的開(kāi)源編程模型。此次發(fā)布正值A(chǔ)I廠商紛紛從自動(dòng)補(bǔ)全式編程工具轉(zhuǎn)型,轉(zhuǎn)而構(gòu)建能夠長(zhǎng)時(shí)間、低人工干預(yù)下處理軟件任務(wù)的智能系統(tǒng)。

Z.ai表示,GLM-5.1能夠在數(shù)百次迭代過(guò)程中保持穩(wěn)定性能,這一能力是其區(qū)別于其他在長(zhǎng)時(shí)任務(wù)中性能下滑模型的核心競(jìng)爭(zhēng)力。

以向量數(shù)據(jù)庫(kù)優(yōu)化任務(wù)為例,GLM-5.1經(jīng)過(guò)超過(guò)600次迭代、6000次工具調(diào)用,最終將查詢速度提升至每秒21500次,約為單次50輪會(huì)話最佳結(jié)果的六倍。

在一份研究報(bào)告中,Z.ai指出GLM-5.1在多項(xiàng)軟件工程基準(zhǔn)測(cè)試上超越了其前代產(chǎn)品GLM-5,在代碼倉(cāng)庫(kù)生成、終端問(wèn)題求解和反復(fù)代碼優(yōu)化等方面表現(xiàn)尤為突出。該公司表示,GLM-5.1在SWE-Bench Pro基準(zhǔn)測(cè)試中得分為58.4,而GLM-5為55.1,同時(shí)也高于OpenAI GPT-5.4、Anthropic Opus 4.6以及谷歌Gemini 3.1 Pro在該基準(zhǔn)上的得分。

GLM-5.1已在MIT許可證下開(kāi)源發(fā)布,可通過(guò)Z.ai的開(kāi)發(fā)者平臺(tái)獲取,模型權(quán)重也已公開(kāi),支持本地部署。這對(duì)那些希望在部署AI工具時(shí)掌握更多控制權(quán)的企業(yè)而言具有較大吸引力。

Z.ai表示,與在長(zhǎng)時(shí)會(huì)話中性能逐漸下降的模型相比,長(zhǎng)時(shí)運(yùn)行下的穩(wěn)定表現(xiàn)是其核心差異化優(yōu)勢(shì)。

業(yè)內(nèi)分析人士指出,目前許多模型在經(jīng)過(guò)相對(duì)較少的對(duì)話輪次后仍會(huì)出現(xiàn)性能停滯或偏移,這限制了其在復(fù)雜多步驟軟件任務(wù)中的實(shí)用價(jià)值。

Pareekh Consulting首席執(zhí)行官Pareekh Jain表示,行業(yè)正在從能夠回答提示詞的工具,轉(zhuǎn)向能夠在較少人工監(jiān)督下完成更長(zhǎng)期任務(wù)的系統(tǒng)。他認(rèn)為,問(wèn)題已不再是"我能問(wèn)AI什么",而是"我能讓它在未來(lái)八小時(shí)內(nèi)完成什么任務(wù)"。

對(duì)于企業(yè)而言,這意味著未來(lái)或許可以在早上將一個(gè)工單交給智能體,經(jīng)過(guò)數(shù)百次實(shí)驗(yàn)和代碼性能分析后,在當(dāng)天結(jié)束時(shí)收到經(jīng)過(guò)優(yōu)化的解決方案。

Forrester副總裁兼首席分析師Charlie Dai表示:"這一能力契合了大規(guī)模代碼重構(gòu)、系統(tǒng)遷移項(xiàng)目和持續(xù)故障處理等真實(shí)需求,表明長(zhǎng)時(shí)運(yùn)行的自主智能體正逐漸走向?qū)嵱?,前提是企業(yè)需要在治理、監(jiān)控和升級(jí)機(jī)制上做好配套,以有效管控風(fēng)險(xiǎn)。"

GLM-5.1采用MIT許可證發(fā)布,對(duì)于受監(jiān)管行業(yè)或?qū)Π踩舾械钠髽I(yè)而言具有重要意義。

Jain認(rèn)為這體現(xiàn)在四個(gè)關(guān)鍵維度:第一是成本,其定價(jià)遠(yuǎn)低于高端商業(yè)模型,自托管部署也讓企業(yè)可以管控費(fèi)用,而非按使用量付費(fèi);第二是數(shù)據(jù)治理,敏感代碼和數(shù)據(jù)無(wú)需發(fā)送至外部API,這在金融、醫(yī)療和國(guó)防等行業(yè)至關(guān)重要;第三是可定制性,企業(yè)可以根據(jù)自身代碼庫(kù)和內(nèi)部工具對(duì)模型進(jìn)行定制,不受任何限制。

第四個(gè)因素,Jain指出,是地緣政治風(fēng)險(xiǎn)。盡管該模型是開(kāi)源的,但其與中國(guó)基礎(chǔ)設(shè)施及相關(guān)實(shí)體的關(guān)聯(lián)仍可能引發(fā)部分美國(guó)企業(yè)的合規(guī)顧慮。

Dai表示,MIT許可證讓企業(yè)更便于在自有系統(tǒng)上部署運(yùn)行該模型,并根據(jù)內(nèi)部需求和治理政策進(jìn)行調(diào)整。他認(rèn)為:"對(duì)于許多買家而言,GLM-5.1在商業(yè)模型之外提供了一個(gè)可行的戰(zhàn)略選項(xiàng),尤其是在監(jiān)管約束、知識(shí)產(chǎn)權(quán)敏感性或長(zhǎng)期平臺(tái)控制最為重要的場(chǎng)景下。"

Z.ai在評(píng)測(cè)中引用了三項(xiàng)基準(zhǔn)測(cè)試:SWE-Bench Pro(測(cè)試復(fù)雜軟件工程任務(wù))、NL2Repo(評(píng)估代碼倉(cāng)庫(kù)生成能力)以及Terminal-Bench 2.0(評(píng)估真實(shí)終端環(huán)境中的問(wèn)題解決能力)。

Omdia首席分析師Lian Jye Su表示:"這些基準(zhǔn)測(cè)試專為考察編程智能體的高級(jí)編程能力而設(shè)計(jì),在這些測(cè)試中名列前茅,反映了強(qiáng)勁的編程性能表現(xiàn),例如從規(guī)劃到執(zhí)行的可靠性、更少的提示詞反復(fù)調(diào)整以及更快的交付速度。然而,這些測(cè)試與典型的企業(yè)現(xiàn)實(shí)環(huán)境仍存在一定距離。"

Su指出,公開(kāi)基準(zhǔn)測(cè)試仍無(wú)法還原專有代碼庫(kù)、遺留系統(tǒng)和代碼審查流程的復(fù)雜現(xiàn)狀。他補(bǔ)充道,基準(zhǔn)測(cè)試結(jié)果來(lái)自受控環(huán)境,與生產(chǎn)環(huán)境存在差距,不過(guò)隨著越來(lái)越多的團(tuán)隊(duì)引入智能體架構(gòu),這一差距正在逐步縮小。

Q&A

Q1:GLM-5.1與其他編程模型相比,最大的優(yōu)勢(shì)是什么?

A:GLM-5.1的核心優(yōu)勢(shì)在于長(zhǎng)時(shí)運(yùn)行下的穩(wěn)定性能。許多現(xiàn)有模型在較少輪次后性能就會(huì)下滑,而GLM-5.1可以在數(shù)百次迭代中持續(xù)運(yùn)行,例如在向量數(shù)據(jù)庫(kù)優(yōu)化任務(wù)中,經(jīng)過(guò)超過(guò)600次迭代后仍能持續(xù)提升,最終查詢速度約是單次50輪會(huì)話最佳結(jié)果的六倍。

Q2:GLM-5.1開(kāi)源對(duì)企業(yè)有什么實(shí)際意義?

A:GLM-5.1采用MIT許可證開(kāi)源,企業(yè)可以本地部署,主要帶來(lái)四方面好處:降低成本(無(wú)需按調(diào)用量付費(fèi))、保障數(shù)據(jù)安全(敏感代碼無(wú)需上傳外部API)、支持自定義(可根據(jù)內(nèi)部代碼庫(kù)靈活調(diào)整),以及一定程度規(guī)避云端依賴風(fēng)險(xiǎn)。對(duì)金融、醫(yī)療等監(jiān)管嚴(yán)格的行業(yè)尤其適用。

Q3:GLM-5.1在基準(zhǔn)測(cè)試中的表現(xiàn)如何?這些成績(jī)能代表真實(shí)能力嗎?

A:GLM-5.1在SWE-Bench Pro上得分58.4,高于前代GLM-5的55.1,也超過(guò)了OpenAI GPT-5.4、Anthropic Opus 4.6和谷歌Gemini 3.1 Pro的得分。不過(guò)分析師指出,這些基準(zhǔn)測(cè)試基于受控環(huán)境,尚無(wú)法完全反映企業(yè)真實(shí)場(chǎng)景中的遺留系統(tǒng)、專有代碼庫(kù)等復(fù)雜情況,實(shí)際落地效果仍需結(jié)合具體業(yè)務(wù)驗(yàn)證。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
雷軍將全程參與新一代小米SU7京滬續(xù)航直播:15小時(shí),“1265公里中間只充一次電”

雷軍將全程參與新一代小米SU7京滬續(xù)航直播:15小時(shí),“1265公里中間只充一次電”

鳳凰網(wǎng)科技
2026-04-16 13:47:07
Lululemon“避孕門”曝光!3億中產(chǎn)天塌了!

Lululemon“避孕門”曝光!3億中產(chǎn)天塌了!

廣告案例精選
2026-04-16 08:28:23
英媒:趙心童是打破克魯斯堡魔咒最佳人選,很快就能世界排名第一

英媒:趙心童是打破克魯斯堡魔咒最佳人選,很快就能世界排名第一

楊華評(píng)論
2026-04-16 01:20:06
新《重案六組》最大雷點(diǎn):不是張一山太瘦,是“季潔”變成了甜妹

新《重案六組》最大雷點(diǎn):不是張一山太瘦,是“季潔”變成了甜妹

喵喵娛樂(lè)團(tuán)
2026-04-16 14:47:02
俄圖-454高調(diào)登場(chǎng),中C929穩(wěn)步前行,天空之爭(zhēng)誰(shuí)將勝出?

俄圖-454高調(diào)登場(chǎng),中C929穩(wěn)步前行,天空之爭(zhēng)誰(shuí)將勝出?

歲暮的歸南山
2026-04-17 06:49:43
零涂層電飯煲降價(jià)42%:松下這次押對(duì)了什么

零涂層電飯煲降價(jià)42%:松下這次押對(duì)了什么

我是一個(gè)粉刷匠2
2026-04-16 15:15:17
缺德到這種程度,已經(jīng)沒(méi)有半點(diǎn)“人性”了

缺德到這種程度,已經(jīng)沒(méi)有半點(diǎn)“人性”了

胖胖說(shuō)他不胖
2026-04-17 09:25:19
安心!海港外援加布里埃爾手術(shù)成功,妻子社媒發(fā)文報(bào)平安

安心!海港外援加布里埃爾手術(shù)成功,妻子社媒發(fā)文報(bào)平安

懂球帝
2026-04-16 19:39:06
第6艘船出事,美軍艦攔截成功,難題已拋給中國(guó),俄政府準(zhǔn)備救場(chǎng)

第6艘船出事,美軍艦攔截成功,難題已拋給中國(guó),俄政府準(zhǔn)備救場(chǎng)

萬(wàn)物知識(shí)圈
2026-04-17 07:17:13
收拾完伊朗,下一個(gè)輪到中國(guó)?中方送出5個(gè)字,斷了特朗普的念想

收拾完伊朗,下一個(gè)輪到中國(guó)?中方送出5個(gè)字,斷了特朗普的念想

春之寞陌
2026-04-17 02:52:21
浙金中心事件最新通報(bào):39人被抓捕,涉案金額高達(dá)229億

浙金中心事件最新通報(bào):39人被抓捕,涉案金額高達(dá)229億

資管裕道人
2026-04-15 21:21:04
華為回歸,小米“撤退”

華為回歸,小米“撤退”

鈦媒體APP
2026-04-16 19:17:33
每吃一次,血管就堵一截?醫(yī)生:這5種水果是腦?!凹铀倨鳌?>
    </a>
        <h3>
      <a href=每吃一次,血管就堵一截?醫(yī)生:這5種水果是腦梗“加速器” 荊醫(yī)生科普
2026-04-02 17:35:43
梅西升級(jí)梅老板!成功收購(gòu)科內(nèi)利亞,曾培養(yǎng)阿爾巴,李昊老東家

梅西升級(jí)梅老板!成功收購(gòu)科內(nèi)利亞,曾培養(yǎng)阿爾巴,李昊老東家

奧拜爾
2026-04-16 23:28:16
韓媒:180°反轉(zhuǎn),樊振東“最后時(shí)刻”回歸幫助中國(guó)男乒衛(wèi)冕?

韓媒:180°反轉(zhuǎn),樊振東“最后時(shí)刻”回歸幫助中國(guó)男乒衛(wèi)冕?

順靜自然
2026-04-16 18:51:41
歐爾班敗選后,克宮發(fā)言人佩斯科夫:我們和歐爾班從來(lái)不是朋友

歐爾班敗選后,克宮發(fā)言人佩斯科夫:我們和歐爾班從來(lái)不是朋友

古史青云啊
2026-04-16 09:57:10
以媒:從媒體上得知與黎停火 以色列高官又驚又怒

以媒:從媒體上得知與黎停火 以色列高官又驚又怒

環(huán)球網(wǎng)資訊
2026-04-17 06:28:16
1898 年,譚嗣同就義,他永遠(yuǎn)不知,自己的后人有多讓人心疼

1898 年,譚嗣同就義,他永遠(yuǎn)不知,自己的后人有多讓人心疼

小燕聊劇
2026-04-14 19:53:58
伊朗的通信設(shè)備突然集體“叛變”?真相令人脊背發(fā)涼

伊朗的通信設(shè)備突然集體“叛變”?真相令人脊背發(fā)涼

菁菁子衿
2026-04-15 20:21:08
四川內(nèi)江市資中縣發(fā)生4.4級(jí)地震 震源深度7千米

四川內(nèi)江市資中縣發(fā)生4.4級(jí)地震 震源深度7千米

極目新聞
2026-04-17 06:54:07
2026-04-17 10:20:49
至頂頭條 incentive-icons
至頂頭條
記錄和推動(dòng)數(shù)字化創(chuàng)新
17749文章數(shù) 49699關(guān)注度
往期回顧 全部

科技要聞

Anthropic推出Opus 4.7,坦言依不及Mythos

頭條要聞

小伙曾花80萬(wàn)開(kāi)店失敗被離婚:妻子覺(jué)得我很難翻身

頭條要聞

小伙曾花80萬(wàn)開(kāi)店失敗被離婚:妻子覺(jué)得我很難翻身

體育要聞

皇馬拜仁踢出名局,但最搶鏡的還是他

娛樂(lè)要聞

絲芭傳媒創(chuàng)始人王子杰去世,享年63歲

財(cái)經(jīng)要聞

海爾與醫(yī)美女王互撕 換血抗衰誰(shuí)的生意?

汽車要聞

空間大五個(gè)乘客都滿意?體驗(yàn)嵐圖泰山X8

態(tài)度原創(chuàng)

游戲
親子
本地
房產(chǎn)
公開(kāi)課

《地鐵2039》已上架Steam!全新概念圖公開(kāi)

親子要聞

6款寶寶營(yíng)養(yǎng)肉餅合集??補(bǔ)鐵補(bǔ)鈣 鮮嫩多汁

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

房產(chǎn)要聞

人人人人!封關(guān)后首屆消博會(huì),擠爆了!

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版