国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

智譜IPO敲鐘前,連夜把開源編程大模型SOTA了

0
分享至

魚羊 henry 發(fā)自 麥蒿寺
量子位 | 公眾號 QbitAI

2025倒計時,新SOTA模型涌現(xiàn)沒有放緩跡象。

一夜之間,編程SOTA模型易主,而且上線即開源,依然來自中國大模型公司——

智譜AI,GLM-4.7。



這波更新,技術(shù)報告里滿眼都是Coding,Coding,還是Coding。

而能力的提升,帶來的最直觀效果是:

AIME 25和人類最后考試(HLE)等基準中,GLM-4.7分數(shù)超GPT-5.1;

SWE-Bench分數(shù)達(73.8%,+5.8%),創(chuàng)開源新高。

官方Demo顯示,寫個植物大戰(zhàn)僵尸不費勁:



總而言之,模型這么一發(fā),雙旦的節(jié)慶氛圍一下到位了(doge)。



官網(wǎng)Chatbot和API均已就位,現(xiàn)在就能在線開玩。

Demo來吧,展示

在前端生成質(zhì)量上,GLM-4.7展現(xiàn)出明顯升級:頁面結(jié)構(gòu)更干凈、組件層級更清晰。



相比GLM-4.6,更像是現(xiàn)代的Web UI,網(wǎng)友元素中更加美觀。





在PPT與視覺物料生成方面,GLM-4.7標題層級明確、元素尺寸更合理。



在復雜幾何結(jié)構(gòu)與空間關(guān)系的表達上,GLM-4.7模型能夠保持較好的結(jié)構(gòu)一致性與細節(jié)穩(wěn)定性。





3D資產(chǎn)的生成質(zhì)量也有顯著提升。





刷新開源SOTA

這次最新的模型主打編程,相較前代GLM-4.6,GLM-4.7在編碼能力、交互體驗與復雜推理等多個維度實現(xiàn)了系統(tǒng)性升級。



  • 復雜推理能力(Reasoning):全面提升,HLE(含工具)42.8(+12.4 vs GLM-4.6),MMUL-Pro 84.3,GPQA-Diamond 85.7,數(shù)學與推理能力更穩(wěn)更強。
  • 核心編碼能力(Code Agent):多語言與終端任務(wù)顯著增強,SWE-bench Verified 73.8(+5.8)、SWE-bench Multilingual 66.7(+12.9)、Terminal Bench 2.0 41.0(+16.5),支持“先思考、再行動”模式。
  • 工具使用能力(General Agent):工具調(diào)用更高效,BrowseComp 52.0(+6.9)、BrowseComp w/ Context Management 67.5(+10.0)、τ2-Bench 87.4(+12.2),網(wǎng)頁瀏覽與工具鏈管理表現(xiàn)更優(yōu)。

此外,GLM-4.7在對話、創(chuàng)意寫作、角色扮演等場景中同樣有提升,系統(tǒng)性增強了編碼、推理與工具使用能力。



交錯式思考和保留式思考

技術(shù)方面,GLM-4.7強化了自GLM-4.5起引入的交錯式思考(Interleaved Thinking),并進一步引入了保留式思考(Preserved thinking)和輪級思考(Turn-level Thinking)。

交錯式思考

GLM在工具調(diào)用之間、收到工具結(jié)果之后繼續(xù)思考。

這讓模型能夠進行更復雜的分布推理,提升了指令遵從和生成質(zhì)量:

在決定下一步行動前先解讀每次的工具輸出,把多次工具調(diào)用和推理步驟串聯(lián)起來,并根據(jù)中間結(jié)果做出更細粒度的決策。



保留式思考

在編碼場景中,GLM-4.7引入了一種新的思考模式:

模型會自動在多回合對話中保留所有思考快,復用已有推理而不是從頭重新推理。這減少了信息丟失和不一致性,使得模型更適用于長程、復雜任務(wù)。還能在真實任務(wù)中節(jié)省更多tokens。



輪級思考

輪級思考是一種按輪控制推理計算的能力,即在同一個會話中,每一輪請求都可以獨立選擇開啟/關(guān)閉思考。

這使得GLM-4.7具備以下優(yōu)勢:

  • 更靈活的成本/時延控制:對“問個事實/改個措辭”等輕量輪次可關(guān)閉思考,追求快速響應(yīng);對“復雜規(guī)劃/多約束推理/代碼調(diào)試”等重任務(wù)輪次可開啟思考,提升正確率與穩(wěn)定性。
  • 更順滑的多輪體驗:思考開關(guān)在會話內(nèi)可隨時切換,模型能在不同輪次間保持對話連貫與輸出風格一致,讓用戶感覺“聰明時更聰明、簡單時更快”。
  • 更適合Agent/工具調(diào)用場景:在需要快速執(zhí)行的工具輪次可降低推理開銷,在需要綜合工具結(jié)果做決策的輪次再開啟深度思考,實現(xiàn)效率與質(zhì)量的動態(tài)平衡。



更多技術(shù)詳情,智譜官方也附上了詳細技術(shù)報告。

BTW,智譜這個月還真上了“節(jié)日限定優(yōu)惠”。



每月最低20元即可暢享GLM-4.7,用上Claude Pro套餐3倍用量。



又是一位好價格屠夫呀。



而且GLM-4.7的深夜炸場,也算是已經(jīng)沖刺IPO上市的智譜,帶來的最新技術(shù)證明。

目前智譜已經(jīng)通過了港交所上市聆訊,IPO敲鐘僅剩下最后100米。

而GLM-4.7可能也是智譜上市之前,最重要的模型更新了……吧?

[1]https://z.ai/blog/glm-4.7

[2]https://x.com/Zai_org/status/2003156119087382683

— 完 —

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
司曉迪高清照片無碼流出,一人睡遍整個娛樂圈頂流?看完太炸裂了

司曉迪高清照片無碼流出,一人睡遍整個娛樂圈頂流?看完太炸裂了

烏娛子醬
2026-01-06 14:19:18
網(wǎng)傳某國產(chǎn)操作系統(tǒng)大廠老董開除核心工程師,理由竟是 “沒穿西裝”

網(wǎng)傳某國產(chǎn)操作系統(tǒng)大廠老董開除核心工程師,理由竟是 “沒穿西裝”

可達鴨面面觀
2026-01-08 19:48:13
演員賈一平近況曝光:已移居美國,住別墅開路虎,又黑又老認不出

演員賈一平近況曝光:已移居美國,住別墅開路虎,又黑又老認不出

阿器談史
2026-01-07 16:33:51
女子酒后跳河自殺身亡,孩子才兩歲半!丈夫向共同飲酒者和出租車司機索賠被駁回

女子酒后跳河自殺身亡,孩子才兩歲半!丈夫向共同飲酒者和出租車司機索賠被駁回

紅星新聞
2026-01-08 21:46:42
美國被爆對委內(nèi)瑞拉動手背后,暗藏一個更大圖謀!

美國被爆對委內(nèi)瑞拉動手背后,暗藏一個更大圖謀!

環(huán)球時報國際
2026-01-08 20:56:04
資深編審、法史學者,北京工業(yè)大學副教授解錕逝世,年僅48歲

資深編審、法史學者,北京工業(yè)大學副教授解錕逝世,年僅48歲

澎湃新聞
2026-01-08 17:04:26
閆學晶好友孫濤再發(fā)聲:誰要是再敢說閆學晶的壞話,我就跟誰急

閆學晶好友孫濤再發(fā)聲:誰要是再敢說閆學晶的壞話,我就跟誰急

小徐講八卦
2026-01-08 09:00:40
國家明確2026債務(wù)新規(guī)!這6種債直接作廢,欠債人可以不用還了?

國家明確2026債務(wù)新規(guī)!這6種債直接作廢,欠債人可以不用還了?

今朝牛馬
2026-01-08 16:52:13
女子看胃病竟死于心臟手術(shù)?南通市第一人民醫(yī)院被指多項違規(guī),釀一級甲等醫(yī)療事故

女子看胃病竟死于心臟手術(shù)?南通市第一人民醫(yī)院被指多項違規(guī),釀一級甲等醫(yī)療事故

上游新聞
2026-01-08 19:57:05
隨著國足0-0伊拉克,澳大利亞2-1泰國,U23亞洲杯最新積分榜出爐

隨著國足0-0伊拉克,澳大利亞2-1泰國,U23亞洲杯最新積分榜出爐

侃球熊弟
2026-01-08 23:54:10
原形畢露?中國女籃第一人全場最差,拖累球隊連輸兩場倒數(shù)太尷尬

原形畢露?中國女籃第一人全場最差,拖累球隊連輸兩場倒數(shù)太尷尬

宗介說體育
2026-01-08 12:52:51
甜甜圈拿到綠卡了?“空氣如此香甜”,悲劇早已注定

甜甜圈拿到綠卡了?“空氣如此香甜”,悲劇早已注定

半耳聆
2026-01-08 18:07:43
42+35+33!33+32+30!NBA一生之敵誕生,最佳新秀要失去懸念了

42+35+33!33+32+30!NBA一生之敵誕生,最佳新秀要失去懸念了

世界體育圈
2026-01-08 10:20:39
丹麥國防部:若美國武力奪取格陵蘭島 丹麥士兵可“先開槍再請示”

丹麥國防部:若美國武力奪取格陵蘭島 丹麥士兵可“先開槍再請示”

財聯(lián)社
2026-01-08 14:40:05
美國媒體人:特朗普增加軍費表明美國可能正準備“世界大戰(zhàn)”

美國媒體人:特朗普增加軍費表明美國可能正準備“世界大戰(zhàn)”

新華社
2026-01-08 16:15:04
女大學生餐館訛錢后續(xù):正臉曝光很漂亮 家人輪番找店主 目的曝光

女大學生餐館訛錢后續(xù):正臉曝光很漂亮 家人輪番找店主 目的曝光

鋭娛之樂
2026-01-08 08:34:40
臨走前李在明涉臺表述更進一步,并提四大請求,中方應(yīng)對很有格局

臨走前李在明涉臺表述更進一步,并提四大請求,中方應(yīng)對很有格局

博覽歷史
2026-01-08 18:45:46
幼童將紙尿褲扔進火鍋?海底撈:鍋具廢棄處理,警方已依法處理當日在場監(jiān)護人

幼童將紙尿褲扔進火鍋?海底撈:鍋具廢棄處理,警方已依法處理當日在場監(jiān)護人

界面新聞
2026-01-08 20:45:02
臺飛行員出事失蹤已15小時,妻子絕望崩潰!臺網(wǎng)友:這兵誰還敢當

臺飛行員出事失蹤已15小時,妻子絕望崩潰!臺網(wǎng)友:這兵誰還敢當

李健政觀察
2026-01-07 23:49:11
為啥說生命的盡頭是玄學?網(wǎng)友:我去那家公司上班,后期公司就垮

為啥說生命的盡頭是玄學?網(wǎng)友:我去那家公司上班,后期公司就垮

帶你感受人間冷暖
2026-01-07 00:10:05
2026-01-09 04:40:49
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
11988文章數(shù) 176356關(guān)注度
往期回顧 全部

科技要聞

智譜拿下“全球大模型第一股”,憑什么

頭條要聞

采用俄羅斯的防空系統(tǒng) 委內(nèi)瑞拉防空體系因何失效

頭條要聞

采用俄羅斯的防空系統(tǒng) 委內(nèi)瑞拉防空體系因何失效

體育要聞

世乒賽銀牌得主,說自己夢里都是孫穎莎

娛樂要聞

抗戰(zhàn)劇《馬背搖籃》首播,獲觀眾好評

財經(jīng)要聞

微軟CTO韋青:未來人類會花錢"戒手機"

汽車要聞

從量變到"智"變 吉利在CES打出了五張牌

態(tài)度原創(chuàng)

游戲
本地
旅游
時尚
公開課

山寨《黑神話》續(xù)作上架 PS 商店 / 《GTA 6》或第三次跳票

本地新聞

1986-2026,一通電話的時空旅程

旅游要聞

告別 “門票依賴”!石林的轉(zhuǎn)型之路,給全國老牌景區(qū)上了一課

珍珠專場|| 無論18歲還是80歲,總是會為它再一次心動

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版