国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

把海外網(wǎng)友晃瞎的神秘大模型,還是中國制造。

0
分享至


今年春節(jié),這些大模型廠商屬于是一點(diǎn)寂寞也耐不住了。

輪流發(fā)射,啊不,應(yīng)該說是輪流在噴射新的模型出來。

除了萬眾矚目的 DeepSeek 還在憋氣,其他大模型公司都沒少閑著。。。

字節(jié)前幾天搞了個(gè) Seedance 2.0,靠著逼真的視頻效果先下一城。

而智譜則是在海外整了個(gè)新活:

經(jīng)常關(guān)注大模型發(fā)布的差友們這幾天應(yīng)該有刷到,前幾天,程序員非常愛用的 AI 聚合平臺(tái),Openrouter 那邊上架了一款匿名模型 —— Pony Alpha。


結(jié)果大家一上手使用后發(fā)現(xiàn)哥們是真能干事啊,定叫它好評(píng)如潮。


于是,熱情吃瓜的海外網(wǎng)友就開始了經(jīng)典的模型猜猜猜游戲,開始推測(cè)這個(gè)匿名模型是哪一家的手筆。


有說是 DeepSeek V4 的,也有說是 Grok 4.2 的,還有說是 llama 5 的。

還有人因?yàn)?Pony 這個(gè)代號(hào),直接開始猜它是騰訊的新模型的。。。

可以說是眾說紛紜。


而昨天,謎底正式揭曉了。

不裝了,我攤牌了。

這個(gè)化名為 pony 的新東西,正是來自于智譜的GLM-5,而且還是個(gè)開源的模型。


世超打開 GLM-5 的基準(zhǔn)測(cè)試成績翻了一下,在智譜最看中的代碼能力這塊,GLM-5 直接逼近了大家公認(rèn)的 AI 編碼冠軍,Claude Opus 4.5。


當(dāng)然,現(xiàn)在各種各樣的 AI 排行榜太多了,大家可能不太理解智譜這次測(cè)的這個(gè) CC-bench-V2 又是個(gè)啥排行榜,代表了啥?

我簡(jiǎn)單看了一下,智譜這次測(cè)的這個(gè) CC-bench-V2,主要考驗(yàn)的是你模型補(bǔ)全代碼的能力有多強(qiáng)。

說人話一點(diǎn),就是把模型丟到一個(gè)沒寫完的工程里,然后看它能不能自個(gè)兒哼哧哼哧把項(xiàng)目給做完。

這塊考的分越高,說明這次 GLM-5 處理復(fù)雜任務(wù)的能力越強(qiáng)。

眾所周知,現(xiàn)在大家想讓 AI 干的活那是越來越復(fù)雜,生成幾個(gè)簡(jiǎn)單的 Html 文件已經(jīng)難不倒這些 AI 大模型了。

而想要把大項(xiàng)目給做好,那就需要讓模型具備這種處理復(fù)雜任務(wù)的能力。

另外還有個(gè)有趣的測(cè)試結(jié)果是,GLM-5 發(fā)生幻覺概率非常低。

當(dāng)一個(gè)問題它不知道的時(shí)候,GLM-5 會(huì)有很大的概率直接說不知道,而不是原地開始胡編亂造。


給孩子教的非常實(shí)誠了屬于是。

既能干活,又不容易產(chǎn)生幻覺。。。GLM-5 的這波更新,屬于完全沖著要讓 AI 好好干活去整的。

在官網(wǎng)上世超還看到一個(gè)非常驚艷的案例,他們直接讓 GLM-5 復(fù)刻了一個(gè)我的世界。


我下過來體驗(yàn)了一下,發(fā)現(xiàn)整個(gè)游戲只需要依賴瀏覽器就能運(yùn)行。

能跑能挖能疊方塊,操作手感非常流暢。


看別人拿 GLM-5 給整的這么猛,世超決定自己也簡(jiǎn)單試一試。

先來點(diǎn)簡(jiǎn)單點(diǎn)的活,拿前兩天特別火的洗車問題來考考它。


我想洗車,我家距離洗車店只有 50 米,請(qǐng)問你推薦我走路去還是開車去呢?

別看這個(gè)問題簡(jiǎn)單,前幾天整懵了一堆大模型,不管是 DeepSeek 還是 OpenAI,還是其他的大模型。。。都全軍覆沒


這些大模型都覺得 50 米的距離太近了,誰開車啊,于是轉(zhuǎn)頭建議大家走路去洗車。。。


而 GLM-5 面對(duì)這個(gè)問題,則是直接看透了問題的本質(zhì) ——人不開車怎么洗車呢?然后完成了一波干凈利索的輸出。


當(dāng)然,這種簡(jiǎn)單的邏輯題不翻車只能算合格,接下來,世超準(zhǔn)備給它上點(diǎn)難度,看看它寫代碼的水平。

不知道差友們前段時(shí)間有沒看過一個(gè)叫《技能五子棋》的喜劇。

劇里的演員們就在傳統(tǒng)五子棋的基礎(chǔ)上,加入了各種各樣花里胡哨的技能元素。

比如,“飛沙走石” 這個(gè)技能,就是把棋盤上對(duì)方的一枚棋子給拿起來丟掉。


再比如“靜如止水”這個(gè)技能,就是給對(duì)面玩家上定身術(shù),讓他不能繼續(xù)下棋。

所以世超決定用 AI 來快速復(fù)刻一下這個(gè)整活游戲。

咱們就敲這么一段話,接下來全部交個(gè) GLM 自由發(fā)揮。


結(jié)果不到三分鐘,它就給我搓完了。


打開一看,整的還挺有模有樣的。。。


不但我要求它安排的四個(gè)技能都整上去了,還給自動(dòng)生成了另外四個(gè)技能。

但是仔細(xì)一玩就露餡了。

點(diǎn)擊了飛沙走石(移除對(duì)面一個(gè)棋子)的技能,把對(duì)面的棋子給扔掉了之后,

按理來說要么是我繼續(xù)下棋,要么是對(duì)面下棋對(duì)吧。

這兩種情況還在我的理解范圍中,AI 給我寫成哪種邏輯我都能理解。

但是 GLM 在這個(gè) A or B 的選擇題中,選了 or。

它讓我選擇給對(duì)面的棋子下到哪里,明顯是神志不清邏輯錯(cuò)亂了。


不過好在它也很聽勸,把我們的需求再和它復(fù)述一下,那它很快就能 Get 到我們想要什么效果。


這樣一來,我們就得到了一個(gè)可以和 AI 原地對(duì)戰(zhàn)的技能五子棋游戲。


坦白說,現(xiàn)在 AI 寫代碼早就不是什么稀奇事了,能寫出這種量級(jí)的 Demo 只能說是 GLM-5 的基本操作,還比較在世超的意料之中。

但比較遺憾的是,因?yàn)檫@次上手的時(shí)間實(shí)在太短,世超沒法拿那些真正復(fù)雜的業(yè)務(wù)代碼去狠狠“拷打”一下它,看看它在那種成百上千個(gè)文件的大項(xiàng)目里,是不是還能保持這種清醒。

不過大家別急,今年世超手頭正好攢了一堆復(fù)雜的爛攤子需求,準(zhǔn)備年后面慢慢丟給它去跑一跑。

等后面深度體驗(yàn)了一段時(shí)間,真的摸清了它的上限和脾氣,再來和大伙做個(gè)更詳細(xì)的匯報(bào)。

撰文:早起

編輯:江江 & 面線

美編:素描

圖片、資料來源:智譜官網(wǎng)、X、網(wǎng)絡(luò)


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
哈梅內(nèi)伊身亡,媒體爆料:內(nèi)塔尼亞胡去年訪問白宮時(shí)就想對(duì)其斬首

哈梅內(nèi)伊身亡,媒體爆料:內(nèi)塔尼亞胡去年訪問白宮時(shí)就想對(duì)其斬首

娛樂的宅急便
2026-03-01 17:54:47
在廁所吃飯、在衣柜里哭泣…她自爆留學(xué)時(shí)被種族歧視!

在廁所吃飯、在衣柜里哭泣…她自爆留學(xué)時(shí)被種族歧視!

奮斗在韓國
2026-02-28 16:48:38
伊朗再對(duì)美以基地發(fā)動(dòng)大規(guī)模襲擊

伊朗再對(duì)美以基地發(fā)動(dòng)大規(guī)模襲擊

財(cái)聯(lián)社
2026-03-01 12:32:05
金正恩:讓朝鮮人民每天都能吃到肉!

金正恩:讓朝鮮人民每天都能吃到肉!

微微熱評(píng)
2025-09-16 11:34:57
日本教室的鐘表,一天24小時(shí)?

日本教室的鐘表,一天24小時(shí)?

日本物語
2026-02-28 20:34:30
“體壇敗類”馬俊仁,強(qiáng)迫隊(duì)員集體切闌尾,親自為女隊(duì)員打禁藥

“體壇敗類”馬俊仁,強(qiáng)迫隊(duì)員集體切闌尾,親自為女隊(duì)員打禁藥

伴君終老
2026-02-27 21:52:24
那條救了中國人餐桌的魚,你可能根本不知道它的故事

那條救了中國人餐桌的魚,你可能根本不知道它的故事

富貴說
2026-02-26 20:49:42
武磊火線復(fù)出難救主 海港0比2國安再度無緣超級(jí)杯

武磊火線復(fù)出難救主 海港0比2國安再度無緣超級(jí)杯

上觀新聞
2026-03-01 18:18:10
孫穎莎如果拿下2026新加坡大滿貫冠軍,

孫穎莎如果拿下2026新加坡大滿貫冠軍,

小光侃娛樂
2026-03-01 14:05:03
2-0!國安奪新賽季首冠,3外援亮相1人表現(xiàn)驚艷,球隊(duì)防守存隱憂

2-0!國安奪新賽季首冠,3外援亮相1人表現(xiàn)驚艷,球隊(duì)防守存隱憂

體壇鑒春秋
2026-03-01 17:38:35
美國被爆警告敘利亞別用中國電信技術(shù) 敘通信部回應(yīng)

美國被爆警告敘利亞別用中國電信技術(shù) 敘通信部回應(yīng)

財(cái)聯(lián)社
2026-02-28 08:19:04
王一博“聊天記錄”辣眼睛,最大輸家是庫迪

王一博“聊天記錄”辣眼睛,最大輸家是庫迪

不正確
2026-02-28 18:44:26
好慘!香港知名演員新片激情戲被刪光,豐滿身材難現(xiàn)大銀幕

好慘!香港知名演員新片激情戲被刪光,豐滿身材難現(xiàn)大銀幕

眼底星碎
2026-03-01 11:31:34
以色列和美國聯(lián)合打擊伊朗多地,革命衛(wèi)隊(duì)會(huì)步哈馬斯后塵嗎?

以色列和美國聯(lián)合打擊伊朗多地,革命衛(wèi)隊(duì)會(huì)步哈馬斯后塵嗎?

火星宏觀
2026-02-28 17:28:30
“天眼”24小時(shí)掃描中東,美軍在中國衛(wèi)星面前,沒有任何秘密可言

“天眼”24小時(shí)掃描中東,美軍在中國衛(wèi)星面前,沒有任何秘密可言

八斗小先生
2026-03-01 08:52:57
?????我又上新聞聯(lián)播了

?????我又上新聞聯(lián)播了

AI進(jìn)化論花生
2026-02-13 15:09:15
你知道最禽獸的事是什么嗎?網(wǎng)友的故事讓人毛骨悚然!

你知道最禽獸的事是什么嗎?網(wǎng)友的故事讓人毛骨悚然!

特約前排觀眾
2026-02-28 00:15:03
無緣首進(jìn)500賽決賽!老將張帥苦戰(zhàn)三盤失利,止步梅里達(dá)站四強(qiáng)

無緣首進(jìn)500賽決賽!老將張帥苦戰(zhàn)三盤失利,止步梅里達(dá)站四強(qiáng)

全景體育V
2026-03-01 10:49:16
6億打水漂?投資人揭《美人魚2》不上映原因,劣跡藝人害慘周星馳

6億打水漂?投資人揭《美人魚2》不上映原因,劣跡藝人害慘周星馳

查爾菲的筆記
2025-09-02 00:48:54
1979年,巴基斯坦前總理被絞死,行刑前只留下一句話,毛主席生前最后見的人就是他

1979年,巴基斯坦前總理被絞死,行刑前只留下一句話,毛主席生前最后見的人就是他

老杉說歷史
2026-01-07 07:58:10
2026-03-01 19:08:49
差評(píng)XPIN incentive-icons
差評(píng)XPIN
用知識(shí)和觀點(diǎn)Debug the world!
10334文章數(shù) 489472關(guān)注度
往期回顧 全部

藝術(shù)要聞

這位荷蘭人的書法,看得人直冒冷汗,寫丑書的人看了無地自容!

頭條要聞

普京就哈梅內(nèi)伊遇害表示哀悼:一次無恥殺害

頭條要聞

普京就哈梅內(nèi)伊遇害表示哀悼:一次無恥殺害

體育要聞

火箭輸給熱火:烏度卡又輸斯波教練

娛樂要聞

《江山為聘》:吳謹(jǐn)言陳哲遠(yuǎn)燃炸朝堂

財(cái)經(jīng)要聞

中東局勢(shì)升級(jí) 如何影響A股、黃金和原油

科技要聞

小米超跑概念車全球首秀!殺入頂豪俱樂部

汽車要聞

理想汽車2月交付26421輛 歷史累計(jì)交付超159萬輛

態(tài)度原創(chuàng)

房產(chǎn)
旅游
教育
數(shù)碼
健康

房產(chǎn)要聞

濱江九小也來了!集齊海僑北+哈羅、寰島...江東教育要炸了!

旅游要聞

文旅新探|伊春鐵力:三月雪未央 林都嬉冬長

教育要聞

這題目做了真的是懵啊,還好老師講過

數(shù)碼要聞

小米首款追蹤器!小米Tag海外正式發(fā)布 兼容iOS 120元起

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

無障礙瀏覽 進(jìn)入關(guān)懷版