国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

太瘋狂了!“龍蝦”紅透A股,OpenClaw連更兩日,32款養(yǎng)蝦大模型集結(jié),創(chuàng)始人在線打假

0
分享至


智東西
作者 陳駿達(dá)
編輯 心緣

智東西3月9日報(bào)道,就在剛剛,OpenClaw發(fā)布了2025.3.8版本的更新,引入CLI備份能力、macOS遠(yuǎn)程網(wǎng)關(guān)令牌配置、ACP溯源功能,并修復(fù)了飛書插件安裝后重復(fù)提示下載的問題,進(jìn)一步優(yōu)化了OpenClaw框架的安全性、提升了與外部服務(wù)的集成深度。


▲OpenClaw2026.3.8更新(圖源:X平臺(tái))

這是兩天內(nèi)OpenClaw發(fā)布的第二次更新,就在昨天,OpenClaw一口氣推出300多條修復(fù)、27項(xiàng)變更和1項(xiàng)重大變更,OpenClaw官方更是發(fā)文稱:“我們不搞那種瑣碎的小版本發(fā)布?!?strong>言下之意就是:要搞就搞大的。


▲OpenClaw2026.3.7更新(圖源:X平臺(tái))

OpenClaw創(chuàng)始人Peter Steinberger還在3月7日順勢轉(zhuǎn)發(fā)了專用于評估大模型在OpenClaw智能體任務(wù)中表現(xiàn)的基準(zhǔn)測試PinchBench,從32款模型評出最新養(yǎng)龍蝦大模型排行榜。

其中排名前三的,有兩個(gè)都是國產(chǎn)模型,分別是MiniMax M2.1和Kimi K2.5。


▲Peter Steinberger轉(zhuǎn)發(fā)PinchBench(圖源:X平臺(tái))

英偉達(dá)創(chuàng)始人兼CEO黃仁勛在上周摩根士丹利TMT大會(huì)發(fā)出感嘆:“Linux花了30年才達(dá)到的成就,OpenClaw只用了3周?!?/strong>

雖然黃仁勛的表述可能有些夸張,不過事實(shí)是,自今年1月以來,OpenClaw的熱度迅速攀升。截至今天下午18點(diǎn),其GitHub星標(biāo)數(shù)量已經(jīng)達(dá)到27萬個(gè),超過了知名開源項(xiàng)目Linux、React,排名全球第一。


一系列圍繞OpenClaw的活動(dòng)、討論乃至“搞錢機(jī)會(huì)”多點(diǎn)開花。上周,在深圳,騰訊大廈門口免費(fèi)安裝OpenClaw的活動(dòng)排起長隊(duì),有騰訊員工評價(jià)這一盛況堪比春節(jié)發(fā)紅包,甚至連馬化騰都在朋友圈感嘆:“沒有想到會(huì)這么火”。


▲馬化騰感嘆OpenClaw熱度(圖源:雷鋒網(wǎng))

在美國紐約,一場以O(shè)penClaw為主題的ClawCon大會(huì)吸引了超1300人,從大學(xué)生、游戲開發(fā)者到硅谷程序員都紛紛報(bào)名,遠(yuǎn)超會(huì)場本身容量,600多人最后被拒之門外。一位參會(huì)者稱:“沒有人關(guān)心你本來是做什么的,大家只關(guān)心你在用OpenClaw Agent做什么?


▲ClawCon大會(huì)盛況(圖源:The Verge)

腦子活絡(luò)的網(wǎng)友已經(jīng)靠OpenClaw賺到第一桶金了,以O(shè)penClaw上門安裝為關(guān)鍵詞搜索,能找到不少帖子,一次上門安裝服務(wù)的價(jià)格在500元左右。有從業(yè)者甚至宣稱,短短數(shù)日內(nèi)憑借這門手藝賺了26萬元,不過這一數(shù)據(jù)的出處已經(jīng)無從考證。


▲MiniMax股價(jià)逼近1000港元(圖源:騰訊自選股)

爆火之中摻雜著混亂。

今年2月,工業(yè)和信息化部網(wǎng)絡(luò)安全威脅和漏洞信息共享平臺(tái)監(jiān)測發(fā)現(xiàn)OpenClaw開源AI Agent部分實(shí)例在默認(rèn)或不當(dāng)配置情況下存在較高安全風(fēng)險(xiǎn),極易引發(fā)網(wǎng)絡(luò)攻擊、信息泄露等安全問題。相關(guān)部門建議,在部署和應(yīng)用OpenClaw時(shí),應(yīng)充分核查公網(wǎng)暴露情況、權(quán)限配置及憑證管理情況,關(guān)閉不必要的公網(wǎng)訪問。

OpenClaw創(chuàng)始人Peter Steinberger昨天在X上親自下場手撕國內(nèi)社交平臺(tái)上的“李鬼”賬號(hào),明確強(qiáng)調(diào):OpenClaw目前在微博、B站沒有任何官方號(hào)。


▲Peter Steinberger在打假(圖源:X平臺(tái))

OpenClaw甚至帶動(dòng)了A股和港股市場中“龍蝦概念股”的瘋漲,A股優(yōu)刻得、博睿數(shù)據(jù)等漲停,港股MiniMax收盤漲23.77%,總市值突破3100億港元,智譜、云知聲等相關(guān)股跟漲。


一、OpenClaw框架大更新,安全與上下文成重點(diǎn)

OpenClaw項(xiàng)目在3月8日進(jìn)行的一次重磅更新,發(fā)布了300多條修復(fù)、27項(xiàng)變更和1項(xiàng)重大變更。貢獻(xiàn)者列表顯示,一共有194人參與,這對于一個(gè)開源項(xiàng)目來說已經(jīng)很多了。


OpenClaw在X平臺(tái)的官方賬號(hào),給這次更新劃了重點(diǎn):支持OpenAI、谷歌的新模型、優(yōu)化各大通訊平臺(tái)的兼容性問題、新增SecretRef安全驗(yàn)證以及新增可插拔上下文引擎等等,直指OpenClaw在日常使用中出現(xiàn)的多種痛點(diǎn),許多更新項(xiàng)目就是由用戶自己開發(fā)的,顯示出這一社區(qū)的活躍度。

這次更新解決了OpenClaw原版框架中無法自主選擇記憶管理插件的痛點(diǎn),還優(yōu)化了客戶端與Agent之間的通信協(xié)議的穩(wěn)定性,并提供持久性的Discord頻道與Telegram的綁定存儲(chǔ)。

中國開發(fā)者也貢獻(xiàn)了不少更新。OpenClaw在國內(nèi)常常與飛書一起搭配使用,但在與飛書生態(tài)的結(jié)合上還做得不是很好。國內(nèi)開發(fā)者@liuxiaopai-ai、@rexl2018、@kcinzgg和@aerelune等就提交多個(gè)更新,優(yōu)化了OpenClaw在飛書內(nèi)部進(jìn)行命令識(shí)別、消息交互、身份識(shí)別優(yōu)化時(shí)的效果。


對于飽受詬病的安全性問題,OpenClaw項(xiàng)目也進(jìn)行了查缺補(bǔ)漏。最重大的變更是,如今網(wǎng)關(guān)認(rèn)證不再允許模棱兩可的配置——當(dāng)同時(shí)設(shè)置了認(rèn)證令牌和密碼時(shí),系統(tǒng)會(huì)強(qiáng)制要求明確指定認(rèn)證模式,而不是讓系統(tǒng)猜測或允許兩者共存,從根源上杜絕了因配置歧義導(dǎo)致的安全漏洞或服務(wù)啟動(dòng)失敗。

OpenClaw的網(wǎng)關(guān)與模型驗(yàn)證現(xiàn)已支持SecretRef,這允許用戶以引用方式管理認(rèn)證令牌,而不再需要將明文密鑰直接寫在配置文件中。此外,系統(tǒng)為了防止信息意外外泄,移除了/status/models等用戶界面中的權(quán)限密鑰片段,并增加了在CLI輸入密碼時(shí)的硬化處理,避免密碼通過進(jìn)程列表泄露。

不過,除了底層框架的優(yōu)化之外,用OpenClaw搭建Agent也需要一個(gè)智慧的大腦,PinchBench的推出,正好為廣大用戶提供了一個(gè)標(biāo)準(zhǔn)。

二、Kilo Code推出“龍蝦基準(zhǔn)測試”,中國模型性價(jià)比突出

PinchBench目前包含23項(xiàng)不同類別的任務(wù),比如股票價(jià)格研究、文檔摘要、文件結(jié)構(gòu)創(chuàng)建、多步復(fù)雜工作流等,為的是全面評估模型在OpenClaw框架下完成編程、辦公、創(chuàng)作等多類型任務(wù)的能力。

目前,已經(jīng)有超30款模型參與了這一基準(zhǔn)測試。值得一提的是,中國模型展現(xiàn)出明顯的性能與價(jià)格優(yōu)勢。

在正確率榜單的前10名中,來自谷歌的Gemini 3 Flash Preview拿下第一,而MiniMax M2.1和Kimi K2.5分列第二、第三,接下來是來自谷歌、OpenAI和Anthropic的多款模型,阿里的Qwen3 Coder Next位列第十。


在性價(jià)比方面,中國模型的優(yōu)勢更為明顯。比如,MiniMax M2.1與Gemini 3 Flash Preview的正確率差距為1.5%,而MiniMax M2.1的成本只有Gemini 3 Flash Preview的大約1/10;Kimi K2.5的表現(xiàn)超過了Claude Opus 4.6,而價(jià)格僅為后者的零頭。


分?jǐn)?shù)之外,這些模型在具體場景的表現(xiàn)究竟如何?

拿下準(zhǔn)確率榜第一的Gemini 3 Flash Preview參加了11項(xiàng)任務(wù)的測試,滿分11分,得分為10.5。在日歷填寫、編程和文件操作等任務(wù)中,Gemini 3 Flash Preview拿到了滿分成績,不過在理解、寫作等任務(wù)中出現(xiàn)瑕疵,而在上下文記憶檢索任務(wù)中其表現(xiàn)最差,得分僅為80%。


位列榜二的MiniMax M2.1同樣拿到10.5分的成績,在編程任務(wù)上,其得分略遜于Gemini 3 Flash Preview,在上下文記憶檢索任務(wù)其得分與Gemini 3 Flash Preview一致,都為80%。

在事實(shí)驗(yàn)證、寫作、研究等任務(wù)上,MiniMax M2.1拿到了滿分。此外,MiniMax M2.1在復(fù)雜多步驟工作流上的表現(xiàn)要比Gemini 3 Flash Preview好上3%,這類工作流在Agent任務(wù)中是極為常見的。


位列第三的Kimi K2.5拿下寫作、編程、研究等7項(xiàng)滿分,不過同樣在上下文記憶檢索任務(wù)中踩坑。看來,對目前的大模型而言,長上下文中的信息捕捉能力仍是有待提升的短板。


榜單上,還有幾款新發(fā)布的模型意外地表現(xiàn)不佳。比如,OpenAI最新發(fā)布的GPT-5.4任務(wù)正確率僅有76%,在總榜上排名第20,甚至不如2024年發(fā)布的GPT-4o。

其在上下文記憶檢索任務(wù)、復(fù)雜工作流、信息理解上的正確率僅有70%左右,在文檔總結(jié)、記憶兩項(xiàng)測試中得分為零。


Qwen3 Max Thinking的任務(wù)正確率僅有46%,在部分涉及文件操作、腳本撰寫的任務(wù)上未能成功執(zhí)行,拿了零分。


從PinchBench的初步測評結(jié)果來看,我們已經(jīng)能總結(jié)出一些共性特點(diǎn)。

對于Agent這一任務(wù)場景來說,并不是模型越大就越好,也不是越新越好。許多進(jìn)入正確率排名前十的模型都不是最大、最強(qiáng)的版本,比如Gemini 3 Flash Preview的成績要優(yōu)于Gemini 3 Pro Preview,Claude Haiku 4.5的得分要優(yōu)于Claude Opus 4.6。

在Agent任務(wù)中,尤其是多步驟工作流、文件操作、編程等,模型通常需要多次調(diào)用工具或與環(huán)境交互。在這些任務(wù)中,輕量級模型更快的推理速度與響應(yīng)延遲,以及更短的思考長度,可能提升了整個(gè)工作流的穩(wěn)定性和成功率。

結(jié)語:OpenClaw熱度不減,開源生態(tài)持續(xù)推高熱度

以O(shè)penClaw為代表的Agent框架,正深刻影響著大模型行業(yè)的方方面面。比如,衡量模型在OpenClaw中表現(xiàn)的基準(zhǔn)測試“PinchBench”,未來有可能成為指導(dǎo)模型開發(fā)商優(yōu)化模型能力的重要參考,以便讓模型更好地適應(yīng)Agent工作流。

同時(shí),OpenClaw也在不斷補(bǔ)齊自身的安全與兼容性短板。OpenClaw的開源特性讓全球開發(fā)者都可以參與到這一框架的優(yōu)化過程中。隨著更多技術(shù)力量的匯入,這股“養(yǎng)龍蝦”的熱潮或許仍將持續(xù)發(fā)酵。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
東莞人挺??!冷空氣+大暴雨馬上殺到!

東莞人挺??!冷空氣+大暴雨馬上殺到!

東莞好生活
2026-03-10 12:49:26
十天狂轟3400次!美以還打不動(dòng)伊朗,兩大強(qiáng)國一出手“打懵”白宮

十天狂轟3400次!美以還打不動(dòng)伊朗,兩大強(qiáng)國一出手“打懵”白宮

科普100克克
2026-03-10 14:58:11
日韓股市開盤全線反攻 韓國綜合指數(shù)一度暴漲超5% 特朗普:將取消一些與石油相關(guān)的制裁

日韓股市開盤全線反攻 韓國綜合指數(shù)一度暴漲超5% 特朗普:將取消一些與石油相關(guān)的制裁

每日經(jīng)濟(jì)新聞
2026-03-10 10:38:57
男子釣獲變異紅紋豬麻鋸,釣魚十幾年沒見過!網(wǎng)友:吃了會(huì)登仙!

男子釣獲變異紅紋豬麻鋸,釣魚十幾年沒見過!網(wǎng)友:吃了會(huì)登仙!

貍貓之一的動(dòng)物圈
2026-03-07 10:02:36
曝2025年“印度產(chǎn)”iPhone 達(dá)5500萬部

曝2025年“印度產(chǎn)”iPhone 達(dá)5500萬部

環(huán)球網(wǎng)資訊
2026-03-10 15:25:22
什么糕點(diǎn)最傷胃?是桃酥嗎?醫(yī)生提醒:5種糕點(diǎn)老年人要少吃

什么糕點(diǎn)最傷胃?是桃酥嗎?醫(yī)生提醒:5種糕點(diǎn)老年人要少吃

華庭講美食
2026-03-09 19:32:51
偉偉道來 | 伊朗降溫美以升級,戰(zhàn)爭進(jìn)入第二階段

偉偉道來 | 伊朗降溫美以升級,戰(zhàn)爭進(jìn)入第二階段

經(jīng)濟(jì)觀察報(bào)
2026-03-09 16:20:16
54歲艾美獎(jiǎng)女演員下海:僅用75分鐘還清房貸

54歲艾美獎(jiǎng)女演員下海:僅用75分鐘還清房貸

小椰的奶奶
2026-03-08 21:03:06
欠中國的錢,委內(nèi)瑞拉不還了?美財(cái)長:中國已無法繼續(xù)獲得委石油

欠中國的錢,委內(nèi)瑞拉不還了?美財(cái)長:中國已無法繼續(xù)獲得委石油

萌城少年強(qiáng)
2026-01-22 12:47:40
李宗仁去世后,胡友松被送去改造,周總理:放不下一個(gè)胡友松嗎

李宗仁去世后,胡友松被送去改造,周總理:放不下一個(gè)胡友松嗎

芊芊子吟
2026-02-03 09:40:07
史詩狂怒行動(dòng)第二階段:地下戰(zhàn)爭

史詩狂怒行動(dòng)第二階段:地下戰(zhàn)爭

南文視界
2026-03-08 22:59:27
公布了!1332人遇難!內(nèi)塔尼亞胡或被關(guān)進(jìn)大牢,特朗普開始急了

公布了!1332人遇難!內(nèi)塔尼亞胡或被關(guān)進(jìn)大牢,特朗普開始急了

史智文道
2026-03-10 10:48:08
你聽過最勁爆的瓜是啥?網(wǎng)友:被大八歲的補(bǔ)習(xí)班老師表白了

你聽過最勁爆的瓜是啥?網(wǎng)友:被大八歲的補(bǔ)習(xí)班老師表白了

帶你感受人間冷暖
2025-11-26 00:10:06
見過什么毀三觀的事網(wǎng)友講述自身經(jīng)歷,真的是很毀三觀。

見過什么毀三觀的事網(wǎng)友講述自身經(jīng)歷,真的是很毀三觀。

侃神評故事
2026-03-09 19:30:03
快船126-118尼克斯!保羅被扎心,加蘭存瑕疵,倫納德也把話挑明

快船126-118尼克斯!保羅被扎心,加蘭存瑕疵,倫納德也把話挑明

魚崖大話籃球
2026-03-10 15:07:52
騰訊版小龍蝦致歉

騰訊版小龍蝦致歉

知知貴陽
2026-03-10 12:13:12
北大醫(yī)學(xué)專家胡大一:睡覺,一個(gè)讓你延長生命的革命性新秘方

北大醫(yī)學(xué)專家胡大一:睡覺,一個(gè)讓你延長生命的革命性新秘方

新浪財(cái)經(jīng)
2026-03-10 00:31:51
哥勸我婚前留退路,我做財(cái)產(chǎn)公證,老公轉(zhuǎn)150萬給小姑子時(shí)傻眼

哥勸我婚前留退路,我做財(cái)產(chǎn)公證,老公轉(zhuǎn)150萬給小姑子時(shí)傻眼

九哥哥車評
2026-03-10 04:36:00
羅永浩評三星S26 Ultra防窺屏:手機(jī)行業(yè)久違的創(chuàng)新

羅永浩評三星S26 Ultra防窺屏:手機(jī)行業(yè)久違的創(chuàng)新

CNMO科技
2026-03-09 13:37:17
女子報(bào)警稱被強(qiáng)奸兩次,警方立馬出動(dòng),男子:她自己脫的衣服

女子報(bào)警稱被強(qiáng)奸兩次,警方立馬出動(dòng),男子:她自己脫的衣服

沒有偏旁的常慶
2026-03-08 08:50:05
2026-03-10 17:07:00
智東西 incentive-icons
智東西
聚焦智能變革,服務(wù)產(chǎn)業(yè)升級。
11332文章數(shù) 116991關(guān)注度
往期回顧 全部

財(cái)經(jīng)要聞

全民"養(yǎng)龍蝦"背后 第一批受害者浮現(xiàn)

頭條要聞

特朗普稱已考慮接替穆杰塔巴的人選 外交部表態(tài)

頭條要聞

特朗普稱已考慮接替穆杰塔巴的人選 外交部表態(tài)

體育要聞

加蘭沒那么差,但鱸魚會(huì)用嗎?

娛樂要聞

肖戰(zhàn)首奪SMG視帝,孫儷四封視后創(chuàng)歷史

科技要聞

全民"養(yǎng)蝦"背后:大廠集體下場瘋狂賣Token

汽車要聞

蔚來換電和理想5C,誰能硬剛,比亞迪兆瓦閃充?

態(tài)度原創(chuàng)

健康
家居
教育
旅游
藝術(shù)

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

家居要聞

自然肌理 溫度質(zhì)感婚房

教育要聞

全員加速中!

旅游要聞

解決游客索道排隊(duì),峨眉山景區(qū)今起開啟觀光車分時(shí)預(yù)約

藝術(shù)要聞

30000畝杏花開了,新疆的春天這么美!

無障礙瀏覽 進(jìn)入關(guān)懷版