国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

太瘋狂了!“龍蝦”紅透A股,OpenClaw連更兩日,32款養(yǎng)蝦大模型集結,創(chuàng)始人在線打假

0
分享至


智東西
作者 陳駿達
編輯 心緣

智東西3月9日報道,就在剛剛,OpenClaw發(fā)布了2025.3.8版本的更新,引入CLI備份能力、macOS遠程網(wǎng)關令牌配置、ACP溯源功能,并修復了飛書插件安裝后重復提示下載的問題,進一步優(yōu)化了OpenClaw框架的安全性、提升了與外部服務的集成深度。


▲OpenClaw2026.3.8更新(圖源:X平臺)

這是兩天內(nèi)OpenClaw發(fā)布的第二次更新,就在昨天,OpenClaw一口氣推出300多條修復、27項變更和1項重大變更,OpenClaw官方更是發(fā)文稱:“我們不搞那種瑣碎的小版本發(fā)布?!?strong>言下之意就是:要搞就搞大的。


▲OpenClaw2026.3.7更新(圖源:X平臺)

OpenClaw創(chuàng)始人Peter Steinberger還在3月7日順勢轉發(fā)了專用于評估大模型在OpenClaw智能體任務中表現(xiàn)的基準測試PinchBench,從32款模型評出最新養(yǎng)龍蝦大模型排行榜。

其中排名前三的,有兩個都是國產(chǎn)模型,分別是MiniMax M2.1和Kimi K2.5。


▲Peter Steinberger轉發(fā)PinchBench(圖源:X平臺)

英偉達創(chuàng)始人兼CEO黃仁勛在上周摩根士丹利TMT大會發(fā)出感嘆:“Linux花了30年才達到的成就,OpenClaw只用了3周?!?/strong>

雖然黃仁勛的表述可能有些夸張,不過事實是,自今年1月以來,OpenClaw的熱度迅速攀升。截至今天下午18點,其GitHub星標數(shù)量已經(jīng)達到27萬個,超過了知名開源項目Linux、React,排名全球第一。


一系列圍繞OpenClaw的活動、討論乃至“搞錢機會”多點開花。上周,在深圳,騰訊大廈門口免費安裝OpenClaw的活動排起長隊,有騰訊員工評價這一盛況堪比春節(jié)發(fā)紅包,甚至連馬化騰都在朋友圈感嘆:“沒有想到會這么火”。


▲馬化騰感嘆OpenClaw熱度(圖源:雷鋒網(wǎng))

在美國紐約,一場以OpenClaw為主題的ClawCon大會吸引了超1300人,從大學生、游戲開發(fā)者到硅谷程序員都紛紛報名,遠超會場本身容量,600多人最后被拒之門外。一位參會者稱:“沒有人關心你本來是做什么的,大家只關心你在用OpenClaw Agent做什么?


▲ClawCon大會盛況(圖源:The Verge)

腦子活絡的網(wǎng)友已經(jīng)靠OpenClaw賺到第一桶金了,以OpenClaw上門安裝為關鍵詞搜索,能找到不少帖子,一次上門安裝服務的價格在500元左右。有從業(yè)者甚至宣稱,短短數(shù)日內(nèi)憑借這門手藝賺了26萬元,不過這一數(shù)據(jù)的出處已經(jīng)無從考證。


▲MiniMax股價逼近1000港元(圖源:騰訊自選股)

爆火之中摻雜著混亂。

今年2月,工業(yè)和信息化部網(wǎng)絡安全威脅和漏洞信息共享平臺監(jiān)測發(fā)現(xiàn)OpenClaw開源AI Agent部分實例在默認或不當配置情況下存在較高安全風險,極易引發(fā)網(wǎng)絡攻擊、信息泄露等安全問題。相關部門建議,在部署和應用OpenClaw時,應充分核查公網(wǎng)暴露情況、權限配置及憑證管理情況,關閉不必要的公網(wǎng)訪問。

OpenClaw創(chuàng)始人Peter Steinberger昨天在X上親自下場手撕國內(nèi)社交平臺上的“李鬼”賬號,明確強調:OpenClaw目前在微博、B站沒有任何官方號。


▲Peter Steinberger在打假(圖源:X平臺)

OpenClaw甚至帶動了A股和港股市場中“龍蝦概念股”的瘋漲,A股優(yōu)刻得、博睿數(shù)據(jù)等漲停,港股MiniMax收盤漲23.77%,總市值突破3100億港元,智譜、云知聲等相關股跟漲。


一、OpenClaw框架大更新,安全與上下文成重點

OpenClaw項目在3月8日進行的一次重磅更新,發(fā)布了300多條修復、27項變更和1項重大變更。貢獻者列表顯示,一共有194人參與,這對于一個開源項目來說已經(jīng)很多了。


OpenClaw在X平臺的官方賬號,給這次更新劃了重點:支持OpenAI、谷歌的新模型、優(yōu)化各大通訊平臺的兼容性問題、新增SecretRef安全驗證以及新增可插拔上下文引擎等等,直指OpenClaw在日常使用中出現(xiàn)的多種痛點,許多更新項目就是由用戶自己開發(fā)的,顯示出這一社區(qū)的活躍度。

這次更新解決了OpenClaw原版框架中無法自主選擇記憶管理插件的痛點,還優(yōu)化了客戶端與Agent之間的通信協(xié)議的穩(wěn)定性,并提供持久性的Discord頻道與Telegram的綁定存儲。

中國開發(fā)者也貢獻了不少更新。OpenClaw在國內(nèi)常常與飛書一起搭配使用,但在與飛書生態(tài)的結合上還做得不是很好。國內(nèi)開發(fā)者@liuxiaopai-ai、@rexl2018、@kcinzgg和@aerelune等就提交多個更新,優(yōu)化了OpenClaw在飛書內(nèi)部進行命令識別、消息交互、身份識別優(yōu)化時的效果。


對于飽受詬病的安全性問題,OpenClaw項目也進行了查缺補漏。最重大的變更是,如今網(wǎng)關認證不再允許模棱兩可的配置——當同時設置了認證令牌和密碼時,系統(tǒng)會強制要求明確指定認證模式,而不是讓系統(tǒng)猜測或允許兩者共存,從根源上杜絕了因配置歧義導致的安全漏洞或服務啟動失敗。

OpenClaw的網(wǎng)關與模型驗證現(xiàn)已支持SecretRef,這允許用戶以引用方式管理認證令牌,而不再需要將明文密鑰直接寫在配置文件中。此外,系統(tǒng)為了防止信息意外外泄,移除了/status/models等用戶界面中的權限密鑰片段,并增加了在CLI輸入密碼時的硬化處理,避免密碼通過進程列表泄露。

不過,除了底層框架的優(yōu)化之外,用OpenClaw搭建Agent也需要一個智慧的大腦,PinchBench的推出,正好為廣大用戶提供了一個標準。

二、Kilo Code推出“龍蝦基準測試”,中國模型性價比突出

PinchBench目前包含23項不同類別的任務,比如股票價格研究、文檔摘要、文件結構創(chuàng)建、多步復雜工作流等,為的是全面評估模型在OpenClaw框架下完成編程、辦公、創(chuàng)作等多類型任務的能力。

目前,已經(jīng)有超30款模型參與了這一基準測試。值得一提的是,中國模型展現(xiàn)出明顯的性能與價格優(yōu)勢。

在正確率榜單的前10名中,來自谷歌的Gemini 3 Flash Preview拿下第一,而MiniMax M2.1和Kimi K2.5分列第二、第三,接下來是來自谷歌、OpenAI和Anthropic的多款模型,阿里的Qwen3 Coder Next位列第十。


在性價比方面,中國模型的優(yōu)勢更為明顯。比如,MiniMax M2.1與Gemini 3 Flash Preview的正確率差距為1.5%,而MiniMax M2.1的成本只有Gemini 3 Flash Preview的大約1/10;Kimi K2.5的表現(xiàn)超過了Claude Opus 4.6,而價格僅為后者的零頭。


分數(shù)之外,這些模型在具體場景的表現(xiàn)究竟如何?

拿下準確率榜第一的Gemini 3 Flash Preview參加了11項任務的測試,滿分11分,得分為10.5。在日歷填寫、編程和文件操作等任務中,Gemini 3 Flash Preview拿到了滿分成績,不過在理解、寫作等任務中出現(xiàn)瑕疵,而在上下文記憶檢索任務中其表現(xiàn)最差,得分僅為80%。


位列榜二的MiniMax M2.1同樣拿到10.5分的成績,在編程任務上,其得分略遜于Gemini 3 Flash Preview,在上下文記憶檢索任務其得分與Gemini 3 Flash Preview一致,都為80%。

在事實驗證、寫作、研究等任務上,MiniMax M2.1拿到了滿分。此外,MiniMax M2.1在復雜多步驟工作流上的表現(xiàn)要比Gemini 3 Flash Preview好上3%,這類工作流在Agent任務中是極為常見的。


位列第三的Kimi K2.5拿下寫作、編程、研究等7項滿分,不過同樣在上下文記憶檢索任務中踩坑。看來,對目前的大模型而言,長上下文中的信息捕捉能力仍是有待提升的短板。


榜單上,還有幾款新發(fā)布的模型意外地表現(xiàn)不佳。比如,OpenAI最新發(fā)布的GPT-5.4任務正確率僅有76%,在總榜上排名第20,甚至不如2024年發(fā)布的GPT-4o。

其在上下文記憶檢索任務、復雜工作流、信息理解上的正確率僅有70%左右,在文檔總結、記憶兩項測試中得分為零。


Qwen3 Max Thinking的任務正確率僅有46%,在部分涉及文件操作、腳本撰寫的任務上未能成功執(zhí)行,拿了零分。


從PinchBench的初步測評結果來看,我們已經(jīng)能總結出一些共性特點。

對于Agent這一任務場景來說,并不是模型越大就越好,也不是越新越好。許多進入正確率排名前十的模型都不是最大、最強的版本,比如Gemini 3 Flash Preview的成績要優(yōu)于Gemini 3 Pro Preview,Claude Haiku 4.5的得分要優(yōu)于Claude Opus 4.6。

在Agent任務中,尤其是多步驟工作流、文件操作、編程等,模型通常需要多次調用工具或與環(huán)境交互。在這些任務中,輕量級模型更快的推理速度與響應延遲,以及更短的思考長度,可能提升了整個工作流的穩(wěn)定性和成功率。

結語:OpenClaw熱度不減,開源生態(tài)持續(xù)推高熱度

以OpenClaw為代表的Agent框架,正深刻影響著大模型行業(yè)的方方面面。比如,衡量模型在OpenClaw中表現(xiàn)的基準測試“PinchBench”,未來有可能成為指導模型開發(fā)商優(yōu)化模型能力的重要參考,以便讓模型更好地適應Agent工作流。

同時,OpenClaw也在不斷補齊自身的安全與兼容性短板。OpenClaw的開源特性讓全球開發(fā)者都可以參與到這一框架的優(yōu)化過程中。隨著更多技術力量的匯入,這股“養(yǎng)龍蝦”的熱潮或許仍將持續(xù)發(fā)酵。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
就在剛剛,臺當局正式宣布

就在剛剛,臺當局正式宣布

安安說
2026-03-23 10:58:47
房價上漲的最強信號!

房價上漲的最強信號!

米宅
2026-03-24 07:26:02
伊朗公布美軍基地遭襲前后對比照片

伊朗公布美軍基地遭襲前后對比照片

新京報
2026-03-24 07:23:01
剛剛,加息大消息!霍爾木茲,伊朗突然宣布!

剛剛,加息大消息!霍爾木茲,伊朗突然宣布!

中國基金報
2026-03-23 19:35:31
你追求的不是成功,是同學會式的顯擺

你追求的不是成功,是同學會式的顯擺

記憶承載
2026-03-22 12:50:17
嫦娥七號即將發(fā)射,中國有望成為全球首個在月球找到水的國家

嫦娥七號即將發(fā)射,中國有望成為全球首個在月球找到水的國家

顧史
2026-03-23 13:41:45
震驚!綿陽三臺縣五家地產(chǎn)商承諾,不再出售低于5000起的住宅…

震驚!綿陽三臺縣五家地產(chǎn)商承諾,不再出售低于5000起的住宅…

火山詩話
2026-03-23 08:40:59
國民黨大地震,不滿鄭麗文,馬英九將底牌亮出,要和蕭旭岑反目?

國民黨大地震,不滿鄭麗文,馬英九將底牌亮出,要和蕭旭岑反目?

DS北風
2026-03-24 01:22:06
法國專家預測伊朗戰(zhàn)爭將持續(xù)多久

法國專家預測伊朗戰(zhàn)爭將持續(xù)多久

參考消息
2026-03-23 15:32:14
特朗普:臺灣屬于中國,武統(tǒng)是中方的自由,但一動手美國會不高興

特朗普:臺灣屬于中國,武統(tǒng)是中方的自由,但一動手美國會不高興

共工之錨
2026-03-22 00:48:09
解雇整個醫(yī)療團隊!皇馬不滿姆巴佩治療問題,伯納烏“發(fā)怒了”

解雇整個醫(yī)療團隊!皇馬不滿姆巴佩治療問題,伯納烏“發(fā)怒了”

里芃芃體育
2026-03-24 09:50:11
以色列犯下致命錯誤,這3個命門,一定要守好

以色列犯下致命錯誤,這3個命門,一定要守好

毛豆論道
2026-03-22 14:07:41
全新奧迪A6L將于3月25日上市,重新定義C級旗艦座駕

全新奧迪A6L將于3月25日上市,重新定義C級旗艦座駕

澎湃新聞
2026-03-23 15:20:04
得到慘痛教訓的特朗普,讓以色列趕緊住手,不要再襲擊能源設施

得到慘痛教訓的特朗普,讓以色列趕緊住手,不要再襲擊能源設施

成視Talk
2026-03-24 09:41:00
小里夫斯:若阿德巴約能在文班亞馬手中砍30分,比打奇才83分更牛

小里夫斯:若阿德巴約能在文班亞馬手中砍30分,比打奇才83分更牛

好火子
2026-03-24 04:35:04
特朗普威脅退出北約,英國不慣著!不到48小時,英對美下達逐客令

特朗普威脅退出北約,英國不慣著!不到48小時,英對美下達逐客令

漫步獨行俠
2026-03-23 08:14:48
路威:庫里可以以角色球員身份加盟馬刺爭冠

路威:庫里可以以角色球員身份加盟馬刺爭冠

體壇周報
2026-03-23 18:37:16
俄副外長:普京訪華日期將于近期公布

俄副外長:普京訪華日期將于近期公布

環(huán)球網(wǎng)資訊
2026-03-23 17:54:53
兩省省政府常務副省長調整

兩省省政府常務副省長調整

起喜電影
2026-03-24 09:11:01
全世界的鼻子都要氣歪了

全世界的鼻子都要氣歪了

牛彈琴
2026-03-24 08:02:23
2026-03-24 10:23:00
智東西 incentive-icons
智東西
聚焦智能變革,服務產(chǎn)業(yè)升級。
11415文章數(shù) 117011關注度
往期回顧 全部

財經(jīng)要聞

很多人,都被黃金嚇怕了!

頭條要聞

特朗普"最后通牒"延期 美伊雙方不同反應引發(fā)外界猜測

頭條要聞

特朗普"最后通牒"延期 美伊雙方不同反應引發(fā)外界猜測

體育要聞

不敢放手一搏,你拿什么去爭冠?

娛樂要聞

鐘麗緹就女兒考拉爭議道歉:女兒還小

科技要聞

史上最大造芯計劃啟動,馬斯克胃口為何這么大

汽車要聞

東風雪鐵龍新凡爾賽C5X上市 官方一口價11.37萬起

態(tài)度原創(chuàng)

教育
數(shù)碼
旅游
本地
公開課

教育要聞

高考完檔案袋為啥不能拆?不小心拆了會怎么樣?

數(shù)碼要聞

愛馬仕推出Paddock Yoyo旅行便攜無線充電器,1750美元

旅游要聞

湖北襄陽一景區(qū)多名游客同日手機被盜,景區(qū)稱事發(fā)地為監(jiān)控盲區(qū)

本地新聞

這里是寶雞 嫽滴很!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版