国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

B站爆了!Hermes首度直播回應(yīng)「抄襲」,MiniMax提前殺入Harness賽點

0
分享至


新智元報道

編輯:好困 犀牛

【新智元導(dǎo)讀】跑分最高未必能贏,但最懂Harness的可以。如今,被Hermes、OpenClaw等全球爆火開源Agent項目「欽定」為默認(rèn)的MiniMax,在OpenRouter上的日均Token消耗已飆到3000億。

昨晚B站,一個老外用四個字炸了彈幕區(qū)。

不熟,勿Cue。


說這話的人是Tommy Eastman,全球最火開源Agent項目Hermes Agent的業(yè)務(wù)負責(zé)人。

首次來中國就被彈幕逼問「你們是不是抄了EvoMap」。

他的回應(yīng)原話是這樣的:

Hermes Agent的代碼倉庫已經(jīng)存在一年多了。直到那些推文出現(xiàn),我才聽說Evo Map。

Nous Research有長期產(chǎn)出前沿研究的記錄,我們是理念驅(qū)動的團隊,除了推動開源AI,不會做任何其他事情。

當(dāng)然,也不會去抄別人的倉庫然后據(jù)為己有。


和Tommy同框的,是MiniMax Agent首席架構(gòu)師阿島和研發(fā)工程師擇因。

爭議三分鐘就翻篇了,但接下來兩個多小時的技術(shù)對談,觸及了一個被忽視已久的問題。

當(dāng)模型能力趨于收斂,AI的下一個競爭維度在哪里?

人類成了瓶頸

現(xiàn)在,阿島的工作方式已經(jīng)變了。

去年九十月份,他已經(jīng)不怎么打開IDE了。日常工作狀態(tài)是同時并發(fā)五六個本地Agent,云端可能還有十個在沙箱里跑。

然后我發(fā)現(xiàn),人類成了瓶頸。

過去幾年,AI行業(yè)習(xí)慣了誰的模型參數(shù)更多、跑分更高的敘事。

但2026年初,OpenClaw一夜爆火,連老黃都在摩根士丹利的論壇上感嘆這可能是有史以來最重要的軟件。

所有人突然意識到,模型再強,不會用工具、不能真正干活,就只是一個聊天機器人。


一夜之間,行業(yè)焦點轉(zhuǎn)向了Harness。

Harness是Agent的運行框架,包括工具調(diào)用編排、記憶管理、Skills系統(tǒng)、沙箱環(huán)境等等。

在那篇全網(wǎng)瘋轉(zhuǎn)的博客「Harness Engineering」中,OpenAI給出了一個清晰的定義—人類掌舵,智能體執(zhí)行。



對此,阿島用高達做了個比喻。

模型是引擎,Harness就是那副機甲。但光有引擎造不出高達,還得有完整的外骨骼才能讓引擎能力最大化。

Claude Code過去兩個月的更新都在龍蝦化。cron定時、連接IM、遠程控制、memory文件夾……我1月初注意到OpenClaw時驚為天人,當(dāng)時團隊還不認(rèn)同。后來證明方向是對的。

行業(yè)在收斂到同一個方向上。

而阿島自己的感受比這更深一層。

我覺得我就是在被AI蒸餾。工程師構(gòu)建Harness的過程,就是把自己的工作方式蒸餾成Skill和代碼。

隨后他補充道,「當(dāng)然,這一切的目的是讓人類去做真正熱愛的事情。就像過去發(fā)明蒸汽機、發(fā)明電力一樣。」

MiniMax在這波浪潮中動作密集。短短幾周做了三件事,發(fā)布業(yè)界首個參與自我迭代的模型M2.7,推出全球首個云端沙箱MaxHermes,上線基于OpenClaw架構(gòu)的云端AI助手MaxClaw。

三者構(gòu)成了一個閉環(huán)。

M2.7從模型層為Harness持續(xù)優(yōu)化底層能力,MaxHermes和MaxClaw從產(chǎn)品層驗證真實場景需求,再反饋回模型訓(xùn)練。

MiniMax管這叫「Model + Harness」雙向飛輪。

Model × Harness

不卷跑分,卷Token

競爭的維度正在發(fā)生根本性轉(zhuǎn)變。過去比的是模型有多聰明,現(xiàn)在比的是同等Token能產(chǎn)出多少價值。

MiniMax的解法,是讓模型專門為Harness而生。

M2.7是3月18日發(fā)布的最新編程模型,也是第一個在訓(xùn)練過程中深度參與迭代自己的商用大模型。

MiniMax構(gòu)建了一套內(nèi)部Agent Harness,讓M2.7作為Agent在其中運行,包含短時記憶、自反饋、自優(yōu)化三個核心模塊。

這套自我進化體現(xiàn)在三個層次。

1. 模型能基于Harness完成任務(wù),在MiniMax的強化學(xué)習(xí)團隊已承擔(dān)30%-50%的日常工作流。

2. 模型能主動迭代Harness本身,自主運行優(yōu)化循環(huán)超過100輪,評測效果提升30%。

3. 模型還有能力迭代機器學(xué)習(xí)模型本身的效果,在MLE Lite的22道高難度競賽中取得9金5銀1銅,得牌率66.6%,僅次于Opus-4.6和GPT-5.4。

M2.7的核心優(yōu)化方向始終瞄準(zhǔn)Agent場景,工具調(diào)用準(zhǔn)確度、復(fù)雜Skills遵循、Agent Harness適配。

在40個復(fù)雜Skills(每個超過2000 Token)的測試中,M2.7仍能保持97%的Skills遵循率。


而最先認(rèn)可這套能力的,是海外開源圈。

從M2.1開始,Hermes的聯(lián)合創(chuàng)始人Teknium就在X上多次公開肯定MiniMax模型在工具調(diào)用、響應(yīng)速度與性價比上的表現(xiàn)。

M2.5、M2.7每次發(fā)布,Hermes Agent都第一時間接入。而且合作還在層層深入。

如今,MiniMax模型已經(jīng)是Hermes Agent中使用量最高的模型之一。

Hermes Agent整體日均Token消耗已從20億飆升至近3000億,M2.7在Open Router上日均消耗超過250億Token,占據(jù)顯著份額。


無獨有偶,OpenClaw創(chuàng)始人Peter,也曾連發(fā)五條推文公開稱贊MiniMax是最好的開源模型。

他表示,M2.1能以其他模型5%的成本運行OpenClaw,效果完全不輸頂尖閉源模型。


Notion聯(lián)合創(chuàng)始人Akshay Kothari則親自宣布,MiniMax M2.5成為Notion Custom Agents中第一個開源權(quán)重模型。


被稱為「Cursor最強對手」的AI編程工具Kilo Code,也高調(diào)宣布MiniMax是默認(rèn)首選模型。


Tommy在直播中給了一個判斷,「中國在開源模型方面已經(jīng)領(lǐng)先了。開源和閉源之間從未有過如此接近的差距。」

在這背后,是一套相互反哺的協(xié)作模式。

Hermes社區(qū)貢獻了自進化Agent的架構(gòu)設(shè)計和產(chǎn)品理念,MiniMax貢獻了讓這套架構(gòu)真正運轉(zhuǎn)的模型能力和工程基礎(chǔ)設(shè)施。

Hermes的架構(gòu)創(chuàng)新為MiniMax的模型優(yōu)化指明方向,優(yōu)先級給了工具調(diào)用、Skills執(zhí)行、長上下文一致性這些Agent核心痛點。MiniMax的模型能力提升又拓寬了Hermes架構(gòu)所能達到的效果邊界。

海外頭部開源項目選MiniMax做默認(rèn)模型,說明一件事。

模型跑分最高未必能贏,模型最懂Harness才能贏。

養(yǎng)蝦養(yǎng)馬,越養(yǎng)越聰明

模型和Harness的閉環(huán)要真正轉(zhuǎn)起來,還需要產(chǎn)品層的驗證和反饋。

為此,MiniMax同時推了MaxHermes和MaxClaw兩條線,分別對應(yīng)兩種Agent進化路徑。

MaxHermes基于開源智能體Hermes Agent構(gòu)建,核心特性是「學(xué)習(xí)閉環(huán)」。


每完成一項復(fù)雜任務(wù),Agent自動從中提煉出可復(fù)用的Skills,保存為獨立文檔,下次按需加載并根據(jù)反饋持續(xù)改進。

加上持久化的跨會話記憶、自然語言定義的定時任務(wù)、多個子代理并行運行機制,它是一個能長期運行、持續(xù)進化的AI智能體。

在Skills層面,OpenClaw的依賴人工預(yù)設(shè)與引導(dǎo),能力在部署那一刻就已固定。

相比之下,MaxHermes的Skills由Agent自主生成、自主迭代,像一個會舉一反三的員工。


MaxClaw則是基于OpenClaw架構(gòu)的云端AI助手,解決的痛點更具體,本地部署門檻高、穩(wěn)定性不夠。上線120小時緊急完成四次擴容,修復(fù)了飛書消息無響應(yīng)等IM問題和進程退出后無法自動恢復(fù)等穩(wěn)定性問題。

功能方面,MaxClaw預(yù)置精選專家級Skill,用戶獲得50G云存儲空間。

對原有的圖片理解、視頻理解、網(wǎng)頁提取等Skill做了系統(tǒng)性升級,新增圖片生成、視頻生成等內(nèi)置工具,全部不產(chǎn)生額外API費用。

安全方面預(yù)置「安全診斷Skill」,能自主診斷修復(fù)報錯。支持同時部署多個龍蝦,移動端(iOS和安卓)已全球上線。

為了方便大家獲取和使用,MiniMax還上線了Skillhub,精選上百種Skills供探索安裝。最近一次更新他們直接把語音模型和音樂模型也接入了OpenClaw生態(tài),小龍蝦能說話、能唱歌。


在平臺層面,MiniMax Agent則推出了Expert 2.0。用戶用自然語言描述任務(wù)目標(biāo),Agent自動完成SOP梳理和能力配置,不需要懂Skill、SubAgent、MCP這些概念。上線以來已有1.6萬+專家Agent被創(chuàng)建和使用。

值得一提的是,MiniMax自己也在吃自己的狗糧。

據(jù)阿島透露,公司內(nèi)部有一個數(shù)字員工,擁有獨立的GitHub賬號,每天自動掃描開源項目,發(fā)現(xiàn)能用到MiniMax模型的就自己去提PR。

用Agent來推廣Agent背后的模型,而海外開源社區(qū)的反饋證明,這招確實管用。

這些產(chǎn)品每天產(chǎn)生的真實場景需求,又反過來驅(qū)動M2.7在工具調(diào)用、Skills遵循等維度上的持續(xù)優(yōu)化。飛輪就是這么轉(zhuǎn)起來的。

但光有模型和產(chǎn)品的互補還不夠。要讓這套閉環(huán)在云端大規(guī)模跑起來,還卡在一個更底層的環(huán)節(jié)。

最容易卡住的就是沙箱

Agent在云端大規(guī)模運行,模型推理只是第一步。更難的是給每個Agent一個安全、隔離、可彈性伸縮的執(zhí)行環(huán)境。

在阿島看來,「最有可能卡住的就是沙箱環(huán)節(jié)。如果迭代速度慢了,競爭力就會受到影響。」

其中底層Infra(身份認(rèn)證、支付、沙箱等)創(chuàng)業(yè)公司很難做,需要和大廠深度合作。就像移動互聯(lián)網(wǎng)時代,支付基礎(chǔ)設(shè)施最終由微信和支付寶解決。

MiniMax的做法,是訓(xùn)練側(cè)和部署側(cè)分別找了兩家頭部云廠商。

訓(xùn)練側(cè),MiniMax與騰訊云深度合作,基于騰訊云Agent Runtime沙箱搭建Forge強化學(xué)習(xí)框架的基礎(chǔ)設(shè)施。

Forge進行大規(guī)模強化學(xué)習(xí)訓(xùn)練時,需要模擬海量并發(fā)交互環(huán)境,讓Agent在真實、可交互的執(zhí)行環(huán)境中探索和試錯。騰訊云提供80ms極速啟動、每分鐘60萬沙箱實例、成功率99.99%的并發(fā)能力,支撐M2.7的自主進化訓(xùn)練。

部署側(cè),MaxClaw和MaxHermes的云端架構(gòu)基于阿里云ACK/ACS構(gòu)建。

MiniMax采用控制平面與執(zhí)行平面分離的模式,阿里云ACK承載統(tǒng)一控制面,ACS Agent Sandbox提供20-40ms極速實例供給,支持每分鐘15000個沙箱的彈性擴縮,任務(wù)按需創(chuàng)建、結(jié)束自動釋放。

騰訊云負責(zé)訓(xùn)練,阿里云負責(zé)部署。

兩大云廠商同時首選MiniMax作為核心合作伙伴,本身就是對其技術(shù)實力和Agent產(chǎn)品規(guī)模的雙重背書。

Token的含金量變了

過去幾年大家在比參數(shù)、比上下文、比跑分。現(xiàn)在比的是另一件事,同等Token能產(chǎn)出多少價值。

MiniMax CEO閆俊杰在3月的業(yè)績電話會上提了一個公式——

AI平臺價值 = 智能密度 × Token吞吐量。

MiniMax的解未必是唯一答案,但它踩中了一個正在被驗證的邏輯,模型為Harness而生,Harness反哺模型進化。

當(dāng)兩家頭部云廠商同時為它修路、四個海外頭部開源項目同時選它做默認(rèn)模型的時候,這個邏輯至少在當(dāng)下是跑通了的。

接下來的問題只剩一個,M3什么時候來。

對此,MiniMax已經(jīng)透露了幾個關(guān)鍵方向:

  • 更大更智能,尤其在coding和通用辦公場景;

  • 原生多模態(tài),支持視頻和圖像輸入;

  • 價格親民,目標(biāo)讓每個人都負擔(dān)得起7×24小時的Agent。

總之,時間不會太遠了。

參考資料:

https://www.bilibili.com/video/BV155djB5ETY

https://www.minimaxi.com/news/minimax-m27-zh

https://agent.minimax.io/max-claw

https://agent.minimax.io/

https://github.com/nousresearch/hermes-agent

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
國家工作人員巨額財產(chǎn)來源不明罪新規(guī)立案標(biāo)準(zhǔn)從30萬提高到300萬

國家工作人員巨額財產(chǎn)來源不明罪新規(guī)立案標(biāo)準(zhǔn)從30萬提高到300萬

深度報
2026-04-17 22:54:19
賽后拒絕握手,朝鮮U20女足全場圍攻,日本隊1次打門就進奪亞洲杯

賽后拒絕握手,朝鮮U20女足全場圍攻,日本隊1次打門就進奪亞洲杯

真理是我親戚
2026-04-18 22:05:26
犯規(guī)罰退一位!WSBK荷蘭站第一回合:張雪機車車手德比斯獲第4名

犯規(guī)罰退一位!WSBK荷蘭站第一回合:張雪機車車手德比斯獲第4名

全景體育V
2026-04-18 20:43:20
想遠離癌癥,先管住嘴!腫瘤科醫(yī)生內(nèi)部的“忌口清單”,很多人天天吃

想遠離癌癥,先管住嘴!腫瘤科醫(yī)生內(nèi)部的“忌口清單”,很多人天天吃

環(huán)球網(wǎng)資訊
2026-04-18 17:59:25
趙心童沒讓眾星徹底嘆服!希金斯:他可能達到小特高度但無法更高

趙心童沒讓眾星徹底嘆服!希金斯:他可能達到小特高度但無法更高

楊華評論
2026-04-18 18:39:32
要徹底離開?格林:這可能是最后一次和庫里打球,感激這一年!

要徹底離開?格林:這可能是最后一次和庫里打球,感激這一年!

愛體育
2026-04-18 22:04:20
新華社點名曝光:拼多多暴力抗法細節(jié)!

新華社點名曝光:拼多多暴力抗法細節(jié)!

仕道
2026-04-18 20:55:32
兩集飆出9.1,這劇不打碼根本沒法看

兩集飆出9.1,這劇不打碼根本沒法看

獨立魚
2026-04-18 21:14:44
馬克龍證實:有法國士兵身亡

馬克龍證實:有法國士兵身亡

魯中晨報
2026-04-18 21:24:20
恒大集團許家印被抓捕全過程

恒大集團許家印被抓捕全過程

新浪財經(jīng)
2026-04-18 20:05:24
“不是打穿天山容易,而是天山那頭有人民”,感慨因何而發(fā)?

“不是打穿天山容易,而是天山那頭有人民”,感慨因何而發(fā)?

新華社
2026-04-16 20:38:52
金螳螂回應(yīng)“23億美元合同”

金螳螂回應(yīng)“23億美元合同”

每日經(jīng)濟新聞
2026-04-17 14:53:45
悲催!上海男子曾年薪百萬,中年失業(yè)被妻子罵廢物,引發(fā)千人共鳴

悲催!上海男子曾年薪百萬,中年失業(yè)被妻子罵廢物,引發(fā)千人共鳴

火山詩話
2026-04-18 06:42:53
這跟不穿有啥區(qū)別?Rose真空上陣、穿鏤空透視,卻被中國女星搶鏡

這跟不穿有啥區(qū)別?Rose真空上陣、穿鏤空透視,卻被中國女星搶鏡

天天熱點見聞
2026-04-18 08:09:59
美軍封鎖霍爾木茲,巴基斯坦反將一軍,為伊朗送去最需要的東西

美軍封鎖霍爾木茲,巴基斯坦反將一軍,為伊朗送去最需要的東西

空天力量
2026-04-18 13:09:10
普京鐵桿突然倒戈,向全世界痛斥三件事,俄羅斯再也裝不下去了

普京鐵桿突然倒戈,向全世界痛斥三件事,俄羅斯再也裝不下去了

諦聽骨語本尊
2026-04-17 14:39:57
剛剛,跳水!霍爾木茲,再生變數(shù)!

剛剛,跳水!霍爾木茲,再生變數(shù)!

中國基金報
2026-04-18 18:19:35
嚴(yán)打來了!5月1日起8類行為會入刑,退休老人要注意

嚴(yán)打來了!5月1日起8類行為會入刑,退休老人要注意

小談食刻美食
2026-04-18 09:44:44
梁文鋒,扛不住了

梁文鋒,扛不住了

邱處機
2026-04-18 16:03:02
決裂?姆巴佩硬剛皇馬!拒絕克洛普執(zhí)教,力挺一人入主

決裂?姆巴佩硬剛皇馬!拒絕克洛普執(zhí)教,力挺一人入主

奶蓋熊本熊
2026-04-19 00:32:00
2026-04-19 01:59:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
15003文章數(shù) 66783關(guān)注度
往期回顧 全部

科技要聞

傳Meta下月擬裁8000 大舉清退人力為AI騰位

頭條要聞

伊朗革命衛(wèi)隊向油輪開火 伊朗最高領(lǐng)袖發(fā)聲

頭條要聞

伊朗革命衛(wèi)隊向油輪開火 伊朗最高領(lǐng)袖發(fā)聲

體育要聞

時隔25年重返英超!沒有人再嘲笑他了

娛樂要聞

劉德華回應(yīng)潘宏彬去世,拒談喪禮細節(jié)

財經(jīng)要聞

"影子萬科"2.0:管理層如何吸血萬物云?

汽車要聞

奇瑞威麟R08 PRO正式上市 售價14.48萬元起

態(tài)度原創(chuàng)

數(shù)碼
親子
家居
時尚
軍事航空

數(shù)碼要聞

華為版的科技春晚來了!Pura 90/Pura X Max下周發(fā):陣容豪華

親子要聞

退燒藥怎么用?90%家長都搞錯了

家居要聞

法式線條 時光靜淌

選對發(fā)型,真的能少走很多變美彎路

軍事要聞

解放軍護衛(wèi)艦與外艦纏斗20小時 細節(jié)披露

無障礙瀏覽 進入關(guān)懷版