国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Token 剛定了中文名,AI 圈又多了個(gè)翻譯不了的詞

0
分享至

  馬上又來(lái)了一個(gè)亟需被認(rèn)證的新詞 Harness。

  這年頭想要在 AI 圈子里當(dāng)個(gè)「全面發(fā)展的專業(yè)人士」,每天要學(xué)習(xí)的概念是真的多。從最早一個(gè) ChatGPT 能指代一切 AI,我能知道 ChatGPT 就已經(jīng)領(lǐng)先身邊大多數(shù)人。

  到后面慢慢發(fā)展到,我要去學(xué)習(xí)什么是 Prompt,是提示詞還是文令、「已死的」MCP,是被 CLI 替代的模型上下文協(xié)議、RAG 是風(fēng)靡一時(shí)的檢索增強(qiáng)生成、Agent 不是代理,是智能體、Skills 是技能,也是專家、Claude Code 是代碼助手。

  還有因?yàn)樽ψ?Claw 得名龍蝦的 OpenClaw、以及龍蝦太火需要大量消耗的 Token = xxx……

  這些堪比「顆粒度」、「對(duì)齊」的職場(chǎng)黑話,如果你都聽(tīng)過(guò),大概率還是能在一些聊 AI 的飯局上稍微顯露一波的。

  

  之前 MiniMax M2.7 模型介紹博客里提到的 Agent Harness 能力

  但現(xiàn)在,新的詞又來(lái)了,什么是 Harness。有網(wǎng)友在社交媒體上用一張?zhí)詫毸阉鞯慕貓D回應(yīng),表示「很好理解」。

  

  很離譜,但是我們把 AI 當(dāng)牛馬去指揮它干活,Harness 翻譯成套在 AI 身上的馬具/束縛,也并不是全無(wú)道理。

  其實(shí) Harness 最早被真正放進(jìn) Agent 領(lǐng)域,還是在 Anthropic 去年十一月的一篇博客,文章里他們探討了現(xiàn)在的 Agent 要執(zhí)行的任務(wù)越來(lái)越長(zhǎng),需要一個(gè)有效的 Harness 來(lái)確保 Agent 的運(yùn)作正常。

  

  博客鏈接:https://www.anthropic.com/engineering/effective-harnesses-for-long-running-agents

  到了今年本地運(yùn)行的 Agent 重新搬上臺(tái)面,一眾 AI 開(kāi)發(fā)者和研究員在自己的技術(shù)博客里,也頻繁提到 Harness 這個(gè)詞。知名博主 Mitchell 提到 Harness Engineering 的理念是,「每當(dāng)發(fā)現(xiàn)某個(gè)智能體犯錯(cuò)時(shí),就花時(shí)間設(shè)計(jì)一個(gè)解決方案,確保它以后不再犯同樣的錯(cuò)誤?!?/p>

  緊接著 OpenAI 在今年二月也發(fā)了幾篇博客,講的也是 Harness engineering,在他們看來(lái),未來(lái)工程師的工作,不是寫(xiě)代碼,而是設(shè)計(jì)智能體的「工作環(huán)境」,Harness 就是這個(gè)工作環(huán)境。

  

  在 OpenAI 官網(wǎng)選擇中文后,直接翻譯成了「工程技術(shù)」,博客鏈接:https://openai.com/zh-Hans-CN/index/harness-engineering/

  為什么 Harness 開(kāi)始被重視

  無(wú)論是 Anthropic 最早的博客,還是后面 OpenAI 的 Harness 工程,它們?cè)谖恼吕锩婷枋龅墓适露际且粯拥摹?/p>

  Harness 是一種包含環(huán)境配置、多 Agents 協(xié)作機(jī)制、嚴(yán)格架構(gòu)約束和上下文管理的系統(tǒng),它彌補(bǔ)了 AI 的「上下文焦慮」和易錯(cuò)性。

  兩家頂級(jí) AI 實(shí)驗(yàn)室都用大量的內(nèi)部工程實(shí)踐證明了,讓大模型自主寫(xiě)出百萬(wàn)行代碼的關(guān)鍵,并非模型本身有多聰明,而在于構(gòu)建了一個(gè)強(qiáng)大的 Harness(工作流框架 / 護(hù)欄系統(tǒng))。

  

  我們讓 Claude 畫(huà)了一張圖,來(lái)完整介紹一下 Agent Harness,Harness = Agent 的運(yùn)行容器 + 安全邊界 + 調(diào)度控制器

  在 Anthropic 的內(nèi)部實(shí)驗(yàn)中,研究員們發(fā)現(xiàn) AI 竟然也會(huì)有「心理問(wèn)題」。

  當(dāng) Claude 執(zhí)行長(zhǎng)周期的代碼任務(wù)時(shí),一旦它感覺(jué)到自己的上下文窗口快要填滿了,它就會(huì)產(chǎn)生「上下文焦慮」。就像快要下班的打工人,開(kāi)始瘋狂敷衍,試圖趕緊結(jié)束任務(wù)。

  要命的是,Claude 并不覺(jué)得自己在敷衍,當(dāng)研究員要求 AI 評(píng)估這些「為了下班趕緊結(jié)束任務(wù)」所編寫(xiě)的代碼時(shí),它發(fā)現(xiàn)不了其中的問(wèn)題。

  面對(duì)這種毛病,傳統(tǒng)的提示詞設(shè)計(jì)毫無(wú)用處。Anthropic 的研究員給出的 Harness 解法是:改變組織架構(gòu)。

  他設(shè)計(jì)了一個(gè)包含三個(gè)角色的 Harness 閉環(huán):

  規(guī)劃師(Planner):負(fù)責(zé)把一句話需求擴(kuò)寫(xiě)成詳細(xì)的產(chǎn)品文檔。

  生成器(Generator):純粹的牛馬,只負(fù)責(zé)按文檔寫(xiě)代碼。

  評(píng)估器(Evaluator):極其冷酷的 QA 兼產(chǎn)品經(jīng)理,手握自動(dòng)化測(cè)試工具。

  

  Anthropic 的報(bào)告中提到,應(yīng)用了 Harness 框架的 Agent 在生成網(wǎng)頁(yè)質(zhì)量上要好很多,但是成本和時(shí)間更長(zhǎng)。

  要求是開(kāi)發(fā)一個(gè)游戲制作器,沒(méi)有 Harness 的那組,AI 跑了 20 分鐘,花了 9 美元。結(jié)果是界面能看,但核心功能是壞的——游戲里的角色出現(xiàn)在屏幕上,但對(duì)任何鍵盤(pán)操作都沒(méi)有反應(yīng),游戲沒(méi)法玩。

  有 Harness 的那組,跑了 6 小時(shí),花了 200 美元。結(jié)果是游戲不只是能玩,還有動(dòng)畫(huà)系統(tǒng)、音效、AI 輔助的關(guān)卡設(shè)計(jì)。

  在這套 Harness 里,生成器寫(xiě)完一段代碼,評(píng)估器就會(huì)像真實(shí)用戶一樣去點(diǎn)擊、測(cè)試,一旦發(fā)現(xiàn) Bug 或是那種充滿「AI 塑料味」的平庸設(shè)計(jì),直接打回重做。

  包括我們經(jīng)常用來(lái)測(cè)試 AI Coding 能力的網(wǎng)頁(yè)生成,Anthropic 也發(fā)現(xiàn),Harness 的潛力相當(dāng)大。在一個(gè)設(shè)計(jì)荷蘭藝術(shù)博物館網(wǎng)頁(yè)的任務(wù)中,前 9 次迭代,AI 都在老老實(shí)實(shí)地畫(huà)平庸的網(wǎng)頁(yè)。

  但在評(píng)估器不斷施壓下,第 10 次迭代,AI 突然拋棄了所有常規(guī)模板。它交出了一個(gè)特立獨(dú)行的 3D 空間:畫(huà)作懸掛在透視棋盤(pán)格的房間里,用戶需要像走迷宮一樣穿梭。

  

  如果說(shuō) Anthropic 的 Harness 側(cè)重于組織架構(gòu),去探索 Harness 的設(shè)計(jì)原理,OpenAI 的 Codex 團(tuán)隊(duì)則是把這件事做成了一種工程文化,更多地把 Harness 當(dāng)作一種工作流框架。

  他們的核心約束只有一條,那就是沒(méi)有人工手寫(xiě)的代碼。所有代碼——業(yè)務(wù)邏輯、測(cè)試、CI 配置、文檔、內(nèi)部工具、生產(chǎn)監(jiān)控儀表盤(pán)——都由 Codex 寫(xiě)。工程師的工作不是寫(xiě)代碼,而是設(shè)計(jì)讓 AI 能可靠工作的環(huán)境。

  一開(kāi)始他們用一個(gè)超長(zhǎng)的 AGENTS.md 文件告訴 AI 所有的規(guī)則。但很快就因?yàn)樯舷挛南拗?,?dǎo)致 AI 只會(huì)進(jìn)行本地模式匹配,沒(méi)有真正理解。而且文件很快過(guò)時(shí),沒(méi)有人維護(hù),AI 開(kāi)始被一堆可能不再成立的規(guī)則誤導(dǎo)。

  

  一套完整的工作流程

  后來(lái)的做法是:AGENTS.md 只有 100 行,只充當(dāng)一個(gè)「目錄」,把 AI 指向結(jié)構(gòu)化的 docs/ 文件夾。架構(gòu)文檔、產(chǎn)品規(guī)格、設(shè)計(jì)決策、技術(shù)債務(wù)追蹤,全部是可以被 AI 直接讀取的版本化文件。每個(gè) doc 由 AI 寫(xiě),由 AI 維護(hù),定期有「文檔園丁」Agent 掃描過(guò)時(shí)的文檔來(lái)自動(dòng)更新。

  他們不在乎 AI 怎么寫(xiě)具體的邏輯,但在 Harness 中設(shè)置了極其嚴(yán)格的 Linter(代碼檢查工具)和物理依賴邊界。業(yè)務(wù)代碼只能單向調(diào)用,越界就會(huì)被系統(tǒng)無(wú)情切斷,根本合并不進(jìn)項(xiàng)目主分支。

  在這個(gè) Harness 中,我們所設(shè)置的規(guī)則,變成了 AI 不可違背的意志。AI 就像生活在「楚門(mén)的世界」里,它擁有寫(xiě)代碼的絕對(duì)自由,但這種自由,永遠(yuǎn)在人類設(shè)定的結(jié)界,即 Harness 之內(nèi)。

  把這些研究放在一起,其實(shí) harness 的本質(zhì)就是一套系統(tǒng),用來(lái)補(bǔ)償當(dāng)前 AI 不擅長(zhǎng)的事。

  AI 不擅長(zhǎng)長(zhǎng)期記憶,Harness 就用進(jìn)度文件、git 歷史、結(jié)構(gòu)化來(lái)補(bǔ)。

  AI 評(píng)價(jià)自己太寬松,用獨(dú)立的評(píng)估 Agent,帶著具體標(biāo)準(zhǔn)和真實(shí)環(huán)境測(cè)試。

  AI 在復(fù)雜任務(wù)里容易偏航,用任務(wù)分解、結(jié)構(gòu)化、合約約定來(lái)約束范圍。

  AI 不具備對(duì)代碼庫(kù)架構(gòu)品味的直覺(jué),因此需要用文檔和自動(dòng)化規(guī)范檢查,將人類的判斷轉(zhuǎn)化為系統(tǒng)規(guī)則。

  

  Claude 生成的 Harness 在 AI 領(lǐng)域的位置信息圖

  有意思的是,隨著模型能力增強(qiáng),harness 的有些部分會(huì)變得不再必要,但新的部分又會(huì)出現(xiàn)。

  Anthropic 在升級(jí)到 Opus 4.6 之后,發(fā)現(xiàn)之前為了對(duì)抗「上下文焦慮」設(shè)計(jì)的「上下文重置」機(jī)制可以直接去掉了,因?yàn)樾履P鸵呀?jīng)能自己處理了。

  但同時(shí),他們發(fā)現(xiàn)了新的方向,用 harness 來(lái)讓 AI 在應(yīng)用里自動(dòng)集成 AI 功能,這是之前模型做不到的事。

  對(duì) Harness 來(lái)說(shuō),模型越強(qiáng),Harness 不是變得更簡(jiǎn)單,而是要去做更難的事

  怎么翻譯 Harness

  在那篇詢問(wèn)「繼 token、Agent 之后,又來(lái)了一個(gè)難以翻譯的詞:Harness」推文下,除了給出那張炸裂的「戰(zhàn)術(shù)胸帶 Harness」截圖外,還有很多網(wǎng)友給出了自己的翻譯。

  有人說(shuō)應(yīng)該叫「線束」,因?yàn)檫@個(gè)詞在汽車(chē)行業(yè)已經(jīng)很多年了。還有「駕馭層」、「駕馭系統(tǒng)」、「Agent 框架」、「控制框架」、「管控層」、「錨定層」、「= Scaffold 腳手架」……

  更有意思的回復(fù)是「安全套」、「套馬桿」、以及約束牛馬該做什么不該做什么的「槽具」。

  

  微博上關(guān)于 Harness 怎么翻譯的討論也很多,Token 可以翻譯成智元的話,那 Harness 就叫智馭吧……也有人覺(jué)得和 MCP 現(xiàn)在無(wú)人問(wèn)津的狀態(tài)一樣,Harness 這個(gè)概念只是現(xiàn)在熱,過(guò)一段時(shí)間又會(huì)有新的詞被造出來(lái)、被流行。

  我們問(wèn)了問(wèn) Claude,它給了好幾個(gè)答案。

  「框架」,它認(rèn)為很多東西都叫框架,framework 可以,architecture 也可以;「執(zhí)行框架」,強(qiáng)調(diào)了運(yùn)行層面,但中性,沒(méi)有「約束」的感覺(jué)。

  「駕馭層」中文語(yǔ)境下不太用這種說(shuō)法;「管控層」強(qiáng)調(diào)了「約束」,但是沒(méi)有「執(zhí)行」;「套具」在 AI 領(lǐng)域完全是陌生的概念。

  

  所以最后它說(shuō)比較實(shí)用的方案是,不翻譯,就用 Harness

  一個(gè)概念如果能被一個(gè)詞完整概括,翻譯本來(lái)順理成章的事。Harness 之所以又是一個(gè)不容易確定的詞,是因?yàn)樗?LLM 這套流程里,同時(shí)包含了「約束」、「執(zhí)行」、「環(huán)境」、「系統(tǒng)」等幾層意思,拆開(kāi)來(lái)哪個(gè)都只說(shuō)對(duì)了一半。

  和 Token 最終被認(rèn)證為「詞元」,Harness 大概率也會(huì)有自己的官方中文。在那天之前,你在技術(shù)文章里看到這個(gè)詞,知道它在說(shuō)什么就夠了。

  然后在某個(gè)聊到 AI 的飯局上,記得說(shuō)一句,「在未來(lái),會(huì)寫(xiě)提示詞和 Skills 都不是核心競(jìng)爭(zhēng)力。真正的頂級(jí)人才,是那些懂得如何設(shè)計(jì) Harness 的人?!?/p>

  關(guān)于 Harness 的詳細(xì)內(nèi)容,還可以閱讀下面這些文章:

  1、Anthropic, Harness design for long-running application development, 適用于長(zhǎng)時(shí)間運(yùn)行應(yīng)用程序開(kāi)發(fā)的 Harness 設(shè)計(jì), 2026-03-24, https://www.anthropic.com/engineering/harness-design-long-running-apps

  2、OpenAI, Harness engineering: leveraging Codex in an agent-first world, Harness 工程:在智能體優(yōu)先的世界中利用 Codex, 2026-02-11, https://openai.com/index/harness-engineering/

  3、Mitchell Hashimoto, My AI Adoption Journey, 我的 AI 應(yīng)用之旅, 2026-02-05, https://mitchellh.com/writing/my-ai-adoption-journey

  4、OpenAI, Unlocking the Codex harness: how we built the App Server, 解鎖 Codex 的 Harness:我們?nèi)绾螛?gòu)建 App Server, 2026-02-04, https://openai.com/index/unlocking-the-codex-harness/

  5、Anthropic, Effective harnesses for long-running agents, 適用于長(zhǎng)期運(yùn)行 Agents 的有效 Harness, 2025-11-26, https://www.anthropic.com/engineering/effective-harnesses-for-long-running-agents

聲明:包含AI生成內(nèi)容

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
臉沒(méi)恢復(fù)就別出來(lái)拍劇了,頂著腫脹臉、笨重假發(fā)套,太讓人出戲了

臉沒(méi)恢復(fù)就別出來(lái)拍劇了,頂著腫脹臉、笨重假發(fā)套,太讓人出戲了

白面書(shū)誏
2026-04-14 18:34:11
天文學(xué)家彭羅斯:人類的死亡只是宇宙的幻象,生命是不可能終結(jié)的

天文學(xué)家彭羅斯:人類的死亡只是宇宙的幻象,生命是不可能終結(jié)的

心中的麥田
2026-03-06 19:27:32
國(guó)乒最后一根救命稻草也斷了,王皓這次真要被逼到絕路上了

國(guó)乒最后一根救命稻草也斷了,王皓這次真要被逼到絕路上了

林子說(shuō)事
2026-04-22 13:14:55
定了!中國(guó)隊(duì)進(jìn)“死亡之組”!

定了!中國(guó)隊(duì)進(jìn)“死亡之組”!

五星體育
2026-04-22 01:19:29
日本導(dǎo)彈威脅上海,中方40天空域警告范圍超臺(tái)兩倍

日本導(dǎo)彈威脅上海,中方40天空域警告范圍超臺(tái)兩倍

明天見(jiàn)灌裝冰塊
2026-04-22 20:29:32
2105km續(xù)航,9.79萬(wàn)!比亞迪官宣:新車(chē)上市

2105km續(xù)航,9.79萬(wàn)!比亞迪官宣:新車(chē)上市

新浪財(cái)經(jīng)
2026-04-21 14:30:59
“硬是撐了下來(lái)…”40歲男子心臟停跳2天后奇跡生還

“硬是撐了下來(lái)…”40歲男子心臟停跳2天后奇跡生還

黃河新聞網(wǎng)呂梁
2026-04-22 09:08:42
“易中天”市值超貴州茅臺(tái)

“易中天”市值超貴州茅臺(tái)

第一財(cái)經(jīng)資訊
2026-04-22 14:48:38
4輪0進(jìn)球向下俯沖!連續(xù)兩年沒(méi)請(qǐng)正經(jīng)教練,浙江隊(duì)的困境因管理層

4輪0進(jìn)球向下俯沖!連續(xù)兩年沒(méi)請(qǐng)正經(jīng)教練,浙江隊(duì)的困境因管理層

中國(guó)足球的那些事兒
2026-04-22 20:20:05
國(guó)家一級(jí)女演員陳麗云被逮捕!

國(guó)家一級(jí)女演員陳麗云被逮捕!

許三歲
2026-03-28 09:24:30
季后賽破5000分!杜蘭特復(fù)出23+6仍輸 下半場(chǎng)僅3分全場(chǎng)9失誤

季后賽破5000分!杜蘭特復(fù)出23+6仍輸 下半場(chǎng)僅3分全場(chǎng)9失誤

醉臥浮生
2026-04-22 13:17:43
火狐把VPN塞進(jìn)瀏覽器,免費(fèi)午餐能吃嗎?

火狐把VPN塞進(jìn)瀏覽器,免費(fèi)午餐能吃嗎?

報(bào)錯(cuò)免疫體
2026-04-22 00:36:29
徐濠縈上海跑步被偶遇新髮型超減齡,網(wǎng)民驚訝:這是52歲的狀態(tài)?

徐濠縈上海跑步被偶遇新髮型超減齡,網(wǎng)民驚訝:這是52歲的狀態(tài)?

粵睇先生
2026-04-22 21:27:29
2032奧運(yùn)主辦地確定,結(jié)果吃驚全球,奧運(yùn)格局將重塑

2032奧運(yùn)主辦地確定,結(jié)果吃驚全球,奧運(yùn)格局將重塑

天馬幸福的人生
2026-04-22 06:41:59
第84分鐘絕殺!中超大黑馬誕生:瘋狂5連勝,排名第3,沖擊冠軍

第84分鐘絕殺!中超大黑馬誕生:瘋狂5連勝,排名第3,沖擊冠軍

足球狗說(shuō)
2026-04-22 21:30:44
特朗普宣布延長(zhǎng)對(duì)伊朗?;?>
    </a>
        <h3>
      <a href=財(cái)聯(lián)社
2026-04-22 04:18:10
風(fēng)向徹底變了!國(guó)乒定調(diào):王勵(lì)勤秦志戩公開(kāi)表態(tài),“莎頭”被認(rèn)可

風(fēng)向徹底變了!國(guó)乒定調(diào):王勵(lì)勤秦志戩公開(kāi)表態(tài),“莎頭”被認(rèn)可

阿纂看事
2026-04-21 16:38:56
嚴(yán)打來(lái)了,5月起8種行為直接入刑,退休老人需格外注意!

嚴(yán)打來(lái)了,5月起8種行為直接入刑,退休老人需格外注意!

小談食刻美食
2026-04-21 07:52:09
余承東:我們成本扛不住了,希望大家早點(diǎn)購(gòu)買(mǎi)

余承東:我們成本扛不住了,希望大家早點(diǎn)購(gòu)買(mǎi)

映射生活的身影
2026-04-20 21:53:17
14年前拿U型鎖砸人的蔡洋:2022年出獄,找不到工作靠打零工為生

14年前拿U型鎖砸人的蔡洋:2022年出獄,找不到工作靠打零工為生

天天熱點(diǎn)見(jiàn)聞
2026-04-21 05:15:28
2026-04-22 22:59:00
AppSo incentive-icons
AppSo
讓智能手機(jī)更好用的秘密
6299文章數(shù) 26823關(guān)注度
往期回顧 全部

科技要聞

對(duì)話梅濤:沒(méi)有視頻底座,具身智能走不遠(yuǎn)

頭條要聞

女生3萬(wàn)5買(mǎi)的比熊犬倆月后癱瘓 給犬做治療花了20多萬(wàn)

頭條要聞

女生3萬(wàn)5買(mǎi)的比熊犬倆月后癱瘓 給犬做治療花了20多萬(wàn)

體育要聞

網(wǎng)易傳媒再度簽約法國(guó)隊(duì)和阿根廷隊(duì)

娛樂(lè)要聞

蜜雪冰城泰國(guó)代言人 被扒出辱華黑歷史

財(cái)經(jīng)要聞

醫(yī)院專家號(hào)"秒空"!警方牽出黑色產(chǎn)業(yè)鏈

汽車(chē)要聞

純電續(xù)航301km+激光雷達(dá) 宋Pro DM-i飛馳版9.99萬(wàn)起

態(tài)度原創(chuàng)

藝術(shù)
旅游
健康
手機(jī)
公開(kāi)課

藝術(shù)要聞

無(wú)花不風(fēng)景

旅游要聞

春來(lái)普陀,赴一場(chǎng)繡球花的河畔之約

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

手機(jī)要聞

蘋(píng)果被吐槽擠牙膏!iPhone 18 Pro只升級(jí)可變光圈:超大底主攝再等一年

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版