国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

一天僅需5毛錢,開源框架替你半夜跑實(shí)驗(yàn)!7*24小時(shí)待命

0
分享至


新智元報(bào)道

編輯:LRST

【新智元導(dǎo)讀】開源框架Deep Researcher Agent幫你全天候自動(dòng)跑深度學(xué)習(xí)實(shí)驗(yàn),節(jié)省大量重復(fù)勞動(dòng)。它通過自主循環(huán)完成想方案、執(zhí)行、監(jiān)控與反思,僅需每天五毛錢。不依賴LLM API,實(shí)現(xiàn)實(shí)時(shí)控制與手機(jī)端監(jiān)控,真正解放研究者精力,讓他們專注于思考。

做深度學(xué)習(xí)研究的朋友,誰沒經(jīng)歷過這種日子,改超參 → 跑訓(xùn)練 → 等 6 小時(shí) → 看結(jié)果 → 再改 → 再跑 → 再等。

Deadline前這個(gè)循環(huán)要重復(fù)上百次。凌晨三點(diǎn)定鬧鐘爬起來,就為了瞄一眼loss有沒有降下去——降了,松一口氣繼續(xù)睡;沒降,眼淚都快下來了還得改一版重新提交。

而最讓人崩潰的不是辛苦,是這件事本質(zhì)上是機(jī)械的:你早就想好了要試什么,剩下的只是把它跑出來而已。這部分時(shí)間,本該屬于真正的思考。

有沒有可能,讓一個(gè)AI Agent替你把這部分跑掉?

GitHub上最近有一個(gè)開源項(xiàng)目叫Deep Researcher Agent的框架,正面回答了這個(gè)問題——你睡覺的時(shí)候,它在煉丹;你寫論文的時(shí)候,它已經(jīng)把 results table 準(zhǔn)備好了。


項(xiàng)目鏈接:https://github.com/Xiangyue-Zhang/auto-deep-researcher-24x7


它是怎么工作的?

框架的核心,是一個(gè)THINK → EXECUTE → MONITOR → REFLECT的自主循環(huán)。


THINK(想方案)Agent 讀取項(xiàng)目說明 + 歷史實(shí)驗(yàn)記憶,分析當(dāng)前最優(yōu)結(jié)果,決定下一步該試什么。注意——它不只是改超參,還能改模型代碼、換 loss 函數(shù)、加數(shù)據(jù)增強(qiáng)策略。

?? EXECUTE(寫代碼 + 起任務(wù))Agent自動(dòng)改代碼或config,先跑一個(gè)強(qiáng)制 dry-run(2 步前向反向)確認(rèn)沒bug,然后才把真正的訓(xùn)練打到GPU上。

MONITOR(盯著,但不花錢)這里是整個(gè)項(xiàng)目最強(qiáng)的一招:訓(xùn)練期間,Agent完全不調(diào)用 LLM API。它只做三件事:

  • kill -0 $PID看進(jìn)程還活著沒

  • nvidia-smi看 GPU 在不在干活

  • tail看日志最后幾行

這三個(gè)操作的API成本是。

REFLECT(看結(jié)果 + 決定下一步)訓(xùn)練結(jié)束,Agent 解析日志、提取指標(biāo)、跟歷史最優(yōu)對(duì)比、記錄里程碑,然后開下一輪。

整個(gè)循環(huán)24小時(shí)不間斷。你想介入?隨時(shí)可以——往項(xiàng)目目錄里扔一個(gè)指令文件就行,Agent下一輪自動(dòng)讀到。

一天成本五毛錢,這是怎么做到的

24/7跑LLM Agent,聽起來不應(yīng)該很貴嗎?


關(guān)鍵就在前面那個(gè)「零成本 MONITOR」。

一天24小時(shí)里,90%以上的時(shí)間都在訓(xùn)練,這段時(shí)間 LLM 調(diào)用費(fèi) = 0。只有開頭「想方案」和結(jié)尾「看結(jié)果」才需要請(qǐng)大模型出馬,每次幾分鐘。

算下來:


一天五毛錢,夠你跑一整個(gè)禮拜也比一杯咖啡便宜。

跑半年內(nèi)存不漲:兩層「恒定記憶」

長時(shí)間運(yùn)行的Agent有個(gè)經(jīng)典毛?。?strong>上下文越積越長,又慢又貴又蠢。

Deep Researcher Agent的解法是一個(gè)兩層記憶系統(tǒng):

  • 第一層:人類寫的項(xiàng)目說明(凍結(jié)不變,最大3000字符)——告訴Agent你想干什么、約束是什么

  • 第二層:Agent自己維護(hù)的滾動(dòng)日志——關(guān)鍵成果自動(dòng)壓縮到 1200 字符以內(nèi),最近決策只保留15條

總記憶量恒定在約5000字符。Agent 跑1天是這個(gè)數(shù),跑6個(gè)月還是這個(gè)數(shù)。

不是demo

是真打過仗

這個(gè)框架不是放在paper里看看的玩具。它已經(jīng)在多個(gè)真實(shí)研究項(xiàng)目中連續(xù)跑了30多天

自主完成500+輪實(shí)驗(yàn)循環(huán),單個(gè)項(xiàng)目指標(biāo)比 baseline 提升52%(200+ 次全自動(dòng)實(shí)驗(yàn)跑出來的),同時(shí)管理4 個(gè)項(xiàng)目、4 臺(tái) GPU 服務(wù)器,最長連續(xù)運(yùn)行30+ 天,期間人類只介入了五六次

Claude和Codex都能用,配置一行切換

框架不綁定單一LLM:

  • Anthropic系:Claude Sonnet 4.6(快) / Claude Opus 4.6(最強(qiáng))

  • OpenAI系:Codex 5.3(快) / GPT 5.4(最強(qiáng))

config改一行就能切,誰強(qiáng)用誰。

躺床上也能煉丹:手機(jī)端實(shí)時(shí)監(jiān)控

配合Happy Coder App(iOS / Android),可以在手機(jī)上:實(shí)時(shí)查看實(shí)驗(yàn)進(jìn)度、接收訓(xùn)練完成 / 出 bug 推送、隨時(shí)給Agent下達(dá)「換個(gè)方向」的指令。

端到端加密,代碼和結(jié)果完全私密。

這意味著你真的可以在地鐵上、在咖啡館、在床上指揮一整套深度學(xué)習(xí)實(shí)驗(yàn)流水線。

一鍵裝好,7 個(gè)斜杠命令

git clone之后跑一句python install.py,立刻獲得7個(gè) Claude Code / Codex 斜杠命令:


完全不會(huì)用?倉庫里有個(gè)AI_GUIDE.md——把這個(gè)文件直接丟給任何 AI 助手,它會(huì)交互式地一步步帶你裝好、跑起第一個(gè)實(shí)驗(yàn)。新手友好到這個(gè)地步。

AI科研工具對(duì)比

目前主流的AI研究工具——Claude Scholar、AI Scientist、SWE-Agent等——要么幫你寫論文,要么幫你寫代碼。但沒有一個(gè)能真正替你把實(shí)驗(yàn)跑出來。

Deep Researcher Agent是第一個(gè)專門為「跑」深度學(xué)習(xí)實(shí)驗(yàn)設(shè)計(jì)的開源 Agent 框架,而不是為「寫」。

?? 但是,請(qǐng)先看完這一段再去 Star

作者在 README 里掛了一段非常嚴(yán)肅的聲明,我覺得這一段比項(xiàng)目本身更值得放到這篇文章里:

本項(xiàng)目嚴(yán)禁用于學(xué)術(shù)造假與任何形式的科研不端行為。

這個(gè)框架被造出來,只有一個(gè)目的——把跑實(shí)驗(yàn)里那些機(jī)械、重復(fù)的環(huán)節(jié)從研究者身上拿掉,讓大家把節(jié)省下來的時(shí)間,投入到真正重要的事情:思考上面。

idea必須由人來提供。請(qǐng)不要寄希望于用本項(xiàng)目進(jìn)行學(xué)術(shù)不端,這不是我們的項(xiàng)目初衷,也不是這個(gè)社區(qū)歡迎的事情。

學(xué)術(shù)應(yīng)當(dāng)保持純粹。Agent可以替你跑實(shí)驗(yàn),但idea、判斷與責(zé)任必須由人來承擔(dān)。我們真誠地希望每一位使用者都能human in the loop地去思考,在自己的研究方向上做出屬于自己的、真實(shí)的貢獻(xiàn)。

在這個(gè)動(dòng)輒「AI一鍵生成論文」的時(shí)代,看到一個(gè)開源作者主動(dòng)給自己的工具立這樣的邊界,挺打動(dòng)人的。

工具是中立的,但作者立場(chǎng)不必中立。

一個(gè)人的精力是有限的。研究者本該把時(shí)間花在讀論文、想 idea、解讀結(jié)果上,而不是花在凌晨三點(diǎn)爬起來看loss有沒有降。

Deep Researcher Agent想做的,就是把后者還給機(jī)器,把前者留給人。

如果你也是煉丹人,如果你也曾在deadline前哭著改config——

這一次,讓AI替你熬夜。你去睡覺。

參考資料:

https://github.com/Xiangyue-Zhang/auto-deep-researcher-24x7

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
4月12日俄烏最新:轉(zhuǎn)折時(shí)刻

4月12日俄烏最新:轉(zhuǎn)折時(shí)刻

西樓飲月
2026-04-12 16:18:11
中超形勢(shì):蓉城2分領(lǐng)跑 3強(qiáng)不敗1隊(duì)不勝 4隊(duì)仍負(fù)分 下輪3場(chǎng)焦點(diǎn)戰(zhàn)

中超形勢(shì):蓉城2分領(lǐng)跑 3強(qiáng)不敗1隊(duì)不勝 4隊(duì)仍負(fù)分 下輪3場(chǎng)焦點(diǎn)戰(zhàn)

我愛英超
2026-04-12 22:08:44
路人搶著合影!上海街頭驚現(xiàn)高顏值“簪花郎”,網(wǎng)友:美到犯規(guī)了

路人搶著合影!上海街頭驚現(xiàn)高顏值“簪花郎”,網(wǎng)友:美到犯規(guī)了

生活魔術(shù)專家
2026-04-11 17:38:03
我國肝癌高發(fā),茶葉是背后的禍因?醫(yī)生勸告:3種茶才是幫兇

我國肝癌高發(fā),茶葉是背后的禍因?醫(yī)生勸告:3種茶才是幫兇

岐黃傳人孫大夫
2026-04-12 06:30:03
史上最貴15分鐘!約老師被迫打卡保獎(jiǎng),他怒噴:這規(guī)則就是笑話

史上最貴15分鐘!約老師被迫打卡保獎(jiǎng),他怒噴:這規(guī)則就是笑話

茅塞盾開本尊
2026-04-12 17:51:42
男星查理·辛嗜性成癮,曾一天與五人發(fā)生關(guān)系,連男人他也不放過

男星查理·辛嗜性成癮,曾一天與五人發(fā)生關(guān)系,連男人他也不放過

七阿姨愛八卦
2026-04-12 17:14:49
張敬軒公開認(rèn)錯(cuò):我所心系的國家,為過去不當(dāng)言論深刻反省及后悔,向公眾致歉...

張敬軒公開認(rèn)錯(cuò):我所心系的國家,為過去不當(dāng)言論深刻反省及后悔,向公眾致歉...

廣州筍嘢益街坊
2026-04-12 11:09:05
北京主場(chǎng)遭上海雙殺引熱議!媒體吐槽北京男籃豪華內(nèi)線“紙老虎”

北京主場(chǎng)遭上海雙殺引熱議!媒體吐槽北京男籃豪華內(nèi)線“紙老虎”

狼叔評(píng)論
2026-04-12 22:12:11
絕了!嚴(yán)月霞身姿碾壓鄭麗文,中國女保鏢這才是真正的大女主!

絕了!嚴(yán)月霞身姿碾壓鄭麗文,中國女保鏢這才是真正的大女主!

TVB的四小花
2026-04-13 00:26:19
江蘇一金店回收46克黃金項(xiàng)鏈,檢測(cè)為999足金,第2天送到總部檢測(cè),純度降為70%!項(xiàng)鏈中摻入了鎢、錸,普通光譜儀測(cè)不出,72家金店被騙

江蘇一金店回收46克黃金項(xiàng)鏈,檢測(cè)為999足金,第2天送到總部檢測(cè),純度降為70%!項(xiàng)鏈中摻入了鎢、錸,普通光譜儀測(cè)不出,72家金店被騙

大風(fēng)新聞
2026-04-12 10:19:04
“半身裙與連衣裙”春日又火出圈了,這么搭配優(yōu)雅顯氣質(zhì)!

“半身裙與連衣裙”春日又火出圈了,這么搭配優(yōu)雅顯氣質(zhì)!

何有強(qiáng)
2026-04-11 23:17:43
“我怕我畢業(yè)走了他會(huì)挨餓”,山東高中生連續(xù)3年給校門口智力缺陷老人送烤腸,臨近畢業(yè)拜托附近女?dāng)傊鲙退?,攤主:很感?dòng),不會(huì)收他的錢

“我怕我畢業(yè)走了他會(huì)挨餓”,山東高中生連續(xù)3年給校門口智力缺陷老人送烤腸,臨近畢業(yè)拜托附近女?dāng)傊鲙退停瑪傊鳎汉芨袆?dòng),不會(huì)收他的錢

瀟湘晨報(bào)
2026-04-12 21:18:21
結(jié)束進(jìn)球荒,多庫時(shí)隔5個(gè)月再度代表曼城取得進(jìn)球

結(jié)束進(jìn)球荒,多庫時(shí)隔5個(gè)月再度代表曼城取得進(jìn)球

懂球帝
2026-04-13 01:05:10
霍思燕機(jī)場(chǎng)被偶遇,全素顏氣質(zhì)不如普通人!打扮邋遢,大腿特別粗

霍思燕機(jī)場(chǎng)被偶遇,全素顏氣質(zhì)不如普通人!打扮邋遢,大腿特別粗

小娛樂悠悠
2026-04-12 10:30:30
八一三淞滬會(huì)戰(zhàn),全國軍隊(duì)都在馳援上海,為什么八路軍沒有來?

八一三淞滬會(huì)戰(zhàn),全國軍隊(duì)都在馳援上海,為什么八路軍沒有來?

談史論天地
2026-04-11 15:20:03
芒果臺(tái)踩雷!趙子琪被淘汰后直播開撕,她的過往連張朝陽都忌憚

芒果臺(tái)踩雷!趙子琪被淘汰后直播開撕,她的過往連張朝陽都忌憚

小徐講八卦
2026-04-12 06:23:01
“人養(yǎng)屋,屋養(yǎng)人”真有道理,家里這3個(gè)地方越干凈,人越有福!

“人養(yǎng)屋,屋養(yǎng)人”真有道理,家里這3個(gè)地方越干凈,人越有福!

唯晨說
2026-04-11 08:40:06
網(wǎng)暴全紅嬋長達(dá)3年,只拘10天?港媒:疑有陳芋汐、陳藝文參與

網(wǎng)暴全紅嬋長達(dá)3年,只拘10天?港媒:疑有陳芋汐、陳藝文參與

開成運(yùn)動(dòng)會(huì)
2026-04-11 11:43:25
王石最麻煩的事已經(jīng)解釋清楚了

王石最麻煩的事已經(jīng)解釋清楚了

鴻樓夢(mèng)plus
2026-04-12 20:49:23
談崩了!特朗普對(duì)華施壓,禁止中伊簽協(xié)議,話音剛落中國鄰國出兵

談崩了!特朗普對(duì)華施壓,禁止中伊簽協(xié)議,話音剛落中國鄰國出兵

影孖看世界
2026-04-12 17:10:36
2026-04-13 01:32:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
14954文章數(shù) 66768關(guān)注度
往期回顧 全部

科技要聞

理想稱遭惡意拉踩,東風(fēng)日產(chǎn):尊重同行

頭條要聞

特朗普:將封鎖任何試圖進(jìn)出霍爾木茲海峽的船只

頭條要聞

特朗普:將封鎖任何試圖進(jìn)出霍爾木茲海峽的船只

體育要聞

創(chuàng)造歷史!五大聯(lián)賽首位女性主教練誕生

娛樂要聞

賭王女兒何超蕸病逝,常年和乳癌斗爭(zhēng)

財(cái)經(jīng)要聞

美伊談判破裂的三大癥結(jié)

汽車要聞

煥新極氪007/007GT上市 限時(shí)19.39萬起

態(tài)度原創(chuàng)

健康
旅游
手機(jī)
家居
軍事航空

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

旅游要聞

北京:郁金香迎來盛花期

手機(jī)要聞

華為闊折疊設(shè)計(jì)圖曝光!這外觀你喜歡嗎?

家居要聞

復(fù)古風(fēng)格 自然簡(jiǎn)約

軍事要聞

美國副總統(tǒng)萬斯:美伊談判未能達(dá)成協(xié)議

無障礙瀏覽 進(jìn)入關(guān)懷版