国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

程序員不許寫代碼!OpenAI硬核實(shí)驗(yàn):3人指揮AI,5個(gè)月造出百萬(wàn)行

0
分享至

  

  新智元報(bào)道

  編輯:元宇

  【新智元導(dǎo)讀】在OpenAI一項(xiàng)內(nèi)部實(shí)驗(yàn)中,一個(gè)最初僅3人的團(tuán)隊(duì)、5個(gè)月、從零到一造出「百萬(wàn)行代碼產(chǎn)品」,沒(méi)有一行代碼是人類程序員完成的,而不手工寫代碼,也是該項(xiàng)目的一條鐵律。

  這一次,人類軟件工程被「倒過(guò)來(lái)」做了!

  剛剛,OpenAI官博曝光了他們的一次內(nèi)部實(shí)驗(yàn):

  一支最初3人的工程師團(tuán)隊(duì),利用Codex智能體在5個(gè)月內(nèi)從零造出了一個(gè)「百萬(wàn)行代碼產(chǎn)品」。

  在整個(gè)過(guò)程中,人類不寫手工代碼,而是把精力集中在「想清楚要什么、把規(guī)則立起來(lái)」,其余的一切交給AI。

  每人每天平均能推進(jìn)3.5個(gè)PR(Pull Request,代碼合并請(qǐng)求),而PR的執(zhí)行環(huán)節(jié)(實(shí)現(xiàn)、測(cè)試、文檔、CI配置)全程由智能體代勞。

  OpenAI為這套工作流賦予了一個(gè)十分形象的名字:「駕馭工程(Harness Engineering)」。

  

  https://openai.com/index/harness-engineering/

  在實(shí)驗(yàn)里,程序員不再是那個(gè)熬夜寫B(tài)ug,再熬夜修Bug的「碼農(nóng)」,而是原來(lái)的「執(zhí)行者」變?yōu)椤格{馭者」。

  這不止是10倍效率提升的「生產(chǎn)力革命」,而是一次對(duì)「軟件工程」定義的顛覆,直接宣告了人類「手工代碼時(shí)代」的終結(jié)。

  改變

  從一個(gè)空的git倉(cāng)庫(kù)開始

  這次實(shí)驗(yàn)從AI的第一次提交開始。

  2025年8月下旬,當(dāng)空倉(cāng)庫(kù)里落下第一個(gè)commit(提交)時(shí),它就已經(jīng)不是人類寫的——當(dāng)時(shí)沒(méi)有任何既有人類代碼可以充當(dāng)「錨點(diǎn)」。

  更魔幻的:連那個(gè)用來(lái)指導(dǎo)AI怎么干活的說(shuō)明書AGENTS.md,第一版也是AI自己寫的。

  從第一天起,這個(gè)倉(cāng)庫(kù)就是由智能體塑造的。人類不許寫代碼,成了這個(gè)項(xiàng)目的一條不可逾越的鐵律。

  這不是為了偷懶,而是一種近乎自虐的「刻意練習(xí)」,只有切斷了人類「親自上手」的退路,才能倒逼團(tuán)隊(duì)去破解那個(gè)在完全無(wú)人情況下構(gòu)建代碼的終極問(wèn)題。

  于是,這個(gè)3人小團(tuán)隊(duì)(后擴(kuò)展到7人),一下子好像成了拿著鞭子的牧羊人,驅(qū)趕著一群不知疲倦的Codex智能體在代碼草原上狂奔。

  結(jié)果令人震撼:5個(gè)月,一百萬(wàn)行代碼。

  重新定義工程師的角色

  這項(xiàng)實(shí)驗(yàn)的早期進(jìn)展,比OpenAI的研究人員預(yù)想得要慢。

  不是因?yàn)镃odex不行,而是因?yàn)榄h(huán)境定義得不夠清晰:智能體缺少實(shí)現(xiàn)高層目標(biāo)所需的工具、抽象和內(nèi)部結(jié)構(gòu)。

  于是,OpenAI工程團(tuán)隊(duì)的主要工作變成了一件事:讓智能體有能力完成有價(jià)值的工作。

  他們把大目標(biāo)拆成更小的構(gòu)建塊(設(shè)計(jì)、編碼、評(píng)審、測(cè)試等),提示智能體把這些塊搭起來(lái),再用它們?nèi)ソ怄i更復(fù)雜的任務(wù)。

  當(dāng)事情失敗時(shí),答案幾乎從來(lái)不是「再試一次」,這里唯一的推進(jìn)方式就是讓Codex去完成工作,人類工程師通常會(huì)退一步問(wèn)自己:

  到底缺了什么能力?怎樣把它變得對(duì)智能體既清晰可見(jiàn),又可以被強(qiáng)制執(zhí)行?

  整個(gè)過(guò)程中,人類幾乎完全通過(guò)提示詞與系統(tǒng)交互:工程師描述任務(wù),運(yùn)行智能體,讓它發(fā)起一個(gè)PR。

  為了推進(jìn)PR完成,研究人員會(huì)讓Codex在本地自審改動(dòng),請(qǐng)求額外的本地和云端智能體評(píng)審,回應(yīng)人類或智能體的反饋,然后在一個(gè)循環(huán)里不斷迭代,直到所有智能體評(píng)審者都滿意。

  隨著時(shí)間推移,幾乎所有評(píng)審工作都移交給了「智能體對(duì)智能體」。

  提升應(yīng)用程序的可讀性

  隨著代碼吞吐量的增加,OpenAI發(fā)現(xiàn):AI編碼的瓶頸變成了人工質(zhì)量檢查(QA)的能力。

  于是,人類的時(shí)間和注意力成了真正的約束。

  為了突破這一瓶頸,OpenAI的辦法是讓Codex能夠直接讀取應(yīng)用程序的用戶界面、日志以及應(yīng)用指標(biāo)等內(nèi)容。

  他們將Chrome DevTools協(xié)議接入了智能體運(yùn)行時(shí),并開發(fā)了處理DOM快照、截圖和導(dǎo)航的技能。

  

  于是,Codex可以自己復(fù)現(xiàn)bug、驗(yàn)證修復(fù)、推理UI行為。

  OpenAI對(duì)可觀測(cè)性工具也采取了同樣的做法。

  日志、指標(biāo)、追蹤通過(guò)本地可觀測(cè)性棧暴露給Codex,并且對(duì)每個(gè)worktree(工作區(qū))都是隔離、臨時(shí)的環(huán)境。

  任務(wù)完成后,這套環(huán)境就會(huì)被銷毀。

  智能體可以用LogQ查日志,用PromQL查指標(biāo)。

  于是,「確保服務(wù)啟動(dòng)在800ms內(nèi)完成」或者「這四條關(guān)鍵用戶路徑里沒(méi)有任何一個(gè)span超過(guò)兩秒」這樣的提示,就變得真正可執(zhí)行。

  做了這些之后,OpenAI研究人員經(jīng)常看到Codex一次運(yùn)行連續(xù)工作六個(gè)小時(shí)以上,通常還是在人類睡覺(jué)的時(shí)候。

  

  給Codex一張地圖

  而不是一本1000頁(yè)的說(shuō)明書

  讓智能體處理大型復(fù)雜任務(wù)時(shí),上下文管理是最大的挑戰(zhàn)之一。

  OpenAI研究人員早期學(xué)到的一個(gè)簡(jiǎn)單經(jīng)驗(yàn)就是:

  給Codex一張地圖,而不是一本1000頁(yè)的說(shuō)明書。

  一開始,團(tuán)隊(duì)試圖寫一個(gè)超大的AGENTS.md文件,把所有規(guī)則、邏輯、注意事項(xiàng)都塞進(jìn)去。結(jié)果,這成了一場(chǎng)災(zāi)難。

  因?yàn)锳I的注意力也是稀缺資源。

  給它一本1000頁(yè)的說(shuō)明書,它會(huì)迷失在細(xì)節(jié)里,漏掉關(guān)鍵約束,或者把目標(biāo)搞錯(cuò)。

  而且,這種單體大文檔維護(hù)起來(lái)簡(jiǎn)直是噩夢(mèng),很快就會(huì)變成「陳舊規(guī)則的墳場(chǎng)」。

  于是,團(tuán)隊(duì)迅速調(diào)整策略,他們把AGENTS.md變成了一張「尋寶地圖」。

  這個(gè)文件只有大約100行,它不包含具體知識(shí),只是一個(gè)目錄,就像一個(gè)導(dǎo)航地圖,指向倉(cāng)庫(kù)深處更深層的真實(shí)來(lái)源。

  設(shè)計(jì)文檔被編目并索引,包括驗(yàn)證狀態(tài)以及一套定義「以智能體為先」操作原則的核心信念。

  └── SECURITY.md

  真正的知識(shí)庫(kù)在結(jié)構(gòu)化的docs/目錄里,是系統(tǒng)的唯一事實(shí)來(lái)源。

  這就是「漸進(jìn)式披露」:智能體從一個(gè)小而穩(wěn)定的入口開始,被教會(huì)下一步去哪找,而不是一開始就被信息淹沒(méi)。

  OpenAI的研究人員還用工具強(qiáng)制執(zhí)行這一點(diǎn)。

  通過(guò)專門的lint和CI任務(wù)校驗(yàn)知識(shí)庫(kù)是否最新、是否交叉鏈接、結(jié)構(gòu)是否正確。

  架構(gòu)文檔給出領(lǐng)域劃分和包分層的頂層視圖。質(zhì)量文檔為每個(gè)產(chǎn)品領(lǐng)域和架構(gòu)層打分,持續(xù)追蹤差距。

  為了保證AI不讀到過(guò)時(shí)的信息,團(tuán)隊(duì)甚至專門安排了一個(gè)「文檔園丁」智能體。

  它的工作只有一個(gè):定期掃描文檔,發(fā)現(xiàn)那些與代碼實(shí)現(xiàn)不一致的陳舊描述,然后自動(dòng)發(fā)起修復(fù)PR。

  讓智能體「看得懂」

  既然倉(cāng)庫(kù)完全由智能體生成,OpenAI研究人員的一個(gè)目標(biāo),就是讓智能體只靠倉(cāng)庫(kù)本身,就能理解完整業(yè)務(wù)領(lǐng)域。

  從智能體視角看,任何它在運(yùn)行時(shí)上下文中訪問(wèn)不到的知識(shí),都等于不存在。

  比如放在Google Docs、聊天記錄、人類大腦的知識(shí),對(duì)系統(tǒng)來(lái)說(shuō)都是不可見(jiàn)的。

  它能看到的只有倉(cāng)庫(kù)里版本化的工件,如代碼、Markdown、schema、可執(zhí)行計(jì)劃。

  如果智能體找不到這些上下文知識(shí),它們就會(huì)和剛?cè)肼毜男峦乱粯?,?duì)于實(shí)際業(yè)務(wù)進(jìn)展一無(wú)所知。

  

  因此,必須把越來(lái)越多的上下文推回倉(cāng)庫(kù)。

  當(dāng)然,給Codex更多上下文,并不是要塞給它更多零散指令,而是把信息組織好、結(jié)構(gòu)化,讓它可以推理。

  自動(dòng)化圍欄

  讓程序員成為代碼世界的「牧羊人」

  光有文檔,還不足以讓一個(gè)完全由智能體生成的代碼庫(kù)保持一致。

  AI畢竟是概率模型,它會(huì)產(chǎn)生幻覺(jué),會(huì)偷懶,會(huì)寫出「看似能跑實(shí)則一團(tuán)糟」的代碼。

  怎么解決?

  智能體在邊界清晰、結(jié)構(gòu)可預(yù)測(cè)的環(huán)境中效率最高。

  OpenAI通過(guò)強(qiáng)制執(zhí)行「不變量」,而不是微觀管理實(shí)現(xiàn)細(xì)節(jié),讓智能體可以高速前進(jìn)而不破壞基礎(chǔ)。

  這就好比為Codex這樣日行千里的AI烈馬,套上了韁繩和馬鞍。

  OpenAI圍繞一個(gè)嚴(yán)格的架構(gòu)模型構(gòu)建系統(tǒng)。每個(gè)業(yè)務(wù)領(lǐng)域都有固定層級(jí),并且依賴方向被嚴(yán)格驗(yàn)證,只允許有限的合法邊界。

  規(guī)則很簡(jiǎn)單:在每個(gè)業(yè)務(wù)領(lǐng)域內(nèi)(如App Settings),代碼只能沿著固定層級(jí)「向前」依賴:

  Types→Config→Repo→Service→Runtime→UI

  橫切關(guān)注點(diǎn)(認(rèn)證、連接器、遙測(cè)、功能開關(guān)等)只能通過(guò)一個(gè)顯式接口:Providers。

  其他依賴一律禁止,并通過(guò)自定義lint(也是Codex生成)和結(jié)構(gòu)測(cè)試強(qiáng)制執(zhí)行。

  

  這種架構(gòu)通常是公司規(guī)模到幾百人時(shí)才會(huì)認(rèn)真設(shè)計(jì)的。但在有編碼智能體的情況下,這是前提條件

  此外,OpenAI的研究人員還定義了一組「品味不變量」,如:

  強(qiáng)制結(jié)構(gòu)化日志

  schema和類型的命名規(guī)范

  文件大小上限

  平臺(tái)級(jí)可靠性要求

  在這個(gè)過(guò)程中,必須明確區(qū)分的是哪些地方必須嚴(yán)格,哪些地方可以放權(quán)。

  這好比管理一個(gè)大型工程平臺(tái):邊界集中管控,內(nèi)部高度自治。

  AI生成的代碼未必符合人類審美,但只要正確、可維護(hù)、對(duì)智能體可讀,就OK。

  在這個(gè)過(guò)程中,人類的品味不會(huì)消失,而是被持續(xù)「編碼」進(jìn)系統(tǒng)。

  評(píng)審意見(jiàn)、重構(gòu)PR、用戶bug都會(huì)轉(zhuǎn)化為文檔更新,或直接升格為工具規(guī)則。

  當(dāng)文檔不夠用時(shí),就需要把規(guī)則寫進(jìn)代碼。

  扔掉鍵盤

  勇敢去駕馭AI

  OpenAI的這項(xiàng)實(shí)驗(yàn)宣告了:大量以CRUD為主的崗位,正在被重塑。

  如果一個(gè)從零開始的系統(tǒng),可以在5個(gè)月內(nèi),由3個(gè)人(不寫一行代碼)構(gòu)建出百萬(wàn)行規(guī)模,傳統(tǒng)軟件公司里那些龐大的開發(fā)團(tuán)隊(duì),還有存在的必要嗎?

  在這個(gè)即將到來(lái)的新時(shí)代,工程師的定義將被徹底改寫。

  你需要的是強(qiáng)大的「架構(gòu)能力」,能夠定義系統(tǒng)的邊界,設(shè)計(jì)模塊之間的約束,構(gòu)建那個(gè)讓AI不跑偏的「圍欄」。

  同時(shí),你還需要精準(zhǔn)的「表達(dá)能力」,學(xué)會(huì)用最清晰的語(yǔ)言(無(wú)論是自然語(yǔ)言還是結(jié)構(gòu)化文檔)向AI描述你的意圖。

  拒絕AI編程,堅(jiān)持手搓代碼的人終將被浪潮吞沒(méi),只有那些懂得駕馭AI的程序員,才有可能成為AI時(shí)代的贏家。

  參考資料:

  https://openai.com/index/harness-engineering/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
廖三寧砍16+5令球迷懷念一人:要是他在,肯定不會(huì)是現(xiàn)在這個(gè)局面

廖三寧砍16+5令球迷懷念一人:要是他在,肯定不會(huì)是現(xiàn)在這個(gè)局面

弄月公子
2026-02-26 21:07:44
那么大的房企,怎么說(shuō)崩就崩了?

那么大的房企,怎么說(shuō)崩就崩了?

流蘇晚晴
2026-02-24 18:57:27
中國(guó)男籃正式上訴!嚴(yán)懲當(dāng)值裁判,郭士強(qiáng)深夜發(fā)聲,趙睿最新傷情

中國(guó)男籃正式上訴!嚴(yán)懲當(dāng)值裁判,郭士強(qiáng)深夜發(fā)聲,趙睿最新傷情

多特體育說(shuō)
2026-02-27 07:27:13
比爾·蓋茨曾出軌的2名俄羅斯女性身份曝光:一人為橋牌選手,吐槽“蓋茨牌技沒(méi)預(yù)想的好”,愛(ài)潑斯坦曾為其付學(xué)費(fèi);一人為核物理學(xué)家

比爾·蓋茨曾出軌的2名俄羅斯女性身份曝光:一人為橋牌選手,吐槽“蓋茨牌技沒(méi)預(yù)想的好”,愛(ài)潑斯坦曾為其付學(xué)費(fèi);一人為核物理學(xué)家

大風(fēng)新聞
2026-02-26 16:54:05
安徽一女婿挽留丈母娘的舉動(dòng),近來(lái)成了熱議的焦點(diǎn)

安徽一女婿挽留丈母娘的舉動(dòng),近來(lái)成了熱議的焦點(diǎn)

大熊歡樂(lè)坊
2026-02-27 03:23:58
升級(jí)版的仙人跳,比戴綠帽子還憋屈

升級(jí)版的仙人跳,比戴綠帽子還憋屈

霹靂炮
2026-02-24 22:53:34
2026年春晚,釋放了3個(gè)信號(hào),普通人要清醒

2026年春晚,釋放了3個(gè)信號(hào),普通人要清醒

老特有話說(shuō)
2026-02-25 22:03:08
《鏢人》下跌嚴(yán)重,20億票房夢(mèng)碎,預(yù)計(jì)虧損超2億

《鏢人》下跌嚴(yán)重,20億票房夢(mèng)碎,預(yù)計(jì)虧損超2億

影視高原說(shuō)
2026-02-26 18:45:47
美官員證實(shí):自特朗普批準(zhǔn)對(duì)華出口芯片兩個(gè)月來(lái),英偉達(dá)H200對(duì)華銷售為零

美官員證實(shí):自特朗普批準(zhǔn)對(duì)華出口芯片兩個(gè)月來(lái),英偉達(dá)H200對(duì)華銷售為零

瀟湘晨報(bào)
2026-02-26 11:19:00
日本排放核水后,奇怪的事發(fā)生了:剛開始各國(guó)對(duì)海鮮避之不及

日本排放核水后,奇怪的事發(fā)生了:剛開始各國(guó)對(duì)海鮮避之不及

百態(tài)人間
2026-02-26 15:21:28
上海海港官宣三人離隊(duì)

上海海港官宣三人離隊(duì)

五星體育
2026-02-26 15:30:57
非洲55國(guó)聯(lián)手禁驢15年,掐斷阿膠命脈,背后真相太現(xiàn)實(shí)

非洲55國(guó)聯(lián)手禁驢15年,掐斷阿膠命脈,背后真相太現(xiàn)實(shí)

流蘇晚晴
2026-02-26 18:17:45
剛剛,龐若鳴跳槽OpenAI!放棄14億年薪,在Meta只待了7個(gè)月

剛剛,龐若鳴跳槽OpenAI!放棄14億年薪,在Meta只待了7個(gè)月

新智元
2026-02-26 13:44:28
現(xiàn)場(chǎng)簽約!中方給出重磅見(jiàn)面禮,默茨輕飄飄2句話,斷了波音后路

現(xiàn)場(chǎng)簽約!中方給出重磅見(jiàn)面禮,默茨輕飄飄2句話,斷了波音后路

紀(jì)中百大事
2026-02-26 19:59:58
世體:貝林的踢球方式會(huì)影響整體戰(zhàn)術(shù),皇馬沒(méi)有他時(shí)勝率更高

世體:貝林的踢球方式會(huì)影響整體戰(zhàn)術(shù),皇馬沒(méi)有他時(shí)勝率更高

懂球帝
2026-02-27 08:00:10
向華強(qiáng)宣布遺產(chǎn)全給郭碧婷!向佐2兄弟不得繼承,徹底鬧翻小兒子

向華強(qiáng)宣布遺產(chǎn)全給郭碧婷!向佐2兄弟不得繼承,徹底鬧翻小兒子

銀河史記
2026-02-26 19:12:27
堵車的源頭找到了!懷化一高速長(zhǎng)達(dá)12公里擁堵,居然是司機(jī)睡著了

堵車的源頭找到了!懷化一高速長(zhǎng)達(dá)12公里擁堵,居然是司機(jī)睡著了

火山詩(shī)話
2026-02-26 10:07:44
老虎灘104艦啟動(dòng)拆解,大連市民留戀告別!三代人記憶里美好永存

老虎灘104艦啟動(dòng)拆解,大連市民留戀告別!三代人記憶里美好永存

半島晨報(bào)
2026-02-26 17:00:35
黃金、白銀,集體拉升!美伊談判,大消息!美聯(lián)儲(chǔ)降息,又有變數(shù)?

黃金、白銀,集體拉升!美伊談判,大消息!美聯(lián)儲(chǔ)降息,又有變數(shù)?

證券時(shí)報(bào)e公司
2026-02-27 08:14:28
特斯拉再次“降價(jià)”!

特斯拉再次“降價(jià)”!

電動(dòng)知家
2026-02-26 10:53:33
2026-02-27 08:52:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
14598文章數(shù) 66644關(guān)注度
往期回顧 全部

科技要聞

英偉達(dá)業(yè)績(jī)亮眼仍跌5% 兩大因素成核心隱憂

頭條要聞

牛彈琴:中國(guó)的兩個(gè)鄰國(guó)大打出手 傷亡相當(dāng)慘重

頭條要聞

牛彈琴:中國(guó)的兩個(gè)鄰國(guó)大打出手 傷亡相當(dāng)慘重

體育要聞

從排球少女到冰壺女神,她在米蘭冬奧練出6塊腹肌

娛樂(lè)要聞

向華強(qiáng)公開表態(tài) 財(cái)產(chǎn)留給兒媳婦郭碧婷

財(cái)經(jīng)要聞

魅族手機(jī),終成棄子?

汽車要聞

40歲的吉利,不惑于內(nèi)外

態(tài)度原創(chuàng)

旅游
健康
游戲
親子
本地

旅游要聞

建在180米高的“煙囪”上,上海唯一的高空秋千運(yùn)營(yíng)即將滿月

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

Steam Deck滿四歲!繼任機(jī)型依然杳無(wú)音信

親子要聞

孩子咳嗽總不好,家長(zhǎng)的治療方向錯(cuò)了!

本地新聞

津南好·四時(shí)總相宜

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版