国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Codex負(fù)責(zé)人打臉Cursor CEO“規(guī)范驅(qū)動(dòng)開(kāi)發(fā)論”!18天造Sora爆款,靠智能體24小時(shí)不停跑,曝OpenAI狂飆內(nèi)幕

0
分享至


作者 | 高允毅

自 8 月 GPT-5 發(fā)布以來(lái),Codex展現(xiàn)出驚人的爆發(fā)力,用戶增長(zhǎng) 20 倍,每周處理數(shù)萬(wàn)億 tokens,成為了 Open AI 最受歡迎的編程智能體。

“Codex 能快速實(shí)現(xiàn) 20的增長(zhǎng),不只是因?yàn)槟P妥儚?qiáng)了,還因?yàn)槲覀兝斫饬,真正的智能體不是一個(gè)模型,而是模型、API 和框架共同努力的結(jié)果!在最新播客中,OpenAI 的編程智能體 Codex 產(chǎn)品負(fù)責(zé)人 Alexander Embiricos 揭露背后的秘密。

比如,Codex 在長(zhǎng)時(shí)任務(wù)能力上的突破。為了讓它能夠連續(xù)工作十幾個(gè)小時(shí)甚至數(shù)天,團(tuán)隊(duì)設(shè)計(jì)了名為“壓縮”的機(jī)制——模型負(fù)責(zé)提煉關(guān)鍵信息,API 承接任務(wù)鏈路,框架負(fù)責(zé)穩(wěn)定運(yùn)行。三層像齒輪般咬合,使 Codex 能夠完成傳統(tǒng)大模型難以支撐的長(zhǎng)時(shí)編程任務(wù)。

正是這樣的底層邏輯,讓 Codex 在業(yè)務(wù)實(shí)戰(zhàn)中有驚人表現(xiàn)。

Andrej Karpathy 曾公開(kāi)分享,他被一個(gè) bug 困住數(shù)小時(shí),最終交給 Codex 處理,一小時(shí)內(nèi)就完成了修復(fù)。

Sora 團(tuán)隊(duì)更是依靠 Codex,在短短 28 天時(shí)間,從 0 到 1 完成 Android 應(yīng)用的上線,直接沖到 App Store 第一。

回顧過(guò)往,Alexander Embiricos 也坦言,Codex 的路徑并非一開(kāi)始就清晰。

早期的 Codex“太過(guò)未來(lái)”,采用遠(yuǎn)程異步交互方式,這符合資深工程師的習(xí)慣但對(duì)大部分工程師并不友好。而真正的拐點(diǎn)來(lái)自一個(gè)關(guān)鍵調(diào)整:團(tuán)隊(duì)將 Codex 從云端遷回本地,讓它直接在工程師的 IDE 中工作,才更接地氣起來(lái)。

目前的 Codex,在 Alexander Embiricos 看來(lái),像一個(gè)“聰明但不會(huì)主動(dòng)的實(shí)習(xí)生,寫(xiě)代碼寫(xiě)的很快!倍 Codex 一直在自我監(jiān)督,自我訓(xùn)練,不斷進(jìn)化。Alexander Embiricos 期待未來(lái) Codex 可以真正參與軟件開(kāi)發(fā)的全流程,成為工程師的好隊(duì)友。

Alexander Embiricos 還談到 OpenAI 的組織文化,他驚嘆于 OpenAI 的速度與野心,迭代速度之快聞所未聞。比起其他組織的“先瞄準(zhǔn)在射擊”,他認(rèn)為 OpenAI 的獨(dú)特之處,正在于“先射擊,再瞄準(zhǔn)”,即先發(fā)布,再根據(jù)真實(shí)使用反饋優(yōu)化路徑。而搜集世界最優(yōu)秀的人才與自下而上的文化,使這種高速迭代成為日常。

對(duì)于未來(lái) AGI 會(huì)何時(shí)到來(lái),Alexander Embiricos 也給出了一個(gè)有趣的視角,他認(rèn)為當(dāng)前真正的限制 AGI 的因素不是模型能力,而是人類(lèi)——我們輸入速度有限、審查速度有限,正在拖累其發(fā)展。

他做了一個(gè)預(yù)判,第一批生產(chǎn)力曲線出現(xiàn)陡增的用戶將在明年出現(xiàn),其后的變化會(huì)加速擴(kuò)散。“當(dāng)增長(zhǎng)曲線突然變得異常陡峭時(shí),”他說(shuō),“我們可能就已經(jīng)站在 AGI 的門(mén)口!

播客里還分享了更多關(guān)于 Codex 背后的細(xì)節(jié)和 Alex 的精彩觀點(diǎn),我們翻譯了該內(nèi)容,并在不改變?cè)饣A(chǔ)上進(jìn)行了刪減和整理,以饗讀者。

播客精彩觀點(diǎn)匯集:

  1. 在 Codex 的幫助下,OpenAI 僅用了幾周時(shí)間,就憑借兩三位工程師的協(xié)作,打造出了 Sora 安卓應(yīng)用,并使其在 App Store 排名第一。Sora 應(yīng)用從零到員工測(cè)試僅用了 18 天,并在 10 天后正式發(fā)布。Codex 通過(guò)分析現(xiàn)有的 iOS 應(yīng)用、制定工作計(jì)劃以及同時(shí)比較兩個(gè)平臺(tái)來(lái)實(shí)現(xiàn)功能,從而提供了極大的幫助。

  2. 即使人工智能模型明天停止改進(jìn),我們?nèi)匀恍枰ㄙM(fèi)數(shù)年時(shí)間進(jìn)行產(chǎn)品開(kāi)發(fā),才能充分發(fā)揮它們的潛力。這項(xiàng)技術(shù)的發(fā)展速度超過(guò)了我們目前能夠最佳利用它的能力。

  3. 充分利用 Codex 的關(guān)鍵在于:選擇最棘手的問(wèn)題,而不是最簡(jiǎn)單的問(wèn)題。這些工具旨在解決棘手的 bug 和復(fù)雜的任務(wù),而不是簡(jiǎn)單的任務(wù)。從那些你平時(shí)需要花費(fèi)數(shù)小時(shí)才能解決的問(wèn)題入手。

  4. OpenAI 最初的 Codex 產(chǎn)品“過(guò)于超前”。它以異步方式在云端運(yùn)行,這對(duì)高級(jí)用戶來(lái)說(shuō)很棒,但對(duì)新手來(lái)說(shuō)卻很困難。當(dāng)它將 Codex 帶回工程師們?nèi)粘9ぷ鞯牡胤健麄冏约旱碾娔X上的代碼編輯器——時(shí),其增長(zhǎng)速度呈爆炸式增長(zhǎng)。過(guò)去 6 個(gè)月里,Codex 的使用量增長(zhǎng)了 20 倍。

  5. 編寫(xiě)代碼可能成為人工智能完成任何任務(wù)的通用方式。人工智能與其點(diǎn)擊界面或構(gòu)建單獨(dú)的集成,不如即時(shí)編寫(xiě)小型程序,這樣才能發(fā)揮最佳性能。這意味著每個(gè)人工智能助手都應(yīng)該內(nèi)置編碼能力,而不僅僅是專(zhuān)門(mén)的編程工具。

  6. OpenAI 的設(shè)計(jì)師現(xiàn)在編寫(xiě)并發(fā)布自己的代碼。設(shè)計(jì)團(tuán)隊(duì)維護(hù)著一個(gè)由人工智能輔助構(gòu)建的、功能齊全的原型。當(dāng)他們有了想法,他們會(huì)直接編寫(xiě)代碼、進(jìn)行測(cè)試,并經(jīng)常自行提交到生產(chǎn)環(huán)境。只有當(dāng)代碼庫(kù)特別復(fù)雜時(shí),工程師才會(huì)介入。

  7. 人工智能生產(chǎn)力的最大瓶頸不是人工智能本身,而是人類(lèi)的打字速度。限制因素在于你輸入提示的速度以及你審查人工智能生成工作的速度。在人工智能能夠更可靠地驗(yàn)證自身輸出并主動(dòng)提供幫助之前,我們將無(wú)法看到這些工具所能帶來(lái)的全部生產(chǎn)力提升。

  8. 編寫(xiě)代碼的樂(lè)趣正在逐漸被審查人工智能生成的代碼所取代。工程師們?cè)?jīng)熱愛(ài)構(gòu)建代碼的創(chuàng)造性過(guò)程,而現(xiàn)在他們卻花費(fèi)更多時(shí)間閱讀人工智能生成的代碼。下一個(gè)挑戰(zhàn)是如何讓代碼審查過(guò)程更快、更令人滿意。

  9. 新型人工智能模型現(xiàn)在可以連續(xù)工作 24 到 60 多個(gè)小時(shí)來(lái)完成單個(gè)任務(wù)。一種名為“壓縮”的技術(shù)可以讓人工智能在內(nèi)存耗盡之前總結(jié)其學(xué)習(xí)到的內(nèi)容,然后在新的會(huì)話中繼續(xù)工作。這使得人工智能能夠?qū)崿F(xiàn)以前無(wú)法實(shí)現(xiàn)的通宵或多天自主工作。

  10. 如果你現(xiàn)在要?jiǎng)?chuàng)辦一家公司,深入了解特定客戶比擅長(zhǎng)產(chǎn)品開(kāi)發(fā)更重要。產(chǎn)品開(kāi)發(fā)變得越來(lái)越容易。如今,真正的優(yōu)勢(shì)在于知道該開(kāi)發(fā)什么產(chǎn)品,以及為誰(shuí)開(kāi)發(fā)產(chǎn)品。

OpenAI 的速度、

文化與用人方式

Lenny:我想先從你在 OpenAI 的經(jīng)歷談起。你大約一年前加入 OpenAI。在那之前,你創(chuàng)辦自己的公司大約五年,再之前你在 Dropbox 擔(dān)任產(chǎn)品經(jīng)理。OpenAI 顯然是一家與你過(guò)去工作過(guò)的所有公司都截然不同的地方。我想問(wèn),在 OpenAI,最特別的運(yùn)作方式是什么?你在那里學(xué)到了什么,是你認(rèn)為無(wú)論未來(lái)走到哪里(假設(shè)你有一天會(huì)離開(kāi))都會(huì)帶走的?

Alex:到目前為止,我覺(jué)得在 OpenAI 工作的節(jié)奏和雄心遠(yuǎn)遠(yuǎn)超出我的想象。說(shuō)這句話時(shí)我會(huì)想到,以前在創(chuàng)業(yè)圈,每個(gè)人都認(rèn)為自己的公司速度快、人才要求高、目標(biāo)宏大,但來(lái)到 OpenAI 后,我意識(shí)到這些詞在這里意味著完全不同的尺度。在 OpenAI,我重新理解了“速度”和“雄心”真正的含義。

我們常聽(tīng)到外界感嘆人工智能公司的發(fā)展速度快,而我首先想到的例子就是模型本身的爆炸式增長(zhǎng)。盡管我們擴(kuò)大了外部數(shù)據(jù)規(guī)模,但像 Codex 這樣十倍級(jí)別的模型增長(zhǎng)只在幾個(gè)月內(nèi)完成,其后的進(jìn)展又繼續(xù)加速。至少對(duì)我而言,在經(jīng)歷那些階段之后,我發(fā)現(xiàn)自己在打造科技產(chǎn)品時(shí),會(huì)自然把目標(biāo)設(shè)定為達(dá)到那種速度和規(guī)模,否則就會(huì)覺(jué)得不足。相比之下,我在創(chuàng)業(yè)公司所經(jīng)歷的節(jié)奏顯得慢得多。

創(chuàng)業(yè)過(guò)程中往往需要權(quán)衡投入與失敗的可能性:先嘗試、再轉(zhuǎn)型。不過(guò)在 OpenAI,我深刻意識(shí)到影響力之巨大,而要把工作做好,需要投入極高的精力。這種需求迫使我更加果斷地安排時(shí)間。

Lenny:在繼續(xù)往下之前,我想追問(wèn)一件事:像 Codex 這樣能迅速推進(jìn)的團(tuán)隊(duì),是否有某種特別的組織架構(gòu)或結(jié)構(gòu)性原因?還是因?yàn)槲覍?duì)開(kāi)源軟件的運(yùn)作方式不夠了解,所以才讓團(tuán)隊(duì)能這樣快速前進(jìn)?一定存在一些結(jié)構(gòu)讓這一切發(fā)生。

Alex:一方面,我們所使用的技術(shù)本身就徹底改變了很多事情,包括我們構(gòu)建產(chǎn)品的方式,以及能夠?yàn)橛脩魧?shí)現(xiàn)的功能。雖然我們經(jīng)常討論基礎(chǔ)模型的改進(jìn),但即使我們停止模型層面的進(jìn)展(雖然事實(shí)上并沒(méi)有),我們?cè)诋a(chǎn)品開(kāi)發(fā)方面仍然落后很多,還有大量產(chǎn)品尚未實(shí)現(xiàn)。可以說(shuō),這個(gè)領(lǐng)域的成熟度遠(yuǎn)高于外界想象。

不過(guò),也有很多讓我意外的地方。剛到 OpenAI 時(shí),我對(duì)組織架構(gòu)了解不多。例如,以往在創(chuàng)業(yè)公司或在 Dropbox 擔(dān)任產(chǎn)品經(jīng)理時(shí),鼓舞團(tuán)隊(duì)士氣、確保團(tuán)隊(duì)朝正確方向前進(jìn),是極其重要的標(biāo)配工作。但在 OpenAI,由于我們并不確切知道近期會(huì)出現(xiàn)哪些功能,也不知道哪些功能最終奏效,即便從技術(shù)層面可行,也無(wú)法確定最終結(jié)果,因此需要保持謙遜,通過(guò)不斷嘗試來(lái)學(xué)習(xí)。

這里的組織架構(gòu)設(shè)計(jì)為高度自下而上運(yùn)作,每個(gè)人都渴望快速推進(jìn)。許多公司聲稱(chēng)是自下而上,但 OpenAI 真正如此。這對(duì)我來(lái)說(shuō)是寶貴的學(xué)習(xí)經(jīng)驗(yàn),也讓我意識(shí)到未來(lái)可能很難再回到非人工智能公司工作。我甚至不確定那意味著什么。如果讓我重新回到過(guò)去,我的做事方式一定會(huì)完全不同。

Lenny:我聽(tīng)到你的描述,感覺(jué)更像“預(yù)備、射擊、瞄準(zhǔn)”,而不是“預(yù)備、瞄準(zhǔn)、射擊”。許多人工智能公司的思路似乎是:因?yàn)椴恢烙脩糇罱K會(huì)怎樣使用產(chǎn)品,所以花大量時(shí)間把產(chǎn)品做到完美毫無(wú)意義。最好的方式是盡快發(fā)布,觀察人們?nèi)绾问褂茫倏焖俚?/p>

Alex:這個(gè)比喻有一定道理,但目標(biāo)成分本身是模糊的。我們大致預(yù)測(cè)未來(lái)可能發(fā)生什么,但其中仍有大量不確定性。一位研究主管常說(shuō),在 OpenAI,我們可以就一年后的未來(lái)展開(kāi)高質(zhì)量對(duì)話,但越接近那個(gè)時(shí)間點(diǎn),反而越難做出理性規(guī)劃。我們會(huì)構(gòu)想遠(yuǎn)期未來(lái)要實(shí)現(xiàn)什么,尤其在人工智能對(duì)齊等議題上,我們必須考慮非常長(zhǎng)期的未來(lái)。但當(dāng)真正進(jìn)入產(chǎn)品階段后,我們會(huì)開(kāi)始關(guān)注戰(zhàn)術(shù)層面的細(xì)節(jié),例如具體要構(gòu)建哪些產(chǎn)品、人們會(huì)如何實(shí)際使用。產(chǎn)品方面,我們更依賴實(shí)證研究來(lái)驗(yàn)證。

Lenny:當(dāng)人們聽(tīng)到你們的做法,會(huì)覺(jué)得像你這樣的公司可以大膽嘗試許多事情,并且在未來(lái)幾個(gè)月內(nèi)不必制定嚴(yán)格計(jì)劃。但關(guān)鍵是,你們聘用了世界上最優(yōu)秀的人才,這似乎是讓這樣的公司取得成功的關(guān)鍵因素。

Alex:這點(diǎn)讓我非常有共鳴。我剛加入時(shí),對(duì)每個(gè)人展現(xiàn)出的個(gè)人動(dòng)力與自主性感到震驚。我認(rèn)為 OpenAI 的運(yùn)作方式無(wú)法靠閱讀一篇文章或聽(tīng)一檔播客就復(fù)制到其他公司。這樣說(shuō)可能直白,但很少有公司擁有能夠以這種方式運(yùn)作的人才。如果要讓這樣的模式在別處出現(xiàn),大概率必須做出許多調(diào)整。

Codex 的定位、

核心哲學(xué)與產(chǎn)品愿景

Lenny:那我們來(lái)聊聊 Codex。你是 Codex 的負(fù)責(zé)人。Codex 現(xiàn)在進(jìn)展如何?你能分享一些數(shù)據(jù)嗎?另外,也不是所有人都清楚 Codex 是什么,你能解釋一下嗎?

Alex:Codex 是開(kāi)源編碼智能體,更具體來(lái)說(shuō),它是一款 VS Code 的 IDE 擴(kuò)展,你可以安裝擴(kuò)展或終端工具。安裝后,你可以與 Codex 互動(dòng),回答與代碼相關(guān)的問(wèn)題,編寫(xiě)代碼,運(yùn)行測(cè)試,執(zhí)行代碼等,也就是軟件開(kāi)發(fā)生命周期中最繁重的部分——實(shí)際編寫(xiě)將被部署到生產(chǎn)環(huán)境的代碼。

更廣泛來(lái)說(shuō),我們認(rèn)為 Codex 是軟件工程團(tuán)隊(duì)成員的起點(diǎn)。當(dāng)我們談到“隊(duì)友”這樣的詞時(shí),我們?cè)O(shè)想的并不僅是讓它編寫(xiě)代碼,而是讓它參與軟件編寫(xiě)的整個(gè)流程,從構(gòu)思、規(guī)劃,到下游的驗(yàn)證、部署與維護(hù)。

我喜歡把今天的 Codex 想象成:一個(gè)非常聰明的實(shí)習(xí)生,但不會(huì)查看 Slack,也不會(huì)主動(dòng)檢查像 Sentry 那樣的監(jiān)控系統(tǒng),除非你要求它這么做。因此,即使它非常聰明,你也不會(huì)完全放手讓它在無(wú)人監(jiān)督的情況下編寫(xiě)代碼,F(xiàn)在大多數(shù)人使用它的方式仍然是與它結(jié)對(duì)編程。

但我們希望未來(lái)能達(dá)到這樣一種程度:就像你雇傭新實(shí)習(xí)生一樣,不只是讓他們寫(xiě)代碼,還讓他們參與整個(gè)流程。即使他們第一次嘗試不完全正確,他們會(huì)持續(xù)參與并通過(guò)迭代最終實(shí)現(xiàn)目標(biāo)。

Lenny:我理解你提到的 “不會(huì)看 Slack” 的意思,是說(shuō)它不會(huì)分心,總是全神貫注在工作上。但你的意思是它無(wú)法掌握正在發(fā)生事情的完整背景,對(duì)吧?對(duì)于團(tuán)隊(duì)中最優(yōu)秀的成員來(lái)說(shuō),你不會(huì)告訴他們每一步該怎么做,你只是在最初幾次會(huì)議中讓他們了解你的溝通方式,然后他們就能在團(tuán)隊(duì)中獨(dú)立工作,甚至主動(dòng)與代碼庫(kù)的其他部分協(xié)作。

Alex:是的,我們認(rèn)為一個(gè)真正優(yōu)秀的隊(duì)友應(yīng)該是積極主動(dòng)的,而 Codex 的一個(gè)主要目標(biāo)就是讓智能體具備這種積極主動(dòng)性。我認(rèn)為這是實(shí)現(xiàn) OpenAI 使命的重要部分——讓人工智能真正造福全人類(lèi)。

當(dāng)下的人工智能產(chǎn)品實(shí)際上很難使用,因?yàn)橛脩舯仨毞浅C鞔_地思考何時(shí)向模型尋求幫助。如果你不主動(dòng)發(fā)出請(qǐng)求,模型就無(wú)法提供幫助。如今,一個(gè)普通用戶可能每天只向人工智能發(fā)出幾十次指令。但如果一個(gè)系統(tǒng)真正智能,人類(lèi)每天能從它獲得數(shù)千次幫助。

因此,我們與 Codex 合作的大部分目標(biāo),是弄清楚如何打造這樣一種默認(rèn)情況下就能提供幫助的“隊(duì)友智能體”。

Lenny:當(dāng)人們想到 Cursor 或云端代碼工具時(shí),它們像集成開(kāi)發(fā)環(huán)境,能輔助寫(xiě)代碼、自動(dòng)補(bǔ)全等。我聽(tīng)出你描述的愿景不同,你指的是一個(gè)真正像遠(yuǎn)程隊(duì)友一樣為你構(gòu)建代碼的系統(tǒng)。你可以與它對(duì)話,讓它執(zhí)行操作,同時(shí)也擁有 IDE 自動(dòng)補(bǔ)全等功能。你們對(duì) Codex 的思考方式究竟有什么不同?

Alex:我們的目標(biāo)是讓開(kāi)發(fā)者在完成任務(wù)時(shí)感覺(jué)擁有超能力,以更快的速度完成工作,同時(shí)不必處處停下來(lái)思考“我現(xiàn)在應(yīng)該如何調(diào)用人工智能來(lái)完成這件事?”。它應(yīng)當(dāng)像系統(tǒng)的一部分一樣與你協(xié)作,當(dāng)你做出動(dòng)作時(shí),它就能自動(dòng)開(kāi)始工作,而不需要你為它操心。

Codex 的技術(shù)突破、

增長(zhǎng)動(dòng)力與三層系統(tǒng)結(jié)構(gòu)

Lenny:我還有很多類(lèi)似的問(wèn)題。不過(guò)我想先問(wèn)一下:Codex 的進(jìn)展如何?有沒(méi)有一些可以分享的統(tǒng)計(jì)數(shù)據(jù)或數(shù)字?

Alex:Codex 自發(fā)布以來(lái)一直呈現(xiàn)爆炸式增長(zhǎng)。GPT-5 在八月份發(fā)布,當(dāng)時(shí)我們已經(jīng)觀察到一些非常有趣的產(chǎn)品洞察。如果你感興趣,我可以詳細(xì)說(shuō)明這種增長(zhǎng)是如何發(fā)生的。我們上次公開(kāi)的數(shù)據(jù)是,自八月以來(lái) Codex 的使用增長(zhǎng)超過(guò)十倍,而現(xiàn)在已經(jīng)達(dá)到二十倍。Codex 模型目前每周服務(wù)數(shù)萬(wàn)億級(jí)的代幣,是我們最受歡迎的編碼模型。

我們做的一件重要事情是組建了一個(gè)緊密整合的團(tuán)隊(duì),讓產(chǎn)品與研究團(tuán)隊(duì)共同迭代模型與框架。這種方式讓我們可以更快速地開(kāi)展更多實(shí)驗(yàn),理解模型與工具如何協(xié)作。我們訓(xùn)練模型時(shí)使用自己的框架,并對(duì)框架持有非常明確的觀點(diǎn)。最近,我們開(kāi)始看到其他大型 API 編碼客戶也采用類(lèi)似方法,這些模型因此變得更加通用。

如今,Codex 已成為使用最廣泛的編碼模型,API 中也有相應(yīng)的版本。

Lenny:你提到過(guò)“增長(zhǎng)被解鎖”,我對(duì)此很好奇。在你加入之前,我感覺(jué)云端代碼幾乎統(tǒng)治一切,每個(gè)人都在使用它,它是當(dāng)時(shí)最好的代碼生成方式。但后來(lái) Codex 出現(xiàn),我記得 Karpathy 發(fā)過(guò)一條推文,說(shuō)他從未見(jiàn)過(guò)這樣的模型。他遇到一個(gè)非常棘手的 bug,花了幾個(gè)小時(shí)都無(wú)法解決,結(jié)果讓 Codex 跑了一個(gè)小時(shí),它就解決了。你們是怎么做到的?

Alex:OpenAI 一直有一個(gè)非常明確的使命,就是構(gòu)建 AGI。因此我們持續(xù)思考如何讓產(chǎn)品能夠在更大規(guī)模中發(fā)揮作用。正如我之前提到的,一個(gè)工程師如果能夠每天從人工智能那里獲得數(shù)千次幫助,那才是真正的價(jià)值。所以我們不斷反思模型與產(chǎn)品應(yīng)該如何演進(jìn)。

當(dāng)我們推出第一版 Codex(Codex Cloud)時(shí),它幾乎相當(dāng)于擁有一臺(tái)屬于你自己的云端計(jì)算機(jī),你可以把任務(wù)委托給它,這本身就非常驚人。其中一個(gè)主要優(yōu)勢(shì)是你可以并行運(yùn)行大量任務(wù)。但是,它也有一些挑戰(zhàn),例如環(huán)境配置復(fù)雜、設(shè)置麻煩,以及模型必須通過(guò)工具去驗(yàn)證更改、學(xué)習(xí)如何使用這種提示方式。

以我常用的類(lèi)比來(lái)說(shuō),這就像你雇了一位隊(duì)友,但你永遠(yuǎn)無(wú)法與他實(shí)時(shí)對(duì)話,只能遠(yuǎn)程、異步來(lái)回溝通。對(duì)某些人來(lái)說(shuō),這確實(shí)是一種有效的工作方式,也可能成為未來(lái)的重要方向。但在早期階段,它對(duì)新用戶的門(mén)檻非常高。

因此,我們?nèi)匀槐3帧翱晌汕抑鲃?dòng)”的愿景,但必須先以更直觀的方式讓用戶從中獲得價(jià)值。如今,大多數(shù)用戶是通過(guò) IDE 擴(kuò)展或 CLI 使用 Codex,讓智能體在本地與你協(xié)作。你的電腦提供環(huán)境,它在沙箱中操作,確保安全可靠,同時(shí)可以訪問(wèn)必要的依賴。如果某個(gè)命令無(wú)法在沙箱中運(yùn)行,它會(huì)詢問(wèn)你,讓你介入。這讓模型能進(jìn)入一個(gè)強(qiáng)大的“反饋循環(huán)”,而我們團(tuán)隊(duì)的任務(wù)就是讓這種反饋循環(huán)逐漸成為產(chǎn)品使用的自然副產(chǎn)品。

如果把模型比喻為團(tuán)隊(duì)成員,給他一臺(tái)剛從商店買(mǎi)來(lái)的全新電腦——沒(méi)有密碼、沒(méi)有權(quán)限、沒(méi)有工具——他很難發(fā)揮作用。但如果你和他并肩工作幾小時(shí),你會(huì)不斷為他補(bǔ)齊各種權(quán)限、工具與操作方式,而在獲得這些前提后,他就能獨(dú)立工作數(shù)小時(shí)。

因此,我的理解是:最初版本的 Codex 太“未來(lái)”,像一個(gè)遠(yuǎn)程云端智能體,以異步方式工作;而你們所做的,是把它重新拉回開(kāi)發(fā)者熟悉的環(huán)境,讓它在 IDE 本地工作,使用戶更容易習(xí)慣新的開(kāi)發(fā)方式。

Alex:這很有意思。在 OpenAI 內(nèi)部,我們長(zhǎng)期依賴 dogfooding(自己用自己做的產(chǎn)品)來(lái)推進(jìn)產(chǎn)品的發(fā)展。通過(guò)在真實(shí)環(huán)境中持續(xù)使用自己的產(chǎn)品,Codex 在過(guò)去一年里顯著加速了公司的工程進(jìn)程,不論是云端還是本地版本都讓整體效率獲得巨大提升。

不過(guò),內(nèi)部獲得的反饋與市場(chǎng)反饋并不完全一致。因?yàn)?OpenAI 的工程文化本身就以提示驅(qū)動(dòng)為中心:先通過(guò)提示規(guī)劃任務(wù),再依賴大規(guī)模并行執(zhí)行,最后異步收集結(jié)果。這種工作流程對(duì)我們來(lái)說(shuō)非常自然,但對(duì)大多數(shù)外部用戶而言卻并非直覺(jué),他們并不會(huì)天然以模型為中心組織開(kāi)發(fā)。

因此在構(gòu)建產(chǎn)品時(shí),我們依賴內(nèi)部信號(hào),但也必須清楚地意識(shí)到不同使用者之間存在巨大差異,需要同時(shí)為專(zhuān)家和新手提供可理解的工作路徑。

Lenny:我很好奇,訓(xùn)練數(shù)據(jù)在其中是否也發(fā)揮了作用。Codex 的進(jìn)步究竟來(lái)自更干凈或更好的數(shù)據(jù),還是更多來(lái)自模型本身的提升?有哪些因素真正推動(dòng)了它的加速?

Alex:這確實(shí)是大家常見(jiàn)的疑問(wèn):Codex 的能力提升究竟是因?yàn)閿?shù)據(jù)變得更好,還是來(lái)自模型本身?實(shí)際情況是多方面共同作用。

首先,模型本身確實(shí)有巨大提升。就在上周三,我們發(fā)布了 GPT-5.1.1 Codex Max,這個(gè)名稱(chēng)非常貼切。它之所以出色,是因?yàn)樵谀阒笆褂?GPT-5.1 Codex 處理的任何任務(wù)上,大約能快 30% 完成,同時(shí)它的推理能力也顯著增強(qiáng)。在更高層次的任務(wù)中,它表現(xiàn)得更智能。

你提到 Karpathy 的推文,那類(lèi)“給我你遇到的最棘手的 bug,我讓模型試試”的例子現(xiàn)在明顯增多,而 Codex Max 特別擅長(zhǎng)處理這些困難問(wèn)題。這本身就讓我們覺(jué)得非常激動(dòng)。

不過(guò)我們現(xiàn)在的思考方式有所變化。過(guò)去,我們更多認(rèn)為“只要訓(xùn)練最好的模型就好了”,但現(xiàn)在我們意識(shí)到真正的智能體并不只是一種模型,而是由三層結(jié)構(gòu)組成:一個(gè)非常智能的推理模型、一套 API,以及一個(gè)能讓模型發(fā)揮能力的框架。

例如,我們非常自豪 Codex 能夠連續(xù)長(zhǎng)時(shí)間運(yùn)行。有時(shí)我們甚至收到用戶反饋,說(shuō)模型連續(xù)運(yùn)行了 24 小時(shí)或更久。這已經(jīng)超過(guò)傳統(tǒng)模型的上下文長(zhǎng)度,因此我們必須為此設(shè)計(jì)出解決方案,也就是“壓縮”。模型需要理解壓縮的概念,API 必須能接收壓縮指令,框架最終負(fù)責(zé)傳遞這些信息。三者缺一不可。

市場(chǎng)上各種編碼工具各自擁有完全不同的工作方式,有的強(qiáng)調(diào)語(yǔ)義搜索,有的依賴自定義工具,有的像我們這樣強(qiáng)調(diào) shell 操作。如果想訓(xùn)練一個(gè)模型,讓它在所有框架下都表現(xiàn)最佳,可能并非不可能,但速度一定會(huì)被拖慢。因此,我們?cè)?Codex 中保持明確主張,讓它只使用 shell,并在沙盒環(huán)境內(nèi)運(yùn)行。這讓模型能夠快速學(xué)習(xí)適合這一環(huán)境的操作行為,也讓整個(gè)系統(tǒng)更加可靠。

因此,回到你提出的問(wèn)題,真正的加速來(lái)源于我們同時(shí)構(gòu)建這三層結(jié)構(gòu),并持續(xù)針對(duì)每一層進(jìn)行調(diào)整,再觀察它們?nèi)绾螀f(xié)同作用。這種緊密整合的產(chǎn)品與研究合作方式,是 Codex 能快速成長(zhǎng)的核心原因。

寫(xiě)代碼是模型最好的

方式與編碼智能體的未來(lái)

Lenny:從你的描述來(lái)看,真正推動(dòng) Codex 的,不只是模型能力的提升,而是模型、API 和框架三者共同構(gòu)成的整體系統(tǒng)。我很好奇,從更高層次來(lái)看,你認(rèn)為人工智能和編碼智能體的未來(lái)會(huì)走向什么方向?

Alex:我認(rèn)為未來(lái)的人工智能智能體會(huì)逐漸擺脫“被動(dòng)工具”的角色,轉(zhuǎn)向“主動(dòng)隊(duì)友”的角色。今天,大多數(shù)人工智能工具仍然依賴用戶提出明確指令,它們并不會(huì)主動(dòng)參與你的工作流程。但一個(gè)真正智能的系統(tǒng)應(yīng)該能夠做到默認(rèn)幫助你,而不是等待你下達(dá)命令。

回到軟件工程的例子,如果你把人工智能視為隊(duì)友,那么你不會(huì)希望每一個(gè)任務(wù)都必須以詳細(xì)指令開(kāi)始。你希望它能自動(dòng)理解上下文、自動(dòng)介入流程,并在你需要之前采取行動(dòng)。我認(rèn)為未來(lái)的智能體應(yīng)該能夠在軟件開(kāi)發(fā)的不同階段參與,包括規(guī)劃、構(gòu)思、驗(yàn)證、部署和維護(hù),不再局限于編寫(xiě)代碼。

我們希望模型具備足夠的判斷能力,能夠識(shí)別當(dāng)前任務(wù),理解它在整個(gè)開(kāi)發(fā)生命周期中的位置,并根據(jù)情況主動(dòng)采取行動(dòng)。這不僅是提升效率,而是改變整個(gè)開(kāi)發(fā)流程的思維方式。

從更廣義的人工智能未來(lái)來(lái)看,我們的目標(biāo)始終是構(gòu)建真正能夠造福所有人的人工智能。讓智能系統(tǒng)成為世界上每一位使用者的隊(duì)友,讓每個(gè)人都能因?yàn)槿斯ぶ悄芏鴵碛懈叩纳a(chǎn)力、更強(qiáng)的創(chuàng)造力,以及更公平的資源獲取能力。這是 OpenAI 的使命,也是我們構(gòu)建這些智能體系統(tǒng)的最終方向。

Lenny:聽(tīng)起來(lái),智能體未來(lái)不只是工具,而是真正的團(tuán)隊(duì)成員。你剛剛提到 Codex 的構(gòu)建方式與其他編碼產(chǎn)品不同,因?yàn)樗蟹浅C鞔_的框架與主張。我想更深入理解這意味著什么。為什么保持這種“強(qiáng)主張”如此重要?

Alex:如果你觀察市場(chǎng)上各種編碼產(chǎn)品,會(huì)發(fā)現(xiàn)它們有完全不同的工具框架與非常不同的理念。例如,有些系統(tǒng)主張一切靠語(yǔ)義搜索,有些依賴定制工具,有些讓用戶自己設(shè)計(jì)輸入方式,而 Codex 的核心主張是讓智能體像一個(gè)在 shell 中工作的工程隊(duì)友,并讓整個(gè)系統(tǒng)圍繞這個(gè)工作方式展開(kāi)。

如果我們?cè)噲D讓模型同時(shí)適應(yīng)所有不同的框架,速度會(huì)變得極慢。因?yàn)槟P捅仨殞W(xué)會(huì)彼此沖突的行為方式,而訓(xùn)練過(guò)程會(huì)被分散、干擾,最終無(wú)法做到任何一個(gè)方向的最佳表現(xiàn)。保持明確主張,使我們能在一個(gè)清晰的環(huán)境下快速迭代,并利用沙盒確保安全可靠。

讓智能體在 shell 環(huán)境中工作不僅是為了熟悉度,也因?yàn)樗茏钭匀坏嘏c開(kāi)發(fā)者的實(shí)際工作流程結(jié)合。模型會(huì)在一個(gè)穩(wěn)定的環(huán)境中執(zhí)行操作、驗(yàn)證結(jié)果、處理依賴,從而形成一個(gè)強(qiáng)大的反饋循環(huán)。我們?cè)俑鶕?jù)這個(gè)反饋循環(huán)調(diào)整模型、API 和框架,讓三者形成緊密協(xié)作的結(jié)構(gòu)。

因此,真正的加速來(lái)自于我們明確地構(gòu)建模型、API 和框架三層結(jié)構(gòu),讓它們成為一個(gè)完整的智能體系統(tǒng),而不是分散的組件。

Lenny:你覺(jué)得在這個(gè)領(lǐng)域最終該如何取勝?人工智能是否會(huì)一直處在公司之間互相競(jìng)爭(zhēng)、模型不斷互相超越的狀態(tài)?會(huì)不會(huì)出現(xiàn)某家公司能夠獨(dú)占鰲頭,讓其他人永遠(yuǎn)追不上?是否真的存在一條明確的通往勝利的道路?

Alex:這讓我想到一個(gè)重要概念:人工智能的未來(lái)不僅是擁有幾個(gè)你認(rèn)識(shí)的隊(duì)友來(lái)幫你寫(xiě)代碼,而是擁有一種真正意義上的團(tuán)隊(duì)合作精神。工程團(tuán)隊(duì)的成員做的事情遠(yuǎn)遠(yuǎn)不止寫(xiě)代碼,他們會(huì)安排日程、移動(dòng)會(huì)議、主動(dòng)修復(fù)問(wèn)題、提出建議,甚至在你還沒(méi)開(kāi)口前就做出正確的行動(dòng)。現(xiàn)在想象一個(gè)世界,幾乎每天都有研究實(shí)驗(yàn)室發(fā)布匪夷所思的新技術(shù),對(duì)人類(lèi)來(lái)說(shuō)要跟上這種節(jié)奏,必須依賴這樣的團(tuán)隊(duì)力量。而人工智能將成為這種團(tuán)隊(duì)的一部分。

未來(lái)的超級(jí)助手應(yīng)該是這樣的存在:你只需要開(kāi)口,它就知道該怎么幫助你。你不需要學(xué)習(xí)它的功能,也不需要閱讀使用技巧,只要啟用它,它就能立即發(fā)揮作用。如果我們能構(gòu)建出這樣一個(gè)系統(tǒng),它就會(huì)成為一個(gè)極具競(jìng)爭(zhēng)力、也極可能勝出的產(chǎn)品。

Alex:在我看來(lái),聊天是一種非常好的人工智能使用界面,特別是在你不知道該怎么做的時(shí)候。就像我在 Teams 或 Slack 里和隊(duì)友交流一樣,聊天是一種自然且通用的方式。我可以提出任何問(wèn)題,不論是否與編程有關(guān),而一個(gè)超級(jí)助手應(yīng)該在這種對(duì)話里表現(xiàn)得和隊(duì)友一樣。當(dāng)你需要深入代碼時(shí),你會(huì)使用更專(zhuān)門(mén)的工具,例如一個(gè)深度集成代碼環(huán)境的智能體。當(dāng)你只需要表達(dá)任務(wù)時(shí),聊天就夠了。所以我們希望構(gòu)建的人工智能既像 ChatGPT 這樣的通用助手,也能在專(zhuān)業(yè)領(lǐng)域,例如編程里,發(fā)揮深度能力。就像 ChatGPT 已經(jīng)成為很多人生活的一部分一樣,你甚至在工作之外也會(huì)使用它。等你開(kāi)始工作時(shí),你自然會(huì)說(shuō):我直接問(wèn)它就好了。我不需要了解所有功能連接器,它會(huì)告訴我它能做到什么,甚至?xí)谖覜](méi)提問(wèn)時(shí)主動(dòng)提供幫助。如果我們能達(dá)到這樣的狀態(tài),我認(rèn)為這就是一條構(gòu)建成功產(chǎn)品的道路。

Lenny:我和 ChatGPT 負(fù)責(zé)人 Nick Charlie 聊過(guò),他說(shuō) ChatGPT 的最初名字其實(shí)非常接近“超級(jí)助手”?雌饋(lái)這一條超級(jí)助手的路線,與編碼智能體的路線幾乎像是 B2C 和 B2B 兩種版本。一個(gè)更偏面向大眾,一個(gè)更偏團(tuán)隊(duì)?wèi)?yīng)用、編寫(xiě)代碼、自動(dòng)執(zhí)行各種任務(wù)。這也是你們的設(shè)計(jì)理念嗎?就像企業(yè)版的 ChatGPT?

Alex:我們現(xiàn)在討論的內(nèi)容橫跨大約一年的產(chǎn)品演進(jìn)時(shí)間,許多事情可能會(huì)發(fā)生得很快,也可能還需要時(shí)間。不過(guò)我可以解釋其中的邏輯。要構(gòu)建一個(gè)超級(jí)助手,它必須能夠真正“做事”,并不是停留在生成文本的層面。

過(guò)去一年我們學(xué)到的一個(gè)核心經(jīng)驗(yàn)是:模型要真正發(fā)揮作用,必須能夠使用電腦,而且需要能夠熟練使用。于是我們開(kāi)始思考,模型應(yīng)該以什么方式使用電腦。理論上可以嘗試模擬操作系統(tǒng)或使用鼠標(biāo)式的點(diǎn)擊,但這些方式既慢又不穩(wěn)定。事實(shí)證明,最強(qiáng)大、最可靠的方式,就是讓模型通過(guò)編寫(xiě)代碼來(lái)操作電腦。編碼是人工智能最自然、最高效的行動(dòng)方式。因此我們?cè)絹?lái)越明確地意識(shí)到,如果你想構(gòu)建一個(gè)通用智能體,它其實(shí)一定會(huì)具備編寫(xiě)代碼的能力。即使用戶不是工程師,他們也可能不會(huì)意識(shí)到智能體正在通過(guò)寫(xiě)代碼完成任務(wù)。就像人們不關(guān)心自己是否在使用互聯(lián)網(wǎng),只會(huì)問(wèn) Wi-Fi 有沒(méi)有連上一樣。

這也是我們?cè)?Codex 上構(gòu)建的核心:它是一個(gè)軟件工程團(tuán)隊(duì)的助手,而它能做事情的方式,就是寫(xiě)代碼。隨著我們看到越來(lái)越多人用 Codex 做產(chǎn)品相關(guān)的任務(wù),我們也更確信,幾乎所有強(qiáng)大的智能體最終都會(huì)通過(guò)編寫(xiě)代碼來(lái)完成工作。

Alex:這也是智能體真正強(qiáng)大的地方。通過(guò)寫(xiě)代碼,智能體能夠構(gòu)建可組合、可重復(fù)使用的能力。代碼可以被導(dǎo)入、被共享,就像團(tuán)隊(duì)成員之間共享腳本一樣。否則,一個(gè)只能通過(guò)點(diǎn)擊操作界面的智能體,其能力是無(wú)法積累、復(fù)用或共享的。因此,當(dāng)我們問(wèn)“通往勝利的道路是什么”,答案不是模型彼此比速度,而是構(gòu)建一個(gè)能夠?qū)懘a、能隨著團(tuán)隊(duì)使用而成長(zhǎng)的智能體體系。未來(lái)用戶加入團(tuán)隊(duì)時(shí),可以直接繼承智能體此前寫(xiě)過(guò)的腳本和能力,就像新人入職時(shí)繼承團(tuán)隊(duì)的內(nèi)部工具一樣。這會(huì)形成一個(gè)不斷累積的系統(tǒng),而不僅是模型單點(diǎn)的智能。

Lenny:Karpathy 曾說(shuō)過(guò),現(xiàn)在的智能體大多還很弱,但未來(lái)會(huì)非常強(qiáng)大。你對(duì)此怎么看?

Alex:我認(rèn)為編碼智能體現(xiàn)在已經(jīng)非常有價(jià)值,而代碼之外的智能體還在早期階段。我的個(gè)人判斷是,當(dāng)所有智能體都能通過(guò)編程以可組合的方式行動(dòng)時(shí),他們才會(huì)真正變得強(qiáng)大。這也是為什么為軟件工程師構(gòu)建產(chǎn)品如此重要。軟件工程師本身喜歡構(gòu)建、喜歡創(chuàng)造,他們會(huì)用各種方式推動(dòng)工具進(jìn)化,而這些涌現(xiàn)行為非常值得觀察。你能從工程師如何使用你的工具里學(xué)到巨量東西,也能更清楚應(yīng)該把什么融入產(chǎn)品。

AI 對(duì)軟件工程與

產(chǎn)品開(kāi)發(fā)的影響

Lenny:關(guān)于工程行業(yè),你知道很多人一直在討論未來(lái)是否還需要學(xué)習(xí)編程,工程師是否會(huì)被人工智能取代等問(wèn)題。但你把人工智能描述成隊(duì)友,一個(gè)與你并肩作戰(zhàn)的存在,讓你變得更強(qiáng),而不是替代者。你認(rèn)為,當(dāng)人工智能像隊(duì)友一樣與工程師協(xié)作,會(huì)對(duì)整個(gè)工程行業(yè)產(chǎn)生怎樣的影響?

Alex:這是一個(gè)非常復(fù)雜的問(wèn)題,但可以從幾個(gè)方向理解。我們剛才討論過(guò),每個(gè)智能體最終都可能需要通過(guò)編碼的方式來(lái)完成任務(wù),而這其實(shí)只是更大理念的一部分。隨著代碼變得越來(lái)越普及,它會(huì)被用于更多場(chǎng)景,而不是更少。即便在人工智能出現(xiàn)之前,代碼已經(jīng)無(wú)處不在,而人工智能只會(huì)讓編程變得更加核心和普遍。因此,具備這種能力的人類(lèi)工程師反而會(huì)更加重要,他們能夠理解問(wèn)題、設(shè)計(jì)系統(tǒng)、與人工智能協(xié)作、提出判斷,而這些能力會(huì)變得越來(lái)越有價(jià)值。我認(rèn)為人工智能并不會(huì)讓工程崗位消失,而是會(huì)改變工程師的工作內(nèi)容,F(xiàn)在我們要思考的是,作為產(chǎn)品團(tuán)隊(duì),我們應(yīng)該如何構(gòu)建工具,讓人類(lèi)的成長(zhǎng)速度最大化,而不是讓他們因?yàn)楣ぞ咛珡?fù)雜而失去方向。

比如現(xiàn)在與編碼智能體合作時(shí),大量代碼是由智能體寫(xiě)出的,但我們發(fā)現(xiàn)許多工程師真正感到樂(lè)趣的部分,是寫(xiě)代碼本身,而不是審查他人寫(xiě)的代碼。審查代碼通常是軟件工程中最枯燥也最耗費(fèi)精神的部分之一,F(xiàn)在人工智能能寫(xiě)出大量代碼,意味著工程師需要更多時(shí)間去審查,而不是創(chuàng)造。這讓工作體驗(yàn)變得更乏味。所以我們開(kāi)始思考怎樣讓產(chǎn)品變得更有趣,讓用戶感到擁有掌控感,而不是覺(jué)得自己被迫花時(shí)間檢查人工智能寫(xiě)的東西。我們加入了代碼審查功能,讓用戶能更快建立對(duì)人工智能輸出的信心;我們讓智能體在執(zhí)行任務(wù)時(shí)更努力地驗(yàn)證自己的工作結(jié)果,讓它先檢查,再讓用戶檢查;我們甚至?xí)伎荚诮缑嫔嫌脩魬?yīng)該先看到什么,例如對(duì)于一個(gè)界面組件,如果智能體同時(shí)生成了代碼和圖像預(yù)覽,我們會(huì)讓用戶先看到圖像,因?yàn)槟遣攀枪こ處熣嬲P(guān)心的最終結(jié)果。只有當(dāng)圖像已經(jīng)展示而且經(jīng)過(guò)智能體審查后,才需要用戶查看代碼本身。

Lenny:我之前采訪過(guò) Cursor 的 CEO Michael,他提到一種趨勢(shì)叫“規(guī)范驅(qū)動(dòng)開(kāi)發(fā)”,也就是你只需要寫(xiě)規(guī)范,由人工智能負(fù)責(zé)寫(xiě)全部代碼。他認(rèn)為未來(lái)工程師會(huì)在比現(xiàn)在更高的抽象層面上工作,而不再需要真正編寫(xiě)或查看大量代碼。你認(rèn)為工程未來(lái)會(huì)朝這個(gè)方向發(fā)展嗎?

Alex:我認(rèn)為抽象的層級(jí)一定會(huì)繼續(xù)提升,而且其實(shí)已經(jīng)在提升了。今天許多開(kāi)發(fā)方式本質(zhì)上就是一種提示驅(qū)動(dòng)的改寫(xiě),人們已經(jīng)開(kāi)始通過(guò)更高層的描述來(lái)讓人工智能完成工作。像規(guī)范驅(qū)動(dòng)開(kāi)發(fā)、計(jì)劃驅(qū)動(dòng)開(kāi)發(fā)等方式已經(jīng)有人在使用,比如當(dāng)人們問(wèn)“如何讓 Codex 在某個(gè)任務(wù)上持續(xù)工作更長(zhǎng)時(shí)間”時(shí),他們通常會(huì)先寫(xiě)一個(gè)類(lèi)似 Markdown 的計(jì)劃文檔,確認(rèn)步驟和目標(biāo),再讓智能體執(zhí)行。如果計(jì)劃本身具有結(jié)構(gòu)性和可驗(yàn)證性,智能體就能執(zhí)行很久。但規(guī)范驅(qū)動(dòng)開(kāi)發(fā)是否適用于所有人,我不是很確定,因?yàn)椴皇敲總(gè)人都喜歡寫(xiě)規(guī)范。確實(shí)有一些人天生使用規(guī)范來(lái)組織思想,但很多團(tuán)隊(duì)并不是這樣工作。

我有一個(gè)更接近現(xiàn)實(shí)工作的比喻:許多團(tuán)隊(duì)最終完成任務(wù)的方式,其實(shí)更像“聊天驅(qū)動(dòng)開(kāi)發(fā)”。團(tuán)隊(duì)成員在聊天工具里不斷討論、同步、修改、決策,流程在對(duì)話中自然推進(jìn),任務(wù)在溝通中就完成了。并不是每件事都需要正式規(guī)范,而是有人提一個(gè)想法,有人再補(bǔ)充說(shuō)明,有人提出下一步行動(dòng),然后工程師直接去做。這種方式其實(shí)比寫(xiě)規(guī)范更普遍,也更貼近日常行為模式。如果人工智能智能體要融入團(tuán)隊(duì),它很可能也會(huì)遵循這種方式。對(duì)于小問(wèn)題,人們不想寫(xiě)規(guī)范,只想說(shuō)一句話,比如“這個(gè)小 bug 修一下”。對(duì)于客戶反饋,人們只想把信息丟給它,讓它自己去理解并處理。在我設(shè)想的未來(lái),人工智能將能夠完全融入這種日常溝通流中,以聊天作為主要工作方式,而不是依賴正式文檔。

我甚至曾想象過(guò)一個(gè)極端版本的未來(lái):智能體人像使用手機(jī)一樣工作,它看到的一切都是豎屏視頻流,用戶可以像刷短視頻那樣快速瀏覽智能體提出的建議。如果不喜歡就左滑,如果覺(jué)得不錯(cuò)就右滑,也可以按住錄音直接補(bǔ)充指令。這種形式聽(tīng)起來(lái)有點(diǎn)荒謬,但它抓住了一個(gè)關(guān)鍵點(diǎn):智能體會(huì)持續(xù)觀察外部信號(hào)、用戶行為、市場(chǎng)動(dòng)向和團(tuán)隊(duì)狀態(tài),并主動(dòng)提出它認(rèn)為重要的事項(xiàng)。就像一個(gè)特別積極主動(dòng)的工程隊(duì)友,會(huì)告訴你應(yīng)該構(gòu)建什么、應(yīng)該修復(fù)什么,它會(huì)自己跟蹤情況,隨時(shí)把重要事推到你的面前。雖然我們沒(méi)有在做這個(gè)“滑動(dòng)式智能體應(yīng)用”,但這種思路很好地展示了智能體可能的未來(lái)形態(tài)。

Alex:在這個(gè)未來(lái)智能體的設(shè)想里,它會(huì)持續(xù)吸收外部信號(hào),而這點(diǎn)讓我覺(jué)得特別重要;仡櫼恍┏晒Φ娜斯ぶ悄墚a(chǎn)品,像我們?cè)?OpenAI 早期用過(guò)的 Branded Codebase,它最初就是 GitHub Copilot 背后的模型,后來(lái)我們又重新使用了這個(gè)品牌,因?yàn)樗_實(shí)非常出色。雖然代碼執(zhí)行很強(qiáng)大,但我其實(shí)更喜歡自動(dòng)補(bǔ)全功能。自動(dòng)補(bǔ)全可能是迄今為止最成功的人工智能產(chǎn)品之一,它的神奇之處在于,它總是在你需要靈感的時(shí)候出現(xiàn),而且能迅速提供幫助。如果它偶爾犯錯(cuò),通常也不是太煩人,這種錯(cuò)誤的代價(jià)很低。它讓我意識(shí)到自動(dòng)補(bǔ)全是一種混合主動(dòng)性的交互方式,它會(huì)根據(jù)你正在做的事情提供情境化的響應(yīng),在你行動(dòng)的瞬間與之配合。這種特性非常值得我們繼續(xù)探索。

當(dāng)我想到瀏覽器產(chǎn)品,比如我們之前發(fā)布的 Atlas,我覺(jué)得瀏覽器可能是人工智能下一步可以深度介入的位置。在瀏覽器里,人們每天處理的大量信息并不是代碼,而是各種網(wǎng)頁(yè)內(nèi)容。如果人工智能能在這個(gè)空間里主動(dòng)幫助你,它就能像隊(duì)友一樣處理許多與工作相關(guān)的事務(wù)。一個(gè)真正的隊(duì)友不會(huì)只處理你給到的任務(wù),而是會(huì)在你瀏覽網(wǎng)頁(yè)、查資料、閱讀文檔的時(shí)候主動(dòng)理解你在做什么,并快速提供協(xié)助。瀏覽器是一個(gè)天然的環(huán)境,因?yàn)樗休d了大量情境信息,也包含多種形式的信號(hào),而這些信號(hào)對(duì)智能體判斷你真正需要什么至關(guān)重要。

Lenny:我真的很喜歡你剛才說(shuō)的那段,因?yàn)樗畔⒘糠浅4,非常豐富。瀏覽器里的自動(dòng)補(bǔ)全也是很有意思的概念。想象人工智能可以在網(wǎng)頁(yè)、草稿、研究資料等一切你正在瀏覽的內(nèi)容中主動(dòng)幫助你,這太迷人了。我之后還想問(wèn)你更多關(guān)于 Atlas 的內(nèi)容。另外,你剛剛提到代碼執(zhí)行能力也很巧妙,我覺(jué)得我現(xiàn)在開(kāi)始看到整個(gè)體系是怎么串聯(lián)起來(lái)的了。

Lenny:我之前采訪過(guò) Block 的 CTO John。他們有一個(gè)內(nèi)部智能體系統(tǒng)叫 Goose。他講過(guò)一個(gè)例子,說(shuō)有個(gè)工程師走進(jìn)辦公室,一只“鵝”就像隊(duì)友一樣盯著他,監(jiān)聽(tīng)他的所有會(huì)議內(nèi)容、關(guān)注項(xiàng)目進(jìn)展,并主動(dòng)幫他做正確的事情。它會(huì)提交 PR、寫(xiě)郵件、草擬 Slack 消息,就像一個(gè)主動(dòng)的工程師隊(duì)友一樣,這和你描述的路線非常接近。

Alex:是的,這很有趣。如果我們問(wèn)他們?cè)谏a(chǎn)力上遇到的瓶頸是什么,我敢猜可能就是那些需要不斷查看的事物,而他們構(gòu)建的 Goose 正是針對(duì)這種問(wèn)題。在 Codex 里我們也看到類(lèi)似情況,人們非常喜歡用 Codex 集成 Slack,特別是在需要快速處理問(wèn)題的時(shí)候。比如在 Slack 里問(wèn)它某個(gè) bug 為什么出現(xiàn),數(shù)據(jù)科學(xué)家會(huì)問(wèn)某個(gè)指標(biāo)為什么變化,它可以直接在 Slack 窗口中給出分析。這種體驗(yàn)非常自然,也很容易被團(tuán)隊(duì)接受。但一旦涉及真正寫(xiě)代碼,人們還是需要回到代碼環(huán)境里去看實(shí)現(xiàn)。

我認(rèn)為現(xiàn)在真正的瓶頸已經(jīng)不在于寫(xiě)代碼本身,而在于驗(yàn)證代碼是否正確。工程師能愿意寫(xiě)代碼,但大型團(tuán)隊(duì)投入最多時(shí)間的活動(dòng)往往是代碼審查和驗(yàn)證,尤其是最后階段的質(zhì)量把控。如果我們想要讓智能體真正融入工程團(tuán)隊(duì),就必須讓團(tuán)隊(duì)能夠?yàn)橹悄荏w配置更多自主性,讓智能體在后期流程中承擔(dān)更多責(zé)任,而不是把大量驗(yàn)證任務(wù)重新推回給工程師。

Alex:寫(xiě)代碼是愉快的,但檢查別人寫(xiě)的代碼往往不是。尤其當(dāng)你需要負(fù)責(zé)最終上線質(zhì)量時(shí),任何微小的錯(cuò)誤都可能導(dǎo)致生產(chǎn)環(huán)境崩潰,而你必須對(duì)這些問(wèn)題負(fù)責(zé)。現(xiàn)在人工智能能寫(xiě)大量代碼,但團(tuán)隊(duì)最終要花更多時(shí)間去驗(yàn)證它寫(xiě)的東西,這讓工程的后期階段成為新的瓶頸。這也是我們不斷思考的一件事:如果我們希望智能體真正幫助人類(lèi),而不是把工程師推出流程之外,我們必須讓智能體獲得更多在后期階段的自主性,并且讓團(tuán)隊(duì)能夠配置智能體,使它在驗(yàn)證、檢查、審閱方面承擔(dān)更多實(shí)際責(zé)任。否則工程師永遠(yuǎn)會(huì)卡在最后的審查階段,被迫花大量時(shí)間做他們并不喜歡的部分,而不是構(gòu)建與創(chuàng)造。

Lenny:你說(shuō)的完全符合我從其他公司聽(tīng)到的情況。許多真正處在技術(shù)前沿的團(tuán)隊(duì)現(xiàn)在遇到最大的瓶頸并不是寫(xiě)代碼,而是弄清楚要構(gòu)建什么,然后在最后階段花大量時(shí)間審查、確認(rèn)、驗(yàn)證。如果一個(gè)項(xiàng)目需要一百個(gè)小時(shí),有八十個(gè)小時(shí)可能都花在審查與驗(yàn)證上,而不是構(gòu)建本身。你剛才提到的這種方向,確實(shí)非常接近許多公司正在思考的未來(lái)。

Codex 如何影響產(chǎn)品經(jīng)理的運(yùn)作方式

Lenny:Codex 對(duì)你作為產(chǎn)品經(jīng)理的工作方式帶來(lái)了哪些影響?我們已經(jīng)知道它明顯改變了工程部門(mén),比如代碼是 AI 幫寫(xiě)的。那么它對(duì)你以及 OpenAI 的項(xiàng)目經(jīng)理帶來(lái)了什么實(shí)際變化?

Alex:對(duì)我來(lái)說(shuō),我感受到的最大變化是“能力被大幅增強(qiáng)”的感覺(jué)。我一直都是偏技術(shù)型的產(chǎn)品經(jīng)理,特別是在為工程師構(gòu)建產(chǎn)品時(shí),我總覺(jué)得必須深入理解產(chǎn)品本身,像吃自己的狗糧一樣使用它。但現(xiàn)在的感覺(jué)是,你不僅能理解產(chǎn)品,還能做遠(yuǎn)比以前更多的事情。Scott Belsky 曾談過(guò)“壓縮人才階層”的想法,也許我沒(méi)有說(shuō)得很準(zhǔn)確,但意思是角色之間的界限變得模糊了,對(duì)某些角色的需求比以前少了,因?yàn)槊總(gè)人能做的事情變多了。每當(dāng)你做一件事,你就突破一次溝通障礙,于是整個(gè)團(tuán)隊(duì)的效率也被抬高了。

如果你問(wèn)更具體的產(chǎn)品工作方式,現(xiàn)在我可以直接問(wèn) Codex 各種問(wèn)題,獲得意見(jiàn),也能快速了解新的變化。原型設(shè)計(jì)也變得更快了。很多人談到規(guī)范文檔,不過(guò)在我看來(lái),真正讓我意外的是,我們?cè)緲?gòu)建 Codex 的核心目標(biāo),是讓它編寫(xiě)能夠被投入生產(chǎn)的代碼。然而我們現(xiàn)在看到的大量實(shí)際用例,卻是工程師用 Codex 來(lái)寫(xiě)“一次性代碼”。這種現(xiàn)象讓我感覺(jué)像是回歸了“無(wú)處不在的代碼”這個(gè)古老的想法。

許多人開(kāi)始用 Codex 做信息分析,他們把一堆數(shù)據(jù)丟進(jìn)去,讓 Codex 幫他們構(gòu)建一個(gè)交互式的數(shù)據(jù)查看器。這種事情以前做起來(lái)很麻煩,現(xiàn)在卻完全值得讓智能體去處理。同樣的事情也發(fā)生在設(shè)計(jì)團(tuán)隊(duì),如果設(shè)計(jì)師想制作一個(gè)動(dòng)畫(huà),他們過(guò)去必須自己寫(xiě)程序,現(xiàn)在他們用 Codex 寫(xiě)了一個(gè)臨時(shí)的動(dòng)畫(huà)編輯器,再用那個(gè)編輯器制作動(dòng)畫(huà),然后提交到代碼庫(kù)里。我們的設(shè)計(jì)團(tuán)隊(duì)因?yàn)?Codex 獲得了巨大的加速。他們甚至建立了類(lèi)似 “Vibe-coded” 的分類(lèi)體系,把自己的原型直接做成 Codex 使用的版本。

現(xiàn)在團(tuán)隊(duì)的討論方式也發(fā)生了變化,因?yàn)槌汕先f(wàn)的事情同時(shí)發(fā)生,設(shè)計(jì)師往往直接在自己的原型里表達(dá)想法,而不是在文檔里討論。我們會(huì)試用他們的原型,如果大家喜歡,他們就把這個(gè)原型實(shí)現(xiàn)為產(chǎn)品界面的 Vibe Code,工程師再負(fù)責(zé)把它轉(zhuǎn)化為正式的 PR。如果代碼庫(kù)是 Rust 或 CLI 這樣比較復(fù)雜的環(huán)境,他們會(huì)做到接近目標(biāo),然后工程師幫他們完成最后提交。

最近發(fā)布的 Sora 安卓應(yīng)用就是一個(gè)最震撼的例子,內(nèi)部因?yàn)槭褂?Codex 而產(chǎn)生了巨大的速度提升。OpenAI 的技術(shù)復(fù)雜度非常高,而過(guò)去一年我們看到全公司各類(lèi)角色的使用技巧都大幅提升,而 Codex 的影響也隨之增強(qiáng)。Sora 安卓版是一個(gè)全新應(yīng)用,我們從零開(kāi)發(fā),只用了 18 天就做出員工可試用版本,又過(guò)了 10 天發(fā)布給公眾。換句話說(shuō),從開(kāi)始到正式上線只用了 28 天。而這個(gè)過(guò)程中,Codex 幫了非常大的忙,有一種“游戲開(kāi)了簡(jiǎn)單模式”的感覺(jué)。

當(dāng)你是一家必須在多個(gè)平臺(tái)構(gòu)建軟件的公司時(shí),Codex 會(huì)讓這些事情變得容易許多。工程師讓 Codex 去分析 iOS 應(yīng)用,然后自動(dòng)生成遷移到 Android 的工作計(jì)劃,再根據(jù)計(jì)劃執(zhí)行。由于我們同時(shí)關(guān)注 iOS 與 Android,Codex 能提供很多可參考的部分,顯著加速了開(kāi)發(fā)。結(jié)果就是,團(tuán)隊(duì)只用了兩周時(shí)間就完成上線準(zhǔn)備,而整個(gè)四周流程包括投產(chǎn)上線。更夸張的是,應(yīng)用上線后馬上登頂應(yīng)用商店排行榜。

Atlas 瀏覽器的開(kāi)發(fā)也是類(lèi)似的故事。Atlas 是一個(gè)很有分量的項(xiàng)目,因?yàn)闃?gòu)建瀏覽器本身就是非常困難的事情。我們必須構(gòu)建許多底層系統(tǒng),而現(xiàn)在的團(tuán)隊(duì)基本都是高級(jí)用戶級(jí)別地使用 Codex。他們告訴我,過(guò)去需要 2~3 名工程師花 2~3 周才能完成的功能,現(xiàn)在只需要一個(gè)工程師一周時(shí)間。這是巨大的加速。目前團(tuán)隊(duì)正在全力構(gòu)建 Windows 版本,同時(shí)改進(jìn) Windows 上的 Codex 支持。最近我們發(fā)布的模型已經(jīng)開(kāi)始原生支持 PowerShell,這是一種非常重要的 Windows 系統(tǒng)語(yǔ)言,這也讓 Codex 在 Windows 平臺(tái)上的表現(xiàn)提升許多。

整個(gè)公司因?yàn)?Codex 而加速,從研究到模型訓(xùn)練速度,再到設(shè)計(jì)與營(yíng)銷(xiāo),我們經(jīng)?吹疆a(chǎn)品營(yíng)銷(xiāo)人員直接在 Slack 里更新字符串或文案,這些都是變化的一部分。公司內(nèi)部對(duì) AI 的使用已經(jīng)滲透到每個(gè)角色,速度之快讓人驚嘆。Sora 應(yīng)用的成功也證明了這種變化的力量,你能想象只有兩三個(gè)工程師,卻發(fā)布了一款登頂全球應(yīng)用商店的產(chǎn)品,這在以前幾乎不可想象。

Atlas 的開(kāi)發(fā)同樣令人震撼。工程師們告訴我,他們幾乎用 Codex 處理所有事情。當(dāng)我問(wèn)他們“你們?cè)趺春饬考铀佟,他們說(shuō),過(guò)去需要兩三周和兩三名工程師的工作,現(xiàn)在一個(gè)人一周搞定。你問(wèn)未來(lái)是否可能讓非工程師完成這些工作?我認(rèn)為這是可能的。角色邊界正在模糊化。你仍然需要對(duì)自己構(gòu)建的東西的本質(zhì)有理解,但具體細(xì)節(jié)將越來(lái)越抽象,就像你不用懂匯編語(yǔ)言也能寫(xiě) Swift,一樣的道理。

隨著時(shí)間推移,我們會(huì)看到越來(lái)越高的抽象層,接近自然語(yǔ)言本身的抽象。自然語(yǔ)言極其靈活,工程師可以用它討論計(jì)劃、規(guī)格、產(chǎn)品與想法,而智能體可以將這些自然語(yǔ)言直接轉(zhuǎn)為可執(zhí)行代碼。未來(lái)不會(huì)突然變成沒(méi)人再寫(xiě)代碼,所有事情都用規(guī)范文檔描述,而會(huì)是循序漸進(jìn)的過(guò)渡。我們先為編碼智能體設(shè)置完善的預(yù)覽系統(tǒng)與測(cè)試系統(tǒng),讓它能看到自己修改后的結(jié)果。下一步可能讓智能體加載示例頁(yè)面、自動(dòng)檢查視覺(jué)效果。再進(jìn)一步,人類(lèi)負(fù)責(zé)篩選,智能體負(fù)責(zé)構(gòu)建。未來(lái) Codex 甚至能自動(dòng)告訴你如何設(shè)置環(huán)境,甚至在代碼庫(kù)里自動(dòng)設(shè)置。

Codex對(duì)生產(chǎn)力的影響、創(chuàng)意與

執(zhí)行力的價(jià)值、垂直領(lǐng)域AI的未來(lái)

Lenny:生活在這樣一個(gè)劇烈變化的時(shí)代真是令人驚嘆。我很好奇這些變化會(huì)產(chǎn)生哪些次生影響,尤其是當(dāng)構(gòu)建速度變得如此之快時(shí),會(huì)帶來(lái)什么后果?這是否意味著分發(fā)會(huì)變得更重要?創(chuàng)意會(huì)變得更有價(jià)值?當(dāng)變化如此迅速時(shí),你覺(jué)得我們會(huì)走向什么方向?

Alex:我仍然認(rèn)為,想法本身的價(jià)值沒(méi)有很多人想象的那么高。真正困難的永遠(yuǎn)是執(zhí)行,你可以在短時(shí)間內(nèi)搭建一個(gè)東西,但要讓它真正有意義、連貫、有生命力,需要極高的執(zhí)行力。產(chǎn)品的分發(fā)依然極其重要,一切所有的前后環(huán)節(jié)都顯得更關(guān)鍵了。除了構(gòu)思、上市和盈利這些核心環(huán)節(jié)以外的許多部分,都因?yàn)殚_(kāi)發(fā)變?nèi)菀锥兊貌辉倌敲聪∪薄?/p>

過(guò)去我們處在一個(gè)奇怪的臨時(shí)狀態(tài),構(gòu)建產(chǎn)品太難,因此只有極擅長(zhǎng)產(chǎn)品開(kāi)發(fā)的人能夠突破重圍,你甚至不需要對(duì)某個(gè)客戶群體有深度理解,也可能做出成功產(chǎn)品。而現(xiàn)在情況完全不同了,我認(rèn)為如果只能選擇一件必須掌握的能力,那就是對(duì)某個(gè)具體客戶的問(wèn)題擁有極其深入的理解。如果你創(chuàng)辦一家初創(chuàng)公司,并且對(duì)行業(yè)有深度洞察,同時(shí)在領(lǐng)域里有人脈,尤其是面對(duì)被現(xiàn)有 AI 工具嚴(yán)重服務(wù)不足的客戶,那么你已經(jīng)掌握了成功的核心。如果你的能力很強(qiáng),但沒(méi)有明確的客戶對(duì)象,情況反而會(huì)更困難,F(xiàn)在的時(shí)代對(duì)“深刻理解問(wèn)題的人”更友好,對(duì)“只擅長(zhǎng)構(gòu)建東西的人”更不友好。

這也是為什么許多人看好垂直領(lǐng)域的 AI 初創(chuàng)公司。你可以用通用模型解決許多泛化問(wèn)題,但如果你致力于把演示文稿制作做到極致,你會(huì)比任何人都更了解那類(lèi)用戶的問(wèn)題。你會(huì)深刻融入他們的日常工作流,你會(huì)知道哪些細(xì)節(jié)真正重要。這些東西才是最終決定性的。

衡量Codex的進(jìn)步:用戶留存、

真實(shí)反饋與社區(qū)信號(hào)

Lenny:當(dāng)你們?cè)u(píng)估 Codex 的發(fā)展時(shí),會(huì)關(guān)注什么指標(biāo)?你們有很多基準(zhǔn)測(cè)試,也做了許多內(nèi)部評(píng)估,那么真正讓你們判斷“我們做得很好”的指標(biāo)是什么?

Alex:一個(gè)我不斷提醒自己的事情是,像 Codex 這樣的產(chǎn)品,本質(zhì)上是一種你必須真正使用的工具。這意味著我們作為團(tuán)隊(duì),很容易變成“高級(jí)用戶”,并在無(wú)意間過(guò)度關(guān)注一些對(duì)普通用戶來(lái)說(shuō)并不關(guān)鍵的功能。為了避免這種偏差,我們必須非常認(rèn)真地看待用戶留存數(shù)據(jù),尤其是 D7,也就是用戶使用后的第七天是否還會(huì)回來(lái)。

我甚至?xí)?cè)許多新賬號(hào),只為了更真實(shí)地體驗(yàn)首次使用流程。我愿意花錢(qián)去購(gòu)買(mǎi)其他產(chǎn)品,只為確保我們對(duì)比的是實(shí)情。因?yàn)檫@個(gè)領(lǐng)域仍處于早期,人們對(duì)這些工具的使用習(xí)慣還沒(méi)有完全形成。

另一個(gè)特別重要的角度是社區(qū)反饋。我們有一個(gè)內(nèi)部的反饋與社交媒體團(tuán)隊(duì),他們非常深入地泡在 Reddit、Twitter 等社區(qū)里。Reddit 的內(nèi)容更真實(shí),Twitter 上的討論往往更即時(shí)也更尖銳。我們非常關(guān)注這些渠道的氛圍,因?yàn)橐粋(gè)編碼智能體可以做很多事情,但往往會(huì)在某些細(xì)節(jié)上失敗,而這些失敗只有真實(shí)用戶才會(huì)指出。Reddit 是我越來(lái)越關(guān)注的地方,因?yàn)槟抢锏母哔澰u(píng)論通常反映真實(shí)用戶的痛點(diǎn)與需求。

如果你問(wèn)我?茨男┳影鎵K,我不會(huì)特別說(shuō)一個(gè)名字,因?yàn)?Reddit 的推薦機(jī)制已經(jīng)能把最重要的內(nèi)容推給我。我只需要觀察人們真實(shí)表達(dá)的情緒,那比任何內(nèi)部指標(biāo)都更有價(jià)值。

為什么要做瀏覽器、Atlas的由來(lái)、

情境化助手的愿景

Lenny:你們發(fā)布了 Atlas。我在推特上說(shuō)我試用了 Atlas,但我并不是很喜歡“純 AI 搜索”的體驗(yàn),有時(shí)候我就是想用 Google,不想等 AI 給我一個(gè)完整的回答,而且當(dāng)時(shí)我感覺(jué)沒(méi)有辦法切換,所以我發(fā)推說(shuō)我要切回去。我并不是覺(jué)得這有什么問(wèn)題,但我看到好像有人因此有點(diǎn)受傷。我猜這其實(shí)是典型的“先發(fā)布產(chǎn)品、觀察用戶行為、再迭代”的例子吧。我想問(wèn)的問(wèn)題是:你們?yōu)槭裁匆鲆粋(gè)網(wǎng)頁(yè)瀏覽器?

Alex:我之前在 Atlas 上工作過(guò)一段時(shí)間,說(shuō)一下我自己的故事。我在加入 OpenAI 之前做過(guò)一個(gè)關(guān)于屏幕共享與結(jié)對(duì)編程方向的創(chuàng)業(yè)項(xiàng)目,而我們當(dāng)時(shí)的核心理念就是構(gòu)建一個(gè)具備上下文理解能力的桌面助手,因?yàn)槲矣X(jué)得把所有背景告訴助手實(shí)在太麻煩了,你得花很多精力解釋你在做什么,而如果助手能自己理解你的工作情境,它就能讓你的操作速度快很多。所以從某種意義上說(shuō),Codex 就像一個(gè)從編碼任務(wù)出發(fā)的“情境助手”。

對(duì)我個(gè)人來(lái)說(shuō),很多工作都發(fā)生在瀏覽器里,所以如果我們能自己做一個(gè)瀏覽器,讓智能體在更完整的上下文中幫助你,而不是像傳統(tǒng)桌面軟件那樣通過(guò)一種“黑客式”的方式抓取信息,那會(huì)極大改善助手的體驗(yàn)。瀏覽器能夠直接訪問(wèn)渲染引擎,而不是依靠截圖,也不需要依賴那些緩慢且不穩(wěn)定的接口。它可以直接讀取 DOM、輔助功能樹(shù)等所有結(jié)構(gòu)化信息,以更可靠的方式提供幫助。

我喜歡用電子游戲來(lái)類(lèi)比,比如你走到某個(gè)對(duì)象旁邊,按下 X 鍵,游戲就會(huì)自動(dòng)執(zhí)行正確的互動(dòng)。在軟件世界里,要做到這一點(diǎn),系統(tǒng)必須知道你當(dāng)前在做什么,需要什么幫助,并且必須有恰當(dāng)?shù)那榫尘索。想象我們要覆蓋的所有世界范圍的任務(wù),智能體每天有可能幫助你成千上萬(wàn)次。如果它只能通過(guò)推送通知來(lái)告訴你“我?guī)湍阕隽诉@個(gè)”,那么你每天會(huì)收到成千上萬(wàn)條 AI 通知,那一定令人崩潰。真正理想的方式是,當(dāng)你專(zhuān)注于某個(gè)工作,比如查看儀表盤(pán)時(shí)指標(biāo)突然下降,智能體可以在右側(cè)出現(xiàn),為你解釋原因,并告訴你可能的解決方案,而且它只在你關(guān)心的那一刻出現(xiàn)。

瀏覽器讓我們能夠做到兩件最重要的事情:第一,為智能體提供完整的情境,讓它知道什么時(shí)候該幫忙;第二,讓用戶完全掌控哪些內(nèi)容能被智能體看到。如果你愿意,你可以在 AI 瀏覽器中打開(kāi)頁(yè)面,讓它對(duì)頁(yè)面采取行動(dòng);如果不愿意,你可以在其他瀏覽器中打開(kāi),這種清晰的邊界既保證安全又讓體驗(yàn)順暢。我們希望實(shí)現(xiàn)一種“混合主動(dòng)性”,在你最需要的恰當(dāng)時(shí)刻表現(xiàn)出智能,而不是以通知轟炸你。

Codex的非工程應(yīng)用:設(shè)計(jì)、

分析與意想不到的用途

Lenny:說(shuō)到 Codex 作為超級(jí)助手,你提到它不僅能寫(xiě)代碼,還能像隊(duì)友一樣幫助你工作。那么有沒(méi)有哪些非工程師對(duì) Codex 的使用方式讓你覺(jué)得有趣或意想不到?

Alex:確實(shí)有很多意想不到的用法,但目前為止,最明顯的仍然是那些偏向技術(shù)或與編程相關(guān)的領(lǐng)域,比如數(shù)據(jù)團(tuán)隊(duì)或做分析的人。然而我相信隨著時(shí)間推移,非工程角色會(huì)出現(xiàn)更多創(chuàng)造性的用法,F(xiàn)在團(tuán)隊(duì)主要專(zhuān)注于讓 Codex 在編碼上做到極致,因?yàn)檫@里還有大量基礎(chǔ)工作要完善。

Codex 適用哪些代碼庫(kù)、

如何最好使用它、入門(mén)策略

Lenny:對(duì)于想使用 Codex 的人來(lái)說(shuō),Codex 是否能適用于所有類(lèi)型的代碼?它能支持哪些語(yǔ)言?比如有人說(shuō)“我不懂 SAP,你能用 Codex 直接幫我寫(xiě)嗎”?最佳實(shí)踐是什么?

Alex:實(shí)際上,使用 Codex 的最佳方式不是給它簡(jiǎn)單任務(wù),而是給它最困難、最真實(shí)的問(wèn)題。有些工具適合從簡(jiǎn)單任務(wù)試用,而 Codex 的定位更像是一款專(zhuān)業(yè)工具,如果你想評(píng)估它的真實(shí)能力,應(yīng)該讓它處理大型代碼庫(kù)里的復(fù)雜任務(wù),例如調(diào)試一個(gè)你自己也不確定原因的 bug,讓它為你查找問(wèn)題根源,再實(shí)現(xiàn)修復(fù)方案。

關(guān)于語(yǔ)言支持,我們的訓(xùn)練覆蓋范圍跟真實(shí)世界的使用分布接近,只要不是特別冷門(mén)或完全私有的小眾語(yǔ)言,Codex 基本都能處理。對(duì)剛開(kāi)始使用 Codex 的人來(lái)說(shuō),我會(huì)建議把它當(dāng)成新隊(duì)友一樣,先讓它理解代碼庫(kù),再一起制定計(jì)劃,然后讓它逐步執(zhí)行任務(wù)。以這種方式,你能更快建立信任,也更容易掌握如何與 Codex 有效協(xié)作。

AI時(shí)代的技能、職業(yè)影響、

未來(lái)AGI時(shí)間表與團(tuán)隊(duì)擴(kuò)張

Lenny:當(dāng) AI 逐漸能寫(xiě)代碼后,很多人開(kāi)始問(wèn):我還應(yīng)該學(xué)習(xí)編程嗎?如果我是學(xué)生,我應(yīng)該學(xué)習(xí)什么?哪些計(jì)算機(jī)科學(xué)知識(shí)在未來(lái)更重要?

Alex:我認(rèn)為學(xué)習(xí)編程依然非常重要,但理由正在發(fā)生變化。首先,隨著編碼智能體不斷變強(qiáng),學(xué)生和職涯早期的人反而能更快做出完整作品,這意味著他們與資深工程師之間的差距縮小了。使用最新工具的熟練度將成為重要優(yōu)勢(shì)。

另一面是,真正關(guān)鍵的不是“打字寫(xiě)程序”,而是理解軟件系統(tǒng)結(jié)構(gòu)、理解什么使系統(tǒng)高效、能夠推理復(fù)雜架構(gòu),并具備團(tuán)隊(duì)溝通協(xié)作能力。AI 不會(huì)突然讓所有人不用寫(xiě)代碼,而是會(huì)逐步擴(kuò)展抽象層,但系統(tǒng)設(shè)計(jì)與判斷力仍然屬于人類(lèi)。工程師仍需能配置智能體,使其驗(yàn)證自己的工作。比如我們?cè)?Atlas 工程中,有工程師專(zhuān)門(mén)要求 Codex 解釋自己無(wú)法自我驗(yàn)證的原因,然后讓 Codex 反復(fù)循環(huán)改進(jìn)。

此外,如果一個(gè)人對(duì)某個(gè)領(lǐng)域擁有深厚知識(shí),例如模型訓(xùn)練基礎(chǔ)設(shè)施、數(shù)據(jù)系統(tǒng)或其他復(fù)雜領(lǐng)域,他們依然會(huì)極具價(jià)值,因?yàn)?AI 反而會(huì)迫使這些專(zhuān)家使用智能體來(lái)加速自己的工作。

Codex自我訓(xùn)練、自動(dòng)監(jiān)控系統(tǒng)、

未來(lái)智能體的形態(tài)

Alex:當(dāng)你處于某個(gè)技術(shù)前沿領(lǐng)域時(shí),會(huì)出現(xiàn)一種非常有趣的現(xiàn)象:你不僅需要深刻理解那個(gè)領(lǐng)域本身,還必須充分利用編碼智能體,而智能體的存在反過(guò)來(lái)又加速你推進(jìn)前沿本身的能力。Codex 在 OpenAI 內(nèi)部已經(jīng)編寫(xiě)了大量用于管理訓(xùn)練運(yùn)行和關(guān)鍵基礎(chǔ)設(shè)施的代碼,我們的研究迭代速度極快,而 Codex 在審查過(guò)程中發(fā)現(xiàn)了許多真正有意義的錯(cuò)誤,包括一些非常隱蔽的配置問(wèn)題。這讓我們看到了一種未來(lái)趨勢(shì)的影子:我們甚至開(kāi)始出現(xiàn)類(lèi)似“Codex 委員會(huì)”這樣的結(jié)構(gòu),使 Codex 幫助 Codex 自身服務(wù)訓(xùn)練系統(tǒng)。

Lenny :Codex 的自我訓(xùn)練到底意味著什么?

Alex:在訓(xùn)練過(guò)程中有大量圖表,人們必須隨時(shí)查看它們,因?yàn)橛?xùn)練成本極高且變化迅速。訓(xùn)練運(yùn)行背后存在許多系統(tǒng),其中一個(gè)系統(tǒng)出錯(cuò)就可能導(dǎo)致整個(gè)訓(xùn)練失效,所以 Codex 會(huì)在循環(huán)中持續(xù)檢查這些圖表的表現(xiàn),并且逐漸學(xué)習(xí)如何從中推斷問(wèn)題。當(dāng)某個(gè)系統(tǒng)需要修復(fù)或暫停時(shí),Codex 會(huì)識(shí)別出異常,提出需要采取行動(dòng)的建議,甚至可能有權(quán)直接修復(fù)并重啟流程。我們?nèi)栽谔剿髯钣行У姆绞,但核心思路是讓智能體持續(xù)監(jiān)控和優(yōu)化訓(xùn)練,使研究團(tuán)隊(duì)能以更高效的方式推進(jìn)工作。

這種能力讓我覺(jué)得未來(lái)的智能體絕不會(huì)只是一個(gè)“寫(xiě)代碼工具”,它將成為一種具備持續(xù)監(jiān)督能力、判斷能力和行動(dòng)能力的系統(tǒng)成員。它理解代碼庫(kù),卻不僅僅服務(wù)于代碼本身,而是可以在整個(gè)復(fù)雜系統(tǒng)運(yùn)行過(guò)程中發(fā)揮“智能監(jiān)護(hù)人”的作用。

關(guān)于 AGI 的時(shí)間表:

我們距離人類(lèi)級(jí)智能有多近?

Lenny:AGI 的時(shí)間表眾說(shuō)紛紜,很難確定真正的進(jìn)展。你怎么看?我們是否正在向更像人類(lèi)的人工智能逐步進(jìn)化?

Alex:對(duì)我來(lái)說(shuō),這個(gè)問(wèn)題更像是在思考我們什么時(shí)候能看到真正意義上的加速曲線,也就是那種典型的曲棍球棒式增長(zhǎng)。

現(xiàn)在有許多限制因素,但我認(rèn)為最被低估的限制因素之一其實(shí)是人類(lèi)本身,比如人的打字速度、提示寫(xiě)作速度、人類(lèi)的多任務(wù)能力。就像你剛才提到的,你可以讓智能體監(jiān)督你做的所有工作,但如果你沒(méi)有為智能體構(gòu)建良好的自主機(jī)制,你仍然得不斷驗(yàn)證它的工作是否正確。于是我們就遇到了新的瓶頸:你能不能審查它寫(xiě)出的所有代碼?能不能驗(yàn)證所有它提出的修改?如果人類(lèi)在這個(gè)環(huán)節(jié)仍然處于瓶頸位置,那么整個(gè)系統(tǒng)就無(wú)法真正加速。

所以我們需要把這些生產(chǎn)力循環(huán)中的人為阻塞解除掉,把那些不斷提示與不斷驗(yàn)證的步驟轉(zhuǎn)移出去。如果我們能重建系統(tǒng),讓智能體能夠默認(rèn)發(fā)揮作用,而不是由人不斷喚醒,那么我們就能真正解鎖那條曲棍球棒曲線。

這并不是一個(gè)非此即彼的過(guò)程,很大程度取決于你在構(gòu)建什么。如果你明年是一家創(chuàng)業(yè)公司,正在構(gòu)建一個(gè)新應(yīng)用,那么你完全可能把它搭建在一個(gè)比以往更自主的智能體堆棧上。相反,如果你在 SAP 這樣的公司工作,它們有大量的舊系統(tǒng),不可能一夜之間讓智能體完全接管端到端流程,它們必須逐步替換、逐步更新,讓智能體能處理越來(lái)越多的部分。

所以我對(duì)這個(gè)問(wèn)題的回答可能有點(diǎn)無(wú)聊,但我確實(shí)認(rèn)為,從明年開(kāi)始我們會(huì)看到第一批早期 adopters 的生產(chǎn)力出現(xiàn)曲棍球式的躍升,而在接下來(lái)的幾年里,這種加速會(huì)不斷擴(kuò)散。當(dāng)曲線進(jìn)一步變陡,真正進(jìn)入模糊但高速的階段,我們可能就已經(jīng)靠近 AGI 了。

Lenny:我喜歡這個(gè)答案,它很現(xiàn)實(shí),也很符合我們常談的那一點(diǎn):審查人工智能的輸出真的很煩人,也是巨大的瓶頸。提升編碼效率是一回事,但解決后期的驗(yàn)證問(wèn)題是另外一件更關(guān)鍵的事情。你提出“人類(lèi)打字速度是瓶頸”這個(gè)觀點(diǎn)非常獨(dú)特,我從未聽(tīng)過(guò),但它非常有啟發(fā)性。

https://www.youtube.com/watch?v=z1ISq9Ty4Cg&t=224s

聲明:本文為 AI前線翻譯整理,不代表平臺(tái)觀點(diǎn),未經(jīng)許可禁止轉(zhuǎn)載。

AI 工具網(wǎng)站上線海外,原來(lái)只需要幾分鐘?迭代慢、延遲高、變現(xiàn)難這三大“天坑”,被騰訊云 EdgeOne Pages 正式版一次填平!

立即注冊(cè),領(lǐng)取開(kāi)發(fā)者專(zhuān)屬權(quán)益包:免費(fèi)加速無(wú)限量 + 免運(yùn)維全棧開(kāi)發(fā) + 安全出海一站式,讓你的業(yè)務(wù)即刻出海,無(wú)憂上線!

今日薦文

你也「在看」嗎?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
龍珠:一口氣看完角色原型,中國(guó)元素真的很多!

龍珠:一口氣看完角色原型,中國(guó)元素真的很多!

動(dòng)漫心世界
2026-01-19 14:13:39
警惕!美媒:衛(wèi)星圖像揭露日本“出云”級(jí)艦艇“航母化”改造最新進(jìn)展

警惕!美媒:衛(wèi)星圖像揭露日本“出云”級(jí)艦艇“航母化”改造最新進(jìn)展

環(huán)球網(wǎng)資訊
2026-01-18 19:14:49
特朗普寫(xiě)信給挪威首相:不給我諾獎(jiǎng),就別怪我不和平了

特朗普寫(xiě)信給挪威首相:不給我諾獎(jiǎng),就別怪我不和平了

觀察者網(wǎng)
2026-01-19 17:42:09
不要在心里養(yǎng)一條毒蛇

不要在心里養(yǎng)一條毒蛇

洞見(jiàn)
2026-01-18 20:38:04
超?ㄩT(mén):77歲被騙光積蓄,83歲仍有性生活,91歲雙腿依舊迷人

超?ㄩT(mén):77歲被騙光積蓄,83歲仍有性生活,91歲雙腿依舊迷人

豐譚筆錄
2025-12-11 11:41:19
《瘋狂動(dòng)物城2》票房超120億,奪得全球亞軍,《哪吒2》無(wú)可撼動(dòng)

《瘋狂動(dòng)物城2》票房超120億,奪得全球亞軍,《哪吒2》無(wú)可撼動(dòng)

影視高原說(shuō)
2026-01-19 19:22:02
77年來(lái)首次,歷史性的一幕發(fā)生,德國(guó)總理下定決心,必須要去中國(guó)

77年來(lái)首次,歷史性的一幕發(fā)生,德國(guó)總理下定決心,必須要去中國(guó)

近史博覽
2026-01-19 14:36:36
0-3出局?各國(guó)球迷熱議U23亞洲半決賽,看好越南進(jìn)決賽,坐等打臉

0-3出局?各國(guó)球迷熱議U23亞洲半決賽,看好越南進(jìn)決賽,坐等打臉

大秦壁虎白話體育
2026-01-20 09:13:37
皇馬要賣(mài)了!巴西天王 “已同意” 加盟藍(lán)軍,1.5 億歐創(chuàng)隊(duì)史紀(jì)錄

皇馬要賣(mài)了!巴西天王 “已同意” 加盟藍(lán)軍,1.5 億歐創(chuàng)隊(duì)史紀(jì)錄

奶蓋熊本熊
2026-01-20 04:50:06
1000架殲-20和900架殲-16?英國(guó)智庫(kù):難以戰(zhàn)勝2030年的中國(guó)空軍

1000架殲-20和900架殲-16?英國(guó)智庫(kù):難以戰(zhàn)勝2030年的中國(guó)空軍

滄海旅行家
2026-01-17 14:05:11
葉文斌,找到了!

葉文斌,找到了!

中國(guó)新聞周刊
2026-01-19 15:47:29
唐嫣在國(guó)外很豪放!穿連體衣下面不系扣,難道不好好穿衣就時(shí)髦?

唐嫣在國(guó)外很豪放!穿連體衣下面不系扣,難道不好好穿衣就時(shí)髦?

章眽八卦
2026-01-05 12:27:07
當(dāng)年藥廠抓了譚秦東,但這次西貝不可能抓羅永浩了?

當(dāng)年藥廠抓了譚秦東,但這次西貝不可能抓羅永浩了?

芳華青年
2026-01-19 20:55:13
丹麥放話不再接受中國(guó)投資,不到3天,特朗普反手一記悶棍

丹麥放話不再接受中國(guó)投資,不到3天,特朗普反手一記悶棍

阿天愛(ài)旅行
2026-01-20 11:07:40
戲子無(wú)情!賀嬌龍去世,與她合作過(guò)的吳京于適竇驍沒(méi)有一個(gè)人悼念

戲子無(wú)情!賀嬌龍去世,與她合作過(guò)的吳京于適竇驍沒(méi)有一個(gè)人悼念

小娛樂(lè)悠悠
2026-01-20 10:30:06
動(dòng)物交配六親不認(rèn),若雄性遇上自己母親呢?馬不欺母是不是真的?

動(dòng)物交配六親不認(rèn),若雄性遇上自己母親呢?馬不欺母是不是真的?

答案在這兒
2025-12-05 01:58:07
扎心了!原來(lái)只要失業(yè),所有人都一樣!網(wǎng)友分享越看越心涼 太難了

扎心了!原來(lái)只要失業(yè),所有人都一樣!網(wǎng)友分享越看越心涼 太難了

有趣的火烈鳥(niǎo)
2025-12-31 20:39:06
梁小龍生前深?lèi)?ài)的兩個(gè)女人,一個(gè)毀容他不走,一個(gè)平淡他守到底

梁小龍生前深?lèi)?ài)的兩個(gè)女人,一個(gè)毀容他不走,一個(gè)平淡他守到底

趣味八卦
2026-01-20 10:56:45
春節(jié)檔看《鏢人》,直接統(tǒng)一全家審美

春節(jié)檔看《鏢人》,直接統(tǒng)一全家審美

閑人電影
2026-01-19 20:00:59
亞洲最大的飛機(jī)墳場(chǎng),藏于中國(guó)一小縣城里,停放數(shù)量?jī)H次于美國(guó)?

亞洲最大的飛機(jī)墳場(chǎng),藏于中國(guó)一小縣城里,停放數(shù)量?jī)H次于美國(guó)?

顧史
2026-01-19 20:21:12
2026-01-20 12:32:49
AI前線 incentive-icons
AI前線
面向AI愛(ài)好者、開(kāi)發(fā)者和科學(xué)家,提供AI領(lǐng)域技術(shù)資訊。
1257文章數(shù) 109關(guān)注度
往期回顧 全部

科技要聞

去年預(yù)虧60億后再投百億 兩大車(chē)企緊抱華為

頭條要聞

貝克漢姆長(zhǎng)子發(fā)長(zhǎng)文公開(kāi)指責(zé)父母:試圖破壞我的婚姻

頭條要聞

貝克漢姆長(zhǎng)子發(fā)長(zhǎng)文公開(kāi)指責(zé)父母:試圖破壞我的婚姻

體育要聞

新的時(shí)代!東契奇生涯首奪全明星票王 此前10年詹姆斯7次奪魁

娛樂(lè)要聞

貝克漢姆長(zhǎng)子發(fā)文決裂:全家都在演戲

財(cái)經(jīng)要聞

2026年,7個(gè)趨勢(shì)正在爆發(fā)

汽車(chē)要聞

奇瑞張貴兵:墨甲不做秀技術(shù)的企業(yè) 只做痛點(diǎn)終結(jié)者

態(tài)度原創(chuàng)

藝術(shù)
健康
數(shù)碼
時(shí)尚
軍事航空

藝術(shù)要聞

書(shū)法圈人士秒認(rèn)墻上14字,普通人能懂嗎?

血常規(guī)3項(xiàng)異常,是身體警報(bào)!

數(shù)碼要聞

1399元小米兒童手表發(fā)布:5MP + 8MP高清翻轉(zhuǎn)雙攝,藍(lán)紫雙色可選

碼住抄作業(yè)!春節(jié)見(jiàn)人不翻車(chē)就靠這8樣!

軍事要聞

古美關(guān)系高度緊張 古巴啟動(dòng)"戰(zhàn)爭(zhēng)狀態(tài)"

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版