国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

OpenAI 罕見認(rèn)錯(cuò):為何放棄一個(gè)模型打天下?

0
分享至


站在2025年末回望,AI行業(yè)已然發(fā)生了翻天覆地的變化。OpenAI的周活躍用戶已突破驚人的8大關(guān),這相當(dāng)于全球10%的人口。在這樣一個(gè)巨量規(guī)模下,早期的大一統(tǒng)模型理論似乎正在失效,取而代之的是專用模型、微調(diào)技術(shù)與智能體(Agent)的全面爆發(fā)。

日前,OpenAI開發(fā)者平臺(tái)負(fù)責(zé)人Sherwin Wua16z合伙人Martin Casado進(jìn)行了一場(chǎng)深度對(duì)話,詳細(xì)拆解了OpenAI如何在模型、定價(jià)和基礎(chǔ)設(shè)施層面構(gòu)建其平臺(tái)體系。

雙方深入探討了OpenAI發(fā)生的轉(zhuǎn)型:從單一的通用模型,轉(zhuǎn)向由專業(yè)化系統(tǒng)、定制微調(diào)選項(xiàng)以及基于節(jié)點(diǎn)的智能體工作流組成的產(chǎn)品矩陣。Sherwin還闡述了從提示工程(Prompt Engineering上下文設(shè)計(jì)(Context Design的演變。

值得注意的是,在談到定價(jià)策略時(shí),Sherwin Wu指出一個(gè)關(guān)鍵洞察:按結(jié)果定價(jià),可能是下一個(gè)“單向棘輪”。一旦你嘗到甜頭,你就再也回不去之前的模式了。

他指出,隨著推理時(shí)計(jì)算(Test-time Compute)的引入,用量和結(jié)果其實(shí)是高度正相關(guān)的。模型思考得越久(用量越大),解決難題的概率(結(jié)果)就越高。所以,也許按量計(jì)費(fèi)本身,就是一種近似的按結(jié)果付費(fèi)。

早在2025317日,盛景率先提出AI RaaSResult-as-a-Service,結(jié)果即服務(wù)的商業(yè)模型。AI RaaS模式的核心特點(diǎn)正是按工作量和工作結(jié)果付費(fèi),從而實(shí)現(xiàn)了AI服務(wù)方與客戶最大程度的利益綁定。

以下是本次對(duì)話的精華實(shí)錄,為方便閱讀,盛景新經(jīng)濟(jì)進(jìn)行了適當(dāng)編輯,希望對(duì)你有所啟發(fā)~

01

平臺(tái)悖論:

既做裁判員,又做運(yùn)動(dòng)員?

Martin Casado:
Sherwin
是當(dāng)下最頂尖的
AI
思想領(lǐng)袖之一。
Sherwin
,非常感謝你的加入。

Sherwin Wu:謝謝 Martin,目前我統(tǒng)領(lǐng) OpenAI 開發(fā)者平臺(tái)的工程團(tuán)隊(duì),其中最核心的產(chǎn)品當(dāng)然是 API。

Martin Casado:
我想聊聊
OpenAI
一個(gè)非常獨(dú)特的點(diǎn):你們既是一個(gè)
橫向公司
(提供
API
,作為數(shù)百萬家公司的基礎(chǔ)設(shè)施),又是一個(gè)
縱向公司
(擁有
ChatGPT
這樣的超級(jí)應(yīng)用)。這在業(yè)界非常罕見。這兩者內(nèi)部有張力嗎?
API
會(huì)不會(huì)被視為在幫助那些與你們垂直版本競(jìng)爭(zhēng)的對(duì)手?

Sherwin Wu:確實(shí)非常罕見,張力也確實(shí)存在。

但我認(rèn)為這得益于 Sam (Altman) 和 Greg (Brockman) 從第一天起就堅(jiān)持的原則:我們的使命是實(shí)現(xiàn) AGI(通用人工智能)并將利益廣泛分配。這意味著我們需要盡可能多的接觸面。ChatGPT是獲得8億用戶的最佳途徑,但通過API,我們能觸達(dá)更多樣化的場(chǎng)景。我們內(nèi)部常討論,API覆蓋的終端用戶范圍其實(shí)比ChatGPT還要廣。

至于競(jìng)爭(zhēng)張力,主要體現(xiàn)在產(chǎn)品側(cè)。比如 ChatGPT 發(fā)布了某個(gè)功能,可能會(huì)讓基于 API 開發(fā)類似產(chǎn)品的客戶感到不滿。

Martin Casado:
這是云計(jì)算和操作系統(tǒng)最古老的故事了
平臺(tái)與開發(fā)者爭(zhēng)利。

Sherwin Wu:對(duì)。但我感受到的壓力更多來自 API 客戶本身,他們會(huì)擔(dān)心:“天哪,你們會(huì)不會(huì)把我現(xiàn)在做的東西自己做了?”

Martin Casado:
歷史上,做
API
的風(fēng)險(xiǎn)在于容易被
去中介化
Disintermediation
)。開發(fā)者可以在云之上構(gòu)建一層,用戶就不知道底層是哪朵云,這樣開發(fā)者可以隨時(shí)切換服務(wù)商。

但我發(fā)現(xiàn),對(duì)于大模型來說,這種
抽象層
很難建立。模型太難被完美封裝了。這幾乎是一種
反去中介化
的技術(shù)
你必須把模型直接暴露給用戶。用戶知道自己在用
GPT-5
還是
GPT-4o

Sherwin Wu:非常深刻。整個(gè)行業(yè)在這個(gè)問題上的認(rèn)知也在轉(zhuǎn)變。起初我們以為模型會(huì)像軟件一樣可以隨意互換。但隨著 GPT-5、o3 等產(chǎn)品的推出,用戶的感知極其敏銳。

Martin Casado:
沒錯(cuò),當(dāng)模型切換時(shí),我甚至能感覺到一種
情感
上的疏離。比如,
你對(duì)我沒以前那么好了

Sherwin Wu:是的。而且從技術(shù)角度看,開發(fā)者,尤其是初創(chuàng)公司,會(huì)針對(duì)特定模型(比如 GPT-5)進(jìn)行深度迭代,打磨 Prompt,優(yōu)化框架。實(shí)際上,你是圍繞著那個(gè)特定模型構(gòu)建產(chǎn)品的。所以即使有人試圖做“模型路由”,模型的粘性依然驚人地高。

02

不會(huì)有“大一統(tǒng)模型”,

專用模型或迎來爆發(fā)式增長(zhǎng)

Martin Casado:
我用
Cursor
寫代碼時(shí)也發(fā)現(xiàn)了這點(diǎn)。我用
GPT-5
進(jìn)行規(guī)劃,用
Cursor
自帶的模型補(bǔ)全,用
Composer
模型修改。

這就引出了一個(gè)大問題:早年大家都認(rèn)為未來只會(huì)有一個(gè)超級(jí)模型(
AGI
)統(tǒng)治一切,連投資人都不投模型公司。但現(xiàn)在的現(xiàn)實(shí)是
模型的大爆發(fā)
。這對(duì)
AGI
OpenAI
意味著什么?你們會(huì)維護(hù)一個(gè)模型組合嗎?你認(rèn)為未來這一切會(huì)被某個(gè)
上帝模型
取代嗎?

Sherwin Wu:這整件事最瘋狂的地方在于大家的想法是如何隨著時(shí)間改變的。我清楚地記得,不久前,也就兩三年前,即使在OpenAI內(nèi)部,當(dāng)時(shí)的想法也是一個(gè)模型統(tǒng)治一切。那時(shí)候我們甚至覺得微調(diào)(Fine-tuningAPI沒必要存在——為什么要有微調(diào)產(chǎn)品?為什么要迭代它?因?yàn)橹髂P蜁?huì)強(qiáng)大到能處理一切。

那也是當(dāng)時(shí)對(duì) AGI 樣貌最簡(jiǎn)單的看法。顯然,自那以后情況完全改變了。但也需要記住,未來可能還會(huì)變。不過現(xiàn)在越來越清晰的是,各種專用模型將擁有一席之地,很可能會(huì)出現(xiàn)各類模型的爆發(fā)式增長(zhǎng)。

你看我們?cè)?/strong>Codex模型本身上就這么做了,有GPT-4o、o1o3GPT-5等等。我不認(rèn)為這是壞事。如果說有什么的話,隨著我們向 AGI 邁進(jìn),事情變得非常出乎意料,市場(chǎng)和產(chǎn)品組合也隨之演變。

因?yàn)椴皇勤A家通吃,也不會(huì)有贏家通吃的整合動(dòng)態(tài)。我們內(nèi)部經(jīng)常思考,隨著通用AI生態(tài)系統(tǒng)的增長(zhǎng),OpenAI從中受益匪淺。這就是為什么我們也開始向其他模型開放我們的部分產(chǎn)品,比如我們的 Evals(評(píng)估)產(chǎn)品現(xiàn)在允許你引入其他模型。這也是為什么我們開源了。

03

強(qiáng)化學(xué)習(xí)微調(diào)的勝利

Martin Casado:
聊聊微調(diào)
API
。你們開始轉(zhuǎn)向更復(fù)雜的微調(diào),這某種程度上是不是一種妥協(xié)?承認(rèn)通用模型無法解決所有垂直領(lǐng)域的特定數(shù)據(jù)問題?正如你所說,與其說是模型擴(kuò)散,不如說很多數(shù)據(jù)實(shí)際上非常有價(jià)值。

在多大程度上這會(huì)變成一種
利益交換
?你們暴露將產(chǎn)品數(shù)據(jù)用于微調(diào)的能力,然后你們也從供應(yīng)商提供的數(shù)據(jù)中受益?還是說這是
100%
隔離的,他們保留自己的數(shù)據(jù)?因?yàn)楦杏X這是下一階段擴(kuò)展的關(guān)鍵。

Sherwin Wu:我們最初投資微調(diào) API 的主要原因:第一,人們有巨大的需求想要更多地定制模型;第二,正是你說的,公司們坐擁巨大的數(shù)據(jù)寶藏,他們想在這波 AI 浪潮中利用這些數(shù)據(jù)。

有趣的是,回到2022、2023年,微調(diào)產(chǎn)品太受限了,人們很難利用這些數(shù)據(jù)。那只是監(jiān)督微調(diào)(SFTAPI。實(shí)際上它只對(duì)指令遵循增強(qiáng)版Instruction Following++)有用,你改改語(yǔ)氣,指導(dǎo)它一下。

但我認(rèn)為最近發(fā)生的巨大解鎖是強(qiáng)化學(xué)習(xí)微調(diào)(Reinforcement Fine-Tuning, RFT。有了這套機(jī)制,我們現(xiàn)在允許你真正運(yùn)行RL(強(qiáng)化學(xué)習(xí))。這更挑剔、更難,你需要投入更多,但它允許你更充分地利用你的數(shù)據(jù)。

我想說的關(guān)于強(qiáng)化學(xué)習(xí)微調(diào)API的重點(diǎn)是,它將范式從微小的增量改進(jìn)(如SFT做的語(yǔ)氣改進(jìn))轉(zhuǎn)變?yōu)閷?shí)際上將模型在你知道的特定用例上提升到SOTA(業(yè)界頂尖)水平。這就是人們真正開始使用RFT API的地方。

因?yàn)槿绻懻撝皇恰昂,我可以讓這個(gè)模型說話方式更好一點(diǎn)”,那沒那么吸引人;但如果是“嘿,對(duì)于醫(yī)療保險(xiǎn)編碼或 Agent 規(guī)劃,你可以用 RFT 和你的數(shù)據(jù)集打造世界上最好的模型”,這就不同了。

Martin Casado:
你們會(huì)想辦法獲取這些數(shù)據(jù)嗎?比如如果我有數(shù)據(jù),我想要便宜的
GPU
,我會(huì)跟你換。

Sherwin Wu:我們確實(shí)在試點(diǎn)一些定價(jià)方案。如果你愿意分享數(shù)據(jù),我們可以提供推理折扣甚至免費(fèi)訓(xùn)練。這能雙贏。

04

提示工程已死?

不,這是“上下文工程”的時(shí)代

Martin Casado:
你剛才提到在這個(gè)過程中,對(duì)
提示工程(
Prompt Engineering
的看法也變了?

Sherwin Wu:是的。2022 年,主流觀點(diǎn)(包括我也這么認(rèn)為)是:未來不需要提示工程。因?yàn)楦鶕?jù)縮放定律(Scaling Laws),模型會(huì)聰明到能和你“心有靈犀”(mind meld),自動(dòng)理解意圖。

這完全錯(cuò)了。雖然現(xiàn)在的模型在指令遵循上比 GPT-3.5 強(qiáng)太多,但游戲的規(guī)則變了。現(xiàn)在的重點(diǎn)不再是以前那種念咒語(yǔ)式的提示工程,而是上下文工程(Context Engineering。即:你給模型什么工具?它什么時(shí)候調(diào)用什么數(shù)據(jù)?

Martin Casado:
RAG
(檢索增強(qiáng)生成)就是一個(gè)很奇怪的例子。我們居然用余弦相似度(
Cosine Similarity
)這種簡(jiǎn)單的算法去檢索信息,然后喂給一個(gè)超級(jí)智能的大腦。這感覺像是在把智能
外包
給檢索步驟。

Sherwin Wu:RAG 誕生于模型還不夠聰明的時(shí)代。但現(xiàn)在有了o3這樣的推理模型——o3 是我最喜歡的模型之一,它是目前最勤奮的模型,能自己決定何時(shí)調(diào)用工具、何時(shí)寫代碼。

范式已經(jīng)轉(zhuǎn)移到了:如何構(gòu)建環(huán)境讓模型去推理。

05

Agent,

是產(chǎn)品還是能力?

Martin Casado:
我們來談?wù)?/blockquote>
Agent
。你有
API
(橫向),你有
ChatGPT
(縱向),我們還沒談
Pixel
(圖像)。這些只是語(yǔ)言。
Agent
(智能體)是一種新模態(tài)(
Modality
)嗎?還是別的什么?

Sherwin Wu:你說的模態(tài)是什么意思?

Martin Casado:
它們對(duì)我來說既感覺像垂直也像橫向。對(duì)我來說,
ChatGPT
是個(gè)產(chǎn)品,我媽都在用。
API
是個(gè)開發(fā)者工具。
Agent
介于兩者之間。它是一個(gè)產(chǎn)品嗎?如果是橫向的
內(nèi)部是怎么處理的?是有個(gè)獨(dú)立的團(tuán)隊(duì)做
Agent
嗎?

Sherwin Wu:有趣的是,你剛才的框架聽起來好像 Agent 是一個(gè)單一的概念……

Martin Casado:
也許更好的問題是,對(duì)你來說什么是
Agent

Sherwin Wu:我對(duì) Agent 的總體看法是:它是一個(gè)能代表你采取行動(dòng)、并且能在長(zhǎng)時(shí)間跨度上工作的AI

如果你這樣想,是的,也許這就是你說的模態(tài),但它只是一種使用AI的方式。我們并不把它看作是獨(dú)立存在的。

Martin Casado:
讓我解釋一下這個(gè)問題的來源。我知道怎么構(gòu)建產(chǎn)品,我們也知道怎么做產(chǎn)品的市場(chǎng)推廣。我們知道把它們變成平臺(tái)的含義。我們也知道怎么做
API
,怎么計(jì)費(fèi),怎么處理開發(fā)者張力。但我一直在試圖弄清楚,對(duì)于
Agent
,它屬于哪個(gè)陣營(yíng)?它更像產(chǎn)品陣營(yíng)嗎?

比如我可以把編碼交給你,你作為用戶直接跟它對(duì)話;或者我可以把它嵌入我的
App
里。這對(duì)定價(jià)和生態(tài)系統(tǒng)意味著什么?比如如果我開家公司,完全圍繞
Codex
構(gòu)建,你會(huì)介意嗎?

Sherwin Wu:開一家圍繞它的公司?我覺得那很棒。我們真的很喜歡 Codex SDK,希望人們能用它構(gòu)建。

實(shí)際上,我認(rèn)為這可能就是你想問的,這也是OpenAI的一個(gè)獨(dú)特之處:歸根結(jié)底,OpenAI是一家AGI公司,是一家智能公司。Agent只是這種智能表現(xiàn)出來的眾多方式之一。

我們?cè)趦?nèi)部思考所有不同產(chǎn)品線——Sora、Codex、API、ChatGPT——的方式是,它們只是部署這種智能的不同界面。并沒有一個(gè)單一的團(tuán)隊(duì)在想這就是Agent”。更多的是每個(gè)產(chǎn)品領(lǐng)域都在思考,這種智能如何轉(zhuǎn)化為一種形式,讓Agent行為成為可能。

在 ChatGPT 這樣的第一方產(chǎn)品中它長(zhǎng)什么樣?這就是為什么 Codex 最終變成了它自己的產(chǎn)品。在編碼產(chǎn)品中它長(zhǎng)什么樣?我們?cè)?ChatGPT 里探索過,有點(diǎn)用,但實(shí)際上 CLI(命令行)界面更有意義,那是另一個(gè)部署界面。

如果你看 API 本身,這是另一個(gè)部署界面。你的思考方式略有不同,因?yàn)槭情_發(fā)者優(yōu)先的思維,我們?cè)趲蛣e人構(gòu)建,定價(jià)略有不同,但這些都是核心智能——即 Agent 行為——的不同表現(xiàn)形式。

06

Agent Builder:

既要智能,又要受控

Martin Casado:
你們最近發(fā)布了
Agent Builder
(智能體構(gòu)建器)
,用的是節(jié)點(diǎn)(
Nodes
)這種確定性的低代碼方式。很多人對(duì)此有爭(zhēng)議,覺得這就變回了老式的
工作流
,不夠
AGI

Sherwin Wu:我在發(fā)布 Agent Builder 時(shí)也收到了很多質(zhì)疑。大家問:“為什么還需要節(jié)點(diǎn)?為什么不直接讓 AI 端到端解決?”

這里有兩個(gè)原因。第一是實(shí)用性。模型雖然強(qiáng),但在長(zhǎng)鏈路任務(wù)上仍然做不到100% 完美。在此期間,人們想用模型,你能給他們構(gòu)建什么?

第二,也是更重要的一點(diǎn),我們發(fā)現(xiàn)工作中存在兩類任務(wù)。一類是像軟件工程師那樣,目標(biāo)明確但過程開放的探索性工作;另一類是程序化工作(Procedural Work,也就是基于SOP(標(biāo)準(zhǔn)作業(yè)程序)的工作。

比如客戶支持、銷售、合規(guī)審核。這些領(lǐng)域的管理者不希望AI發(fā)揮創(chuàng)造力,他們需要AI嚴(yán)格遵循SOP。比如只有金額小于多少時(shí)才能退款。這種確定性需求巨大,我覺得硅谷的很多人并沒有意識(shí)到有大量的工作實(shí)際上屬于這一類。

而帶有節(jié)點(diǎn)的 Agent Builder 正是為了解決這類“既要智能又要受控”的問題。

Martin Casado:
就像游戲里的
NPC
(非玩家角色)。你不能讓
NPC
隨便說話,它必須遵循游戲邏輯。所以人們現(xiàn)在會(huì)用代碼把邏輯
硬編碼
進(jìn)去,以此約束模型。

Sherwin Wu:完全正確。這就是我們?cè)趪L試解決的問題。如果不加約束,模型就會(huì)放飛自我,這在受監(jiān)管行業(yè)是不可接受的。

07

定價(jià)的終局:

單向棘輪與結(jié)果付費(fèi)

Martin Casado:
聊聊定價(jià)。你們現(xiàn)在還是以
Usage-based
(按量計(jì)費(fèi))為主。

Sherwin Wu:我們?cè)?API 上做基于用量的定價(jià),最簡(jiǎn)單的原因就是它最接近實(shí)際使用情況。

我們?cè)趦?nèi)部做的一件事是,我們總是確保我們的基于用量定價(jià)是從“成本加成”(Cost-plus)的角度來定價(jià)的,確保我們?cè)诶麧?rùn)率方面是負(fù)責(zé)任的。

我們不久前收購(gòu)了一家公司,關(guān)于定價(jià)我和公司的創(chuàng)始人聊過。他的觀點(diǎn)是,定價(jià)有點(diǎn)像一個(gè)單向棘輪(One-way Ratchet。一旦你嘗到了基于用量定價(jià)的甜頭,你就再也回不去那種按部署付費(fèi)的模式了。

這是真的,因?yàn)樗絹碓浇咏銓?shí)際獲得的效用。唯一的痛點(diǎn)在于,你要維護(hù)大量賬務(wù)系統(tǒng)才能做到這一點(diǎn)。但如果你能做到,他認(rèn)為這就是一個(gè)單向的趨勢(shì)——沒有回頭路。

現(xiàn)在最熱門的新事物是:有了AI,你可以衡量結(jié)果(Outcomes)了。如果那能行,也許那是下一個(gè)單向棘輪。

我思考過基于結(jié)果的定價(jià)(Outcome-based pricing),這在第一方產(chǎn)品側(cè)可能更多見,在 API 側(cè)有點(diǎn)難。

API側(cè),這是一個(gè)典型的 usage-based 場(chǎng)景,我們必須打造支持這套體系的基礎(chǔ)設(shè)施,所以我們應(yīng)該會(huì)繼續(xù)使用量計(jì)費(fèi)。

但未來可能會(huì)有一種情況:AI 本身可以準(zhǔn)確判斷這些價(jià)值,然后把它綁定到計(jì)費(fèi)上。

Martin Casado
這就是
AI
討論的問題:任何時(shí)候你都可以說
未來它會(huì)變得足夠好

Sherwin Wu但到了那一步,它就真的不是問題了。結(jié)果導(dǎo)向的定價(jià)聽起來非常吸引人——如果它能跑通。

但我開始發(fā)現(xiàn)的一件事是,隨著推理時(shí)計(jì)算(Test-time Compute)的引入,用量和結(jié)果其實(shí)是高度正相關(guān)的。模型思考得越久(用量越大),解決難題的概率(結(jié)果)就越高。

所以,也許按量計(jì)費(fèi)本身,就是一種近似的按結(jié)果付費(fèi)。

我個(gè)人會(huì)持續(xù)關(guān)注結(jié)果導(dǎo)向定價(jià)是否真正可行。

08

開源的戰(zhàn)略思考

Martin Casado:
你怎么看開源?競(jìng)爭(zhēng)?互相蠶食?戰(zhàn)略目標(biāo)是什么?

Sherwin Wu:我個(gè)人很喜歡開源。如果沒有開源,互聯(lián)網(wǎng)就不會(huì)存在,云也不會(huì)存在。

有趣的是,在我們發(fā)布開源模型之前,我知道 Sam 也有這種感覺。有一種奇怪的心態(tài),因?yàn)?OpenAI 沒發(fā)布任何東西,看起來好像 OpenAI 超級(jí)反開源。但我自從加入以來就一直和 Sam 討論開源模型。我們?cè)噲D思考如何排序。算力總是個(gè)難題。我們一直想做這個(gè)。我很高興我們終于在今年早些時(shí)候做了……也就是發(fā)布GPT-OS的時(shí)候。

我對(duì)此的看法是:第一,作為一個(gè)既垂直又橫向的公司,我們想繼續(xù)投資生態(tài)系統(tǒng)。第二,從OpenAI的角度看,如果AI生態(tài)系統(tǒng)增長(zhǎng),水漲船高對(duì)我們有幫助。如果我們發(fā)布開源模型能解鎖其他行業(yè)的用例,那很好。

Martin Casado:
人們很少談?wù)摰氖沁@些開源
AI
商業(yè)模式其實(shí)運(yùn)作得很好,因?yàn)榛ハ嘈Q食的風(fēng)險(xiǎn)其實(shí)很低。并不是說他們拿了權(quán)重就能重現(xiàn)你的服務(wù)。而且推理其實(shí)超級(jí)難。

Sherwin Wu:推理是個(gè)難題。所以我個(gè)人認(rèn)為開源與API業(yè)務(wù)的關(guān)系是:第一,沒看到蠶食風(fēng)險(xiǎn)。第二,特別是對(duì)所有大實(shí)驗(yàn)室來說,通常有兩三個(gè)模型產(chǎn)生了所有的影響和收入。那些是我們投入大量資源改進(jìn)的模型,也是推理極其困難的模型。

如果你看我們的推理團(tuán)隊(duì),真的很強(qiáng)。我的感覺是,即使我們開源了 GPT-5,要以我們能做到的水平去運(yùn)行推理也是非常非常難的。

Martin Casado:
是否可能為產(chǎn)品垂直化模型?

Sherwin Wu:我覺得我們?cè)谙蚰莻(gè)方向移動(dòng)。問題是垂直化多深。我們做的大部分是在后訓(xùn)練(Post-training)、工具使用層面。比如 GPT-5 Codex 特別擅長(zhǎng)使用 Codex 框架。但還有更深層的垂直化。

Martin Casado:
我這很多的思維模型來自
Pixel
(圖像)領(lǐng)域。你可以
LoRA
一堆圖像模型,做很多事讓它更適合某些產(chǎn)品。你會(huì)相信你可以為編輯或剪切粘貼垂直化一個(gè)模型。但在文本領(lǐng)域你看不到這個(gè)。幾乎總是你只是暴露一個(gè)模型。

Sherwin Wu:我認(rèn)為圖像模型和文本模型有區(qū)別。圖像模型往往小得多,迭代快得多。這就是為什么圖像模型那邊有瘋狂的爆發(fā)。而對(duì)于文本模型,總會(huì)有這個(gè)非常大的預(yù)訓(xùn)練模型。即使是后訓(xùn)練也不容易,算力還是挺重的。所以我認(rèn)為那是更大的瓶頸。在圖像方面,你可以微調(diào)它讓它極其擅長(zhǎng)編輯人臉……然后圍繞它構(gòu)建產(chǎn)品。

Martin Casado:
我得說,在同一家公司做語(yǔ)言模型和像
Pixel
這樣的擴(kuò)散模型有點(diǎn)
反模式
Anti-pattern
)。大多數(shù)嘗試過的公司都覺得很笨重。但你們和
Google
是兩個(gè)反例。這些基礎(chǔ)設(shè)施能融合嗎?是不同的組織嗎?共享基礎(chǔ)設(shè)施嗎?

Sherwin Wu:我覺得你完全沒錯(cuò),這是反模式,很難搞定。我覺得要?dú)w功于我們的研究團(tuán)隊(duì),架構(gòu)得很好。但我認(rèn)為最重要的是,我們的世界模擬團(tuán)隊(duì)(構(gòu)建 Sora 的團(tuán)隊(duì))非常扎實(shí)。

Martin Casado:
是同樣的基礎(chǔ)設(shè)施嗎?

Sherwin Wu:是同樣的……其實(shí)相當(dāng)獨(dú)立。這也是我們能做到的原因之一。團(tuán)隊(duì)必須極強(qiáng),而且它們運(yùn)行得非常獨(dú)立。它們思考自己的路線圖,獨(dú)立思考產(chǎn)品化(這也是 Sora App 誕生的原因)。甚至推理?xiàng)R猜杂胁煌?/p>

Martin Casado:
我以為
API
主要是基于文本的。你們做實(shí)際的基于圖像的東西嗎?

Sherwin Wu:做,我們有一堆。DALL-E API。DALL-E 2 是那個(gè)讓我決定加入 OpenAI 的模型。我記得讓它畫一只鴨子,它生成了一張白鴨子的照片,那讓我決定加入。我們?cè)?API 里有圖像生成,也有視頻生成。

Martin Casado:
我還有一百萬個(gè)問題想問你,但時(shí)間到了。非常感謝。

Sherwin Wu:謝謝。

2025盛景半年回顧


人生只有四千周,而企業(yè)生存期更短,跨越10年經(jīng)營(yíng)期的企業(yè)少之又少,企業(yè)要想有質(zhì)量地活下去,活得更好更久,“極簡(jiǎn)增長(zhǎng)”就是看透并掌控事物本質(zhì)的那個(gè)關(guān)鍵點(diǎn)。

選對(duì)了路,路就不會(huì)遠(yuǎn)。盛景推出《極簡(jiǎn)增長(zhǎng) 立竿見影》在線課程,期望能夠幫助更多的企業(yè)走上增長(zhǎng)道路。未來有多近,在于我們已經(jīng)走了多遠(yuǎn)。未來有多遠(yuǎn),在于我們與誰(shuí)同行。期待與你同行、共勉。

歡迎大家點(diǎn)擊底部【閱讀原文】觀看《極簡(jiǎn)增長(zhǎng) 立竿見影》的在線視頻課程,了解如何用極致簡(jiǎn)單的增長(zhǎng)方法論,實(shí)現(xiàn)快速增長(zhǎng)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
董宇輝2025年直播銷售額超210億,一個(gè)人幾乎可以頂整個(gè)胖東來

董宇輝2025年直播銷售額超210億,一個(gè)人幾乎可以頂整個(gè)胖東來

映射生活的身影
2026-01-11 15:58:00
“2026年第一個(gè)闖大禍的人”,如何制造了“千人赴約殺豬宴”的網(wǎng)絡(luò)狂歡

“2026年第一個(gè)闖大禍的人”,如何制造了“千人赴約殺豬宴”的網(wǎng)絡(luò)狂歡

新民周刊
2026-01-12 19:26:19
形勢(shì)危急:據(jù)稱,伊朗抗議活動(dòng)的死亡人數(shù)急劇上升到500多人

形勢(shì)危急:據(jù)稱,伊朗抗議活動(dòng)的死亡人數(shù)急劇上升到500多人

一種觀點(diǎn)
2026-01-12 08:13:06
夫妻倆收到203萬拆遷款后被控詐騙,羈押707天因證據(jù)不足獲釋;多方回應(yīng)

夫妻倆收到203萬拆遷款后被控詐騙,羈押707天因證據(jù)不足獲釋;多方回應(yīng)

大風(fēng)新聞
2026-01-12 21:25:05
長(zhǎng)江電力:2025年度凈利潤(rùn)341.67億元,同比增加5.14%

長(zhǎng)江電力:2025年度凈利潤(rùn)341.67億元,同比增加5.14%

每日經(jīng)濟(jì)新聞
2026-01-13 17:22:10
喜訊!U23國(guó)足踢泰國(guó)的比賽沒開始,就有望迎來三位久違強(qiáng)援助陣

喜訊!U23國(guó)足踢泰國(guó)的比賽沒開始,就有望迎來三位久違強(qiáng)援助陣

張麗說足球
2026-01-13 16:53:28
傅作義原本擬授上將,毛主席沒點(diǎn)頭,最終周總理親自找傅說明原因

傅作義原本擬授上將,毛主席沒點(diǎn)頭,最終周總理親自找傅說明原因

歷史龍?jiān)w
2026-01-05 08:55:07
80后已經(jīng)有1100萬人提前下車了。

80后已經(jīng)有1100萬人提前下車了。

愛吃糖的貓cat
2025-11-16 18:27:38
不出意外的話,2026年春節(jié)將出現(xiàn)下面5大現(xiàn)象,早看要準(zhǔn)備!

不出意外的話,2026年春節(jié)將出現(xiàn)下面5大現(xiàn)象,早看要準(zhǔn)備!

農(nóng)夫也瘋狂
2026-01-13 11:26:47
力壓西部群星!一周封神!掘金新人值多少?

力壓西部群星!一周封神!掘金新人值多少?

籃球盛世
2026-01-13 19:03:33
怪不得阿隆索下課!皇馬內(nèi)訌曝光:2億巨星帶頭,跟主帥對(duì)著干

怪不得阿隆索下課!皇馬內(nèi)訌曝光:2億巨星帶頭,跟主帥對(duì)著干

球場(chǎng)沒跑道
2026-01-13 09:28:12
知名童星剛滿18就立即加入OnlyFans,一天賺290萬美元

知名童星剛滿18就立即加入OnlyFans,一天賺290萬美元

隨波蕩漾的漂流瓶
2026-01-11 18:03:40
“兩岸統(tǒng)一”突破點(diǎn)不在馬英九,也不在國(guó)民黨,可能在這個(gè)人身上

“兩岸統(tǒng)一”突破點(diǎn)不在馬英九,也不在國(guó)民黨,可能在這個(gè)人身上

趣文說娛
2026-01-12 17:36:51
山姆必買清單:不買這7個(gè),等于白來!

山姆必買清單:不買這7個(gè),等于白來!

廣州生活美食圈
2026-01-12 12:03:04
廣州小學(xué)生被抽血事件:告訴爸媽就扣小紅花

廣州小學(xué)生被抽血事件:告訴爸媽就扣小紅花

每日一見
2026-01-02 12:21:28
中戲新疆班畢業(yè)生出面證實(shí),中戲2011級(jí)新疆班沒有林傲霏

中戲新疆班畢業(yè)生出面證實(shí),中戲2011級(jí)新疆班沒有林傲霏

我就是個(gè)碼字的
2026-01-12 17:30:25
A股:散戶聽我一句勸,1795億主力出逃,明天要出現(xiàn)大級(jí)別調(diào)整行情?

A股:散戶聽我一句勸,1795億主力出逃,明天要出現(xiàn)大級(jí)別調(diào)整行情?

股市皆大事
2026-01-13 16:08:07
2026 年 3 大生肖財(cái)運(yùn)爆棚,橫財(cái)上上吉,富貴找上門!

2026 年 3 大生肖財(cái)運(yùn)爆棚,橫財(cái)上上吉,富貴找上門!

人閒情事
2026-01-13 19:37:32
香煙新助燃劑引發(fā)爭(zhēng)議,漲價(jià)背后真相曝光

香煙新助燃劑引發(fā)爭(zhēng)議,漲價(jià)背后真相曝光

老特有話說
2026-01-12 19:10:22
難以置信!冷戰(zhàn)五天,浙江女子拒丈夫提夫妻生活要求,被網(wǎng)友炮轟

難以置信!冷戰(zhàn)五天,浙江女子拒丈夫提夫妻生活要求,被網(wǎng)友炮轟

火山詩(shī)話
2026-01-13 07:23:45
2026-01-13 20:24:49
盛景產(chǎn)業(yè)互聯(lián)網(wǎng)觀察 incentive-icons
盛景產(chǎn)業(yè)互聯(lián)網(wǎng)觀察
閱讀最精粹的商業(yè)信息。
2052文章數(shù) 5356關(guān)注度
往期回顧 全部

科技要聞

每年10億美元!谷歌大模型注入Siri

頭條要聞

美記者問伊朗是否被要求退出金磚國(guó)家軍演 外交部回應(yīng)

頭條要聞

美記者問伊朗是否被要求退出金磚國(guó)家軍演 外交部回應(yīng)

體育要聞

他帶出國(guó)乒世界冠軍,退休后為愛徒返場(chǎng)

娛樂要聞

周杰倫以球員身份參加澳網(wǎng),C位海報(bào)公開

財(cái)經(jīng)要聞

"天量存款"將到期 資金會(huì)否搬入股市?

汽車要聞

限時(shí)9.99萬元起 2026款啟辰大V DD-i虎鯨上市

態(tài)度原創(chuàng)

教育
旅游
本地
時(shí)尚
公開課

教育要聞

影子老師 | 春季開學(xué),專業(yè)入校支持,全國(guó)30城服務(wù)早鳥預(yù)定開始

旅游要聞

【海岱四季】雪落半島 美不勝收

本地新聞

云游內(nèi)蒙|到巴彥淖爾去,赴一場(chǎng)塞上江南的邀約

走過那個(gè)夏天,甜茶終于站上金球獎(jiǎng)之巔

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版