網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

扎克伯格談DeepSeek(上):他們做了令人驚嘆的底層優(yōu)化，但還不支持多模態(tài)

2025-05-06 22:52:20　來源: 柳胖胖

北京舉報(bào)

分享至

　　或許是因?yàn)樽罱麺eta財(cái)報(bào)發(fā)布，或許是因?yàn)樽罱麹lama受到的非議太多，或許是因?yàn)樾≡鷤€(gè)人的分享欲爆棚，他在和的前后腳，還接受了這檔商業(yè)人文播客Dwarkesh Podcast的訪談。

　　，這個(gè)訪談犀利點(diǎn)評(píng)他人更多，他聊到了OpenAI、聊到了谷歌的Gemini，聊到了 Anthropic，全程還提及14次DeepSeek，8次China，4次Trump。

　　 本次訪談的幾大主題

　　Llama 4、基準(zhǔn)測(cè)試刷榜、開源vs閉源之爭(zhēng)

　　AI爆炸，但AGI 的商業(yè)模式是什么？

　　DeepSeek和中國、export controls和Trump

　　Orion智能眼鏡、人與 AI 的關(guān)系，如何避免被技術(shù)的獎(jiǎng)勵(lì)機(jī)制劫持？

　　Llama 4 和其他AI模型的比較

　　以下是整個(gè)訪談的內(nèi)容目錄，本篇只包含前四部分。下篇幾天后發(fā)出，里面提到了美國科技巨頭是否會(huì)配合 Trump的問題，也挺有意思，歡迎關(guān)注本號(hào)，敬請(qǐng)期待。

　　一、How Llama 4 compares to other models

　　二、Intelligence explosion

　　三、AI Friends, Therapists & Girlfriend

　　四、 DeepSeek & China

　　五、Open source AI

　　六、Monetizing AGI

　　七、The role of a CEO

　　八、Is big tech aligning with Trump?

　　九、100x productivity

　　 一、How Llama 4 compares to other models

　　Dwarkesh Patel：Mark，感謝你再次參加我們的播客。

　　Mark Zuckerberg：很高興來，見到你很開心。

　　DP：彼此彼此。上次你來，我們聊的是 Llama 3，現(xiàn)在你們發(fā)布了 Llama 4。

　　MZ：嚴(yán)格來說，是 Llama 4 的首個(gè)版本。

　　DP：沒錯(cuò)。有哪些新亮點(diǎn)？發(fā)生了什么變化？

　　MZ:整個(gè)領(lǐng)域變化太快了。自上次交談以來，真是天翻地覆。Meta AI 的月活用戶已逼近十億，著實(shí)令人驚嘆。

　　我覺得今年會(huì)是大年，尤其是當(dāng)我們真正跑通用戶的個(gè)性化閉環(huán)，就是利用算法掌握關(guān)于興趣的context，包括信息流、個(gè)人檔案、社交圖譜，還有基于你與 AI 對(duì)話的內(nèi)容，這種“個(gè)性化”，將成為下一個(gè)令人振奮的大方向，我對(duì)此十分看好。

　　模型本身也在突飛猛進(jìn)。我對(duì) Llama 4 的首批發(fā)布相當(dāng)滿意。我們官宣了四個(gè)模型，率先放出其中兩個(gè)，Scout 和 Maverick，算是中小模型。

　　Llama 3 最受歡迎的是 80 億參數(shù)版本，所以 Llama 4 也會(huì)有同等規(guī)模的后繼，內(nèi)部代號(hào)Little Llama，預(yù)計(jì)數(shù)月內(nèi)上線。

　　Scout 和 Maverick的“單位成本智能”極高（highest intelligence per cost），原生多模態(tài)、高效、單機(jī)即可運(yùn)行，專為低延遲場(chǎng)景打造，我們會(huì)先滿足內(nèi)部需求，再開源給大眾，這一直是我們的做法。

　　我同樣期待即將到來的Behemoth，這是我們首個(gè)“前沿級(jí)”模型，參數(shù)量逾 2 萬億，非常龐大。僅僅是為它做后訓(xùn)練，我們就得搭一堆新基礎(chǔ)設(shè)施。

　　現(xiàn)在要思考的是，普通開發(fā)者如何用得上？也許需要蒸餾成更易部署的尺寸，畢竟消費(fèi)級(jí)產(chǎn)品，不可能直接跑這么大的模型。

　　回想Llama 3 的節(jié)奏，首發(fā)很激動(dòng)人心，隨后一年我們持續(xù)迭代，3.1 是4050 億參數(shù)版本，3.2 加入完整多模態(tài)，今年我們同樣有類似路線圖，事情很多。

　　DP：有人覺得，過去一年頂級(jí)閉源模型與頂級(jí)開源模型的差距更大了，雖說 Llama 4 全系列尚未放完，但 Llama 4 Maverick 在 Chatbot Arena 僅排第 35，在多項(xiàng)主流基準(zhǔn)上，同級(jí)別的 o4-mini 或 Gemini 2.5 Flash 的表現(xiàn)都更好，你怎么看？

　　MZ：幾點(diǎn)想法吧，第一，今年總體對(duì)開源模型而言絕對(duì)是大年，去年像樣的創(chuàng)新開源模型幾乎只有 Llama，如今優(yōu)秀模型百花齊放。

　　普遍預(yù)測(cè)稱，今年開源模型的使用量將超過閉源，我認(rèn)為很有可能。令人驚喜的是，不止 Llama，很多模型都很出色。

　　再說推理模型現(xiàn)象，你提到的 o3、o4 等，現(xiàn)在出現(xiàn)了專業(yè)化：若要在數(shù)學(xué)、編程等任務(wù)上做到最好，就需要推理模型在推理時(shí)，投入更多算力，換取更高智能。

　　我們也在做 Llama 4 的推理版本，日后會(huì)放出。

　　但對(duì)我們關(guān)注的大量應(yīng)用來說，延遲與單位成本智能（intelligence per cost），更為關(guān)鍵。面向消費(fèi)者時(shí)，沒人愿意多等半分鐘，若能在半秒給出足夠好的答案，那就是最好的。

　　兩條路線，都很重要，我也看好將推理模型與核心語言模型融合——Google 最新的 Gemini 就在走這條路，未來會(huì)出現(xiàn)多種形態(tài)。

　　你提到 Chatbot Arena，這暴露了基準(zhǔn)測(cè)試的弊�。喝绾卧u(píng)估模型在哪些任務(wù)表現(xiàn)優(yōu)異？

　　過去一年，我們更多把模型錨定在Meta AI 的北極星用例（Meta AI product north star use cases）。

　　許多開源基準(zhǔn)，偏向極其特定的場(chǎng)景，未必符合普通用戶真實(shí)需求，它們衡量的能力組合，與用戶在產(chǎn)品中真正關(guān)心的往往不同。

　　過度迎合這些基準(zhǔn)，就會(huì)跑偏，未必帶來最佳產(chǎn)品體驗(yàn)和最高使用量。我們的北極星是用戶反饋，用戶說想要什么，以及實(shí)際行為，很多基準(zhǔn)也很容易被“刷榜”。

　　舉例說，Sonnet 3.7 是好模型，卻排不上前列，我們團(tuán)隊(duì)其實(shí)可以輕松把 Llama 4 Maverick 調(diào)優(yōu)到榜首，但現(xiàn)在發(fā)布的模型，壓根沒為榜單做微調(diào)，所以排名靠后。

　　對(duì)這些榜單，要審慎看待，我們主要還是以產(chǎn)品價(jià)值為依據(jù)。

　　DP：你覺得有沒有某種基準(zhǔn)，能客觀衡量你所謂的“用戶價(jià)值”北極星，讓你說：“我得讓 Llama 4 在這項(xiàng)基準(zhǔn)上拿第一？”

　　MZ：我們的基準(zhǔn)，就是Meta AI 的用戶價(jià)值user value。

　　DPa：可那無法與其他模型對(duì)比吧？

　　MaZ：也許能，因?yàn)槲覀兛梢詢?nèi)部運(yùn)行其他模型做對(duì)照，這正是開源的一大優(yōu)勢(shì)，社區(qū)能幫你揪出模型的短板與長處。

　　現(xiàn)實(shí)是，各模型的優(yōu)化組合略有不同。所有領(lǐng)先實(shí)驗(yàn)室，都在追求同一個(gè)終點(diǎn)：人工通用智能AGI、或者人工超級(jí)智能ASI，讓每個(gè)人擁有超人級(jí)工具，創(chuàng)造任何想要的東西，極大賦能個(gè)人并帶來經(jīng)濟(jì)紅利。

　　但不同團(tuán)隊(duì)確有各自的側(cè)重，Anthropic更聚焦編程及相關(guān)智能體，OpenAI 近期更偏向推理。

　　我猜最終使用最廣的，會(huì)是那種響應(yīng)迅速、交互自然、原生多模態(tài)、能融入日常的模型。

　　你應(yīng)該試過我們即將發(fā)布的新 Meta AI App，我們放了個(gè)全雙工語音（full-duplex voice）的 Demo。雖然還早，還沒設(shè)為默認(rèn)語音模型，但其自然對(duì)話的感覺，非常吸引人。

　　把這與正確的“個(gè)性化”結(jié)合，未來的產(chǎn)品體驗(yàn)將是，幾年后，我們?nèi)粘?huì)一直與 AI 交談。

　　拿著手機(jī)瀏覽信息流時(shí)，它與你對(duì)話，提供上下文、回答問題，在消息應(yīng)用中，輔助溝通。最終，我們走在街頭，戴著眼鏡或其他 AI 設(shè)備，與之無縫互動(dòng)。

　　這就是北極星，只要某項(xiàng)基準(zhǔn)能讓人們覺得質(zhì)量足夠好、愿意使用，那才對(duì)我們最重要。

　　二、 Intelligence Explosion 智能爆炸

　　DP：我同時(shí)體驗(yàn)了 Orion 和 Meta AI App，語音模式流暢得驚人，真的很出色。

　　關(guān)于各大實(shí)驗(yàn)室所追求的優(yōu)化方向，如果非得為他們的觀點(diǎn)做辯護(hù)，他們通常認(rèn)為，一旦徹底自動(dòng)化軟件工程與 AI 研究，就能引爆一場(chǎng)“智能爆炸”。

　　屆時(shí)，數(shù)以百萬計(jì)的“軟件工程師的副本copies of software engineers”，會(huì)把 Llama 1 到 Llama 4 之間那種量級(jí)的進(jìn)步再復(fù)制一遍，只是時(shí)間從數(shù)年縮短到數(shù)周或數(shù)月。

　　所以，只要把“軟件工程師”這個(gè)環(huán)節(jié)閉環(huán)起來，你就能率先抵達(dá)人工超級(jí)智能ASI，你怎么看？

　　MZ：我認(rèn)為這個(gè)設(shè)想頗具說服力，這也是我們?cè)?Meta 內(nèi)部大力投入編碼代理的原因。鑒于我們并不是一家企業(yè)級(jí)軟件公司，我們主要是為自身需求構(gòu)建這些工具。

　　我們的目標(biāo)很明確——不是去做一個(gè)通用的開發(fā)者工具，而是打造能推進(jìn) Llama 研究的編碼代理coding agent和 AI 研究代理research agent，并且它們完全接入了我們的內(nèi)部工具鏈toolchain。

　　這的確重要，也必將成為 AI 研發(fā)的關(guān)鍵一環(huán)。我猜在未來 12-18 個(gè)月內(nèi)，為這些項(xiàng)目編寫的大部分代碼，都將由 AI 完成，而且我指的不是自動(dòng)補(bǔ)全�，F(xiàn)在自動(dòng)補(bǔ)全已經(jīng)不錯(cuò)：你開始寫一段代碼，它可以把一整段補(bǔ)全。

　　我說的是，你只需給出目標(biāo)，它就能運(yùn)行測(cè)試、改進(jìn)功能、定位問題，寫出的代碼質(zhì)量，已超過團(tuán)隊(duì)里一般優(yōu)秀工程師的平均水平，我確信這會(huì)非常關(guān)鍵。

　　但我并不認(rèn)為這就是全部，這個(gè)行業(yè)很大，AI 的開發(fā)方式也會(huì)多種多樣。我不相信最終只會(huì)出現(xiàn)一家擁有單一優(yōu)化函數(shù)、能最好地服務(wù)所有人的公司。

　　不同實(shí)驗(yàn)室會(huì)在不同領(lǐng)域領(lǐng)跑：有的更偏向企業(yè)或編碼場(chǎng)景，有的專注效率提升，有的聚焦社交或娛樂。

　　即便在助手領(lǐng)域，也會(huì)有注重信息與生產(chǎn)力的助手，也會(huì)有偏向陪伴的助手，或者純粹有趣、娛樂，直接出現(xiàn)在信息流里的內(nèi)容。

　　總之空間巨大，奔向 AGI 的道路上既有共同要邁的臺(tái)階，也有大量仍待創(chuàng)造的全新事物，我猜未來會(huì)看到各團(tuán)隊(duì)之間的進(jìn)一步專業(yè)化。

　　DP：有意思的是，你基本同意會(huì)出現(xiàn)“智能爆炸”，最終會(huì)誕生超級(jí)智能。如果我沒理解錯(cuò)的話，在這種情況下，為什么還要費(fèi)心開發(fā)個(gè)人助手之類的應(yīng)用？為什么不先把超級(jí)智能做出來，其他東西晚點(diǎn)再說？

　　MZ：那只是飛輪flywheel的一部分。我不太認(rèn)同“快速起飛fast take-off”論的一個(gè)原因是——建設(shè)實(shí)體基礎(chǔ)設(shè)施需要時(shí)間。

　　如果要建一個(gè)吉瓦級(jí)算力集群gigawatt cluster of compute，就需要時(shí)間。NVIDIA 需要時(shí)間穩(wěn)定新一代系統(tǒng)，你還得規(guī)劃網(wǎng)絡(luò)架構(gòu)，建設(shè)機(jī)房，拿許可證，搞能源——可能是燃?xì)廨啓C(jī)，也可能是可再生能源——無論哪種，背后都有完整的供應(yīng)鏈。

　　我們上次播客里，聊過很多這類問題。這些都是現(xiàn)實(shí)世界、以人類時(shí)間尺度推進(jìn)的事。當(dāng)你在某一層獲得更高智能，往往會(huì)撞到另一層的瓶頸。

　　工程學(xué)永遠(yuǎn)如此：解決一個(gè)瓶頸，下一個(gè)瓶頸就出現(xiàn)。

　　另一個(gè)瓶頸是：人們需要時(shí)間去適應(yīng)、去學(xué)習(xí)如何與系統(tǒng)形成反饋閉環(huán)。

　　這些系統(tǒng)不會(huì)一現(xiàn)身，就讓所有人瞬間會(huì)用，它們與人的使用方式是共同進(jìn)化的，人學(xué)著如何最好地用助手，助手也在學(xué)用戶在乎什么，開發(fā)者再把助手做得更好。

　　同時(shí)，我們還在積累上下文。一年兩年后回頭看，助手能引用你兩年前聊過的話，這非�？帷Ｈ绻裉觳派暇€，就算再完美，也不可能引用兩年前不存在的對(duì)話。

　　所以我的觀點(diǎn)是：智能增速確實(shí)陡峭。人們與 AI 助手的交互量和數(shù)據(jù)反饋飛輪同樣增長迅猛。

　　同時(shí)，算力供應(yīng)鏈、基礎(chǔ)設(shè)施、監(jiān)管框架也都在建設(shè)中，單有“寫代碼”那一環(huán)，遠(yuǎn)遠(yuǎn)不夠。

　　舉個(gè)例子：幾年前，我們廣告團(tuán)隊(duì)做過一個(gè)項(xiàng)目，自動(dòng)化廣告排序?qū)嶒?yàn)。那是個(gè)相對(duì)封閉的環(huán)境，并非開放式編碼，系統(tǒng)會(huì)回溯公司歷史上每一次廣告實(shí)驗(yàn)，分析成敗和結(jié)果，然后提出新假設(shè)去做試驗(yàn)，提高廣告效果。

　　結(jié)果我們發(fā)現(xiàn)，瓶頸在于運(yùn)行實(shí)驗(yàn)的算力，以及可用的用戶分層。哪怕 Meta 有 35 億用戶，每個(gè)實(shí)驗(yàn)仍需幾十萬甚至上百萬人，才能顯著統(tǒng)計(jì)，我們已經(jīng)有更多優(yōu)質(zhì)想法，但算力和受試人群都不夠用。

　　因此，僅僅生成更多實(shí)驗(yàn)想法，并不會(huì)帶來增益。AI 生成的“假設(shè)”，如果未來能有價(jià)值，平均質(zhì)量得先超越目前“上線門檻”以上的、由頂尖工程師提出的想法才行。

　　我相信我們會(huì)很快達(dá)到哪里，但這不是“AI 會(huì)寫代碼，一切瞬間升級(jí)”的故事，現(xiàn)實(shí)約束很多。你得有算力，有人群做實(shí)驗(yàn)，隨著 AI 質(zhì)量持續(xù)提升。

　　也許五到十年后，沒有任何人類團(tuán)隊(duì)能再提出比 AI 更好的假設(shè)了，也許吧，但那絕非現(xiàn)在。

　　DP：如果你認(rèn)同智能走向這幅圖景，那看好 Meta 的理由，顯然在于你們擁有龐大分發(fā)渠道，也能由此收集更多可用于訓(xùn)練的數(shù)據(jù)，你說Meta AI現(xiàn)在已有十億活躍用戶。

　　MZ：不是獨(dú)立App，本次單獨(dú)推出的 App 才剛上線，供想嘗鮮的人使用，體驗(yàn)確實(shí)不錯(cuò)，里面有些新點(diǎn)子值得聊。

　　但我所說的“十億”，主要發(fā)生在我們的各大應(yīng)用里。

　　用Meta AI 用得最多的是WhatsApp，而 WhatsApp 的主戰(zhàn)場(chǎng)在美國以外。雖然我們?cè)诿绹淹黄埔粌|用戶，但美國的主流消息平臺(tái)其實(shí)是 iMessage，所以美國用戶往往低估了Meta AI 的實(shí)際使用量。

　　也正因如此，獨(dú)立App就很重要。美國無論如何都是關(guān)鍵市場(chǎng)，可WhatsApp在這兒確實(shí)不是老大，我們需要?jiǎng)e的路徑交付一流體驗(yàn)，讓Meta AI 真正出現(xiàn)在美國用戶面前。

　　DP：如果 AI 的未來不再只是答疑，而是成為虛擬同事，那么在 WhatsApp里集成 Meta AI ，是否就無助于訓(xùn)練出完全自主的程序員或遠(yuǎn)程工作者？那時(shí)，誰擁有更大語言模型的分發(fā)量，或許就沒那么重要了？

　　MZ：我還是覺得場(chǎng)景會(huì)多元，想象一下互聯(lián)網(wǎng)剛誕生時(shí)，你問：互聯(lián)網(wǎng)的主戰(zhàn)場(chǎng)會(huì)是什么？知識(shí)工作還是面向大眾的消費(fèi)級(jí)應(yīng)用？

　　結(jié)果，其實(shí)兩者都成了支柱。

　　世界如此龐雜，通常不會(huì)由一家企業(yè)包攬所有需求。

　　具體到你的問題：人們確實(shí)不會(huì)在 WhatsApp 里寫代碼，我絲毫不覺得那會(huì)成為主要用例。但人們肯定會(huì)讓 AI 去做很多事，其中不少都需要 AI 寫代碼，只是用戶未必意識(shí)到。

　　我們內(nèi)部有大批工程師在用 Meta AI，公司內(nèi)還有名為 MetaMate 的工具，以及一系列圍繞它打造的編碼與研究代理，這條反饋循環(huán)可以大幅提速我們的內(nèi)部研發(fā)。

　　AI 幾乎肯定會(huì)帶來知識(shí)工作和編碼的革命，我也相信它會(huì)定義下一代搜索，幫助完成更復(fù)雜的信息任務(wù)。

　　此外，人們會(huì)用它來娛樂自己，如今互聯(lián)網(wǎng)到處都是梗和段子，未來也一樣。人類傾注大量精力去娛樂、去推動(dòng)文化、用幽默闡釋觀察到的現(xiàn)象，這點(diǎn)永遠(yuǎn)不會(huì)變。

　　回顧Instagram、Facebook 的演變：十幾、二十年前主要是文字，后來手機(jī)有了攝像頭，圖片成主流，再后來移動(dòng)網(wǎng)絡(luò)提速，手機(jī)看視頻不再卡頓，于是視頻崛起。過去十年，大多數(shù)人在 FB 和 IG 上花的時(shí)間，都在看視頻。

　　那你覺得五年后，大家還會(huì)只是刷視頻嗎？不會(huì)的，內(nèi)容會(huì)變得可互動(dòng)：你滑到一條看似Reels 的內(nèi)容，卻能跟它對(duì)話，它會(huì)回應(yīng)你，甚至像游戲一樣，讓你跳進(jìn)去互動(dòng)，這一切都將由 AI 驅(qū)動(dòng)。

　　所有形態(tài)將百花齊放，我們野心很大，會(huì)涉獵多個(gè)領(lǐng)域，但我不認(rèn)為任何一家公司能包辦全部。

　　 三、 AI Friends, Therapists, Girlfriend

　　 DP：關(guān)于 AI 生成內(nèi)容與 AI 互動(dòng)這點(diǎn)，現(xiàn)在已經(jīng)有人與 AI 心理咨詢師、AI 朋友，甚至更多角色建立了有意義的關(guān)系。隨著 AI 變得更獨(dú)特、更有個(gè)性、更聰明、更即興、更風(fēng)趣，這種關(guān)系只會(huì)愈發(fā)緊密。

　　人們肯定會(huì)和 AI 建立關(guān)系，我們?cè)撊绾未_保這些關(guān)系是健康的？

　　MZ：很多問題只有真正看到用戶行為后，才能回答。最重要的前提是，在每一步都主動(dòng)提出這個(gè)問題，并認(rèn)真對(duì)待。但是，如果一開始就過于武斷，認(rèn)定某些做法必然不好，往往會(huì)扼殺掉價(jià)值。

　　人們之所以使用某樣?xùn)|西，是因?yàn)樗鼘?duì)他們有價(jià)值。我設(shè)計(jì)產(chǎn)品的核心原則之一是：用戶是聰明的，他們知道什么對(duì)自己有用。

　　偶爾產(chǎn)品里會(huì)出現(xiàn)負(fù)面情況，你要盡量把風(fēng)險(xiǎn)降到最低�？扇绻阌X得某件事不好，而用戶卻樂此不疲，大多數(shù)情況下，以我的經(jīng)驗(yàn)，用戶肯定是對(duì)的，你錯(cuò)了。

　　只是你尚未找到解釋框架，理解為何這件事對(duì)他們有益，這就是我的基本思路。

　　我相信人們會(huì)把 AI 用在許多社交場(chǎng)景。實(shí)際上，我們已經(jīng)看到不少人用 Meta AI 來練習(xí)與親友的艱難對(duì)話：

　　“我和女友出現(xiàn)問題，該怎么談？”
“我得跟老板進(jìn)行一場(chǎng)硬碰硬的交流，該怎么說？”

　　這樣的功能很有幫助，等到個(gè)性化閉環(huán)真正跑起來，AI 越來越了解你，這種體驗(yàn)會(huì)更具吸引力。

　　有個(gè)我常提的數(shù)據(jù)：平均美國人擁有的“真朋友”不足 3 個(gè)。可他們心里期望的朋友數(shù)量，大約是 15 個(gè)。到某個(gè)點(diǎn)，人們會(huì)覺得“我太忙，顧不過來了”，但大多數(shù)人都渴望比現(xiàn)實(shí)更多的聯(lián)結(jié)，也經(jīng)常感到孤獨(dú)。

　　有人擔(dān)心 AI 會(huì)取代現(xiàn)實(shí)中的面對(duì)面關(guān)系，我傾向認(rèn)為不會(huì)。線下交流有無可替代的優(yōu)勢(shì)，只是現(xiàn)實(shí)中很多人得不到足夠的連接感。

　　今天，一些 AI 心理師、AI 女友之類的應(yīng)用，仍帶著輕微的“污名”。隨著時(shí)間推移，社會(huì)會(huì)逐漸找到合適的解釋，說明它們的價(jià)值、使用者的合理性，以及它們?cè)鯓诱嬲纳屏松睿F(xiàn)在仍然非常早期。

　　目前做虛擬治療師、虛擬伴侶的公司，不過寥寥數(shù)家，而且“具身化”很弱，打開應(yīng)用只是一張頭像，最多有點(diǎn)粗糙的動(dòng)畫，談不上真正的具身。

　　你見過我們 Reality Labs 的 Codec Avatars，那真的像真人一樣。這正是未來，你將能隨時(shí)與 AI 進(jìn)行視頻對(duì)話，而手勢(shì)同樣關(guān)鍵，真實(shí)對(duì)話中，超過一半的信息并非語言，而是非語言信號(hào)。

　　DP：前幾天我體驗(yàn)了 Orion，印象相當(dāng)深刻。我總體對(duì)這項(xiàng)技術(shù)持樂觀態(tài)度，也像你說的那樣較為“自由主義”，如果用戶選擇做某事，很可能對(duì)他們有益。

　　雖說，我不確定一個(gè)沉迷 TikTok 的人，是否真的滿意自己花在 TikTok 上的時(shí)間。

　　而我之所以樂觀，是因?yàn)橐谖磥?AGI 世界生存，我們也需要用這類工具升級(jí)自身能力，而且世界會(huì)因此更美，比如處處都能見到“吉卜力風(fēng)”。

　　不過，你們團(tuán)隊(duì)展示的一個(gè)標(biāo)志性場(chǎng)景，讓我有些擔(dān)心，我坐在早餐桌前，余光里不斷劃過一排排 Reels，也許將來屏幕另一側(cè)還會(huì)有我的 AI 女友。

　　這很糟糕，技術(shù)的“獎(jiǎng)勵(lì)劫持reward-hacked”的所有阻力，似乎正在被全部消除，該怎么確保五年后不會(huì)變成這樣？

　　MZ:我仍然相信人們清楚自己想要什么，你看到的只是一個(gè)多任務(wù)與全息演示，僅用于展示能力。我同意未來不該是視野邊角總有東西爭(zhēng)奪注意力，大多數(shù)人不會(huì)喜歡那樣。

　　在設(shè)計(jì)眼鏡時(shí)，我們尤其注意這一點(diǎn)。對(duì)眼鏡而言，首要任務(wù)是“隱形”，它本質(zhì)上是一副好眼鏡。這也是 Ray-Ban Meta 受歡迎的原因，它能聽歌、接電話、拍照錄像，AI 只有在你需要時(shí)才出現(xiàn)，當(dāng)你不需要時(shí)，它就是一副好看的眼鏡。

　　把存在感降到最低，這將是 AR 時(shí)代至關(guān)重要的設(shè)計(jì)原則。

　　更宏觀地看，數(shù)字世界在我們生活中如此重要，卻只能通過“物理數(shù)字屏幕”來訪問——手機(jī)、電腦、墻上的電視，這些都是大塊硬件。

　　技術(shù)已經(jīng)走到讓物理與數(shù)字徹底融合的階段，比如全息疊加holographic overlays就是實(shí)現(xiàn)路徑。

　　我同意，設(shè)計(jì)原則必須圍繞人與人互動(dòng)，你可隨時(shí)把數(shù)字對(duì)象帶入對(duì)話，比如：

　　想展示什么？直接拉出一個(gè)屏幕，三維可交互；

　　想打牌？來，一副虛擬牌，我們一起玩；

　　我們倆面對(duì)面，第三位朋友可以“全息”加入。

　　但正如沒人愿意讓現(xiàn)實(shí)空間過度雜亂，因?yàn)榫裆蠒?huì)被壓垮，人們同樣不會(huì)想讓混合現(xiàn)實(shí)空間顯得擁擠不堪。

　　這更像一種美學(xué)規(guī)范，最終會(huì)形成共識(shí)，我相信我們會(huì)找到平衡。

　　四、DeepSeek and China

　　DP：回到 AI 這個(gè)話題。你剛才提到，物理基礎(chǔ)設(shè)施會(huì)成為非常大的瓶頸。拿其他開源模型來說，比如 DeepSeek，他們目前掌握的算力明顯少于 Meta 這樣的實(shí)驗(yàn)室，可有人認(rèn)為它的表現(xiàn)已經(jīng)能和 Llama 系列抗衡。

　　如果中國在搭建物理基礎(chǔ)設(shè)施、擴(kuò)大工業(yè)規(guī)模、獲取電力以及上線數(shù)據(jù)中心方面更有優(yōu)勢(shì)，你會(huì)不會(huì)擔(dān)心他們最終在這條賽道上超過我們？

　　MZ：這確實(shí)是一場(chǎng)真刀真槍的競(jìng)賽，而你已經(jīng)能看到各國產(chǎn)業(yè)政策在發(fā)揮作用。中國正在并網(wǎng)更多電力，因此，美國必須加快數(shù)據(jù)中心建設(shè)和能源生產(chǎn)的流程，否則我們會(huì)落入相當(dāng)不利的境地。

　　與此同時(shí)，針對(duì)芯片等產(chǎn)品的export control，也的確在產(chǎn)生效果。大家談到 DeepSeek 時(shí)常說，他們做了很多“令人驚嘆的底層優(yōu)化”。沒錯(cuò)，他們確實(shí)做到了，而且相當(dāng)厲害。

　　可接著就要問：為什么 DeepSeek 得這么做，而美國的實(shí)驗(yàn)室卻不用？

　　原因是，他們用的是經(jīng)export controls“降級(jí)”后的 NVIDIA 芯片，而美國實(shí)驗(yàn)室可以直接用完整版。DeepSeek 只好把大量精力花在低層基礎(chǔ)設(shè)施優(yōu)化上，這是美國同行不必付出的成本。

　　結(jié)果是，DeepSeek 在文本任務(wù)上，拿出了漂亮的成績，但他們目前只支持文本。他們的優(yōu)化很驚艷，文本效果也不錯(cuò)，可如今每個(gè)重磅新模型都是多模態(tài)：既能處理圖像，也能處理語音，而 DeepSeek 的模型做不到。

　　為什么？并不是他們能力不足，而是他們必須先投入資源去彌補(bǔ)export controls帶來的硬件缺口。

　　再看 Llama 4 與 DeepSeek 的比較。我們的推理版本還沒發(fā)布，所以 R1 的對(duì)標(biāo)暫時(shí)不清楚。但就文本任務(wù)而言，我們用更小的模型，就能達(dá)到和 DeepSeek 相同的水平，因此單位智能成本（cost-per-intelligence）更低。在多模態(tài)上，我們目前處于領(lǐng)先，而他們的模型根本沒有這部分能力。

　　綜合來看，Llama 4 表現(xiàn)很強(qiáng)，我相信大多數(shù)人最終會(huì)更愿意使用 Llama 4。不過，DeepSeek 那邊顯然也有一支優(yōu)秀的團(tuán)隊(duì)。你提到的電力、算力與芯片的可獲得性，確實(shí)至關(guān)重要。不同實(shí)驗(yàn)室能夠做什么、做到何種程度，在很大程度上都取決于這些前置條件。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.