国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

扎克伯格談DeepSeek(上):他們做了令人驚嘆的底層優(yōu)化,但還不支持多模態(tài)

0
分享至

   或許是因為最近Meta財報發(fā)布,或許是因為最近Llama受到的非議太多,或許是因為小扎個人的分享欲爆棚,他在和的前后腳,還接受了這檔商業(yè)人文播客Dwarkesh Podcast的訪談。

   ,這個訪談犀利點評他人更多,他聊到了OpenAI、聊到了谷歌的Gemini,聊到了 Anthropic,全程還提及14次DeepSeek,8次China,4次Trump。

   本次訪談的幾大主題

  Llama 4、基準(zhǔn)測試刷榜、開源vs閉源之爭

  AI爆炸,但AGI 的商業(yè)模式是什么?

  DeepSeek和中國、export controls和Trump

  Orion智能眼鏡、人與 AI 的關(guān)系,如何避免被技術(shù)的獎勵機(jī)制劫持?

  Llama 4 和其他AI模型的比較

   以下是整個訪談的內(nèi)容目錄,本篇只包含前四部分。下篇幾天后發(fā)出,里面提到了美國科技巨頭是否會配合 Trump的問題,也挺有意思,歡迎關(guān)注本號,敬請期待。

   一、How Llama 4 compares to other models

   二、Intelligence explosion

   三、AI Friends, Therapists & Girlfriend

  四、 DeepSeek & China

  五、Open source AI

  六、Monetizing AGI

  七、The role of a CEO

  八、Is big tech aligning with Trump?

  九、100x productivity

   一、How Llama 4 compares to other models

  Dwarkesh Patel:Mark,感謝你再次參加我們的播客。

  Mark Zuckerberg:很高興來,見到你很開心。

  DP:彼此彼此。上次你來,我們聊的是 Llama 3,現(xiàn)在你們發(fā)布了 Llama 4。

  MZ:嚴(yán)格來說,是 Llama 4 的首個版本。

  DP:沒錯。有哪些新亮點?發(fā)生了什么變化?

  MZ:整個領(lǐng)域變化太快了。自上次交談以來,真是天翻地覆。Meta AI 的月活用戶已逼近十億,著實令人驚嘆。

  我覺得今年會是大年,尤其是當(dāng)我們真正跑通用戶的個性化閉環(huán),就是利用算法掌握關(guān)于興趣的context,包括信息流、個人檔案、社交圖譜,還有基于你與 AI 對話的內(nèi)容,這種“個性化”,將成為下一個令人振奮的大方向,我對此十分看好。

  模型本身也在突飛猛進(jìn)。我對 Llama 4 的首批發(fā)布相當(dāng)滿意。我們官宣了四個模型,率先放出其中兩個,Scout 和 Maverick,算是中小模型。

  Llama 3 最受歡迎的是 80 億參數(shù)版本,所以 Llama 4 也會有同等規(guī)模的后繼,內(nèi)部代號Little Llama,預(yù)計數(shù)月內(nèi)上線。

  Scout 和 Maverick的“單位成本智能”極高(highest intelligence per cost),原生多模態(tài)、高效、單機(jī)即可運行,專為低延遲場景打造,我們會先滿足內(nèi)部需求,再開源給大眾,這一直是我們的做法。

  我同樣期待即將到來的Behemoth,這是我們首個“前沿級”模型,參數(shù)量逾 2 萬億,非常龐大。僅僅是為它做后訓(xùn)練,我們就得搭一堆新基礎(chǔ)設(shè)施。

  現(xiàn)在要思考的是,普通開發(fā)者如何用得上?也許需要蒸餾成更易部署的尺寸,畢竟消費級產(chǎn)品,不可能直接跑這么大的模型。

  回想Llama 3 的節(jié)奏,首發(fā)很激動人心,隨后一年我們持續(xù)迭代,3.1 是4050 億參數(shù)版本,3.2 加入完整多模態(tài),今年我們同樣有類似路線圖,事情很多。

  DP:有人覺得,過去一年頂級閉源模型與頂級開源模型的差距更大了,雖說 Llama 4 全系列尚未放完,但 Llama 4 Maverick 在 Chatbot Arena 僅排第 35,在多項主流基準(zhǔn)上,同級別的 o4-mini 或 Gemini 2.5 Flash 的表現(xiàn)都更好,你怎么看?

  MZ:幾點想法吧,第一,今年總體對開源模型而言絕對是大年,去年像樣的創(chuàng)新開源模型幾乎只有 Llama,如今優(yōu)秀模型百花齊放。

  普遍預(yù)測稱,今年開源模型的使用量將超過閉源,我認(rèn)為很有可能。令人驚喜的是,不止 Llama,很多模型都很出色。

  再說推理模型現(xiàn)象,你提到的 o3、o4 等,現(xiàn)在出現(xiàn)了專業(yè)化:若要在數(shù)學(xué)、編程等任務(wù)上做到最好,就需要推理模型在推理時,投入更多算力,換取更高智能。

  我們也在做 Llama 4 的推理版本,日后會放出。

  但對我們關(guān)注的大量應(yīng)用來說,延遲單位成本智能(intelligence per cost),更為關(guān)鍵。面向消費者時,沒人愿意多等半分鐘,若能在半秒給出足夠好的答案,那就是最好的。

  兩條路線,都很重要,我也看好將推理模型與核心語言模型融合——Google 最新的 Gemini 就在走這條路,未來會出現(xiàn)多種形態(tài)。

  你提到 Chatbot Arena,這暴露了基準(zhǔn)測試的弊病:如何評估模型在哪些任務(wù)表現(xiàn)優(yōu)異?

  過去一年,我們更多把模型錨定在Meta AI 的北極星用例(Meta AI product north star use cases)。

  許多開源基準(zhǔn),偏向極其特定的場景,未必符合普通用戶真實需求,它們衡量的能力組合,與用戶在產(chǎn)品中真正關(guān)心的往往不同。

  過度迎合這些基準(zhǔn),就會跑偏,未必帶來最佳產(chǎn)品體驗和最高使用量。我們的北極星是用戶反饋,用戶說想要什么,以及實際行為,很多基準(zhǔn)也很容易被“刷榜”。

  舉例說,Sonnet 3.7 是好模型,卻排不上前列,我們團(tuán)隊其實可以輕松把 Llama 4 Maverick 調(diào)優(yōu)到榜首,但現(xiàn)在發(fā)布的模型,壓根沒為榜單做微調(diào),所以排名靠后。

  對這些榜單,要審慎看待,我們主要還是以產(chǎn)品價值為依據(jù)。

  DP:你覺得有沒有某種基準(zhǔn),能客觀衡量你所謂的“用戶價值”北極星,讓你說:“我得讓 Llama 4 在這項基準(zhǔn)上拿第一?”

  MZ:我們的基準(zhǔn),就是Meta AI 的用戶價值user value。

  DPa:可那無法與其他模型對比吧?

  MaZ:也許能,因為我們可以內(nèi)部運行其他模型做對照,這正是開源的一大優(yōu)勢,社區(qū)能幫你揪出模型的短板與長處。

  現(xiàn)實是,各模型的優(yōu)化組合略有不同。所有領(lǐng)先實驗室,都在追求同一個終點:人工通用智能AGI、或者人工超級智能ASI,讓每個人擁有超人級工具,創(chuàng)造任何想要的東西,極大賦能個人并帶來經(jīng)濟(jì)紅利。

  但不同團(tuán)隊確有各自的側(cè)重,Anthropic更聚焦編程及相關(guān)智能體,OpenAI 近期更偏向推理。

  我猜最終使用最廣的,會是那種響應(yīng)迅速、交互自然、原生多模態(tài)、能融入日常的模型

  你應(yīng)該試過我們即將發(fā)布的新 Meta AI App,我們放了個全雙工語音(full-duplex voice)的 Demo。雖然還早,還沒設(shè)為默認(rèn)語音模型,但其自然對話的感覺,非常吸引人。

  把這與正確的“個性化”結(jié)合,未來的產(chǎn)品體驗將是,幾年后,我們?nèi)粘恢迸c AI 交談。

  拿著手機(jī)瀏覽信息流時,它與你對話,提供上下文、回答問題,在消息應(yīng)用中,輔助溝通。最終,我們走在街頭,戴著眼鏡或其他 AI 設(shè)備,與之無縫互動。

  這就是北極星,只要某項基準(zhǔn)能讓人們覺得質(zhì)量足夠好、愿意使用,那才對我們最重要。

   二、 Intelligence Explosion 智能爆炸

  DP:我同時體驗了 Orion 和 Meta AI App,語音模式流暢得驚人,真的很出色。

  關(guān)于各大實驗室所追求的優(yōu)化方向,如果非得為他們的觀點做辯護(hù),他們通常認(rèn)為,一旦徹底自動化軟件工程與 AI 研究,就能引爆一場“智能爆炸”。

  屆時,數(shù)以百萬計的“軟件工程師的副本copies of software engineers”,會把 Llama 1 到 Llama 4 之間那種量級的進(jìn)步再復(fù)制一遍,只是時間從數(shù)年縮短到數(shù)周或數(shù)月。

  所以,只要把“軟件工程師”這個環(huán)節(jié)閉環(huán)起來,你就能率先抵達(dá)人工超級智能ASI,你怎么看?

  MZ:我認(rèn)為這個設(shè)想頗具說服力,這也是我們在 Meta 內(nèi)部大力投入編碼代理的原因。鑒于我們并不是一家企業(yè)級軟件公司,我們主要是為自身需求構(gòu)建這些工具。

  我們的目標(biāo)很明確——不是去做一個通用的開發(fā)者工具,而是打造能推進(jìn) Llama 研究的編碼代理coding agent和 AI 研究代理research agent,并且它們完全接入了我們的內(nèi)部工具鏈toolchain。

  這的確重要,也必將成為 AI 研發(fā)的關(guān)鍵一環(huán)。我猜在未來 12-18 個月內(nèi),為這些項目編寫的大部分代碼,都將由 AI 完成,而且我指的不是自動補全?,F(xiàn)在自動補全已經(jīng)不錯:你開始寫一段代碼,它可以把一整段補全。

  我說的是,你只需給出目標(biāo),它就能運行測試、改進(jìn)功能、定位問題,寫出的代碼質(zhì)量,已超過團(tuán)隊里一般優(yōu)秀工程師的平均水平,我確信這會非常關(guān)鍵。

  但我并不認(rèn)為這就是全部,這個行業(yè)很大,AI 的開發(fā)方式也會多種多樣。我不相信最終只會出現(xiàn)一家擁有單一優(yōu)化函數(shù)、能最好地服務(wù)所有人的公司。

  不同實驗室會在不同領(lǐng)域領(lǐng)跑:有的更偏向企業(yè)或編碼場景,有的專注效率提升,有的聚焦社交或娛樂。

  即便在助手領(lǐng)域,也會有注重信息與生產(chǎn)力的助手,也會有偏向陪伴的助手,或者純粹有趣、娛樂,直接出現(xiàn)在信息流里的內(nèi)容。

  總之空間巨大,奔向 AGI 的道路上既有共同要邁的臺階,也有大量仍待創(chuàng)造的全新事物,我猜未來會看到各團(tuán)隊之間的進(jìn)一步專業(yè)化。

  DP:有意思的是,你基本同意會出現(xiàn)“智能爆炸”,最終會誕生超級智能。如果我沒理解錯的話,在這種情況下,為什么還要費心開發(fā)個人助手之類的應(yīng)用?為什么不先把超級智能做出來,其他東西晚點再說?

  MZ:那只是飛輪flywheel的一部分。我不太認(rèn)同“快速起飛fast take-off”論的一個原因是——建設(shè)實體基礎(chǔ)設(shè)施需要時間。

  如果要建一個吉瓦級算力集群gigawatt cluster of compute,就需要時間。NVIDIA 需要時間穩(wěn)定新一代系統(tǒng),你還得規(guī)劃網(wǎng)絡(luò)架構(gòu),建設(shè)機(jī)房,拿許可證,搞能源——可能是燃?xì)廨啓C(jī),也可能是可再生能源——無論哪種,背后都有完整的供應(yīng)鏈。

  我們上次播客里,聊過很多這類問題。這些都是現(xiàn)實世界、以人類時間尺度推進(jìn)的事。當(dāng)你在某一層獲得更高智能,往往會撞到另一層的瓶頸。

  工程學(xué)永遠(yuǎn)如此:解決一個瓶頸,下一個瓶頸就出現(xiàn)。

  另一個瓶頸是:人們需要時間去適應(yīng)、去學(xué)習(xí)如何與系統(tǒng)形成反饋閉環(huán)。

  這些系統(tǒng)不會一現(xiàn)身,就讓所有人瞬間會用,它們與人的使用方式是共同進(jìn)化的,人學(xué)著如何最好地用助手,助手也在學(xué)用戶在乎什么,開發(fā)者再把助手做得更好。

  同時,我們還在積累上下文。一年兩年后回頭看,助手能引用你兩年前聊過的話,這非???。如果它今天才上線,就算再完美,也不可能引用兩年前不存在的對話。

  所以我的觀點是:智能增速確實陡峭。人們與 AI 助手的交互量和數(shù)據(jù)反饋飛輪同樣增長迅猛。

  同時,算力供應(yīng)鏈、基礎(chǔ)設(shè)施、監(jiān)管框架也都在建設(shè)中,單有“寫代碼”那一環(huán),遠(yuǎn)遠(yuǎn)不夠。

  舉個例子:幾年前,我們廣告團(tuán)隊做過一個項目,自動化廣告排序?qū)嶒?。那是個相對封閉的環(huán)境,并非開放式編碼,系統(tǒng)會回溯公司歷史上每一次廣告實驗,分析成敗和結(jié)果,然后提出新假設(shè)去做試驗,提高廣告效果。

  結(jié)果我們發(fā)現(xiàn),瓶頸在于運行實驗的算力,以及可用的用戶分層。哪怕 Meta 有 35 億用戶,每個實驗仍需幾十萬甚至上百萬人,才能顯著統(tǒng)計,我們已經(jīng)有更多優(yōu)質(zhì)想法,但算力和受試人群都不夠用。

  因此,僅僅生成更多實驗想法,并不會帶來增益。AI 生成的“假設(shè)”,如果未來能有價值,平均質(zhì)量得先超越目前“上線門檻”以上的、由頂尖工程師提出的想法才行。

  我相信我們會很快達(dá)到哪里,但這不是“AI 會寫代碼,一切瞬間升級”的故事,現(xiàn)實約束很多。你得有算力,有人群做實驗,隨著 AI 質(zhì)量持續(xù)提升。

  也許五到十年后,沒有任何人類團(tuán)隊能再提出比 AI 更好的假設(shè)了,也許吧,但那絕非現(xiàn)在。

  DP:如果你認(rèn)同智能走向這幅圖景,那看好 Meta 的理由,顯然在于你們擁有龐大分發(fā)渠道,也能由此收集更多可用于訓(xùn)練的數(shù)據(jù),你說Meta AI現(xiàn)在已有十億活躍用戶。

  MZ:不是獨立App,本次單獨推出的 App 才剛上線,供想嘗鮮的人使用,體驗確實不錯,里面有些新點子值得聊。

  但我所說的“十億”,主要發(fā)生在我們的各大應(yīng)用里。

  用Meta AI 用得最多的是WhatsApp,而 WhatsApp 的主戰(zhàn)場在美國以外。雖然我們在美國已突破一億用戶,但美國的主流消息平臺其實是 iMessage,所以美國用戶往往低估了Meta AI 的實際使用量。

  也正因如此,獨立App就很重要。美國無論如何都是關(guān)鍵市場,可WhatsApp在這兒確實不是老大,我們需要別的路徑交付一流體驗,讓Meta AI 真正出現(xiàn)在美國用戶面前。

  DP:如果 AI 的未來不再只是答疑,而是成為虛擬同事,那么在 WhatsApp里集成 Meta AI ,是否就無助于訓(xùn)練出完全自主的程序員或遠(yuǎn)程工作者?那時,誰擁有更大語言模型的分發(fā)量,或許就沒那么重要了?

  MZ:我還是覺得場景會多元,想象一下互聯(lián)網(wǎng)剛誕生時,你問:互聯(lián)網(wǎng)的主戰(zhàn)場會是什么?知識工作還是面向大眾的消費級應(yīng)用?

  結(jié)果,其實兩者都成了支柱。

  世界如此龐雜,通常不會由一家企業(yè)包攬所有需求。

  具體到你的問題:人們確實不會在 WhatsApp 里寫代碼,我絲毫不覺得那會成為主要用例。但人們肯定會讓 AI 去做很多事,其中不少都需要 AI 寫代碼,只是用戶未必意識到。

  我們內(nèi)部有大批工程師在用 Meta AI,公司內(nèi)還有名為 MetaMate 的工具,以及一系列圍繞它打造的編碼與研究代理,這條反饋循環(huán)可以大幅提速我們的內(nèi)部研發(fā)。

  AI 幾乎肯定會帶來知識工作和編碼的革命,我也相信它會定義下一代搜索,幫助完成更復(fù)雜的信息任務(wù)。

  此外,人們會用它來娛樂自己,如今互聯(lián)網(wǎng)到處都是梗和段子,未來也一樣。人類傾注大量精力去娛樂、去推動文化、用幽默闡釋觀察到的現(xiàn)象,這點永遠(yuǎn)不會變。

  回顧Instagram、Facebook 的演變:十幾、二十年前主要是文字,后來手機(jī)有了攝像頭,圖片成主流,再后來移動網(wǎng)絡(luò)提速,手機(jī)看視頻不再卡頓,于是視頻崛起。過去十年,大多數(shù)人在 FB 和 IG 上花的時間,都在看視頻。

  那你覺得五年后,大家還會只是刷視頻嗎?不會的,內(nèi)容會變得可互動:你滑到一條看似Reels 的內(nèi)容,卻能跟它對話,它會回應(yīng)你,甚至像游戲一樣,讓你跳進(jìn)去互動,這一切都將由 AI 驅(qū)動。

  所有形態(tài)將百花齊放,我們野心很大,會涉獵多個領(lǐng)域,但我不認(rèn)為任何一家公司能包辦全部。

   三、 AI Friends, Therapists, Girlfriend

   DP:關(guān)于 AI 生成內(nèi)容與 AI 互動這點,現(xiàn)在已經(jīng)有人與 AI 心理咨詢師、AI 朋友,甚至更多角色建立了有意義的關(guān)系。隨著 AI 變得更獨特、更有個性、更聰明、更即興、更風(fēng)趣,這種關(guān)系只會愈發(fā)緊密。

   人們肯定會和 AI 建立關(guān)系,我們該如何確保這些關(guān)系是健康的?

  MZ:很多問題只有真正看到用戶行為后,才能回答。最重要的前提是,在每一步都主動提出這個問題,并認(rèn)真對待。但是,如果一開始就過于武斷,認(rèn)定某些做法必然不好,往往會扼殺掉價值。

  人們之所以使用某樣?xùn)|西,是因為它對他們有價值。我設(shè)計產(chǎn)品的核心原則之一是:用戶是聰明的,他們知道什么對自己有用。

  偶爾產(chǎn)品里會出現(xiàn)負(fù)面情況,你要盡量把風(fēng)險降到最低??扇绻阌X得某件事不好,而用戶卻樂此不疲,大多數(shù)情況下,以我的經(jīng)驗,用戶肯定是對的,你錯了。

  只是你尚未找到解釋框架,理解為何這件事對他們有益,這就是我的基本思路。

  我相信人們會把 AI 用在許多社交場景。實際上,我們已經(jīng)看到不少人用 Meta AI 來練習(xí)與親友的艱難對話:

  “我和女友出現(xiàn)問題,該怎么談?”
“我得跟老板進(jìn)行一場硬碰硬的交流,該怎么說?”

  這樣的功能很有幫助,等到個性化閉環(huán)真正跑起來,AI 越來越了解你,這種體驗會更具吸引力。

  有個我常提的數(shù)據(jù):平均美國人擁有的“真朋友”不足 3 個。可他們心里期望的朋友數(shù)量,大約是 15 個。到某個點,人們會覺得“我太忙,顧不過來了”,但大多數(shù)人都渴望比現(xiàn)實更多的聯(lián)結(jié),也經(jīng)常感到孤獨。

  有人擔(dān)心 AI 會取代現(xiàn)實中的面對面關(guān)系,我傾向認(rèn)為不會。線下交流有無可替代的優(yōu)勢,只是現(xiàn)實中很多人得不到足夠的連接感。

  今天,一些 AI 心理師、AI 女友之類的應(yīng)用,仍帶著輕微的“污名”。隨著時間推移,社會會逐漸找到合適的解釋,說明它們的價值、使用者的合理性,以及它們怎樣真正改善了生活,但現(xiàn)在仍然非常早期。

  目前做虛擬治療師、虛擬伴侶的公司,不過寥寥數(shù)家,而且“具身化”很弱,打開應(yīng)用只是一張頭像,最多有點粗糙的動畫,談不上真正的具身。

  你見過我們 Reality Labs 的 Codec Avatars,那真的像真人一樣。這正是未來,你將能隨時與 AI 進(jìn)行視頻對話,而手勢同樣關(guān)鍵,真實對話中,超過一半的信息并非語言,而是非語言信號。

  DP:前幾天我體驗了 Orion,印象相當(dāng)深刻。我總體對這項技術(shù)持樂觀態(tài)度,也像你說的那樣較為“自由主義”,如果用戶選擇做某事,很可能對他們有益。

  雖說,我不確定一個沉迷 TikTok 的人,是否真的滿意自己花在 TikTok 上的時間。

  而我之所以樂觀,是因為要在未來 AGI 世界生存,我們也需要用這類工具升級自身能力,而且世界會因此更美,比如處處都能見到“吉卜力風(fēng)”。

  不過,你們團(tuán)隊展示的一個標(biāo)志性場景,讓我有些擔(dān)心,我坐在早餐桌前,余光里不斷劃過一排排 Reels,也許將來屏幕另一側(cè)還會有我的 AI 女友。

  這很糟糕,技術(shù)的“獎勵劫持reward-hacked”的所有阻力,似乎正在被全部消除,該怎么確保五年后不會變成這樣?

  MZ:我仍然相信人們清楚自己想要什么,你看到的只是一個多任務(wù)與全息演示,僅用于展示能力。我同意未來不該是視野邊角總有東西爭奪注意力,大多數(shù)人不會喜歡那樣。

  在設(shè)計眼鏡時,我們尤其注意這一點。對眼鏡而言,首要任務(wù)是“隱形”,它本質(zhì)上是一副好眼鏡。這也是 Ray-Ban Meta 受歡迎的原因,它能聽歌、接電話、拍照錄像,AI 只有在你需要時才出現(xiàn),當(dāng)你不需要時,它就是一副好看的眼鏡。

  把存在感降到最低,這將是 AR 時代至關(guān)重要的設(shè)計原則。

  更宏觀地看,數(shù)字世界在我們生活中如此重要,卻只能通過“物理數(shù)字屏幕”來訪問——手機(jī)、電腦、墻上的電視,這些都是大塊硬件。

  技術(shù)已經(jīng)走到讓物理與數(shù)字徹底融合的階段,比如全息疊加holographic overlays就是實現(xiàn)路徑。

  我同意,設(shè)計原則必須圍繞人與人互動,你可隨時把數(shù)字對象帶入對話,比如:

  想展示什么?直接拉出一個屏幕,三維可交互;

  想打牌?來,一副虛擬牌,我們一起玩;

  我們倆面對面,第三位朋友可以“全息”加入。

  但正如沒人愿意讓現(xiàn)實空間過度雜亂,因為精神上會被壓垮,人們同樣不會想讓混合現(xiàn)實空間顯得擁擠不堪。

  這更像一種美學(xué)規(guī)范,最終會形成共識,我相信我們會找到平衡。

  四、DeepSeek and China

  DP:回到 AI 這個話題。你剛才提到,物理基礎(chǔ)設(shè)施會成為非常大的瓶頸。拿其他開源模型來說,比如 DeepSeek,他們目前掌握的算力明顯少于 Meta 這樣的實驗室,可有人認(rèn)為它的表現(xiàn)已經(jīng)能和 Llama 系列抗衡。

  如果中國在搭建物理基礎(chǔ)設(shè)施、擴(kuò)大工業(yè)規(guī)模、獲取電力以及上線數(shù)據(jù)中心方面更有優(yōu)勢,你會不會擔(dān)心他們最終在這條賽道上超過我們?

  MZ:這確實是一場真刀真槍的競賽,而你已經(jīng)能看到各國產(chǎn)業(yè)政策在發(fā)揮作用。中國正在并網(wǎng)更多電力,因此,美國必須加快數(shù)據(jù)中心建設(shè)和能源生產(chǎn)的流程,否則我們會落入相當(dāng)不利的境地。

  與此同時,針對芯片等產(chǎn)品的export control,也的確在產(chǎn)生效果。大家談到 DeepSeek 時常說,他們做了很多“令人驚嘆的底層優(yōu)化”。沒錯,他們確實做到了,而且相當(dāng)厲害。

  可接著就要問:為什么 DeepSeek 得這么做,而美國的實驗室卻不用?

  原因是,他們用的是經(jīng)export controls“降級”后的 NVIDIA 芯片,而美國實驗室可以直接用完整版。DeepSeek 只好把大量精力花在低層基礎(chǔ)設(shè)施優(yōu)化上,這是美國同行不必付出的成本。

  結(jié)果是,DeepSeek 在文本任務(wù)上,拿出了漂亮的成績,但他們目前只支持文本。他們的優(yōu)化很驚艷,文本效果也不錯,可如今每個重磅新模型都是多模態(tài):既能處理圖像,也能處理語音,而 DeepSeek 的模型做不到。

  為什么?并不是他們能力不足,而是他們必須先投入資源去彌補export controls帶來的硬件缺口。

  再看 Llama 4 與 DeepSeek 的比較。我們的推理版本還沒發(fā)布,所以 R1 的對標(biāo)暫時不清楚。但就文本任務(wù)而言,我們用更小的模型,就能達(dá)到和 DeepSeek 相同的水平,因此單位智能成本(cost-per-intelligence)更低。在多模態(tài)上,我們目前處于領(lǐng)先,而他們的模型根本沒有這部分能力。

  綜合來看,Llama 4 表現(xiàn)很強(qiáng),我相信大多數(shù)人最終會更愿意使用 Llama 4。不過,DeepSeek 那邊顯然也有一支優(yōu)秀的團(tuán)隊。你提到的電力、算力與芯片的可獲得性,確實至關(guān)重要。不同實驗室能夠做什么、做到何種程度,在很大程度上都取決于這些前置條件。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
上海交大:每次起床后大量喝水的人,用不了多久,身體或有7變化

上海交大:每次起床后大量喝水的人,用不了多久,身體或有7變化

讀懂世界歷史
2025-11-23 11:18:04
62歲退休大爺:人老了出軌雖然很有激情,但最終下場很慘

62歲退休大爺:人老了出軌雖然很有激情,但最終下場很慘

熱心柚子姐姐
2026-01-30 16:48:23
特朗普:將對伊朗發(fā)動大規(guī)模打擊

特朗普:將對伊朗發(fā)動大規(guī)模打擊

亞太觀瀾
2026-01-29 20:40:03
面條立大功!研究發(fā)現(xiàn):糖尿病患者常吃面條,或能降低3種并發(fā)癥

面條立大功!研究發(fā)現(xiàn):糖尿病患者常吃面條,或能降低3種并發(fā)癥

岐黃傳人孫大夫
2026-01-12 09:05:07
詹?。毫_德里不在狀態(tài),但瓜帥的換人調(diào)整太慢了

詹?。毫_德里不在狀態(tài),但瓜帥的換人調(diào)整太慢了

懂球帝
2026-02-02 03:18:47
恭喜皇馬!英超前三中場表忠心,1.4億不講價,10億豪門不愿放人

恭喜皇馬!英超前三中場表忠心,1.4億不講價,10億豪門不愿放人

阿泰希特
2026-02-01 13:01:21
金價單日暴跌超11%,銀價創(chuàng)40多年來最差單日表現(xiàn)

金價單日暴跌超11%,銀價創(chuàng)40多年來最差單日表現(xiàn)

界面新聞
2026-02-01 13:23:39
你是咋意識到自己沒見過世面的?網(wǎng)友:書里的楊桃饞了我二十多年

你是咋意識到自己沒見過世面的?網(wǎng)友:書里的楊桃饞了我二十多年

解讀熱點事件
2025-10-06 00:05:03
剛剛,崩了!40萬人爆倉!

剛剛,崩了!40萬人爆倉!

中國基金報
2026-02-01 07:39:50
美國取消伊朗官員和家屬入境居留權(quán)!最早周末攻擊伊朗

美國取消伊朗官員和家屬入境居留權(quán)!最早周末攻擊伊朗

項鵬飛
2026-01-31 16:11:28
患者10年三次入院,最后一次右腰背部出現(xiàn)“破口”,背后病因居然是……丨醫(yī)起推理吧

患者10年三次入院,最后一次右腰背部出現(xiàn)“破口”,背后病因居然是……丨醫(yī)起推理吧

醫(yī)脈通
2026-02-01 18:14:32
2026年煙草大洗牌!國家出手后,買煙賣煙全變了,渾水摸魚的涼了

2026年煙草大洗牌!國家出手后,買煙賣煙全變了,渾水摸魚的涼了

老特有話說
2026-01-17 21:11:59
西安事變真相:蔣家7侄陣亡護(hù)蔣,雙方死傷超600,血債被記五十四年

西安事變真相:蔣家7侄陣亡護(hù)蔣,雙方死傷超600,血債被記五十四年

磊子講史
2025-12-30 18:03:15
2026亞冠迎巨變!中超參賽3隊或全換,成都蓉城有望成最大贏家

2026亞冠迎巨變!中超參賽3隊或全換,成都蓉城有望成最大贏家

體壇鑒春秋
2026-02-01 14:06:02
中國古代單日陣亡最高的戰(zhàn)役:香積寺互砍,4個時辰11萬人陣亡!

中國古代單日陣亡最高的戰(zhàn)役:香積寺互砍,4個時辰11萬人陣亡!

小豫講故事
2026-01-31 06:00:10
領(lǐng)導(dǎo)突然問你“要不要考慮去別的崗位”,千萬不要說“我考慮下”,高情商這么回,反客為主!

領(lǐng)導(dǎo)突然問你“要不要考慮去別的崗位”,千萬不要說“我考慮下”,高情商這么回,反客為主!

二胡的歲月如歌
2026-01-03 18:02:12
央媒怒批、坑害老百姓!臭名昭著的幾個相聲演員,各個難以原諒

央媒怒批、坑害老百姓!臭名昭著的幾個相聲演員,各個難以原諒

草莓解說體育
2026-02-01 19:14:23
山東小伙娶只有8歲智商的新娘,笑的合不攏嘴,網(wǎng)友:賺大了

山東小伙娶只有8歲智商的新娘,笑的合不攏嘴,網(wǎng)友:賺大了

靜若梨花
2026-02-01 16:39:42
女護(hù)士處理男患者隱私部位,會感覺難為情嗎?美女護(hù)士說出大實話

女護(hù)士處理男患者隱私部位,會感覺難為情嗎?美女護(hù)士說出大實話

第7情感
2025-09-17 12:12:15
久違了,達(dá)米安傷愈復(fù)出時隔124天再次代表國米出場

久違了,達(dá)米安傷愈復(fù)出時隔124天再次代表國米出場

懂球帝
2026-02-02 02:34:52
2026-02-02 04:03:00
柳胖胖 incentive-icons
柳胖胖
36氪、虎嗅、鈦媒體專欄作者
208文章數(shù) 386關(guān)注度
往期回顧 全部

科技要聞

10億元寶紅包突襲 復(fù)刻微信支付還是微視?

頭條要聞

愛潑斯坦追逐女孩、安德魯跪爬女子身上畫面全公布

頭條要聞

愛潑斯坦追逐女孩、安德魯跪爬女子身上畫面全公布

體育要聞

德約大度祝賀阿卡 幽默互動逗笑納達(dá)爾

娛樂要聞

春晚第三次聯(lián)排陣容曝光:全是實力派

財經(jīng)要聞

黃仁勛臺北"夜宴":匯聚近40位臺企高管

汽車要聞

嵐圖汽車1月交付10515輛 同比增長31%

態(tài)度原創(chuàng)

游戲
健康
時尚
房產(chǎn)
軍事航空

末期癌癥玩家圓夢《毀滅戰(zhàn)士》!id公開致敬

耳石癥分類型,癥狀大不同

“多巴胺風(fēng)”又又又火了!這樣穿時髦又減齡

房產(chǎn)要聞

藏不住的小城大事,海澄新城執(zhí)掌自貿(mào)港風(fēng)口,進(jìn)階兌現(xiàn)美好生活新篇

軍事要聞

伊朗民眾:伊朗不會屈服于美國霸權(quán)

無障礙瀏覽 進(jìn)入關(guān)懷版