国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

黃仁勛萬字訪談:放棄中國市場,美國將輸?shù)鬉I技術(shù)棧競爭

0
分享至


芯東西(公眾號:aichip001)
編譯 高遠矚
編輯 漠影

芯東西4月16日報道,4月15日,頂尖的AI播客主持人Dwarkesh Patel與英偉達創(chuàng)始人兼CEO黃仁勛進行了一場近兩小時的深度對話。黃仁勛系統(tǒng)拆解了英偉達面臨的五大關(guān)鍵問題:是否依賴稀缺供應鏈構(gòu)建護城河、TPU等ASIC芯片能否打破其壟斷、為何不自己做超大規(guī)模云廠商、是否應向中國出售AI芯片,以及公司為何不采用多種不同芯片架構(gòu)。內(nèi)容同時涉及競爭壁壘、AI算力市場格局、公司戰(zhàn)略邊界及中美芯片政策等核心維度。

黃仁勛在訪談中明確闡述了英偉達的原則是“做必要的事,同時盡可能少做”。他強調(diào),英偉達只投入那些“如果我不做,就沒人會做”的事情,例如CUDA生態(tài)、加速計算和特定領(lǐng)域計算庫(如cuLitho),而不會輕易進入云服務領(lǐng)域與客戶競爭,因為“世界上有很多云服務商,如果我不做,別人會做”。

對于公司的未來,他展現(xiàn)出極強的自信與長期主義承諾:“你可以信賴英偉達的一件事是,今年的Vera Rubin會令人難以置信,明年的Vera Rubin Ultra會來,后年Feynman會來。每一年你都可以信賴我們。”他認為,英偉達正成為世界AI工業(yè)的基石,這種穩(wěn)定性和一致性是任何ASIC團隊都無法提供的。

在談及中國AI芯片出口與競爭時,黃仁勛明確反對將AI芯片出口管制極端化,直言“將AI比作濃縮鈾是一個糟糕的、不合邏輯的類比”,并批評“那種失敗者的心態(tài),對我來說毫無意義”。他談到,中國擁有全球50%的AI研究人員,是開源軟件和開放模型的最大貢獻者之一;華為剛剛度過了公司歷史上最好的一年,已出貨數(shù)百萬顆AI芯片,而且中國有大量閑置的數(shù)據(jù)中心和充足的能源,即使使用7nm工藝,也能通過數(shù)量堆疊和算法創(chuàng)新彌補制程差距。

他認為,放棄中國市場不會阻止中國AI發(fā)展,反而會迫使中國建立獨立于美國技術(shù)棧的完整生態(tài)系統(tǒng),重蹈美國電信行業(yè)被政策排擠出世界市場的覆轍,并提醒:“AI是一個五層的技術(shù)蛋糕。我們在所有五層都部署了生態(tài)系統(tǒng)。放棄芯片層,就等于讓美國輸?shù)粽麄€技術(shù)棧的競爭?!?/p>

以下是這篇播客的核心內(nèi)容:

1、下游需求即護城河: 英偉達能鎖定上游產(chǎn)能,根本原因是巨大的下游需求讓供應鏈愿意投資。

2、真正瓶頸是能源和“水管工”: 任何供應鏈瓶頸都不會超過兩三年,CoWoS、EUV都能快速擴產(chǎn),真正瓶頸是能源和“水管工”。

3、可編程架構(gòu)才是關(guān)鍵: AI不僅是矩陣乘法,新算法需要可編程架構(gòu),專用TPU無法打破英偉達的壟斷。

4、CUDA的“飛輪效應”: 數(shù)億GPU的安裝基礎(chǔ)、覆蓋所有云平臺、支持無數(shù)框架,這是任何ASIC無法比擬的護城河。

5、性價比世界第一: 英偉達每瓦token數(shù)和每美元性能都是全球最高,黃仁勛歡迎對手用MLPerf、InferenceMAX來證明。

6、Anthropic是特例: 轉(zhuǎn)投TPU是因為當時英偉達無力進行數(shù)十億美元的投資,而非技術(shù)劣勢。

7、不做云,只投資: 英偉達不自己做超大規(guī)模云廠商,而是投資CoreWeave等neocloud,避免與客戶競爭。

8、先到先得,從不漲價: GPU分配不是價高者得,而是先下采購訂單先得;英偉達保持價格穩(wěn)定,做行業(yè)基石。

9、DeepSeek是“可怕的結(jié)果”: DeepSeek若在華為芯片上首發(fā),意味著AI模型可能在美國技術(shù)棧之外運行得最好,對美國是重大損失。

10、放棄市場會催生對手: 放棄中國這個全球第二大科技市場,只會推動中國建立獨立于美國的技術(shù)棧。

以下是播客內(nèi)容的完整編譯:

一、英偉達的核心工作難以被商品化:將電子轉(zhuǎn)化為token

主持人:我們看到很多軟件公司的估值暴跌,因為人們認為有了AI之后,軟件就會變得像普通商品一樣,不再稀缺。有人會天真地想:英偉達把GDS2文件發(fā)給臺積電。臺積電制造邏輯芯片die,制造開關(guān),然后用SK海力士、美光和三星生產(chǎn)的HBM封裝起來。然后把它送到臺灣的ODM那里,他們組裝機架。英偉達本質(zhì)上是在做軟件,由別人來制造。如果軟件變得像普通商品一樣不再稀缺,那英偉達也會變得不再稀缺嗎?

黃仁勛:歸根結(jié)底,總得有人把電子轉(zhuǎn)化為token。把電子轉(zhuǎn)化為token,并隨著時間的推移讓這些token更有價值——這個過程很難完全商品化。從電子到token的轉(zhuǎn)化是一段令人難以置信的旅程。讓一個token比另一個token更有價值,就像讓一個分子比另一個分子更有價值一樣。其中涉及的藝術(shù)、工程、科學和發(fā)明,顯然我們正在實時目睹這一切。這種轉(zhuǎn)化、制造以及其中的所有科學,遠未被深刻理解,這段旅程也遠未結(jié)束。

你描述問題的方式,其實就是我對我們公司的思維模型。輸入是電子,輸出是token,中間是英偉達。我們的工作是:做必要的事情,同時盡可能少做,以實現(xiàn)這種轉(zhuǎn)化,達到驚人的能力。我所說的“盡可能少做”是指,凡是我無需親力親為的,我就與人合作,讓它成為我生態(tài)系統(tǒng)的一部分。

看看今天的英偉達,我們可能擁有最大的合作伙伴生態(tài)系統(tǒng),包括上游和下游的供應鏈、所有的計算機公司、應用開發(fā)者以及模型構(gòu)建者。AI就像一塊五層的蛋糕,我們在全部五層都有生態(tài)系統(tǒng)。我們試圖盡可能少做,但我們必須做的那部分,事實證明,極其困難,我不認為那部分會變得像普通商品一樣不再稀缺。

事實上,我也不認為企業(yè)軟件公司、工具制造商……今天的大多數(shù)軟件公司都是工具制造商。有些不是,有些是工作流編碼系統(tǒng)。但對很多公司來說,它們是工具制造商。例如,Excel、PowerPoint是工具,Cadence、Synopsys制造工具。我看到的與大家看到的恰恰相反。我認為Agent的數(shù)量將呈指數(shù)級增長,工具用戶的數(shù)量也將呈指數(shù)級增長,所有這些工具的實例數(shù)量很可能會飆升。

Synopsys Design Compiler的實例數(shù)量很可能會飆升,同時使用floor planners、我們的布局工具和設(shè)計規(guī)則檢查器的Agent數(shù)量也會飆升。今天,我們受限于工程師的數(shù)量。明天,這些工程師將得到一群Agent的支持。我們將以前所未有的方式探索設(shè)計空間,我們將使用我們今天使用的工具。

我認為工具的使用將導致軟件公司業(yè)績飆升,之所以還沒發(fā)生,是因為Agent使用工具的能力還不夠好。這些公司要么自己構(gòu)建Agent,要么Agent會變得足夠好,才能夠使用這些工具,我認為兩者會同時發(fā)生。

二、英偉達如何構(gòu)建供應鏈護城河:上游大額采購承諾和生態(tài)協(xié)同

主持人:我記得在你們最新的財報文件中,你們與代工廠、內(nèi)存和封裝供應商有近1000億美元的采購承諾。SemiAnalysis報道說,你們這類采購承諾將達到2500億美元。一種解讀是,英偉達的護城河在于你們鎖定了未來多年的稀缺組件。別人可能有加速器,但他們真的能拿到制造它所需的內(nèi)存嗎?真的能拿到制造它所需的邏輯芯片嗎?這是否是英偉達未來幾年的主要護城河?

黃仁勛:這是我們可以做到、而別人很難做到的事情之一。我們在上游做出了巨大的承諾,其中一些是顯性的,就是你提到的這些承諾。有些是隱性的,例如,上游的很多投資是由我們的供應鏈做出的,因為我對那些CEO們說:“讓我告訴你們這個行業(yè)會有多大,讓我解釋為什么,讓我和你們一起推理,讓我展示我所看到的?!?/p>

通過這個告知、啟發(fā)并與上游不同行業(yè)CEO們對齊的過程,他們愿意進行投資。他們?yōu)槭裁丛敢鉃槲叶皇菫閯e人投資?原因在于,他們知道我有能力購買他們的產(chǎn)品,并通過我的下游銷售出去。事實是,英偉達的下游供應鏈和下游需求如此之大,他們愿意在上游進行投資。

你看看GTC大會,人們對其規(guī)模和參會人數(shù)感到驚嘆。那是全方位的,整個AI宇宙匯聚一堂。他們聚在一起是因為需要互相了解,我把他們聚集起來,讓下游看到上游,上游看到下游,所有人都能看到AI的進步。非常重要的是,他們都能見到AI原住民、所有正在建設(shè)的AI初創(chuàng)公司以及所有正在發(fā)生的奇妙事情,這樣他們就能親眼看到我告訴他們的一切。我花大量時間,直接或間接地,告知我們的供應鏈、合作伙伴和生態(tài)系統(tǒng),我們面前的機會。

一些人總是說:“在大多數(shù)主題演講中,都是一個接一個的公告。”而我們的主題演講,總有一部分有點“折磨人”,因為它幾乎像是在做教育。事實上,這正是我的想法,我需要確保整個供應鏈、上下游、生態(tài)系統(tǒng),理解即將發(fā)生什么、為什么會發(fā)生、何時發(fā)生、規(guī)模會有多大,并能像我一樣系統(tǒng)地推理。

關(guān)于你描述的護城河,我們能夠為未來而建設(shè)。如果未來幾年我們的規(guī)模達到萬億美元級別,我們有供應鏈來支撐。沒有我們的影響力,沒有我們業(yè)務的速度……就像有現(xiàn)金流一樣,還有供應鏈流、有周轉(zhuǎn)。如果一個架構(gòu)的業(yè)務周轉(zhuǎn)率低,沒人會為其建立供應鏈。我們維持規(guī)模的能力,完全是因為我們的下游需求如此巨大。他們看到了,聽說了,看到了這一切的到來,這使我們能夠以現(xiàn)有的規(guī)模做我們能做的事情。

三、AI行業(yè)的瞬時需求大于總供應,但每個瓶頸兩三年內(nèi)都能解決

主持人:我想更具體地了解上游能否跟得上,你們每年向全球提供的FLOPs數(shù)量,已經(jīng)是原來的三倍以上。

黃仁勛:在這種規(guī)模下還能翻倍,確實令人難以置信。

主持人:確實,但再看看邏輯芯片。你們是臺積電N3節(jié)點的最大客戶,也是N2節(jié)點最大的客戶之一,今年整個AI將占N3產(chǎn)能的60%,根據(jù)SemiAnalysis的數(shù)據(jù),明年將達到86%。如果你已經(jīng)是最大頭,你怎么翻倍?你如何年復一年地做到這一點?我們現(xiàn)在是否處于一個因為上游限制而不得不放緩AI計算增長率的階段?你覺得有辦法繞過這個限制嗎?我們最終如何年復一年地建設(shè)兩倍多的晶圓廠?

黃仁勛:在某種程度上,瞬時需求大于世界上游和下游的總供應。在任何時刻,我們甚至可能受限于水管工的數(shù)量,這確實發(fā)生過。

主持人:水管工也應該被邀請參加明年的GTC。

黃仁勛:好主意,但這是個好現(xiàn)象。你希望一個行業(yè)的瞬時需求大于該行業(yè)的總供應,反之顯然不太好。如果差距太大,某個特定組件供應差得太遠,整個行業(yè)會蜂擁而上解決它。例如,人們現(xiàn)在不太談論CoWoS了。

原因是,我們花了兩年時間拼命攻克它。我們翻倍、翻倍、再翻倍,翻了好幾番,現(xiàn)在我認為我們的狀況相當不錯。臺積電現(xiàn)在明白,CoWoS的供應必須與邏輯和內(nèi)存需求的其余部分保持同步,他們正在以與擴展邏輯相同的水平來擴展CoWoS和未來的封裝技術(shù)。這太棒了,因為在很長一段時間里,CoWoS和HBM內(nèi)存都相當特殊,但它們不再是特殊技術(shù)了,人們現(xiàn)在意識到它們是主流的計算技術(shù)。

當然,我們現(xiàn)在更有能力影響更廣泛范圍的供應鏈。在AI革命之初,我現(xiàn)在說的這些話,五年前我就說了。有些人相信并投入了,例如,Sanjay和美光團隊。我仍然清楚地記得那次會議,我清楚地說明了將要發(fā)生什么,為什么會發(fā)生,以及今天的預測。他們真的加大了投入,我們在LPDDR和HBM內(nèi)存方面與他們合作,他們確實投入了。這對公司來說顯然是非常好的,有些人來得晚一些,但現(xiàn)在他們都來了。

每一個瓶頸都會得到大量關(guān)注,我們現(xiàn)在提前數(shù)年預判瓶頸。例如,過去幾年我們對Lumentum、Coherent以及硅光子生態(tài)系統(tǒng)的投資,真的重塑了供應鏈,我們在臺積電周圍建立了完整的供應鏈。我們與他們合作COUPE,發(fā)明了大量技術(shù),并將這些專利授權(quán)給供應鏈,以保持其良好和開放。

我們正在通過發(fā)明新技術(shù)、新工作流程、雙面探測等新型測試設(shè)備,以及通過投資公司、幫助它們擴大產(chǎn)能,來為供應鏈做好準備。你可以看到,我們正在努力塑造生態(tài)系統(tǒng),以便供應鏈準備好支持這樣的規(guī)模。

主持人:有些瓶頸好解決,有些就沒那么容易,像擴展CoWoS跟擴展。

黃仁勛:我選了最難的一個——水管工,一些末日論者總在描述“崗位消失”,水管工和電工的短缺引起了我的擔憂。如果我們勸阻人們成為軟件工程師,我們就會耗盡軟件工程師。同樣的預言十年前就發(fā)生過,末日論者當時告訴人們:“無論如何,別當放射科醫(yī)生。”你可能還在網(wǎng)上看到過一些視頻,說放射科將是第一個消失的職業(yè),世界不再需要更多的放射科醫(yī)生,但我們現(xiàn)在很缺放射科醫(yī)生。

四、芯片產(chǎn)能瓶頸可在兩三年內(nèi)解決,真正的限制是能源政策

主持人:回到關(guān)于某些東西可以規(guī)?;硪恍﹦t不能……你如何每年實際制造出兩倍數(shù)量的邏輯芯片?歸根結(jié)底,內(nèi)存和邏輯都受限于EUV。你如何年復一年地獲得兩倍數(shù)量的EUV機器?

黃仁勛:這些都不是不可能快速規(guī)?;模羞@些在兩三年內(nèi)都容易做到。你只需要一個需求信號,一旦你能造出一個,你就能造出十個;一旦你能造出十個,你就能造出一百萬個,這些東西復制起來并不難。

主持人:你會深入到供應鏈的哪一層?你會去找ASML說:“如果我展望三年后,英偉達要達到每年兩萬億美元的收入,我們需要多得多的EUV機器”嗎?

黃仁勛:有些我需要直接去談,有些是間接的。如果我能說服臺積電,ASML自然就會被說服。我們必須考慮關(guān)鍵的瓶頸點,但如果臺積電被說服了,幾年內(nèi)你就會有大量的EUV機器。

我的觀點是,沒有任何一個瓶頸會持續(xù)超過兩三年,沒有。與此同時,我們正在將計算效率提高10倍、20倍,從Hopper到Blackwell甚至提高30到50倍。因為CUDA非常靈活,我們不斷推出新算法,我們開發(fā)各種新技術(shù),在增加容量的同時提高效率,這些都不讓我擔心。我擔心的是我們下游的東西,那些阻礙能源供應的能源政策……沒有能源,你就無法創(chuàng)建工業(yè),沒有能源,你就無法創(chuàng)建一個全新的制造業(yè)。

我們想在美國再工業(yè)化,我們希望將芯片制造、計算機制造和封裝帶回美國,我們希望制造電動汽車和機器人等新東西。我們希望建AI工廠。沒有能源,你無法建造任何這些東西,而這些事情需要很長時間。更多的芯片產(chǎn)能,是兩三年能解決的問題,更多的CoWoS產(chǎn)能,也是兩三年能解決的問題。

五、英偉達構(gòu)建的是多樣化的加速計算平臺,而不僅是AI張量處理單元

主持人:我想問問關(guān)于你們競爭對手的情況。看看TPU,可以說世界上排名前三的模型中有兩個,Claude和Gemini,是在TPU上訓練的。這對英偉達的未來意味著什么?

黃仁勛:我們構(gòu)建的東西非常不同,英偉達構(gòu)建的是加速計算,而不僅僅是張量處理單元。加速計算用于各種領(lǐng)域:分子動力學、量子色動力學、數(shù)據(jù)處理、數(shù)據(jù)幀、結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù),它還用于流體動力學和粒子物理。此外,我們也把它用于AI。

加速計算要多樣化得多,盡管AI是當下的熱門話題,顯然非常重要且有影響力,但計算遠不止于此。英偉達重新發(fā)明了計算的方式,從通用計算轉(zhuǎn)向加速計算,我們的市場覆蓋范圍遠遠超過任何TPU或ASIC可能達到的范圍。看看我們的位置,我們是唯一一家加速各種應用程序的公司,我們擁有龐大的生態(tài)系統(tǒng)。所以,各種框架和算法都在英偉達上運行。

因為我們的計算機設(shè)計成可供他人操作,任何操作員都可以購買我們的系統(tǒng)。而對于大多數(shù)自建系統(tǒng),你必須自己當操作員,因為它們的設(shè)計靈活性不足以讓其他人操作。因為任何人都可以操作我們的系統(tǒng),我們存在于每一個云平臺中,包括Google、Amazon、Azure和OCI。

如果你想運營它以供出租,你最好擁有一個龐大的、來自各行各業(yè)的客戶生態(tài)系統(tǒng)來作為承購方。如果你想為自己運營,我們顯然有能力幫助你自己運營,就像我們?yōu)閤AI的Elon做的那樣。而且,因為我們能讓任何公司、任何行業(yè)的操作員都能使用,你可以用它來為Lilly公司建造用于科學研究和藥物發(fā)現(xiàn)的超級計算機。我們可以幫助他們運營自己的超級計算機,并將其用于我們加速的整個藥物發(fā)現(xiàn)和生物科學領(lǐng)域。

有一大堆應用是我們能夠處理而TPU無法處理的,英偉達構(gòu)建的CUDA也是一個出色的張量處理單元,但它也處理數(shù)據(jù)處理的每一個生命周期、計算、AI等等。我們的市場機會大得多,我們的覆蓋范圍也廣得多。因為我們現(xiàn)在支持世界上每一個應用,你可以在任何地方構(gòu)建英偉達系統(tǒng),并且知道會有客戶使用它。這是一個非常不同的情況。

六、英偉達實現(xiàn)代際性能飛躍的根本原因:可編程架構(gòu)和算法創(chuàng)新

主持人:你們一季度收入600億美元,但這并不來自于制藥和量子計算,而是因為AI是一項前所未有的技術(shù),并且以前所未有的速度增長。那么問題來了,對于AI本身來說,什么是最好的?我不了解細節(jié),但我與我的AI研究員朋友交流時,他們說:“你看,當我使用TPU時,它是一個巨大的脈動陣列,非常適合做矩陣乘法,而GPU非常靈活,當有很多分支或非規(guī)則內(nèi)存訪問時,它很棒?!?/strong>

但AI是什么呢?它就是一次又一次、非常可預測的矩陣乘法。你不需要為warp調(diào)度器或線程與內(nèi)存庫之間的切換犧牲任何die面積。而TPU真正優(yōu)化的,正是當前即將到來的收入增長和計算用例中的絕大部分,我想知道你對此有何回應。

黃仁勛:矩陣乘法是AI的重要組成部分,但不是唯一的部分。如果你想提出一種新的注意力機制,以不同的方式解耦,或者發(fā)明一種全新的架構(gòu)——比如混合SSM——你需要一個普遍可編程的架構(gòu)。如果你想創(chuàng)建一個融合了擴散模型和自回歸技術(shù)的模型,你需要一個普遍可編程的架構(gòu),我們運行你能想象到的一切,這就是優(yōu)勢所在。它允許更容易地發(fā)明新算法,因為它是一個可編程系統(tǒng)。

發(fā)明新算法的能力才是AI進步如此之快的真正原因。TPU和其他任何東西一樣,都受到摩爾定律的影響,我們知道摩爾定律每年大約提升25%。真正實現(xiàn)10倍或100倍飛躍的唯一方法是,每年從根本上改變算法及其計算方式。

這就是英偉達的根本優(yōu)勢,我們之所以能讓Blackwell比Hopper快50倍……我第一次宣布Blackwell能效將比Hopper高35倍時,沒人相信。后來Dylan寫了篇文章說我“藏著掖著”,實際上是50倍,僅靠摩爾定律你無法合理做到這一點。我們解決這個問題的方法是采用新模型,比如MoE,這些模型被并行化、解耦,并分布在一個計算系統(tǒng)中。如果沒有能力真正深入并用CUDA提出新的kernel,這真的很難做到。

這是可編程架構(gòu)與英偉達是一家極端協(xié)同設(shè)計公司這兩個事實的結(jié)合。我們甚至可以將部分計算卸載到fabric本身,比如NVLink,或者卸載到網(wǎng)絡(luò),比如Spectrum-X。我們可以同時影響處理器、系統(tǒng)、fabric、庫和算法的變革。沒有CUDA來做這件事,我甚至不知道從何開始。

七、CUDA的寶貴價值:生態(tài)系統(tǒng)、安裝基礎(chǔ)和普遍存在性

主持人:這引出了一個關(guān)于英偉達客戶群的有趣問題。你們60%的收入來自五大超大規(guī)模云廠商。在另一個時代,面對不同的客戶——比如說運行實驗的教授——他們需要CUDA。他們不能使用別的加速器。他們只需要用帶CUDA的PyTorch,一切就都優(yōu)化好了。

但這些超大規(guī)模云廠商有資源編寫自己的kernel。事實上,為了獲得針對他們特定架構(gòu)所需的那最后5%性能,他們必須這樣做。Anthropic和Google主要運行它們自己的加速器,或者使用TPU和Trainium。但即使是使用GPU的OpenAI,也有Triton,因為他們需要自己的kernel。深入到CUDA C++,他們沒有使用cuBLAS和NCCL,而是有自己的軟件棧,這個軟件棧也可以編譯到其他加速器上。如果你大多數(shù)客戶能夠并且確實在制作CUDA的替代品,那么CUDA在多大程度上真的是前沿AI發(fā)生在英偉達上的原因呢?

黃仁勛:CUDA是一個豐富的生態(tài)系統(tǒng),如果你想在任何計算機上優(yōu)先構(gòu)建,首先基于CUDA構(gòu)建是極其明智的。因為生態(tài)系統(tǒng)如此豐富,我們支持每一個框架。如果你想創(chuàng)建自定義kernel……例如,我們?yōu)門riton做出了巨大貢獻,所以Triton的后端包含了大量的英偉達技術(shù)。

我們樂于幫助每一個框架變得盡可能好,框架非常多。有Triton、vLLM、SGLang等等?,F(xiàn)在又涌現(xiàn)出一大批新的強化學習框架,比如verl和NeMo RL。隨著后訓練和強化學習的發(fā)展,整個領(lǐng)域正在爆炸式增長。所以,如果你想基于某個架構(gòu)構(gòu)建,基于CUDA構(gòu)建是最有意義的,因為你知道生態(tài)系統(tǒng)很強大。

如果出了問題,問題更可能出在你的代碼里,而不是下面那堆積如山的代碼中,別忘了構(gòu)建這些系統(tǒng)時你要處理多少代碼。當某些東西不工作時,是你錯了還是計算機錯了?你希望總是你自己錯了,并且能夠信任計算機。顯然,我們自己還有很多bug,但我們的系統(tǒng)經(jīng)過了如此充分的檢驗,你至少可以在這個基礎(chǔ)上構(gòu)建。這是第一點:生態(tài)系統(tǒng)的豐富性、可編程性和能力。

第二點是,如果你是一個開發(fā)者,無論你在構(gòu)建什么,你最想要的是一個安裝基礎(chǔ),你希望自己寫的軟件能在大量其他計算機上運行,你不是只為自己構(gòu)建軟件。你是為你的集群或所有人的集群構(gòu)建,因為你是一個框架構(gòu)建者,英偉達的CUDA生態(tài)系統(tǒng)最終是它最寶貴的財富。

我們現(xiàn)在有數(shù)億個GPU在使用中,每個云平臺都有。這可以追溯到A10、A100、H100、H200、L系列、P系列,各種尺寸和形狀的都有。如果你是一家機器人公司,你希望那個CUDA棧能真正在機器人內(nèi)部運行,我們幾乎無處不在。這個安裝基礎(chǔ)意味著,一旦你開發(fā)了軟件或模型,它將在任何地方都有用,這價值連城。

最后,我們存在于每一個云平臺中,這使我們真正獨一無二。如果你是一家AI公司或開發(fā)者,你不完全確定你會與哪個云服務商合作,或者你想在哪里運行它。我們無處不在,包括如果你愿意,也可以在你本地運行。生態(tài)系統(tǒng)豐富性、安裝基礎(chǔ)廣泛性以及我們所在位置的通用性,這些結(jié)合在一起,使得CUDA價值連城。

八、英偉達的每瓦性能和每美元性能均為世界最高,形成了客戶依賴的飛輪

主持人:這些優(yōu)勢對你的主要客戶來說是否真的很重要?對于很多人來說,這些優(yōu)勢可能很重要。但那種能夠自己構(gòu)建軟件棧的人,占據(jù)了你們收入的大部分。特別是,如果我們進入一個AI在那些具有嚴格驗證循環(huán)(你可以進行強化學習)的事情上變得特別擅長的世界……關(guān)于如何最有效地編寫執(zhí)行attention或MLP的kernel以進行擴展的問題,這是一個非常可驗證的反饋循環(huán)。

所有超大規(guī)模云廠商都能為自己編寫這些自定義kernel嗎?英偉達仍然有很好的性價比,所以他們可能還是更愿意用英偉達。但問題是,這是否就變成了一個簡單的問題:誰能在給定成本下提供最好的規(guī)格、最好的FLOPs和內(nèi)存帶寬。而歷史上,由于CUDA這個護城河,英偉達在AI硬件和軟件方面一直擁有、并且現(xiàn)在仍然擁有最高的利潤率,超過70%。問題在于,如果你的大多數(shù)客戶實際上能夠負擔得起構(gòu)建替代品,而不是被CUDA護城河困住,你還能維持這些利潤率嗎?

黃仁勛:我們分配給這些AI實驗室的工程師數(shù)量是驚人的,我們與他們一起工作,優(yōu)化他們的軟件棧。原因在于,沒有人比我們更了解我們的架構(gòu)。這些架構(gòu)不像CPU那樣通用,CPU有點像凱迪拉克,不錯的巡航車,從來不會開太快,每個人都能開得挺好,有巡航控制,一切都很簡單。但在很多方面,英偉達的GPU、加速器,就像F1賽車。我想象每個人都能以100英里的時速駕駛它,但要想把它推向極限,需要相當多的專業(yè)知識,我們使用大量AI來創(chuàng)建我們擁有的kernel。

我很確定在相當長的一段時間內(nèi),我們?nèi)匀粫恍枰N覀兊膶I(yè)知識常常能幫助我們的AI實驗室合作伙伴輕松地將其軟件棧性能再提升2倍。我們優(yōu)化完他們的軟件棧或某個特定kernel后,他們的模型速度提升了3倍、2倍、50%,這并不罕見。這是一個巨大的數(shù)字,尤其是考慮到他們擁有的集群規(guī)模,所有那些Hoppers和Blackwells。當你將其提升一倍時,這直接轉(zhuǎn)化為收入。

英偉達的計算棧是世界上性價比最高的,毫無疑問。沒有人能向我證明,當今世界上有任何單一平臺擁有更好的性能-總體擁有成本比,一家都沒有。事實上,現(xiàn)有的基準測試已經(jīng)證明了這一點。Dylan的InferenceMAX就擺在那里,任何人都可以使用,但沒有一個……TPU不來,Trainium也不來。

我鼓勵他們使用InferenceMAX來展示他們令人難以置信的推理成本,這真的很難,沒人愿意站出來。MLPerf也是。我歡迎Trainium來展示他們一直聲稱的40%優(yōu)勢。我很樂意聽到他們展示TPU的成本優(yōu)勢,在我看來,這毫無意義,從基本原理上講,這毫無意義。

所以我認為我們?nèi)绱顺晒Φ脑蚝芎唵危驗槲覀兊目傮w擁有成本如此之好。其次,你說我們60%的客戶是前五大云廠商,但大部分業(yè)務是外部的。例如,AWS上的大部分英偉達算力是供外部客戶使用的,而不是內(nèi)部使用。Azure上的大部分客戶,顯然都是外部客戶。OCI上的所有客戶都是外部客戶,不是內(nèi)部使用。他們青睞我們的原因是因為我們的覆蓋范圍如此之廣,我們可以為他們帶來世界上所有偉大的客戶。這些客戶都構(gòu)建在英偉達之上,而所有這些公司之所以構(gòu)建在英偉達之上,是因為我們的覆蓋范圍和通用性如此之廣。

所以我認為這個飛輪確實是:安裝基礎(chǔ)、我們架構(gòu)的可編程性、生態(tài)系統(tǒng)的豐富性,以及世界上有這么多AI公司。現(xiàn)在有數(shù)萬家了。如果你是那些AI初創(chuàng)公司之一,你會選擇哪種架構(gòu)?你會選擇最充裕的架構(gòu),我們是世界上最充裕的。你會選擇安裝基礎(chǔ)最大的,我們是最大的安裝基礎(chǔ),你會選擇擁有豐富生態(tài)系統(tǒng)的。

這就是飛輪,這就是為什么結(jié)合了以下幾點:第一,我們的每美元性能如此出色,以至于他們擁有成本最低的token。第二,我們的每瓦性能是世界上最高的。所以,如果我們的合作伙伴中有一家建造了一個吉瓦級的數(shù)據(jù)中心,那個吉瓦級數(shù)據(jù)中心最好能產(chǎn)生最多的收入和token數(shù)量,這直接轉(zhuǎn)化為收入。你希望它產(chǎn)生盡可能多的token,最大化該數(shù)據(jù)中心的收入,我們是世界上每瓦token數(shù)最高的架構(gòu)。最后,如果你的目標是出租基礎(chǔ)設(shè)施,我們擁有世界上最多的客戶,這就是飛輪運作的原因。

九、Anthropic使用TPU是特殊案例,源于英偉達當時缺乏投資能力

主持人:有意思,我想問題歸結(jié)為,實際的市場結(jié)構(gòu)是怎樣的?因為即使有其他公司……可能存在一個世界,有數(shù)萬家AI公司大致平等地分享算力。但即使通過這五大超大規(guī)模云廠商,真正在亞馬遜上使用算力的是Anthropic、OpenAI以及那些大型基礎(chǔ)模型實驗室,他們自己能夠負擔并且有能力讓不同的加速器工作起來。

黃仁勛:不,我認為你的前提是錯的,我務必要糾正,因為這對AI來說太重要了。這對科學的未來太重要了。對這個行業(yè)的未來太重要了。

主持人:讓我把問題說完,然后我們可以一起討論。如果你說的關(guān)于價格、性能、每瓦性能等等這些都是真的,那你認為,為什么像Anthropic這樣的公司,就在幾天前宣布與博通和谷歌達成一項multi-gigawatt(數(shù)吉瓦級)的TPU交易,并且他們的大部分算力將來自TPU?

顯然對谷歌來說,TPU占其大部分算力。所以,如果我看這些大型AI公司,似乎他們的很多算力……曾經(jīng)一度全是英偉達,現(xiàn)在不是了。所以我很好奇,如果這些在紙面上都是真的,為什么他們轉(zhuǎn)而使用其他加速器?

黃仁勛:Anthropic是一個特例,不是趨勢。沒有Anthropic,TPU的增長從何而來?百分之百是Anthropic。沒有Anthropic,Trainium的增長從何而來?百分之百是Anthropic,我認為這是眾所周知、廣為人知的。并不是說ASIC的機會很多,只有一個Anthropic。

主持人:但OpenAI與AMD的交易……他們正在構(gòu)建自己的Titan加速器。

黃仁勛:是的,但我認為我們都承認,他們絕大部分算力還是來自英偉達。我們?nèi)詫⒁黄鹱龊芏喙ぷ?,我不介意別人使用其他東西并嘗試。如果他們不嘗試這些東西,怎么會知道我們的有多好呢?有時候你需要被提醒一下,我們必須不斷贏得我們目前的地位。

總是有夸大的說法,看看有多少ASIC項目被取消了。僅僅因為你打算建造一個ASIC……你仍然需要建造比英偉達更好的東西。建造比英偉達更好的東西并不容易,事實上,這不合理。英偉達肯定在某些方面有缺失,嚴重缺失。因為憑借我們的規(guī)模、我們的速度,我們是世界上唯一一家每年都在推出新產(chǎn)品的公司。每年都有巨大飛躍。

主持人:我想他們的邏輯是:“它不需要更好。它只需要不比70%差太多,”因為他們付給你70%的利潤率。

黃仁勛:不,別忘了,即使是ASIC,利潤率也相當高。比方說英偉達的利潤率是70%,但ASIC的利潤率是65%,你真正能省下多少?

主持人:你是說來自博通之類的公司?

黃仁勛:是的,當然。你得付錢給某人。據(jù)我所知,ASIC的利潤率非常高,他們也相信這一點,他們?yōu)樽约毫钊穗y以置信的ASIC利潤率感到相當自豪。

所以,你問為什么。很久以前,我們沒有能力去做(投資)。當時,我沒有深刻內(nèi)化建立一個像OpenAI和Anthropic這樣的基礎(chǔ)AI實驗室有多么困難,以及他們需要來自供應商本身的大量投資。我們當時沒有能力向Anthropic進行數(shù)十億美元的投資,以便他們使用我們的算力。但谷歌和AWS有,他們一開始就投入了巨額投資,作為回報,Anthropic使用他們的算力,我們當時沒有能力做到這一點。

我想說的是,我的錯誤在于我沒有深刻內(nèi)化他們真的別無選擇,風險投資家絕不會向一個AI實驗室投入50到100億美元,期望它能成為Anthropic,這是我的失誤。但即使我當時明白了,我也不認為我們當時有能力做到,但我不會再犯同樣的錯誤了。

我很高興投資OpenAI,也很高興幫助他們擴展,我相信這樣做是必要的。然后,當Anthropic來找我們時,我也很高興成為投資者,很高興幫助他們擴展,我們當時就是做不到。如果我能讓時光倒流——如果英偉達當時能像現(xiàn)在這么強大——我會非常樂意這樣做。

十、英偉達遵循“做必要之事、盡可能少做”的原則,通過投資支持云生態(tài)而非自營

主持人:多年來,英偉達一直是AI領(lǐng)域賺錢的公司,賺得盆滿缽滿。現(xiàn)在你在進行投資,據(jù)報道,你已經(jīng)向OpenAI投資了高達300億美元,向Anthropic投資了100億美元,現(xiàn)在他們的估值還在漲,我相信會繼續(xù)漲。

所以,如果這么多年來,你一直在給他們提供算力,你看到了它的發(fā)展方向,而一兩年前——或者在某些情況下甚至一年前——他們的價值只有現(xiàn)在的十分之一,你手頭又有這么多現(xiàn)金……那么,存在著一個世界,要么英偉達自己成為一個基礎(chǔ)模型實驗室,進行大規(guī)模投資來實現(xiàn)這一點,要么以現(xiàn)在的估值更早地做成你現(xiàn)在做的這些交易,而且你當時有現(xiàn)金做這些。所以我很好奇,為什么不早點做呢?

黃仁勛:我們一有能力就做了,如果我能,我會更早做。在Anthropic需要我們做的時候,我們就是沒能力做,當時我們還沒有這種意識。

主持人:怎么會?是現(xiàn)金問題嗎?

黃仁勛:是的,投資規(guī)模的問題。當時我們從未在公司外部進行過投資,更沒有那么大額的,我們沒意識到我們需要這樣做。我一直以為他們可以去找風險投資家融資,看在上帝的份上,所有公司不都這樣嗎?但他們試圖做的事情,通過風險投資是做不到的。OpenAI想做的事情,通過風險投資是做不到的,我現(xiàn)在認識到這點了,我當時不知道。

但這就是他們的天才之處,這就是他們聰明的地方,他們當時就意識到必須做那樣的事情,我很高興他們做了。盡管我們導致Anthropic不得不去找別人,我仍然很高興事情發(fā)生了,Anthropic的存在對世界是件好事。我為此感到高興。

主持人:我想你仍然在賺很多錢,而且每個季度賺的錢都多得多。

黃仁勛:有點遺憾還是可以的。

主持人:所以問題仍然存在,好吧,你一直在賺這么多錢,英偉達應該用這些錢做什么呢?有一個答案是,圍繞如何將這些實驗室的資本支出轉(zhuǎn)換為運營支出以便他們能租用算力,已經(jīng)出現(xiàn)了一個完整的中介生態(tài)系統(tǒng)。因為芯片非常昂貴,但AI模型在不斷進步,所以它們在生命周期內(nèi)能創(chuàng)造很多價值。它們產(chǎn)生的token價值在增加,但前期設(shè)置成本很高,英偉達有錢做資本支出。事實上,據(jù)報道,你們正在支持CoreWeave,金額高達63億美元,并且已經(jīng)投資了20億美元。

為什么英偉達不自己成為一家云服務商?為什么不自己成為一家超大規(guī)模云廠商,把這些算力租出去?你們有這么多現(xiàn)金來做這件事。

黃仁勛:這是我們公司的理念,我認為這是明智的。我們應該做必要的事情,同時盡可能少做。這意味著,在我們構(gòu)建計算平臺的工作中,如果我們不做,我真心相信就沒人會做了。如果我們不承擔我們所承擔的風險——如果我們不像那樣構(gòu)建NVLink,如果我們不構(gòu)建整個軟件棧,如果我們不像那樣創(chuàng)建生態(tài)系統(tǒng),如果我們不致力于CUDA20年并且在大部分時間里虧損——如果我們不做,別人也不會做。

如果我們不創(chuàng)建所有的CUDA-X庫,讓它們都針對特定領(lǐng)域……十五年前,我們進軍特定領(lǐng)域庫,因為我們意識到,如果我們不創(chuàng)建這些特定領(lǐng)域庫,無論是用于光線追蹤、圖像生成還是AI的早期工作,這些模型,如果我們不創(chuàng)建它們,用于數(shù)據(jù)處理、結(jié)構(gòu)化數(shù)據(jù)處理或向量數(shù)據(jù)處理,如果我們不創(chuàng)建它們,沒人會做。我對此完全確定。我們創(chuàng)建了一個名為cuLitho的計算光刻庫。如果我們不創(chuàng)建,沒人會做。所以,如果我們不做我們所做的事情,加速計算就不會像現(xiàn)在這樣進步。

所以我們應該做那些事,我們應該將我們公司、我們所有的力量、全心全意地投入到那些事情上。然而,世界上有很多云服務商。如果我不做,別人會做。所以,遵循這個“做必要的事,但盡可能少做”——盡可能少做——這個理念今天仍存在于我們公司。我所做的每一件事,都帶著這個視角。

就云服務而言,如果我們不支持CoreWeave的存在,這些neocloud、這些AI云就不會存在。如果我們不幫助CoreWeave存在,它們就不會存在。如果我們不支持Nscale,他們就不會有今天的成就,如果我們不支持Nebius,他們也不會有今天的成就,現(xiàn)在他們做得非常好。

這是一個商業(yè)模式嗎?我們應該做必要的事,盡可能少做。所以我們投資于我們的生態(tài)系統(tǒng),因為我希望我們的生態(tài)系統(tǒng)蓬勃發(fā)展。我希望這種架構(gòu)和AI能夠連接盡可能多的行業(yè)、盡可能多的國家,并使得地球能夠建立在AI之上,建立在美國技術(shù)棧之上。這個愿景正是我們正在追求的。

現(xiàn)在,你提到的其中一件事……有很多偉大的、了不起的基礎(chǔ)模型公司,我們試圖投資于所有公司。這是我們要做的另一件事。我們不挑選贏家。我們需要支持每個人。這是我們樂于做的事情的一部分。這對我們的業(yè)務至關(guān)重要。但我們也刻意不去挑選贏家。所以當我投資其中一家時,我會投資所有。

主持人:你們?yōu)槭裁纯桃獠惶暨x贏家?

黃仁勛:第一點,因為這不是我們的工作。第二點,英偉達剛起步時,有60家3D圖形公司,我們是唯一幸存下來的。如果你從這60家圖形公司里猜哪家能成功,英偉達最有可能被排在“不會成功”的名單首位。

這遠在你之前,但英偉達的圖形架構(gòu)是完全錯誤的。不是有點錯。我們創(chuàng)建了一個完全錯誤的架構(gòu),開發(fā)者不可能支持它。它永遠不會成功。我們基于良好的第一原理推理,但最終得到了錯誤的解決方案。所有人都會把我們排除在外。而我們今天在這里。

所以我有足夠的謙遜認識到這一點:不要挑選贏家。要么讓它們自己照顧自己,要么照顧所有。

十一、英偉達的GPU分配遵循采購訂單順序,從不價高者得

主持人:有一點我不明白,你說:“你看,我們并不是僅僅因為它們是neocloud就優(yōu)先考慮它們,想扶持它們?!钡阋擦信e了一堆neocloud,并說沒有英偉達它們就不會存在。這兩者如何兼容?

黃仁勛:首先,他們需要有存在的意愿,并且來尋求我們的幫助。當他們想存在,并且有商業(yè)計劃、專業(yè)知識和熱情……他們顯然必須自己有一些能力。但是,如果歸根結(jié)底,他們需要一些投資來啟動,我們會支持他們。

你的問題是:“我們想不想做融資業(yè)務?”答案是不想。有人在做融資業(yè)務,我們寧愿與所有從事融資業(yè)務的人合作,而不是自己成為融資方。我們的目標是專注于我們所做的,保持我們的商業(yè)模式盡可能簡單,并支持我們的生態(tài)系統(tǒng)。

當像OpenAI這樣的公司需要300億美元規(guī)模的投資,因為它還在IPO之前,而我們深信他們,我深信他們會成為……嗯,他們已經(jīng)是一家非凡的公司了,他們會成為一家令人難以置信的公司,世界需要他們存在,世界希望他們存在,我希望他們存在,他們順風順水,讓我們支持他們,讓他們發(fā)展。我們會做這些投資,因為他們需要我們這樣做。但我們不是想做得盡可能多,我們是想做得盡可能少。

主持人:這可能是一個顯而易見的問題,但我們已經(jīng)生活在GPU短缺的情況下很多年了,而且因為模型越來越好,這種情況還在加劇。

黃仁勛:我們的GPU是短缺的。

主持人:是的,眾所周知,英偉達分配稀缺的配額,不僅僅是基于最高出價者,而是基于:“嘿,我們希望確保這些neocloud存在。我們給CoreWeave一些,給Crusoe一些,給Lambda一些?!边@對英偉達有什么好處?首先,你同意這種“碎片化市場”的描述嗎?

黃仁勛:不,你的前提是錯誤的。我們對這些事情足夠用心,我們對這些事情非常用心。首先,如果你不下采購訂單,再多的口頭溝通也沒用。在我們拿到采購訂單之前,我們能做什么?所以第一件事,我們非常努力地與每個人合作,完成預測,因為這些系統(tǒng)需要很長時間來構(gòu)建,數(shù)據(jù)中心也需要很長時間來構(gòu)建。我們通過預測等方式使供需對齊。明白嗎?這是第一要務。

第二,我們試圖與盡可能多的人進行預測,但最終,你還是得下訂單。也許,無論出于什么原因,你沒有下訂單。我能怎么辦?在某個節(jié)點,先到先得。但除此之外,如果你還沒準備好,因為你的數(shù)據(jù)中心還沒準備好,或者某些組件還沒準備好讓你能夠建立數(shù)據(jù)中心,我們可能會決定先服務其他客戶,這只是為了最大化我們自身工廠的吞吐量。我們可能會在那里做一些調(diào)整。

除此之外,優(yōu)先級是先到先得,你必須下采購訂單。如果你不下……當然,關(guān)于這一點有一些故事。例如,這一切都始于一篇關(guān)于Larry和Elon與我共進晚餐時懇求GPU的文章,那從未發(fā)生過,我們確實共進了晚餐,那是一頓美好的晚餐,他們從未懇求GPU,他們只需要下訂單就行,一旦他們下了訂單,我們會盡力把產(chǎn)能分配給他們,我們并不復雜。

主持人:好的,所以聽起來有一個隊列,然后根據(jù)你的數(shù)據(jù)中心是否準備好以及你何時下采購訂單,你在特定時間拿到貨。但這聽起來仍然不是最高出價者就能拿到,有什么理由不這樣做?

黃仁勛:我們從不那樣做。

主持人:為什么不直接給出價最高的人?

黃仁勛:因為那是不好的商業(yè)實踐,你設(shè)定你的價格,然后人們決定買或不買。我知道芯片行業(yè)的其他公司會在需求高時改變價格,但我們就是不這么做,這從來不是我們的做法。你可以信賴我們,我寧愿成為一個可靠的人,成為行業(yè)的基石,你不需要猜疑。如果我給你報了價,那就是報價,如果需求飆升,那就隨它去。

主持人:另一方面,這就是你們與臺積電保持富有成效關(guān)系的原因,對吧?

黃仁勛:是的,英偉達和他們做生意,我想快30年了。英偉達和臺積電沒有法律合同,總是有一些粗略的公平。有時候我對,有時候我錯,有時候我得到更好的交易,有時候我得到更差的,但總的來說,這種關(guān)系是不可思議的,我可以完全信任他們。

你可以信賴英偉達的一件事是,今年的Vera Rubin會令人難以置信,明年的Vera Rubin Ultra會來,后年,F(xiàn)eynman會來,再后一年,我還沒介紹名字,每一年你都可以信賴我們。你得去世界上找另一個ASIC團隊——隨便選一個你的ASIC團隊——看看你能不能對他們說:“我可以把我的全部家當、我的整個生意押在你們每年都會為我服務上,你們的token成本每年會下降一個數(shù)量級,我可以像信賴時鐘一樣信賴你?!?/p>

我剛才對臺積電說了類似的話,對于歷史上任何其他代工廠,你都不可能說出這樣的話。但今天你可以對英偉達這么說,你可以每年都信賴我們。如果你想購買價值10億美元的AI工廠算力,沒問題。如果你想購買1億美元,沒問題。你想購買1000萬美元,或者只是一個機架,沒問題。或者只是一塊顯卡,沒問題。如果你想下價值1000億美元的AI工廠訂單,沒問題。今天,我們是世界上唯一一家你能說出這樣的話的公司。

我對臺積電也能這么說,我想買一個,或者買十億個,都沒問題。我們只需要經(jīng)過規(guī)劃流程,以及所有成熟公司會做的事情。所以,我認為英偉達成為世界AI工業(yè)基石的能力,這是我們花了幾十年才達到的位置。巨大的承諾,巨大的奉獻,我們公司的穩(wěn)定性和一致性非常重要。

十二、向中國銷售芯片有助于保持美國技術(shù)棧的全球主導地位,出口管制適得其反

主持人:好的,我想問問關(guān)于中國的問題。實際上,關(guān)于向中國出售芯片是好是壞,我不知道自己怎么想,但我喜歡對嘉賓唱反調(diào)。所以當Dario來的時候(他支持出口管制),我問他,為什么不能美國和中國都在數(shù)據(jù)中心里擁有一批天才呢?但因為你站在對立面,我會用相反的方式來問你。

一種思考方式是,Anthropic實際上幾天前宣布了Mythos Preview。這個模型Mythos,他們甚至不會公開發(fā)布,因為他們說它具有如此強的網(wǎng)絡(luò)攻擊能力,以至于世界還沒有準備好,直到我們確保這些零日漏洞被修補好。但他們說它發(fā)現(xiàn)了所有主流操作系統(tǒng)、所有瀏覽器中的數(shù)千個高危漏洞。它在OpenBSD中發(fā)現(xiàn)了一個漏洞,這個操作系統(tǒng)是專門為沒有零日漏洞而設(shè)計的。它發(fā)現(xiàn)了一個存在了27年的漏洞。

所以,如果中國公司、中國實驗室和中國政府能夠獲得AI芯片,來訓練像Claude Mythos這樣具有網(wǎng)絡(luò)攻擊能力的模型,并用更多的算力運行數(shù)百萬個它的實例,那么問題來了,這是否對美國公司、美國的國家安全構(gòu)成威脅?

黃仁勛:首先,Mythos是在相當普通的算力水平上訓練的,而且算力規(guī)模也相當普通,是由一家非凡的公司訓練的。訓練它所使用的算力規(guī)模和類型在中國是大量存在的,所以你首先得認識到,中國是有芯片的。

他們制造了全球60%的主流芯片,也許更多,這對他們來說是一個非常大的產(chǎn)業(yè),他們擁有一些世界上最偉大的計算機科學家。如你所知,所有這些AI實驗室中的大多數(shù)AI研究人員都是中國人,他們擁有全球50%的AI研究人員。那么問題是,考慮到他們已經(jīng)擁有的所有資產(chǎn)——他們擁有充足的能源,他們有很多芯片,他們擁有大多數(shù)AI研究人員——如果你擔心他們,創(chuàng)造一個安全世界的最佳方式是什么?

將他們視為受害者,把他們變成敵人,很可能不是最佳答案,他們是競爭對手,我們希望美國贏。但我認為,進行對話和研究方面的對話可能是最安全的做法。由于我們目前視中國為對手的態(tài)度,這個領(lǐng)域是明顯缺失的。我們的AI研究人員和他們的AI研究人員進行交流至關(guān)重要,我們必須嘗試就“不將AI用于什么”達成一致。

關(guān)于在軟件中尋找漏洞,當然,這正是AI應該做的。它會在很多軟件中找到漏洞嗎?當然。有非常非常多的漏洞,AI軟件本身也有很多漏洞。這正是AI應該做的,我很高興AI已經(jīng)達到了這樣一個水平,可以幫助我們提高如此多的生產(chǎn)力。

有一點被低估了,那就是圍繞網(wǎng)絡(luò)安全、AI網(wǎng)絡(luò)安全、AI安全、AI隱私和AI安全的生態(tài)系統(tǒng)的豐富性。有一整個AI初創(chuàng)公司的生態(tài)系統(tǒng)正在努力為我們創(chuàng)造這個未來,你擁有一個令人難以置信的AI Agent,周圍有成千上萬的AI Agent在保護它、確保它的安全,這個未來肯定會到來。

讓一個AI Agent到處亂跑而沒人看管的想法,有點瘋狂。我們很清楚,這個生態(tài)系統(tǒng)需要蓬勃發(fā)展。事實證明,這個生態(tài)系統(tǒng)需要開源,這個生態(tài)系統(tǒng)需要開放模型,他們需要開放的軟件棧,以便所有這些AI研究人員和所有這些偉大的計算機科學家能夠構(gòu)建同樣強大的AI系統(tǒng),并確保AI的安全。所以,我們需要確保做的一件事是保持開源生態(tài)系統(tǒng)的活力。這一點不容忽視。其中很大一部分來自中國,我們不應該扼殺它。

關(guān)于中國,當然我們希望美國擁有盡可能多的算力。我們受限于能源,但我們有很多人在努力解決這個問題,我們絕不能讓能源成為我們國家的瓶頸。但我們同樣希望的是,確保世界上所有的AI開發(fā)者都在美國技術(shù)棧上進行開發(fā),并將AI的進步(特別是開源的進步)貢獻給美國生態(tài)系統(tǒng)。如果創(chuàng)造兩個生態(tài)系統(tǒng):一個是只運行在外國技術(shù)棧上的開源生態(tài)系統(tǒng),另一個是運行在美國技術(shù)棧上的封閉生態(tài)系統(tǒng),那將是非常愚蠢的,我認為這對美國來說將是一個可怕的結(jié)果。

十三、中國擁有充足的能源、芯片產(chǎn)能和AI研究人員,出口管制反而加速其自主生態(tài)

主持人:回到黑客攻擊所需的FLOPs差異上的擔憂是:是的,他們有算力,但有一些估計認為,由于他們停留在7nm——他們沒有EUV因為芯片制造出口管制——他們實際能生產(chǎn)的FLOPs數(shù)量,只有美國的十分之一。

那么,他們最終能否訓練出像Mythos這樣的模型?能,但問題是,因為我們有更多的FLOPs,美國的實驗室能夠首先達到這些能力水平。因為Anthropic先達到了,他們說,“好吧,我們會把它保留一個月,同時我們會讓所有這些美國公司使用它。他們會修補所有漏洞,然后我們再發(fā)布?!?/strong>

此外,即使他們訓練出這樣的模型,大規(guī)模部署它的能力……如果你有一個網(wǎng)絡(luò)黑客,擁有100萬個實例比擁有1000個實例危險得多。所以推理算力真的很重要。事實上,他們有這么多如此優(yōu)秀的AI研究人員,這才是可怕的地方,因為是什么讓這些工程師研究人員更有效率?是算力。

如果你和美國任何一個AI實驗室交談,他們會說限制他們的是算力。有DeepSeek創(chuàng)始人或通義千問領(lǐng)導層的引述,他們說他們受限制的是算力。那么問題是,讓美國公司因為擁有更多算力而先達到Mythos級別的能力,讓我們的社會為此做好準備,在中國達到之前(因為他們算力較少),這樣做不是更好嗎?

黃仁勛:我們應該總是第一,我們應該總是擁有更多。但為了讓你描述的結(jié)果成立,你必須把它推向極端,他們必須沒有算力,如果他們有一些算力,問題是多少是需要的?

他們在中國的算力總量是巨大的,你說的是世界第二大計算市場。如果他們想?yún)R聚他們的算力,他們有大量的算力可以匯聚。

主持人:但這是真的嗎?有人做估算,說“中芯國際在工藝節(jié)點上實際上是落后的。”

黃仁勛:他們擁有的能量是驚人的,對不對?AI是一個并行計算問題,不是嗎?為什么他們不能因為能源幾乎是免費的,就把4倍、10倍的芯片放在一起?他們有那么多能源,他們有完全空置、已通電的數(shù)據(jù)中心。你知道他們有鬼城,他們也有鬼數(shù)據(jù)中心,他們有如此多的基礎(chǔ)設(shè)施容量,如果他們想,他們只需把更多的芯片組合起來,即使是7nm的。

他們制造芯片的能力是世界上最大的之一,半導體行業(yè)知道他們在壟斷主流芯片。他們產(chǎn)能過剩,產(chǎn)能太多,所以,認為中國將無法擁有AI芯片的想法完全是胡說八道。

當然,如果你問我,如果全世界根本沒有算力,美國會不會更領(lǐng)先?但這不是一個結(jié)果,這不是一個真實的場景,他們已經(jīng)擁有大量的算力。你所擔心的那個門檻,他們已經(jīng)達到了,甚至超過了。

所以我認為你誤解了,AI是一個五層蛋糕,最底層是能源。當你擁有充足的能源時,它可以彌補芯片的不足。如果你擁有充足的芯片,它可以彌補能源的不足。例如,美國能源稀缺,這就是為什么英偉達必須不斷推進我們的架構(gòu),進行這種極端協(xié)同設(shè)計,以便用我們運出的少量芯片——因為能源非常有限——我們的每瓦吞吐量高得離譜。

但是,如果你的瓦特數(shù)量完全充足,是免費的,你還會在乎每瓦性能嗎?你會有很多。你可以用舊芯片來做。所以7nm芯片本質(zhì)上就是Hopper,Hopper的能力……我得告訴你,今天的模型大部分是在Hopper、Hopper這一代上訓練的,所以7nm芯片完全夠用,能源的充足是他們的優(yōu)勢。

主持人:但問題在于他們是否能實際制造出足夠的芯片。

黃仁勛:但他們能,證據(jù)是什么?華為剛剛經(jīng)歷了公司歷史上最好的一年。

主持人:他們運出了多少芯片?

黃仁勛:很多,數(shù)百萬,數(shù)百萬比Anthropic擁有的多得多。

主持人:問題在于中芯國際能生產(chǎn)多少邏輯芯片,以及能生產(chǎn)多少內(nèi)存。

黃仁勛:我告訴你實際情況。他們有充足的邏輯芯片,也有充足的HBM2內(nèi)存。

主持人:對。但如你所知,訓練和推理這些模型的瓶頸通常是帶寬,所以如果你用的是HBM2……我不記得具體數(shù)字,但與你最新的產(chǎn)品相比,內(nèi)存帶寬可能存在幾乎一個數(shù)量級的差異,這影響巨大。

黃仁勛:華為是一家網(wǎng)絡(luò)公司。

主持人:但這并不能改變你需要EUV來制造最先進HBM的事實。

黃仁勛:不對,完全不對。他們可以把它們組合在一起,就像我們用NVL72做的那樣,他們已經(jīng)展示了硅光子技術(shù),可以將所有這些算力連接成一個巨大的超級計算機,你的前提是錯誤的。

事實是,他們的AI發(fā)展進展順利,世界上最優(yōu)秀的AI研究人員,因為算力有限,他們也提出了極其聰明的算法。記住,我剛才說摩爾定律每年大約進步25%。然而,通過偉大的計算機科學,我們?nèi)匀豢梢詫⑺惴ㄐ阅芴岣?0倍。我的意思是,偉大的計算機科學才是杠桿所在。

毫無疑問,MoE是一個偉大的發(fā)明,毫無疑問,所有令人難以置信的注意力機制都減少了計算量。我們必須承認,AI的大部分進步來自算法進步,而不僅僅是原始硬件。現(xiàn)在,如果大多數(shù)進步來自算法、計算機科學和編程,那么告訴我,他們那支AI研究人員大軍難道不是他們的根本優(yōu)勢嗎?我們看到了,DeepSeek不是一個無足輕重的進步,DeepSeek首先在華為上發(fā)布的那一天,對我們國家來說是一個可怕的結(jié)果。

主持人:為什么?因為現(xiàn)在你可以有一個像DeepSeek這樣的模型,如果它是開源的,可以在任何加速器上運行,為什么未來這種情況會改變?

黃仁勛:假設(shè)它不會改變,假設(shè)它是為華為優(yōu)化的,是為他們的架構(gòu)優(yōu)化的,那將使我們的架構(gòu)處于劣勢。你描述了一個我認為是好消息的情況。一家公司開發(fā)了軟件,開發(fā)了一個AI模型,并且它在美國技術(shù)棧上運行得最好,我認為那是好消息,你把它設(shè)定為壞消息的前提。我來告訴你壞消息:如果世界各地的AI模型都是在非美國硬件上開發(fā)并運行得最好,那對我們來說才是壞消息。

主持人:我想我只是沒看到證據(jù)表明存在巨大的差異會阻止你切換加速器,美國的實驗室正在所有云平臺上、所有不同的加速器上運行他們的模型。

黃仁勛:我就是證據(jù),你拿一個為英偉達優(yōu)化的模型,然后嘗試在別的上面運行。

主持人:但美國的實驗室確實這么做。

黃仁勛:但它們運行得并不更好,英偉達的成功就是完美的證據(jù),AI模型是在我們的技術(shù)棧上創(chuàng)建的,在我們的技術(shù)棧上運行得最好,這難道不合邏輯嗎?

主持人:Anthropic的模型在GPU上運行,也在Trainium上運行,在TPU上運行。

黃仁勛:需要做很多工作才能改變,但看看全球南方,看看中東,開箱即用,如果所有的AI模型都在別人的技術(shù)棧上運行得最好,你此刻必須是在主張一個荒謬的說法,說這對美國是好事。

主持人:假設(shè)中國公司先達到下一個Mythos,他們首先在美國軟件中發(fā)現(xiàn)所有安全漏洞,但他們可以在英偉達硬件上做到這一點,并將其輸出到全球南方,他們在英偉達硬件上做,那怎么是好事?

黃仁勛:那不是好事,所以我們不要讓這種事發(fā)生。

主持人:你為什么認為它是完全可以替代的,如果你不向他們運送算力,它就會被華為完全替代?他們是落后的,對吧?他們的芯片比你的差。

黃仁勛:現(xiàn)在就有證據(jù),他們的芯片產(chǎn)業(yè)巨大。

主持人:你可以直接比較H200和華為910C之間的FLOPs、帶寬或內(nèi)存,大概是二分之一到三分之一。

黃仁勛:他們用更多數(shù)量,他們用兩倍的數(shù)量。

主持人:你的論點似乎是,他們有這么多隨時可用的能源,對吧?他們需要芯片來填充它。

黃仁勛:而且他們擅長制造。

主持人:我相信最終他們將能夠超越所有人進行制造,但在這關(guān)鍵的幾年里。

黃仁勛:你說的關(guān)鍵幾年是什么?

主持人:未來幾年,我們將擁有能夠進行所有網(wǎng)絡(luò)攻擊的模型。

黃仁勛:既然如此,如果未來幾年是關(guān)鍵,那么我們必須確保在這關(guān)鍵的幾年里,世界上所有的AI模型都建立在美國技術(shù)棧上。

主持人:如果它們建立在美國技術(shù)棧上,那怎么能阻止它們,如果它們擁有更先進的能力,發(fā)動相當于Mythos的網(wǎng)絡(luò)攻擊呢?

黃仁勛:無論哪種方式都無法保證。

主持人:但如果你早點擁有它,我們可以做好準備。

黃仁勛:為什么讓AI行業(yè)的一層失去整個市場,以便另一層受益?有五層,每一層都必須成功。最需要成功的一層實際上是AI應用層,你為什么如此執(zhí)著于那個AI模型?那一家公司?出于什么原因?

主持人:因為這些模型使得這些極其強大的攻擊能力成為可能,并且你需要算力來運行它們。

黃仁勛:是能源、芯片和AI研究人員的生態(tài)系統(tǒng)使之成為可能。

主持人:好吧,退一步說,中國必須能夠建立足夠的7nm產(chǎn)能,記住,他們?nèi)匀煌A粼?nm,而你將推進到3nm,然后是2nm或1.6nm,通過Feynman。所以當你在1.6nm時,他們?nèi)詫⒃?nm,他們必須生產(chǎn)足夠的芯片來彌補差距。他們有如此多的能源,你給他們的芯片越多,他們擁有的算力就越多。所以問題歸結(jié)為,最終他們獲得了更多的算力,算力是訓練和推理的輸入——

黃仁勛:我只是覺得你在說絕對的話,我認為美國應該領(lǐng)先,美國的算力是世界其他地區(qū)總和的100倍。

英偉達制造最先進的技術(shù),我們確保美國實驗室最先聽到消息,并有最先購買的機會,如果他們錢不夠,我們甚至投資他們。美國應該領(lǐng)先,我們想做一切可能的事來確保美國領(lǐng)先,我們正在竭盡所能做到這一點。

主持人:但如果他們受限于算力,向中國運送芯片怎么能讓美國保持領(lǐng)先?

黃仁勛:不,我們有給美國的Vera Rubin,現(xiàn)在,我算不算在美國?你認為我是美國的一部分嗎?

主持人:是的。

黃仁勛:你認為英偉達是一家美國公司嗎?第一,為什么我們不想出一個更平衡的法規(guī),讓英偉達能夠在全球獲勝,而不是放棄全球市場?你為什么想讓美國放棄全球市場?

芯片產(chǎn)業(yè)是美國生態(tài)系統(tǒng)的一部分,它是美國技術(shù)領(lǐng)先地位的一部分,它是AI生態(tài)系統(tǒng)的一部分,它是AI領(lǐng)先地位的一部分,為什么你的政策、你的理念會導致美國放棄世界市場的巨大份額?

主持人:我想這里的主張是……Dario有一句引言,他說這就像波音吹噓我們向朝鮮出售核彈,但導彈外殼是波音制造的。這在某種程度上是在支持美國的技術(shù)棧,本質(zhì)上,你在給他們這種能力。

黃仁勛:將AI與你剛才提到的任何東西相比,都是瘋狂的。

主持人:但AI類似于濃縮鈾,對吧?它可以有正面用途,也可以有負面用途,我們?nèi)匀徊幌氚褲饪s鈾送到其他國家。

黃仁勛:誰在發(fā)送濃縮鈾?

主持人:這個類比是,濃縮鈾就像算力。

黃仁勛:這是一個糟糕的類比。這是一個不合邏輯的類比。

主持人:但如果這些算力可以運行一個能夠?qū)γ绹熊浖M行零日漏洞利用的模型,那怎么不是一種武器?

黃仁勛:首先,解決這個問題的方法是,與研究人員對話,與中國對話,與所有國家對話,確保人們不以那種方式使用技術(shù)。

第二點,我們還需要確保美國領(lǐng)先,Vera Rubin、Blackwell在美國大量供應,堆積如山。顯然,我們的結(jié)果會證明這一點。大量供應,巨量供應。我們擁有的算力很棒。我們這里有很棒的AI研究人員,這很好,我們應該保持領(lǐng)先。

然而,我們也必須認識到,AI不僅僅是一個模型,AI是一個五層蛋糕,AI行業(yè)的每一層都很重要,我們希望美國在每一層都獲勝,包括芯片層。放棄整個市場不會讓美國長期在技術(shù)競賽中贏得芯片層、贏得計算棧,這是一個事實。

主持人:我想問題的關(guān)鍵在于,現(xiàn)在向他們出售芯片如何幫助我們在長期獲勝?特斯拉長期以來向中國銷售極好的電動汽車。iPhone在中國銷售,極好。它們并沒有導致他們被鎖定,中國仍然會制造他們自己的電動車版本,并且他們正在主導市場,他們的智能手機正在主導市場。

黃仁勛:我們今天開始對話時,你承認英偉達的地位非常不同。你用了“護城河”這樣的詞,對我們公司來說,最重要的事情是我們生態(tài)系統(tǒng)的豐富性,這關(guān)乎開發(fā)者,50%的AI開發(fā)者在中國,美國不應該放棄這一點。

主持人:但我們在美國有很多英偉達開發(fā)者,這并不妨礙美國實驗室未來也能夠使用其他加速器。事實上,他們現(xiàn)在也在使用其他加速器,這沒問題,很好。我不明白為什么在中國情況會不同,如果你向他們出售英偉達芯片,就像谷歌可以使用TPU和英偉達一樣。

黃仁勛:我們必須不斷創(chuàng)新,而且你可能知道,我們的份額在增長,而不是在減少。即使我們在中國競爭,我們也會失去那個市場的這個前提……你不是在和一個醒來就是輸家的人說話,這種失敗者的態(tài)度,失敗者的前提,對我來說毫無意義。

我們不是汽車,我今天可以買這個品牌的車,明天用另一個品牌的車,很容易。計算不是這樣的,x86交易的存在是有原因的,ARM如此粘性是有原因的。這些生態(tài)系統(tǒng)難以替代,需要花費大量的時間和精力,大多數(shù)人不想這樣做。所以我們的工作是繼續(xù)培育這個生態(tài)系統(tǒng),不斷推進技術(shù),以便我們能夠在市場競爭。

基于你描述的前提放棄一個市場,我根本無法認同,這毫無意義。因為我不認為美國是輸家,我們的行業(yè)不是輸家,那種失敗的主張,那種失敗者的心態(tài),對我來說毫無意義。

主持人:我的想法在于不是存在某個算力的關(guān)鍵閾值,而是任何邊際算力都是有幫助的,所以如果你有更多算力,你就可以訓練更好的模型。

黃仁勛:而我只是想讓你承認,對美國技術(shù)產(chǎn)業(yè)來說,任何邊際銷售都是有益的。

主持人:如果運行在這些芯片上的AI模型具備網(wǎng)絡(luò)攻擊能力,或者這些芯片正在訓練具有網(wǎng)絡(luò)能力的模型并運行更多這些模型的實例,它不是核武器,但它促成了一種武器。

黃仁勛:你使用的邏輯,你大可以對微處理器和DRAM說同樣的話,你大可以對電力說同樣的話。

主持人:但事實上,我們確實對制造最先進DRAM的相關(guān)技術(shù)實行出口管制。我們對所有種類的芯片制造材料都有針對中國的出口管制。

黃仁勛:我們向中國出售大量的DRAM和CPU,我認為這是正確的。

主持人:我想這又回到了根本問題:AI是否不同?如果你擁有那種能在軟件中找到零日漏洞的技術(shù),這是否是我們希望盡量減少中國率先達到、廣泛部署的能力?

黃仁勛:我們希望美國領(lǐng)先。我們可以控制這一點。

主持人:如果芯片已經(jīng)在那里,他們正在用它們訓練那個模型,我們?nèi)绾慰刂疲?/strong>

黃仁勛:我們有大量的算力,我們有大量的AI研究人員,我們正在盡可能快地競賽。

主持人:再說一次,我們擁有的核武器比任何人都多,但我們不想把濃縮鈾送到任何地方。

黃仁勛:我們不是濃縮鈾,我們是一個芯片,而且是一個他們自己能制造的芯片。

主持人:但他們向你購買是有原因的。我們有中國公司創(chuàng)始人的引述,說他們受限于算力。

黃仁勛:因為我們的芯片更好,總體而言,我們的芯片更好,這是毫無疑問的。如果沒有我們的芯片……你能承認華為度過了創(chuàng)紀錄的一年嗎?你能承認一大批芯片公司已經(jīng)上市了嗎?你能承認嗎?

你能否也承認,我們曾經(jīng)在那個市場占有非常大的份額,而現(xiàn)在我們不再擁有那么大的份額?我們還可以承認,中國大約占世界科技產(chǎn)業(yè)的40%。為美國科技產(chǎn)業(yè)放棄那個市場,是對我們國家的傷害,這是對我們國家安全的傷害,這是對我們技術(shù)領(lǐng)先地位的傷害,這一切只為了一個公司的利益,這對我來說毫無意義。

主持人:我想我有點困惑,感覺你在做兩種不同的陳述,一是,如果我們被允許競爭,我們將在與華為的競爭中獲勝,因為我們的芯片會好得多。二是,無論如何,沒有我們,他們也會做同樣的事情。這兩者怎么能同時為真呢?

黃仁勛:這顯然是真的,在沒有更好選擇的情況下,你會接受你唯一的選擇,這怎么不合邏輯了?這太合邏輯了。

主持人:他們想要英偉達芯片的原因是它們更好,更好意味著更多算力,更多算力意味著你可以訓練更好的模型。

黃仁勛:不,只是更好。更好是因為它更容易編程,我們有更好的生態(tài)系統(tǒng),但無論更好是什么……當然我們會給他們算力,那又怎樣?事實是,我們得到了好處。別忘了,我們得到了美國技術(shù)領(lǐng)先地位的好處。我們得到了開發(fā)者在美國技術(shù)棧上工作的好處。我們得到了好處,隨著那些AI模型擴散到世界其他地方,美國技術(shù)棧因此成為最佳選擇,我們可以繼續(xù)推進和擴散美國技術(shù),我相信這是積極的,這是美國技術(shù)領(lǐng)先地位非常重要的一部分。

現(xiàn)在,你所倡導的政策導致了美國電信行業(yè)基本上被政策排擠出世界,以至于我們不再控制自己的電信,我不認為那是明智的,這有點狹隘,并導致了意想不到的后果,我此刻正在向你描述的這些后果,你似乎很難理解。

主持人:好吧,似乎關(guān)鍵是有一個潛在的收益和一個潛在的成本。我們想弄清楚的是,收益是否值得成本,我想讓你承認這個潛在的成本。算力是訓練強大模型的輸入,強大的模型確實具有強大的攻擊能力,比如網(wǎng)絡(luò)攻擊。美國公司先達到Mythos級別的能力是件好事,然后他們現(xiàn)在會暫時保留這些能力,以便美國公司和美國政府能夠在那樣的能力被宣布之前,讓他們的軟件得到更好的保護。

如果中國擁有更多算力或更多匯聚的算力,如果他們能夠更早地制造出Mythos級別的模型并廣泛部署,那將是非常糟糕的。這之所以沒有發(fā)生,原因之一是我們有更多的算力,這要感謝像英偉達這樣的美國公司。這是將其運送到中國的成本。那么,讓我們暫時把收益放在一邊。你承認這是一個潛在的成本嗎?

黃仁勛:我也會告訴你,潛在的成本是,我們讓AI棧中最重要的層之一,芯片層,放棄了整個市場——世界第二大市場——以便他們能夠發(fā)展規(guī)模,發(fā)展自己的生態(tài)系統(tǒng),以便未來的AI模型以與美國技術(shù)棧截然不同的方式得到優(yōu)化。隨著AI擴散到世界其他地方,他們的標準、他們的技術(shù)棧將變得比我們的優(yōu)越,因為他們的模型是開放的。

主持人:我想我只是足夠相信英偉達的內(nèi)核工程師和CUDA工程師,認為他們可以優(yōu)化——

黃仁勛:AI不僅僅是內(nèi)核優(yōu)化,你知道的。

主持人:當然,但你可以做很多事情,從蒸餾到一個非常適合你芯片的模型。

黃仁勛:我們會盡最大努力。

主持人:你們擁有完整的軟件生態(tài),即便中國暫時有更好的開源模型,行業(yè)也不會長期鎖定在中國生態(tài)上。

黃仁勛:事實上中國是世界上開源軟件的最大貢獻者、中國是世界上開放模型的最大貢獻者,今天它建立在美國技術(shù)棧上,英偉達的技術(shù)棧上。

AI技術(shù)棧的所有五層都很重要,美國應該去贏得全部五層。它們都很重要,當然,最重要的一層是AI應用層,那個擴散到社會中、使用最多的層將從這場工業(yè)革命中受益最多。但我的觀點是,每一層都必須成功。

如果我們嚇唬這個國家,讓人民認為AI是某種核彈,以至于每個人都討厭AI,每個人都害怕AI,我不知道你如何幫助美國,你在幫倒忙。如果我們因為AI會扼殺所有軟件工程工作而嚇跑所有人不去做軟件工程——結(jié)果我們沒有軟件工程師——我們在幫美國的倒忙。

如果我們因為計算機視覺完全免費,沒有AI會比放射科醫(yī)生做得更差,而嚇跑所有人不去做放射科,以至于沒人想當放射科醫(yī)生,我們就是從根本上混淆了工作和任務的區(qū)別。放射科醫(yī)生的工作是患者護理,任務是讀片。如果我們?nèi)绱松羁痰卣`解這一點,嚇跑所有人不去上放射科學校,我們就會沒有足夠的放射科醫(yī)生,也就沒有足夠好的醫(yī)療保健。

所以我在論證,當你提出一個如此極端的前提時,一切從零變成無窮大,我們最終以一種不真實的方式嚇到了人們。生活不是那樣的。我們希望美國是第一嗎?當然,我們需要在那個技術(shù)棧的每一層都成為領(lǐng)導者嗎?當然需要。今天你在談論Mythos,因為Mythos很重要,當然,那很棒。

但幾年后,我向你做出預測,當我們希望美國技術(shù)棧,希望美國技術(shù)擴散到世界各地——到印度、到中東、到非洲、到東南亞——當我們的國家希望出口,因為我們希望出口我們的技術(shù),我們希望出口我們的標準時,在那一天,我希望你和我能再次進行同樣的對話。我會準確地告訴你今天對話的內(nèi)容,你的政策和你的想象如何毫無充分理由地導致美國放棄了世界第二大市場。

我們不應該放棄它,如果我們輸了,那就輸了,但我們?yōu)槭裁匆艞??現(xiàn)在沒有人主張全有或全無,沒有人主張全有或全無,意味著我們隨時向中國運送一切,沒有人主張那樣。我們應該始終把最好的技術(shù)留在這里,我們應該始終把最多的技術(shù)留在這里,并且最先得到。但我們也應該努力在全球競爭和取勝,這兩件事可以同時發(fā)生。這需要一些細微差別,一些成熟度,而不是絕對化。世界不是絕對化的。

主持人:好的,論點取決于這一點。他們構(gòu)建了針對他們幾年后能制造的最好芯片進行優(yōu)化的模型,這些芯片被出口到世界各地,這就設(shè)定了標準。由于EUV出口管制,如我們所說,你將推進到1.6nm。幾年后,他們?nèi)詫⑼A粼?nm。

從國內(nèi)來看,他們可能會傾向于,“我們有這么多能源,可以大規(guī)模制造。我們?nèi)詫⑹褂?nm?!钡诔隹诜矫?,他們的7nm芯片必須與你們的1.6nm芯片競爭。他們的模型必須對7nm進行如此深入的優(yōu)化,以至于在他們的7nm上運行他們的模型比在你們的1.6nm上運行他們的模型更好。

黃仁勛:那我們看看事實好嗎?Blackwell的光刻技術(shù)比Hopper先進50倍嗎?是50倍嗎?差遠了,我一遍又一遍地說,摩爾定律已死,從Hopper到Blackwell,僅就晶體管本身而言,姑且說是75%,相差三年,75%,Blackwell是Hopper的50倍。

我的觀點是,架構(gòu)很重要,計算機科學很重要,半導體物理也很重要,但計算機科學很重要。AI的影響主要來自計算棧,這就是為什么CUDA如此有效,為什么CUDA如此受喜愛。它是一個生態(tài)系統(tǒng),一個計算架構(gòu),允許如此大的靈活性,以至于如果你想完全改變一個架構(gòu)——創(chuàng)造出像MoE這樣的東西,像擴散模型這樣的東西,解耦的東西——你都可以做到,很容易做到。

所以,事實是,AI關(guān)乎上層的軟件棧,正如它關(guān)乎底層的架構(gòu)一樣。就我們擁有針對我們技術(shù)棧、我們生態(tài)系統(tǒng)進行優(yōu)化的架構(gòu)和軟件棧而言,這顯然是有利的,因為我們今天開始對話時就談到了英偉達的生態(tài)系統(tǒng)有多么豐富。為什么人們總是喜歡首先為CUDA編程?他們確實如此,他們確實如此,中國的研究人員也是如此。

但是,如果我們被迫離開中國,首先,這是一個政策錯誤,顯然它會產(chǎn)生反作用,它對美國產(chǎn)生了不利影響,推動并加速了他們的芯片產(chǎn)業(yè),它迫使他們所有的AI生態(tài)系統(tǒng)專注于他們內(nèi)部的架構(gòu)?,F(xiàn)在還不算太晚,但無論如何,這已經(jīng)發(fā)生了。

你將看到,在未來,他們顯然不會停留在7nm。他們擅長制造。他們將從7nm繼續(xù)前進。那么,5nm和7nm之間有10倍的差距嗎?答案是否定的,架構(gòu)很重要,網(wǎng)絡(luò)很重要。這就是為什么英偉達收購了Mellanox。網(wǎng)絡(luò)很重要,能源很重要,所有這些都很重要,不像你試圖簡化的那樣簡單。

十四、英偉達不會輕易回到舊工藝節(jié)點,但極端情況下會考慮

主持人:我們之前討論了臺積電、內(nèi)存等方面的瓶頸。那么,如果我們處于這樣一個世界,你已經(jīng)占據(jù)了N3節(jié)點的大部分產(chǎn)能——在某個時候你會進入N2節(jié)點,并成為那里的產(chǎn)能主力——你是否認為你可以回到N7,利用較舊工藝節(jié)點的閑置產(chǎn)能,并說:“AI的需求如此之大,而我們擴展前沿節(jié)點的能力無法滿足它,所以我們要制造一個Hopper或Ampere,但用上我們今天所知道的關(guān)于數(shù)值格式的一切以及你描述的所有其他改進”?你認為這種情況會在2030年之前發(fā)生嗎?

黃仁勛:沒有必要,原因是,每一代架構(gòu)不僅僅是晶體管尺寸,你做了大量的工程、封裝和堆疊,還有數(shù)值格式和系統(tǒng)架構(gòu)。

當你產(chǎn)能耗盡時,想輕易回到另一個節(jié)點……那種研發(fā)水平?jīng)]人負擔得起。我們能夠負擔得起向前邁進,我不認為我們能負擔得起回頭,現(xiàn)在,如果世界只是說……如果有一天,我們做個思想實驗,那天我們意識到,“聽著,我們再也不會有更多產(chǎn)能了?!?我會回頭使用7nm嗎?毫不猶豫,我當然會。

主持人:我交談過的一個人有一個問題:為什么英偉達不同時運行多個不同架構(gòu)的芯片項目?你可以做類似Cerebras那樣的晶圓級集成,你可以做類似Dojo那樣的巨大封裝,你可以做一個沒有CUDA的。你有資源和工程人才并行做所有這些,那么,考慮到AI和架構(gòu)可能走向何方,為什么把所有的雞蛋放在一個籃子里?

黃仁勛:哦,我們可以。只是我們沒有更好的主意,我們可以做所有那些事情,只是它們不是更好的選擇。我們在模擬器里模擬了所有,結(jié)果證明更差,所以我們不會做,我們正在做的正是我們想做的項目。如果工作負載發(fā)生巨大變化——我不是指算法,我指的是實際的工作負載,這取決于市場的形態(tài)——我們可能會決定增加其他加速器。

例如,最近我們增加了Groq,我們將把Groq整合到我們的CUDA生態(tài)系統(tǒng)中。我們現(xiàn)在這樣做,是因為token的價值已經(jīng)變得如此之高,以至于可以對token進行不同的定價。在過去,就在幾年前,token要么免費,要么幾乎不貴。但現(xiàn)在你可以有不同的客戶,這些客戶想要不同的答案,因為客戶賺了這么多錢——例如,我們的軟件工程師——如果我能給他們響應更快的token,讓他們比現(xiàn)在更高效,我愿意為此付費。

但這個市場只是最近才出現(xiàn),所以我認為我們現(xiàn)在有能力根據(jù)響應時間對同一個模型進行不同的細分。這就是為什么我們決定擴展帕累托前沿,創(chuàng)建一個響應時間更快的推理細分市場,即使其吞吐量較低。直到現(xiàn)在,更高的吞吐量總是更好的。我們認為可能存在一個世界,其中有非常高ASP的token,即使工廠的吞吐量較低,ASP也能彌補。

這就是我們這樣做的原因,否則,從架構(gòu)的角度來看,如果我有更多的錢,我會把更多的錢投在英偉達的架構(gòu)后面。

主持人:我認為這種極其昂貴的token以及推理市場的解耦想法非常有趣。

黃仁勛:它的細分市場。

十五、即使沒有深度學習革命,英偉達的加速計算使命依然能使其成為大公司

主持人:假設(shè)深度學習革命沒有發(fā)生,英偉達會做什么?

黃仁勛:加速計算,我們一直在做的事情。我們公司的前提是,摩爾定律將會……通用計算對很多事情有好處,但對很多計算來說并不理想。

所以我們結(jié)合了一種叫做GPU的架構(gòu),CUDA,和一個CPU,這樣我們可以加速CPU的工作負載。不同的代碼內(nèi)核或算法可以卸載到我們的GPU上。因此,你將一個應用程序加速100倍、200倍。哪里可以用到?顯然是工程、科學和物理、數(shù)據(jù)處理、計算機圖形、圖像生成,各種領(lǐng)域。即使今天沒有AI,英偉達也會非常非常大。

原因很根本,那就是通用計算繼續(xù)擴展的能力基本上已經(jīng)到頭了。而唯一的辦法……不是唯一的辦法,但辦法之一是通過特定領(lǐng)域的加速。我們開始的一個領(lǐng)域是計算機圖形,但還有許多其他領(lǐng)域,各種都有。粒子物理和流體、結(jié)構(gòu)化數(shù)據(jù)處理,所有不同類型、能從CUDA中受益的算法。

我們的使命確實是,將加速計算帶給世界,并推進通用計算無法完成的各種應用,并將其擴展到能夠幫助突破某些科學領(lǐng)域的能力水平。早期的一些應用是分子動力學、能源勘探的地震處理、當然還有圖像處理,所有這些通用計算效率太低而無法勝任的領(lǐng)域。

如果沒有AI,我會非常難過。但是,由于我們在計算方面取得的進步,我們民主化了深度學習。我們讓任何地方的研究人員、科學家、學生都能使用一臺PC或一塊GeForce擴展卡來做了不起的科學,那個基本承諾沒有改變,一點都沒有。

如果你看GTC大會,有整個開頭部分,沒有一個是關(guān)于AI的。整個部分,比如計算光刻,或者我們的量子化學工作,數(shù)據(jù)處理工作,所有這些東西都與AI無關(guān)。它們?nèi)匀环浅V匾N抑繟I非常有趣且令人興奮,但也有很多人正在做大量非常重要的、與AI無關(guān)的工作,張量并不是你計算的唯一方式,我們希望幫助每個人。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
他是導致臺灣難以收復的關(guān)鍵人物,若不是他,臺灣或許早就解放了

他是導致臺灣難以收復的關(guān)鍵人物,若不是他,臺灣或許早就解放了

觀史搜尋著
2026-04-17 22:43:50
金像獎成功收官:四大尷尬,三大暖心,兩個意外發(fā)現(xiàn),謝霆鋒贏麻

金像獎成功收官:四大尷尬,三大暖心,兩個意外發(fā)現(xiàn),謝霆鋒贏麻

八斗小先生
2026-04-20 16:37:47
曼聯(lián)百年最差引援!斯科爾斯親口點名:他連球都踢不明白

曼聯(lián)百年最差引援!斯科爾斯親口點名:他連球都踢不明白

一隅非生
2026-04-22 06:25:10
祭拜鬼社當天,日本發(fā)出崩潰預警,美歐視而不見,中國不再伸援手

祭拜鬼社當天,日本發(fā)出崩潰預警,美歐視而不見,中國不再伸援手

凡知
2026-04-22 10:04:20
黑粉攻擊何潤東風波升級!博主怒撕:蹭熱度該適可而止,又老又丑

黑粉攻擊何潤東風波升級!博主怒撕:蹭熱度該適可而止,又老又丑

小徐講八卦
2026-04-19 15:19:03
機會來了!曼城獲勝必可反超阿森納,利茲取勝則保級無憂

機會來了!曼城獲勝必可反超阿森納,利茲取勝則保級無憂

嗨皮看球
2026-04-22 12:57:46
美媒:伊朗最高領(lǐng)袖穆杰塔巴已批準同美方進行談判,白宮20日一整天都在等德黑蘭,如出現(xiàn)進展跡象,特朗普也可能同意延長?;鹌谙?>
    </a>
        <h3>
      <a href=極目新聞
2026-04-21 09:44:58
52歲大媽再婚3個月就果斷離婚,坦言道:他心里只有風花雪月

52歲大媽再婚3個月就果斷離婚,坦言道:他心里只有風花雪月

烙任情感
2026-04-21 11:11:28
4500萬人恐斷糧!美國深夜求援中俄:糧食紅線被踩化肥緊缺超黃金

4500萬人恐斷糧!美國深夜求援中俄:糧食紅線被踩化肥緊缺超黃金

聞識
2026-04-22 01:12:59
三百年的行書天花板,這字美得無可挑剔,啟功也自嘲僅學得皮毛

三百年的行書天花板,這字美得無可挑剔,啟功也自嘲僅學得皮毛

幸福娃3790
2026-03-03 11:47:28
藍眼北京人控訴陳麗華20余年,比女首富更該銘記

藍眼北京人控訴陳麗華20余年,比女首富更該銘記

老蝣說體育
2026-04-19 17:40:22
局勢正在惡化,日本高調(diào)宣布,高市為戰(zhàn)爭做準備,30國幫手全到了

局勢正在惡化,日本高調(diào)宣布,高市為戰(zhàn)爭做準備,30國幫手全到了

混沌錄
2026-04-20 16:38:07
不到24小時,日本面臨雙重麻煩,高市陷絕境:連個能幫忙的都沒有

不到24小時,日本面臨雙重麻煩,高市陷絕境:連個能幫忙的都沒有

椰青美食分享
2026-04-21 17:45:03
若沒有此人,中國歷史或?qū)⒏膶?!晚年離休后享受什么待遇?

若沒有此人,中國歷史或?qū)⒏膶?!晚年離休后享受什么待遇?

史之銘
2026-04-19 15:49:20
殲-10CE 進駐德黑蘭,以色列戰(zhàn)機瞬間不敢囂張

殲-10CE 進駐德黑蘭,以色列戰(zhàn)機瞬間不敢囂張

利刃號
2026-04-20 20:06:52
央視官宣!4月27日

央視官宣!4月27日

鯨探所長
2026-04-22 11:55:43
劉德華2027內(nèi)地巡演官宣,包括上海、廣州、北京等六城!

劉德華2027內(nèi)地巡演官宣,包括上海、廣州、北京等六城!

極目新聞
2026-04-22 12:03:51
剛剛!ChatGPT Images 2.0突然發(fā)布,實測強得離譜

剛剛!ChatGPT Images 2.0突然發(fā)布,實測強得離譜

雷科技
2026-04-22 09:39:47
第一次對「鋁箔紙」產(chǎn)生了敬意!以為烘焙專用,沒想到是家居神器

第一次對「鋁箔紙」產(chǎn)生了敬意!以為烘焙專用,沒想到是家居神器

裝修秀
2026-04-18 11:55:03
善惡到頭終有報,如今73歲的唐國強,已經(jīng)走上了一條不歸路!

善惡到頭終有報,如今73歲的唐國強,已經(jīng)走上了一條不歸路!

吳蒂旅行ing
2026-03-20 05:20:46
2026-04-22 13:12:49
芯東西 incentive-icons
芯東西
專注AI芯片、半導體產(chǎn)業(yè)媒體
2290文章數(shù) 8153關(guān)注度
往期回顧 全部

科技要聞

凌晨突發(fā)!ChatGPT Images 2.0發(fā)布

頭條要聞

KTV服務員被指強奸14歲女生 官方通報

頭條要聞

KTV服務員被指強奸14歲女生 官方通報

體育要聞

一到NBA季后賽,四屆DPOY就成了主角

娛樂要聞

復婚無望!baby黃曉明陪小海綿零交流

財經(jīng)要聞

伊朗拒絕出席 特朗普宣布延長?;鹌谙?/h3>

汽車要聞

四款全球首秀+AI落地 大眾汽車集團在華轉(zhuǎn)型全面提速

態(tài)度原創(chuàng)

家居
教育
本地
手機
公開課

家居要聞

極簡繪夢 克制和諧

教育要聞

2026 成都新初高中大爆發(fā)!七中 、 樹德、 西川、北二外領(lǐng)銜,9 月集體亮相!

本地新聞

春色滿城關(guān)不?。座N梅浪漫盛放,吳山藏了一片四月雪

手機要聞

小米盧偉冰:REDMI K90 Max官方300元的內(nèi)存補貼會盡量延續(xù)

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版