国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

英偉達新核彈,站在蘋果的肩膀上

0
分享至

2024GTC大會上,黃仁勛右手B200,左手H100,理所當(dāng)然地有了新人忘舊人: “我們需要更大的GPU,如果不能更大,就把更多GPU組合在一起,變成更大的虛擬GPU?!?/p>

英偉達公布的Blackwell架構(gòu)的B200 GPU,親手把網(wǎng)紅顯卡H100拍在了沙灘上。

按照黃仁勛的介紹,B200理論上的AI性能可達20PFLOPS,是H100的五倍。相比H100的800億晶體管規(guī)模,B200的晶體管規(guī)模高達2080億。

一般來說,芯片算力提升的最常用方法是采用先進制程,用更高的密度在芯片里塞進更多晶體管。如摩爾定律所說:

集成電路上可以容納的晶體管數(shù)目,大約每經(jīng)過18個月到24個月便會增加一倍。

比如采用7nm工藝的A100 GPU,芯片(Die)面積為826mm2,內(nèi)有542億晶體管;采用5nm(臺積電N4)工藝的H100,芯片面積縮小為814mm2,晶體管數(shù)量反而暴漲至800億。

然而,B200在晶體管數(shù)量提高近三倍的同時,并沒有用更先進的3nm工藝,而是采用了和H100一樣的5nm工藝。黃仁勛所說的“大”和“組合”,是字面意義上的:

從技術(shù)原理看,B200其實是把兩塊芯片“拼”成了一個大芯片。

在英偉達的PPT演示里,兩顆GPU從邊緣“無縫粘合”在一起,面積X2的同時,算力翻倍。

1+1=2的方法看似簡單粗暴,背后卻是一場在物理學(xué)邊緣的沖鋒與冒險。

1+1有時候不等于2

工廠提高生產(chǎn)力有兩種辦法:一是擴建廠房,裝進更多的生產(chǎn)線;二是升級生產(chǎn)線,在廠房面積不變的情況下,增加生產(chǎn)線數(shù)量。

芯片公司一直以來都在采用第二種方法:通過生產(chǎn)線創(chuàng)新(工藝制程),在有限的芯片面積里塞進更多晶體管,避免擴建廠房帶來的房租成本上漲。

但這種方式的局限性在于,生產(chǎn)線創(chuàng)新(工藝制程)對應(yīng)的研發(fā)成本越來越高,甚至有高過房租的趨勢。H100采用的5nm工藝,很可能就是GPU量產(chǎn)的極限制程,繼續(xù)下探到3nm,很可能成本上吃虧。

擴建廠房的確是一個辦法,但放在芯片生產(chǎn)上,會遇到一個中國人很熟悉的問題:土地供應(yīng)有限。

每一顆芯片都是從12寸的硅晶圓(土地)上“切”下來的,那么芯片(廠房)面積越大,每塊晶圓能“切”出來的芯片就越少。

再考慮到良率和大面積芯片的散熱問題(施工事故),單個芯片成本會成倍提高。

由此衍生出了第三種思路:建一個一模一樣的廠房,讓兩個廠房同時生產(chǎn),既避開了成本問題,又提高了生產(chǎn)效率。

這種方法聽上去簡單,但實踐起來難于登天。

芯片在執(zhí)行計算任務(wù)時需要經(jīng)歷兩個階段:數(shù)據(jù)傳輸和計算,數(shù)據(jù)傳輸花費時間過多,計算“空載”,就會造成算力的浪費。就像兩間廠房需要一個工頭傳達指示,工頭在A廠房發(fā)表講話時,B廠房的工人都在摸魚。

這就導(dǎo)致在一塊主板上封裝10顆芯片,性能非但不會提高10倍,反而很可能連兩倍都不到。

2011年,英偉達發(fā)布了GTX590顯卡,最大特點是在一個PCB板上裝了兩顆GPU芯片。

但在具體的游戲中,想同時調(diào)用兩顆GPU的算力,不僅需要專門的軟件支持,性能也只有單顆芯片的130%左右。

原因就在于,大量的算力被低效的數(shù)據(jù)傳輸浪費了。

GTX590顯卡里有兩顆GPU芯片

為了解決產(chǎn)線工人趁著工頭不在消極怠工的問題,英偉達團隊在2017年發(fā)表論文,提出了名為“可組合封裝GPU”的架構(gòu),核心在于將多顆GPU集成在同一個芯片封裝內(nèi)。

傳統(tǒng)的芯片封裝是“先封再拼”,即兩顆芯片封裝完畢,再用導(dǎo)線連接。英偉達的方案是“先拼再封”,先把兩顆芯片拼成一個大芯片,再封裝到一起。

把芯片(廠房)之間的物理距離縮減到0,工頭傳遞指示,兩邊的工人同時學(xué)習(xí)貫徹,降低數(shù)據(jù)傳輸時間,實現(xiàn)1+1=2。

幾個月后,老對手AMD表示論文誰不會寫,刊發(fā)論文展示了4顆GPU集成在同一封裝內(nèi)的設(shè)計,宣稱其性能比當(dāng)時的最強GPU還要高45.5%,并且coming soon。

但無論是英偉達還是AMD,都沒能把這個方案真正“soon”出來。

第一個讓1+1=2的,是蘋果。

蘋果的超能力就是有錢

2022年,蘋果發(fā)布了M1 Ultra芯片,其最大特點是直接將兩顆M1 Max芯片“粘合”在一起,變成一張大芯片,業(yè)內(nèi)戲稱“膠水大法”。

1+1=2的意義正如蘋果在新聞稿中所說:


M1 Ultra 在工作時依然表現(xiàn)出一枚芯片的整體性,也會被所有軟件識別為一枚完整芯片,開發(fā)者無需重寫代碼就能直接運用它的強大性能。這在史上從無先例。

M1 Ultra由兩顆一模一樣的M1 Max芯片拼接而成

蘋果之前,幾乎所有的“縫合”方案,都無法解決芯片在連接過程中產(chǎn)生的損耗,使得性能往往“1+1<2”。M1 Ultra的背后,是一個名為UltraFusion的“縫合技術(shù)”。

按照蘋果官方的說法,Ultra Fusion由蘋果與臺積電共同研發(fā)。但從經(jīng)驗看,蘋果發(fā)揮的最大作用,是以“技術(shù)冠名費”的方式,報銷了臺積電的研發(fā)開支。

兩顆芯片的縫合,核心是要解決芯片間的數(shù)據(jù)傳輸問題。

為了實現(xiàn)“無縫粘合”,蘋果用上了臺積電最昂貴、最先進的封裝技術(shù)——第五代CoWoS-S。[2]

傳統(tǒng)的傳輸方式是將兩顆芯片封裝在一塊基板上,芯片之間的傳輸由引線解決。CoWoS方案在基板和芯片之間加了一層硅中介層,通過在硅中介層里布線,間接將兩顆小芯片連接起來,連接密度是現(xiàn)有技術(shù)的兩倍。

這個技術(shù)的關(guān)鍵就在于硅中介層,也是燒錢的根源。

硅中階層本質(zhì)上是一片硅晶圓,也就是“切”芯片的原材料。僅僅為了做連接,就要另加一層硅晶圓的費用,這手筆恐怕只有蘋果做得出來。

后來,英偉達在H100上采用了更成熟的CoWoS,成本仍超過4000美元。蘋果作為最初的試錯者,成本只會更高。

除了CoWoS,蘋果的錢還燒在了“縫合”技術(shù)上[2]。

芯片制造的本質(zhì),是在硅晶圓上刻畫復(fù)雜電路。但在實際制造過程中,電路不是直接刻在硅晶圓上的,而是先刻在一個掩膜版上,再通過光刻和刻蝕把電路“轉(zhuǎn)移”到硅晶圓上。

英偉達當(dāng)年遇到的問題是,GPU芯片本身面積就大,一旦兩顆GPU拼接,就會超過正常掩膜版的大小(H100的面積已經(jīng)接近臺積電5nm掩模版的極限),電路就無法被完整地刻畫。

蘋果提出的解決方案是,1個掩膜版不夠,咱直接上四個吧。

通過四個掩膜版“縫合”,將電路刻畫的面積增加到2500mm2,是英偉達同期GPU的3倍多(815mm2)。

在芯片制造中,很大一部分成本就來自掩膜版制作。

掩膜版生產(chǎn)需要Mask Writer(掩膜版寫入機),精密程度堪比光刻機。而且Mask Writer只在掩膜版制作時使用,每種芯片只做一次,難以攤薄成本。

除此之外,由于Ultra Fusion用到了大量新技術(shù),比如連接芯片的高縱橫比硅通孔(TSV)技術(shù),用于散熱的新型非凝膠型熱界面材料(TIM)等[2],臺積電都是拿著發(fā)票找蘋果報銷的。

M1 Ultra發(fā)布時,業(yè)界都沒有準確的成本推算。不是研究員水平不到位,實在是技術(shù)過于先進,算不出來。

高科技產(chǎn)業(yè)最關(guān)鍵的問題不是技術(shù)如何實現(xiàn),而是誰來掏錢把論文和實驗室里的數(shù)據(jù)變成可以量產(chǎn)的產(chǎn)品。不知道看著M1 Ultra的拼接示意圖,會不會有久遠的記憶攻擊黃仁勛。


技術(shù)狂人的商業(yè)冒險

最早試圖解決的1+1<2問題的,既不是英偉達也不是蘋果,而是臺積電元老蔣尚義。

2009年,回歸臺積電的張忠謀請回已經(jīng)退休的蔣尚義。 在后者帶領(lǐng)下,臺積電以“后閘級”技術(shù)路線成功超越三星率先量產(chǎn)28nm工藝。 但在研發(fā)過程中,蔣尚義發(fā)現(xiàn)晶體管單位制造成本不降反升,制程升級提升性能的性價比開始降低。

拿著張忠謀批的1億美元預(yù)算和400多人的工程師團隊,蔣尚義帶隊開始了“超越摩爾計劃”。

傳統(tǒng)互聯(lián)技術(shù)下,傳輸速率已經(jīng)觸及天花板。蔣尚義開始嘗試一種新思路:

把兩顆芯片放到一起封裝,物理距離縮短了,傳輸速度自然提高。為了區(qū)別于傳統(tǒng)封裝,蔣尚義將其命名為“先進封裝”。

2011年,臺積電得到FPGA大廠賽靈思訂單,憑借CoWoS以及共同開發(fā)的硅通孔(TSV)等技術(shù),成功將4個28nm FPGA芯片拼接在一起,推出了史上最大的FPGA芯片。

然而,大部分客戶對CoWoS興致寥寥,賽靈思的訂單杯水車薪。

不是臺積電技術(shù)不夠好,實在是先進封裝太貴了。

老客戶高通的高管在與蔣尚義共進午餐時直白表示,CoWoS技術(shù)很好,但“我只愿意為它花費1美分/平方毫米”,而臺積電當(dāng)時的售價是7美分/平方毫米[3]。

據(jù)說英偉達也是臺積電CoWoS的第一批目標(biāo)客戶之一,因為數(shù)據(jù)傳輸?shù)钠款i一直是困擾GPU計算的核心問題。但聽到臺積電的報價后,英偉達當(dāng)場表示,老技術(shù)還能再湊合幾年[3]。

另一方面,先進制程還在穩(wěn)步推進,先進封裝的理念顯得過于超前,畢竟領(lǐng)導(dǎo)還在開卡羅拉,你就別急著換寶馬了。

因此,先進封裝團隊在臺積電內(nèi)部的一度邊緣化,甚至被當(dāng)做老干部療養(yǎng)院。后來跳槽三星的梁孟松,就認為自己被調(diào)往先進封裝業(yè)務(wù)屬于“下放”。

隨后,臺積電開始給CoWoS做減法,掏出了替代方案“InFO”,將昂貴的硅中介層換成其他材料,犧牲了連接密度,但成本大幅下降。

緊接著,臺積電遇到了可以靠一己之力改變供應(yīng)商命運的超級甲方:蘋果。

2013年前后,由于與三星在手機市場的競爭,蘋果開始將芯片代工交由臺積電。


憑借InFO方案,臺積電在16nm工藝的基礎(chǔ)上,制造出了比三星14nm性能更強的A10處理器,貢獻了歷代iPhone中第二輕薄的iPhone 7[5]。

有了蘋果的大單的,臺積電的先進封裝業(yè)務(wù)迅速盤活,并在2022年拿出了震驚業(yè)界的M1 Ultra芯片。2024年開年,這個攻堅十多年的“膠水大法”,又被用在了英偉達的新核彈B200上。英偉達順勢拿下冠名權(quán),將這項技術(shù)命名為“NV-HBI”。

先進封裝方案依然昂貴,但對今天的英偉達來說,成本兩個字怎么寫,他們可能已經(jīng)忘了。

尾聲

除了CoWoS,另一個被生成式AI帶火的技術(shù)HBM,其探索同樣可以追溯到十年前。

CoWoS拿到賽靈思的第一筆訂單時,蔣尚義大喜過望,但賽靈思的動機卻讓他有些哭笑不得:把四個老芯片拼在一起,直接當(dāng)成新產(chǎn)品加價賣,就不用自己開發(fā)新產(chǎn)品了[3]。

在美國計算機歷史博物館的采訪中,蔣尚義回憶道[3]: “我開發(fā)技術(shù)的初衷是解決性能瓶頸問題,在我看來,我的創(chuàng)新并沒有被用在好的地方”。

科技革命很難推動技術(shù)創(chuàng)新,反而是技術(shù)創(chuàng)新讓科技革命成為可能。創(chuàng)造歷史的人,永遠無法預(yù)見自己在歷史進程中的坐標(biāo)。

在我們不曾踏足的物理學(xué)的邊境,還有無數(shù)偉大的創(chuàng)新尚在不為人知的角落。

參考文章:

[1] NVIDIA Blackwell Architecture and B200/B100 Accelerators Announced: Going Bigger With Smaller Data,Anandtech

[2] 蘋果UltraFusion技術(shù),廈門云天半導(dǎo)體

[3] 蔣尚義萬字自述,披露臺積電的登頂之路,新芽

[4] 臺積電的先進封裝是這樣煉成的,天下雜志

[5] 蘋果iPhone 7 A10處理器的新封裝在技術(shù)和商業(yè)上都產(chǎn)生了巨大的影響,Yole Development

[6] 蘋果M1 Ultra解密:業(yè)內(nèi)首個GPU裸片集成,如何實現(xiàn),集微網(wǎng)

[7] Apple Will Help TSMC to Be in the Leading Position in the Next Era,utmel

編輯:李墨天

視覺設(shè)計:疏睿

責(zé)任編輯:李墨天

封面圖片來自ShotDeck

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
淡水悖論:一個令科學(xué)家百思不得其解的謎題

淡水悖論:一個令科學(xué)家百思不得其解的謎題

魅力科學(xué)君
2026-03-04 18:11:29
“建議所有公司把程序員全裁掉!” OpenClaw爆火,六位資深“養(yǎng)蝦人”自述與AI共生

“建議所有公司把程序員全裁掉!” OpenClaw爆火,六位資深“養(yǎng)蝦人”自述與AI共生

新浪財經(jīng)
2026-03-07 06:21:48
一場追思會,戳穿翁帆沉默兩個月真相,原來楊振寧生前真的沒說錯

一場追思會,戳穿翁帆沉默兩個月真相,原來楊振寧生前真的沒說錯

來科點譜
2025-12-15 09:06:33
29歲,婚期定在明年,命卻停在了洗杯子的十秒里。

29歲,婚期定在明年,命卻停在了洗杯子的十秒里。

小蜜情感說
2026-03-07 22:26:01
女網(wǎng)最新戰(zhàn)報!鄭欽文首盤3-2被逆轉(zhuǎn),空砍2記ACE,關(guān)鍵時刻雙誤

女網(wǎng)最新戰(zhàn)報!鄭欽文首盤3-2被逆轉(zhuǎn),空砍2記ACE,關(guān)鍵時刻雙誤

劉姚堯的文字城堡
2026-03-08 09:07:13
特朗普沒想到:美伊大戰(zhàn)打醒兩個國家,一個是越南,一個是菲律賓

特朗普沒想到:美伊大戰(zhàn)打醒兩個國家,一個是越南,一個是菲律賓

頭條爆料007
2026-03-08 11:22:26
10.99萬起!本田官宣:新車首次降價

10.99萬起!本田官宣:新車首次降價

高科技愛好者
2026-03-07 23:10:42
非洲19歲女孩遠嫁河南48歲農(nóng)民,生倆混血兒,稱:我每天都在享福

非洲19歲女孩遠嫁河南48歲農(nóng)民,生倆混血兒,稱:我每天都在享福

談史論天地
2026-03-06 09:52:47
踢了23分鐘就掛靴!瓦拉內(nèi)退役后首發(fā)聲:身體零件已散架,不硬撐

踢了23分鐘就掛靴!瓦拉內(nèi)退役后首發(fā)聲:身體零件已散架,不硬撐

仰臥撐FTUer
2026-03-06 13:38:03
八年磨一劍!又一“大國重器”被中國成功攻克,外媒有點破防了

八年磨一劍!又一“大國重器”被中國成功攻克,外媒有點破防了

大衛(wèi)聊科技
2026-03-08 13:25:05
準備同歸于盡!伊朗或啟用“沉睡小組”,在美國本土執(zhí)行斬首行動

準備同歸于盡!伊朗或啟用“沉睡小組”,在美國本土執(zhí)行斬首行動

東極妙嚴
2026-03-06 13:43:35
隨著蘭帕德率隊2-0,萊斯特城1-1,赫爾城1-3,英冠最新積分榜出爐

隨著蘭帕德率隊2-0,萊斯特城1-1,赫爾城1-3,英冠最新積分榜出爐

側(cè)身凌空斬
2026-03-08 07:03:56
F1澳洲:包攬冠亞!梅奔笑了,法拉利勝利飛了,邁凱倫天崩開局

F1澳洲:包攬冠亞!梅奔笑了,法拉利勝利飛了,邁凱倫天崩開局

體育妞世界
2026-03-08 13:54:00
高市早苗笑得合不攏嘴,日本高官放話:中國將被迫放棄對日反制

高市早苗笑得合不攏嘴,日本高官放話:中國將被迫放棄對日反制

現(xiàn)代小青青慕慕
2026-02-01 10:01:34
1926年郭沫若首次見青年毛澤東,卻留下深刻印象:狀貌如婦人好女

1926年郭沫若首次見青年毛澤東,卻留下深刻印象:狀貌如婦人好女

文史季季紅
2026-01-16 17:05:03
3個利空影響,33個創(chuàng)新藥股暴跌30%,這波牛市最慘的是醫(yī)藥股東

3個利空影響,33個創(chuàng)新藥股暴跌30%,這波牛市最慘的是醫(yī)藥股東

鵬哥投研
2026-03-08 09:16:47
因找不到人演,被《知否》導(dǎo)演忽悠進組的5位演員,意外成就經(jīng)典

因找不到人演,被《知否》導(dǎo)演忽悠進組的5位演員,意外成就經(jīng)典

沒有偏旁的常慶
2026-03-08 07:45:03
張?zhí)m回京3天,連放4個“大招”!既讓汪小菲吃癟,又打了S家的臉

張?zhí)m回京3天,連放4個“大招”!既讓汪小菲吃癟,又打了S家的臉

八斗小先生
2026-03-08 12:32:18
英國王室再傳“病訊”!王妃已無法站立!

英國王室再傳“病訊”!王妃已無法站立!

夜深愛雜談
2026-03-07 18:57:52
替罪羊還是雙重間諜?—— 蘇萊曼尼的繼任者圣城旅司令卡尼迷局

替罪羊還是雙重間諜?—— 蘇萊曼尼的繼任者圣城旅司令卡尼迷局

民間胡扯老哥
2026-03-07 09:20:23
2026-03-08 14:43:00
遠川科技評論 incentive-icons
遠川科技評論
用投資視角,扒巨頭秘史
377文章數(shù) 2281關(guān)注度
往期回顧 全部

數(shù)碼要聞

英偉達吃下獨顯市場94%,AMD怎么了?

頭條要聞

伊朗小學(xué)遭襲致超165人遇難 特朗普:是伊朗干的

頭條要聞

伊朗小學(xué)遭襲致超165人遇難 特朗普:是伊朗干的

體育要聞

大傷后被交易,他說:22歲的我已經(jīng)死了

娛樂要聞

周迅新戀情曝光,李亞鵬等人已成過去

財經(jīng)要聞

油價要失控?

科技要聞

OpenClaw最大的推手是閑魚和小紅書

汽車要聞

9分鐘充飽 全新騰勢Z9GT首搭閃充技術(shù)26.98萬起

態(tài)度原創(chuàng)

本地
藝術(shù)
教育
房產(chǎn)
公開課

本地新聞

食味印象|一口入魂!康樂烤肉串起千年絲路香

藝術(shù)要聞

“北京意象·活力通州”繪畫作品展 | 油畫作品選

教育要聞

致敬每一個閃光的她:在學(xué)而思,看見教育里的她力量

房產(chǎn)要聞

傳統(tǒng)學(xué)區(qū)房熄火?2月??诙址勘鸬陌鍓K竟然是…

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版