国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

英偉達(dá)新核彈,站在蘋果的肩膀上

0
分享至

2024GTC大會上,黃仁勛右手B200,左手H100,理所當(dāng)然地有了新人忘舊人: “我們需要更大的GPU,如果不能更大,就把更多GPU組合在一起,變成更大的虛擬GPU。”

英偉達(dá)公布的Blackwell架構(gòu)的B200 GPU,親手把網(wǎng)紅顯卡H100拍在了沙灘上。

按照黃仁勛的介紹,B200理論上的AI性能可達(dá)20PFLOPS,是H100的五倍。相比H100的800億晶體管規(guī)模,B200的晶體管規(guī)模高達(dá)2080億。

一般來說,芯片算力提升的最常用方法是采用先進(jìn)制程,用更高的密度在芯片里塞進(jìn)更多晶體管。如摩爾定律所說:

集成電路上可以容納的晶體管數(shù)目,大約每經(jīng)過18個月到24個月便會增加一倍。

比如采用7nm工藝的A100 GPU,芯片(Die)面積為826mm2,內(nèi)有542億晶體管;采用5nm(臺積電N4)工藝的H100,芯片面積縮小為814mm2,晶體管數(shù)量反而暴漲至800億。

然而,B200在晶體管數(shù)量提高近三倍的同時,并沒有用更先進(jìn)的3nm工藝,而是采用了和H100一樣的5nm工藝。黃仁勛所說的“大”和“組合”,是字面意義上的:

從技術(shù)原理看,B200其實(shí)是把兩塊芯片“拼”成了一個大芯片。

在英偉達(dá)的PPT演示里,兩顆GPU從邊緣“無縫粘合”在一起,面積X2的同時,算力翻倍。

1+1=2的方法看似簡單粗暴,背后卻是一場在物理學(xué)邊緣的沖鋒與冒險。

1+1有時候不等于2

工廠提高生產(chǎn)力有兩種辦法:一是擴(kuò)建廠房,裝進(jìn)更多的生產(chǎn)線;二是升級生產(chǎn)線,在廠房面積不變的情況下,增加生產(chǎn)線數(shù)量。

芯片公司一直以來都在采用第二種方法:通過生產(chǎn)線創(chuàng)新(工藝制程),在有限的芯片面積里塞進(jìn)更多晶體管,避免擴(kuò)建廠房帶來的房租成本上漲。

但這種方式的局限性在于,生產(chǎn)線創(chuàng)新(工藝制程)對應(yīng)的研發(fā)成本越來越高,甚至有高過房租的趨勢。H100采用的5nm工藝,很可能就是GPU量產(chǎn)的極限制程,繼續(xù)下探到3nm,很可能成本上吃虧。

擴(kuò)建廠房的確是一個辦法,但放在芯片生產(chǎn)上,會遇到一個中國人很熟悉的問題:土地供應(yīng)有限。

每一顆芯片都是從12寸的硅晶圓(土地)上“切”下來的,那么芯片(廠房)面積越大,每塊晶圓能“切”出來的芯片就越少。

再考慮到良率和大面積芯片的散熱問題(施工事故),單個芯片成本會成倍提高。

由此衍生出了第三種思路:建一個一模一樣的廠房,讓兩個廠房同時生產(chǎn),既避開了成本問題,又提高了生產(chǎn)效率。

這種方法聽上去簡單,但實(shí)踐起來難于登天。

芯片在執(zhí)行計(jì)算任務(wù)時需要經(jīng)歷兩個階段:數(shù)據(jù)傳輸和計(jì)算,數(shù)據(jù)傳輸花費(fèi)時間過多,計(jì)算“空載”,就會造成算力的浪費(fèi)。就像兩間廠房需要一個工頭傳達(dá)指示,工頭在A廠房發(fā)表講話時,B廠房的工人都在摸魚。

這就導(dǎo)致在一塊主板上封裝10顆芯片,性能非但不會提高10倍,反而很可能連兩倍都不到。

2011年,英偉達(dá)發(fā)布了GTX590顯卡,最大特點(diǎn)是在一個PCB板上裝了兩顆GPU芯片。

但在具體的游戲中,想同時調(diào)用兩顆GPU的算力,不僅需要專門的軟件支持,性能也只有單顆芯片的130%左右。

原因就在于,大量的算力被低效的數(shù)據(jù)傳輸浪費(fèi)了。

GTX590顯卡里有兩顆GPU芯片

為了解決產(chǎn)線工人趁著工頭不在消極怠工的問題,英偉達(dá)團(tuán)隊(duì)在2017年發(fā)表論文,提出了名為“可組合封裝GPU”的架構(gòu),核心在于將多顆GPU集成在同一個芯片封裝內(nèi)。

傳統(tǒng)的芯片封裝是“先封再拼”,即兩顆芯片封裝完畢,再用導(dǎo)線連接。英偉達(dá)的方案是“先拼再封”,先把兩顆芯片拼成一個大芯片,再封裝到一起。

把芯片(廠房)之間的物理距離縮減到0,工頭傳遞指示,兩邊的工人同時學(xué)習(xí)貫徹,降低數(shù)據(jù)傳輸時間,實(shí)現(xiàn)1+1=2。

幾個月后,老對手AMD表示論文誰不會寫,刊發(fā)論文展示了4顆GPU集成在同一封裝內(nèi)的設(shè)計(jì),宣稱其性能比當(dāng)時的最強(qiáng)GPU還要高45.5%,并且coming soon。

但無論是英偉達(dá)還是AMD,都沒能把這個方案真正“soon”出來。

第一個讓1+1=2的,是蘋果。

蘋果的超能力就是有錢

2022年,蘋果發(fā)布了M1 Ultra芯片,其最大特點(diǎn)是直接將兩顆M1 Max芯片“粘合”在一起,變成一張大芯片,業(yè)內(nèi)戲稱“膠水大法”。

1+1=2的意義正如蘋果在新聞稿中所說:


M1 Ultra 在工作時依然表現(xiàn)出一枚芯片的整體性,也會被所有軟件識別為一枚完整芯片,開發(fā)者無需重寫代碼就能直接運(yùn)用它的強(qiáng)大性能。這在史上從無先例。

M1 Ultra由兩顆一模一樣的M1 Max芯片拼接而成

蘋果之前,幾乎所有的“縫合”方案,都無法解決芯片在連接過程中產(chǎn)生的損耗,使得性能往往“1+1<2”。M1 Ultra的背后,是一個名為UltraFusion的“縫合技術(shù)”。

按照蘋果官方的說法,Ultra Fusion由蘋果與臺積電共同研發(fā)。但從經(jīng)驗(yàn)看,蘋果發(fā)揮的最大作用,是以“技術(shù)冠名費(fèi)”的方式,報銷了臺積電的研發(fā)開支。

兩顆芯片的縫合,核心是要解決芯片間的數(shù)據(jù)傳輸問題。

為了實(shí)現(xiàn)“無縫粘合”,蘋果用上了臺積電最昂貴、最先進(jìn)的封裝技術(shù)——第五代CoWoS-S。[2]

傳統(tǒng)的傳輸方式是將兩顆芯片封裝在一塊基板上,芯片之間的傳輸由引線解決。CoWoS方案在基板和芯片之間加了一層硅中介層,通過在硅中介層里布線,間接將兩顆小芯片連接起來,連接密度是現(xiàn)有技術(shù)的兩倍。

這個技術(shù)的關(guān)鍵就在于硅中介層,也是燒錢的根源。

硅中階層本質(zhì)上是一片硅晶圓,也就是“切”芯片的原材料。僅僅為了做連接,就要另加一層硅晶圓的費(fèi)用,這手筆恐怕只有蘋果做得出來。

后來,英偉達(dá)在H100上采用了更成熟的CoWoS,成本仍超過4000美元。蘋果作為最初的試錯者,成本只會更高。

除了CoWoS,蘋果的錢還燒在了“縫合”技術(shù)上[2]。

芯片制造的本質(zhì),是在硅晶圓上刻畫復(fù)雜電路。但在實(shí)際制造過程中,電路不是直接刻在硅晶圓上的,而是先刻在一個掩膜版上,再通過光刻和刻蝕把電路“轉(zhuǎn)移”到硅晶圓上。

英偉達(dá)當(dāng)年遇到的問題是,GPU芯片本身面積就大,一旦兩顆GPU拼接,就會超過正常掩膜版的大?。℉100的面積已經(jīng)接近臺積電5nm掩模版的極限),電路就無法被完整地刻畫。

蘋果提出的解決方案是,1個掩膜版不夠,咱直接上四個吧。

通過四個掩膜版“縫合”,將電路刻畫的面積增加到2500mm2,是英偉達(dá)同期GPU的3倍多(815mm2)。

在芯片制造中,很大一部分成本就來自掩膜版制作。

掩膜版生產(chǎn)需要Mask Writer(掩膜版寫入機(jī)),精密程度堪比光刻機(jī)。而且Mask Writer只在掩膜版制作時使用,每種芯片只做一次,難以攤薄成本。

除此之外,由于Ultra Fusion用到了大量新技術(shù),比如連接芯片的高縱橫比硅通孔(TSV)技術(shù),用于散熱的新型非凝膠型熱界面材料(TIM)等[2],臺積電都是拿著發(fā)票找蘋果報銷的。

M1 Ultra發(fā)布時,業(yè)界都沒有準(zhǔn)確的成本推算。不是研究員水平不到位,實(shí)在是技術(shù)過于先進(jìn),算不出來。

高科技產(chǎn)業(yè)最關(guān)鍵的問題不是技術(shù)如何實(shí)現(xiàn),而是誰來掏錢把論文和實(shí)驗(yàn)室里的數(shù)據(jù)變成可以量產(chǎn)的產(chǎn)品。不知道看著M1 Ultra的拼接示意圖,會不會有久遠(yuǎn)的記憶攻擊黃仁勛。


技術(shù)狂人的商業(yè)冒險

最早試圖解決的1+1<2問題的,既不是英偉達(dá)也不是蘋果,而是臺積電元老蔣尚義。

2009年,回歸臺積電的張忠謀請回已經(jīng)退休的蔣尚義。 在后者帶領(lǐng)下,臺積電以“后閘級”技術(shù)路線成功超越三星率先量產(chǎn)28nm工藝。 但在研發(fā)過程中,蔣尚義發(fā)現(xiàn)晶體管單位制造成本不降反升,制程升級提升性能的性價比開始降低。

拿著張忠謀批的1億美元預(yù)算和400多人的工程師團(tuán)隊(duì),蔣尚義帶隊(duì)開始了“超越摩爾計(jì)劃”。

傳統(tǒng)互聯(lián)技術(shù)下,傳輸速率已經(jīng)觸及天花板。蔣尚義開始嘗試一種新思路:

把兩顆芯片放到一起封裝,物理距離縮短了,傳輸速度自然提高。為了區(qū)別于傳統(tǒng)封裝,蔣尚義將其命名為“先進(jìn)封裝”。

2011年,臺積電得到FPGA大廠賽靈思訂單,憑借CoWoS以及共同開發(fā)的硅通孔(TSV)等技術(shù),成功將4個28nm FPGA芯片拼接在一起,推出了史上最大的FPGA芯片。

然而,大部分客戶對CoWoS興致寥寥,賽靈思的訂單杯水車薪。

不是臺積電技術(shù)不夠好,實(shí)在是先進(jìn)封裝太貴了。

老客戶高通的高管在與蔣尚義共進(jìn)午餐時直白表示,CoWoS技術(shù)很好,但“我只愿意為它花費(fèi)1美分/平方毫米”,而臺積電當(dāng)時的售價是7美分/平方毫米[3]。

據(jù)說英偉達(dá)也是臺積電CoWoS的第一批目標(biāo)客戶之一,因?yàn)閿?shù)據(jù)傳輸?shù)钠款i一直是困擾GPU計(jì)算的核心問題。但聽到臺積電的報價后,英偉達(dá)當(dāng)場表示,老技術(shù)還能再湊合幾年[3]。

另一方面,先進(jìn)制程還在穩(wěn)步推進(jìn),先進(jìn)封裝的理念顯得過于超前,畢竟領(lǐng)導(dǎo)還在開卡羅拉,你就別急著換寶馬了。

因此,先進(jìn)封裝團(tuán)隊(duì)在臺積電內(nèi)部的一度邊緣化,甚至被當(dāng)做老干部療養(yǎng)院。后來跳槽三星的梁孟松,就認(rèn)為自己被調(diào)往先進(jìn)封裝業(yè)務(wù)屬于“下放”。

隨后,臺積電開始給CoWoS做減法,掏出了替代方案“InFO”,將昂貴的硅中介層換成其他材料,犧牲了連接密度,但成本大幅下降。

緊接著,臺積電遇到了可以靠一己之力改變供應(yīng)商命運(yùn)的超級甲方:蘋果。

2013年前后,由于與三星在手機(jī)市場的競爭,蘋果開始將芯片代工交由臺積電。


憑借InFO方案,臺積電在16nm工藝的基礎(chǔ)上,制造出了比三星14nm性能更強(qiáng)的A10處理器,貢獻(xiàn)了歷代iPhone中第二輕薄的iPhone 7[5]。

有了蘋果的大單的,臺積電的先進(jìn)封裝業(yè)務(wù)迅速盤活,并在2022年拿出了震驚業(yè)界的M1 Ultra芯片。2024年開年,這個攻堅(jiān)十多年的“膠水大法”,又被用在了英偉達(dá)的新核彈B200上。英偉達(dá)順勢拿下冠名權(quán),將這項(xiàng)技術(shù)命名為“NV-HBI”。

先進(jìn)封裝方案依然昂貴,但對今天的英偉達(dá)來說,成本兩個字怎么寫,他們可能已經(jīng)忘了。

尾聲

除了CoWoS,另一個被生成式AI帶火的技術(shù)HBM,其探索同樣可以追溯到十年前。

CoWoS拿到賽靈思的第一筆訂單時,蔣尚義大喜過望,但賽靈思的動機(jī)卻讓他有些哭笑不得:把四個老芯片拼在一起,直接當(dāng)成新產(chǎn)品加價賣,就不用自己開發(fā)新產(chǎn)品了[3]。

在美國計(jì)算機(jī)歷史博物館的采訪中,蔣尚義回憶道[3]: “我開發(fā)技術(shù)的初衷是解決性能瓶頸問題,在我看來,我的創(chuàng)新并沒有被用在好的地方”。

科技革命很難推動技術(shù)創(chuàng)新,反而是技術(shù)創(chuàng)新讓科技革命成為可能。創(chuàng)造歷史的人,永遠(yuǎn)無法預(yù)見自己在歷史進(jìn)程中的坐標(biāo)。

在我們不曾踏足的物理學(xué)的邊境,還有無數(shù)偉大的創(chuàng)新尚在不為人知的角落。

參考文章:

[1] NVIDIA Blackwell Architecture and B200/B100 Accelerators Announced: Going Bigger With Smaller Data,Anandtech

[2] 蘋果UltraFusion技術(shù),廈門云天半導(dǎo)體

[3] 蔣尚義萬字自述,披露臺積電的登頂之路,新芽

[4] 臺積電的先進(jìn)封裝是這樣煉成的,天下雜志

[5] 蘋果iPhone 7 A10處理器的新封裝在技術(shù)和商業(yè)上都產(chǎn)生了巨大的影響,Yole Development

[6] 蘋果M1 Ultra解密:業(yè)內(nèi)首個GPU裸片集成,如何實(shí)現(xiàn),集微網(wǎng)

[7] Apple Will Help TSMC to Be in the Leading Position in the Next Era,utmel

編輯:李墨天

視覺設(shè)計(jì):疏睿

責(zé)任編輯:李墨天

封面圖片來自ShotDeck

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
電磁炮+140垂發(fā)!川普官宣"特朗普級戰(zhàn)列艦",看圖后感嘆:太美了

電磁炮+140垂發(fā)!川普官宣"特朗普級戰(zhàn)列艦",看圖后感嘆:太美了

離離言幾許
2025-12-23 11:14:27
4個月關(guān)店11家!昔日超市一哥大潤發(fā)跌落神壇,到底敗在哪?

4個月關(guān)店11家!昔日超市一哥大潤發(fā)跌落神壇,到底敗在哪?

普覽
2025-12-23 18:51:53
奇葩親戚朋友的要求有多離譜?網(wǎng)友:這年頭還有想吃絕戶的

奇葩親戚朋友的要求有多離譜?網(wǎng)友:這年頭還有想吃絕戶的

解讀熱點(diǎn)事件
2025-12-21 00:05:08
410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

深度報
2025-12-14 22:36:54
24GB+1TB!新機(jī)曝光:搭載驍龍8 Gen5+2億潛望長焦!

24GB+1TB!新機(jī)曝光:搭載驍龍8 Gen5+2億潛望長焦!

科技堡壘
2025-12-23 11:31:08
向太太敢說了!向華強(qiáng)今年已經(jīng)78了,但是她和向華強(qiáng)還有X生活!

向太太敢說了!向華強(qiáng)今年已經(jīng)78了,但是她和向華強(qiáng)還有X生活!

小娛樂悠悠
2025-12-23 14:57:09
又冷又凍的冬天,東北人過得老帶派了

又冷又凍的冬天,東北人過得老帶派了

新周刊
2025-12-24 09:11:03
南博很可能是背鍋的?前院長曾昭燏日記未提1961年鑒定

南博很可能是背鍋的?前院長曾昭燏日記未提1961年鑒定

數(shù)字財(cái)經(jīng)智庫
2025-12-22 12:23:22
恭喜國乒3人!入圍2025十大運(yùn)動員,王楚欽孫穎莎落選,理由如下

恭喜國乒3人!入圍2025十大運(yùn)動員,王楚欽孫穎莎落選,理由如下

運(yùn)動探索
2025-12-25 09:24:17
火箭真明智!查出靜脈血栓,無限期休戰(zhàn),還好交易了他

火箭真明智!查出靜脈血栓,無限期休戰(zhàn),還好交易了他

籃球看比賽
2025-12-25 10:54:27
平安夜沒有停火,特朗普計(jì)劃失敗,烏克蘭的信仰之光不會被撲滅

平安夜沒有?;?,特朗普計(jì)劃失敗,烏克蘭的信仰之光不會被撲滅

山河路口
2025-12-24 13:57:53
陪睡陪玩只是冰山一角!萬達(dá)蒸發(fā)800億后,王思聰再次傳出大丑聞

陪睡陪玩只是冰山一角!萬達(dá)蒸發(fā)800億后,王思聰再次傳出大丑聞

說歷史的老牢
2025-12-24 11:43:36
緬北女魔頭魏榕:用“珍珠奶茶”折磨女孩,她的惡毒遠(yuǎn)超你想象

緬北女魔頭魏榕:用“珍珠奶茶”折磨女孩,她的惡毒遠(yuǎn)超你想象

就一點(diǎn)
2025-07-27 13:38:01
《江南春》驚天逆轉(zhuǎn):國企接盤偽作,神秘買家朱光是誰?

《江南春》驚天逆轉(zhuǎn):國企接盤偽作,神秘買家朱光是誰?

銜春信
2025-12-25 05:42:47
中國軍隊(duì)回撤時越軍為何不追擊?越南少將阮德輝回憶:并非不敢打

中國軍隊(duì)回撤時越軍為何不追擊?越南少將阮德輝回憶:并非不敢打

古書記史
2025-12-22 19:50:50
乒乓球選手不滿獎金:世界羽聯(lián)獎金是24萬美元,WTT只有8萬

乒乓球選手不滿獎金:世界羽聯(lián)獎金是24萬美元,WTT只有8萬

懂球帝
2025-12-24 12:26:29
3億多的榮耀OPPO被偷?京東倉庫遭洗劫,內(nèi)部員工爆料:早有預(yù)謀

3億多的榮耀OPPO被偷?京東倉庫遭洗劫,內(nèi)部員工爆料:早有預(yù)謀

烏娛子醬
2025-12-24 14:59:27
胡錫進(jìn):《江南春》等幾幅流向市場的書畫應(yīng)該歸還給龐家

胡錫進(jìn):《江南春》等幾幅流向市場的書畫應(yīng)該歸還給龐家

映射生活的身影
2025-12-24 20:07:27
新任公安局長探訪民情,在自家飯店吃飯被“所長小舅子”掀了桌子

新任公安局長探訪民情,在自家飯店吃飯被“所長小舅子”掀了桌子

卡西莫多的故事
2025-12-19 11:15:00
你最意外的一筆收入咋來的?網(wǎng)友:扶了個老太太,喜提負(fù)二十萬

你最意外的一筆收入咋來的?網(wǎng)友:扶了個老太太,喜提負(fù)二十萬

解讀熱點(diǎn)事件
2025-12-23 00:05:06
2025-12-25 11:31:01
遠(yuǎn)川科技評論 incentive-icons
遠(yuǎn)川科技評論
用投資視角,扒巨頭秘史
371文章數(shù) 2279關(guān)注度
往期回顧 全部

數(shù)碼要聞

華為WATCH十周年款開售 航天級鈦合金機(jī)身 2799起

頭條要聞

媒體:靖國神社強(qiáng)塞韓軍人牌位 韓國如何清算是個看點(diǎn)

頭條要聞

媒體:靖國神社強(qiáng)塞韓軍人牌位 韓國如何清算是個看點(diǎn)

體育要聞

26歲廣西球王,在質(zhì)疑聲中成為本土得分王

娛樂要聞

金莎被小19歲男友求婚,成功后擁抱親吻

財(cái)經(jīng)要聞

美國未來18個月不對中國芯片加額外關(guān)稅

科技要聞

屠龍少年被"招安"!英偉達(dá)平安夜豪擲200億

汽車要聞

預(yù)售31.3萬元起 全新奧迪Q5L將于1月內(nèi)上市

態(tài)度原創(chuàng)

藝術(shù)
家居
數(shù)碼
時尚
本地

藝術(shù)要聞

何鏡堂院士新巨作!砸5億,江西“頭號工程”藏著什么硬核科技?

家居要聞

經(jīng)典彌新 品味浪漫居所

數(shù)碼要聞

1799元起!華為MatePad 11.5正式開售 主打護(hù)眼學(xué)習(xí)

對不起周柯宇,是陳靖可先來的

本地新聞

云游安徽|一川江水潤安慶,一塔一戲一城史

無障礙瀏覽 進(jìn)入關(guān)懷版