国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

SemiAnalysis GTC深度解讀:三款新系統(tǒng)背后,英偉達(dá)正在重新定義AI基礎(chǔ)設(shè)施的邊界

0
分享至

在GTC 2026大會上,英偉達(dá)一口氣推出三款全新系統(tǒng)——Groq LPX推理機(jī)架、Vera ETL256 CPU機(jī)架與STX存儲參考架構(gòu),將其產(chǎn)品版圖從GPU算力核心向低延遲推理、CPU編排與存儲層全面延伸,標(biāo)志著英偉達(dá)正系統(tǒng)性地重構(gòu)AI基礎(chǔ)設(shè)施的定義邊界。

其中最受市場關(guān)注的是Groq LPX系統(tǒng)。這是英偉達(dá)以200億美元完成對Groq知識產(chǎn)權(quán)授權(quán)與核心團(tuán)隊(duì)引進(jìn)后,不到四個月內(nèi)推出的首款產(chǎn)品化成果。

LPX機(jī)架將Groq的LP30芯片與英偉達(dá)GPU深度整合,并引入"注意力與前饋網(wǎng)絡(luò)解耦"(Attention FFN Disaggregation,下稱AFD)技術(shù),在高交互推理場景中針對性地壓縮解碼延遲,為大規(guī)模推理系統(tǒng)開辟了此前不存在的優(yōu)化路徑。

與此同時,Vera ETL256將256顆CPU塞入單一液冷機(jī)架,以銅纜拓?fù)鋵?shí)現(xiàn)機(jī)架內(nèi)全互聯(lián),直接瞄準(zhǔn)隨AI規(guī)模擴(kuò)張而日益凸顯的CPU供給瓶頸;STX則通過標(biāo)準(zhǔn)化存儲參考架構(gòu),將英偉達(dá)的掌控范圍從算力層和網(wǎng)絡(luò)層正式延伸至存儲基礎(chǔ)設(shè)施層。

SemiAnalysis認(rèn)為,三款系統(tǒng)共同指向同一個戰(zhàn)略信號:英偉達(dá)不再僅僅是GPU供應(yīng)商,而是在向全棧AI基礎(chǔ)設(shè)施平臺商演進(jìn),其觸角已覆蓋推理優(yōu)化、CPU密度、存儲編排等此前由其他廠商主導(dǎo)的領(lǐng)域,這將深刻影響整個AI硬件供應(yīng)鏈的競爭格局。

LPX與LP30:Groq架構(gòu)正式融入英偉達(dá)推理?xiàng)?/strong>

英偉達(dá)與Groq之間的交易在結(jié)構(gòu)上被設(shè)計為知識產(chǎn)權(quán)授權(quán)與人才引進(jìn),而非傳統(tǒng)并購。英偉達(dá)由此幾乎即時獲得了Groq的全部IP和核心團(tuán)隊(duì),并在不到四個月內(nèi)推出基于Groq第三代LPU架構(gòu)的LP30芯片與LPX機(jī)架系統(tǒng)。

LP30采用三星SF4工藝,配備500MB片上SRAM,F(xiàn)P8精度下算力為1.2 PFLOPS,相較于Groq第一代LPU(230MB SRAM,750 TFLOPS INT8)實(shí)現(xiàn)了大幅提升,性能增長主要由制程節(jié)點(diǎn)從GF16遷移至SF4驅(qū)動。

LP30以單一整體裸片形式存在,無需先進(jìn)封裝。值得關(guān)注的是,SF4工藝不擠占英偉達(dá)在臺積電N3上的稀缺產(chǎn)能配額,也不消耗同樣緊張的HBM資源,因此LPX系統(tǒng)代表的是真正意義上的增量產(chǎn)能與增量收入,據(jù)SemiAnalysis指出,這是競爭對手無法復(fù)制的差異化優(yōu)勢。

LPU的核心價值與天然局限

LPU架構(gòu)的競爭優(yōu)勢在于高帶寬SRAM與確定性流水線執(zhí)行機(jī)制,這使其在單用戶低延遲場景下具備GPU難以企及的首token生成速度。然而,高密度SRAM的代價是容量受限——權(quán)重加載后所剩空間極為有限,隨批量增大KV Cache迅速飽和,整體吞吐量顯著弱于GPU。

據(jù)SemiAnalysis分析,獨(dú)立部署的LPU系統(tǒng)在大規(guī)模token服務(wù)上并不經(jīng)濟(jì),但在對延遲極度敏感的場景中可獲取可觀的溢價,這正是LPU在解耦解碼系統(tǒng)中的定位基礎(chǔ)。


AFD技術(shù):GPU與LPU的角色分工

AFD技術(shù)將大模型推理中的注意力計算(Attention)與前饋網(wǎng)絡(luò)計算(FFN)拆分至不同硬件。注意力計算因涉及動態(tài)KV Cache加載,天然適合GPU處理;FFN計算因其無狀態(tài)、可靜態(tài)調(diào)度的特性,與LPU確定性架構(gòu)高度契合。

在這一框架下,GPU專注處理注意力計算,HBM容量得以充分釋放用于KV Cache,提升系統(tǒng)可并發(fā)處理的token總量;LPU則承擔(dān)FFN計算,發(fā)揮其低延遲優(yōu)勢。GPU與LPU之間通過All-to-All集合通信完成token的分發(fā)與匯聚,并以乒乓流水線方式隱藏通信延遲。

此外,LPU也可在投機(jī)解碼(Speculative Decoding)框架中發(fā)揮作用,將草稿模型或多token預(yù)測(MTP)層部署至LPU,進(jìn)一步降低單次解碼步驟的延遲開銷,通??蓪⒚看谓獯a步驟的輸出token數(shù)提升至1.5至2倍。


LPX機(jī)架架構(gòu)

LPX機(jī)架由32個1U LPU計算托盤與2臺Spectrum-X交換機(jī)構(gòu)成。每個計算托盤搭載16塊LP30、2塊Altera FPGA(英偉達(dá)稱之為"Fabric Expansion Logic")、1顆Intel Granite Rapids主機(jī)CPU及1塊BlueField-4前端模塊。

FPGA在系統(tǒng)中承擔(dān)多重關(guān)鍵職能:將LPU的C2C協(xié)議轉(zhuǎn)換為以太網(wǎng)以接入Spectrum-X規(guī)模擴(kuò)展網(wǎng)絡(luò),提供LPU與主機(jī)CPU之間的PCIe橋接,并為系統(tǒng)提供每塊最高256GB的DDR5擴(kuò)展內(nèi)存用于KV Cache存儲。整個機(jī)架的規(guī)模擴(kuò)展帶寬總計約640TB/s。

LPU模塊以"腹對腹"方式安裝于PCB板兩側(cè),上下各8塊,旨在縮短全互聯(lián)網(wǎng)格所需的X和Y方向走線長度。節(jié)點(diǎn)內(nèi)16塊LPU以全互聯(lián)Mesh拓?fù)湎噙B,節(jié)點(diǎn)間通過銅纜背板互聯(lián),跨機(jī)架連接則通過前面板OSFP接口實(shí)現(xiàn)。


Vera ETL256:256顆CPU的密度極限

隨著AI工作負(fù)載對數(shù)據(jù)預(yù)處理、調(diào)度編排和強(qiáng)化學(xué)習(xí)驗(yàn)證的需求持續(xù)攀升,CPU正成為制約GPU利用率的新瓶頸。強(qiáng)化學(xué)習(xí)場景尤為突出——CPU需要并行運(yùn)行仿真環(huán)境、執(zhí)行代碼并對輸出進(jìn)行驗(yàn)證。GPU規(guī)模的擴(kuò)張速度遠(yuǎn)超CPU,使得維持GPU滿載所需的CPU集群規(guī)模不斷擴(kuò)大。

英偉達(dá)的應(yīng)對方案是Vera ETL256,將256顆Vera CPU集成于單一機(jī)架,依賴液冷實(shí)現(xiàn)這一密度目標(biāo)。

該系統(tǒng)的設(shè)計邏輯與NVL計算機(jī)架一脈相承:將算力密度提升至銅纜可覆蓋機(jī)架內(nèi)全部連接的臨界點(diǎn),從而在主干網(wǎng)絡(luò)層面完全消除光收發(fā)器的需求。銅纜帶來的成本節(jié)約,足以抵消液冷引入的額外開銷。

具體而言,Vera ETL機(jī)架由32個計算托盤構(gòu)成,上下各16個,以4個1U MGX ETL交換托盤(基于Spectrum-6)為中軸對稱排列。這種對稱布局刻意壓縮各計算托盤與主干交換托盤之間的線纜長度差異,確保全部連接均處于銅纜可達(dá)范圍內(nèi)。

每個交換托盤的后向端口負(fù)責(zé)機(jī)架內(nèi)銅纜主干通信,32個前向OSFP接口則提供與POD其余節(jié)點(diǎn)的光纖連接。機(jī)架內(nèi)網(wǎng)絡(luò)采用Spectrum-X多平面拓?fù)洌瑢?00 Gb/s通道分布至四臺交換機(jī),在單一網(wǎng)絡(luò)層內(nèi)實(shí)現(xiàn)256顆CPU的全互聯(lián)以太網(wǎng)連接,每個計算托盤承載8顆Vera CPU。


STX:英偉達(dá)向存儲層的系統(tǒng)性延伸

STX是英偉達(dá)在GTC 2026發(fā)布的存儲參考機(jī)架架構(gòu),與此前推出的CMX上下文存儲平臺配套,共同構(gòu)成英偉達(dá)向存儲基礎(chǔ)設(shè)施層滲透的完整布局。

STX在CMX基礎(chǔ)上進(jìn)一步建立參考架構(gòu),精確規(guī)定一個集群中需要配置多少磁盤驅(qū)動器、Vera CPU、BF-4 DPU、CX-9網(wǎng)卡和Spectrum-X交換機(jī)。

每個STX機(jī)箱內(nèi)含2個BF-4單元,合計2顆Vera CPU、4塊CX-9網(wǎng)卡和4個SOCAMM模塊;整個STX機(jī)架共16個機(jī)箱,對應(yīng)32顆Vera CPU、64塊CX-9網(wǎng)卡和64個SOCAMM。

英偉達(dá)在發(fā)布STX的同時罕見地點(diǎn)名一批主要存儲廠商——包括DDN、Dell Technologies、HPE、IBM、NetApp、Supermicro及VAST Data等——表示上述廠商均將支持STX標(biāo)準(zhǔn),延續(xù)了英偉達(dá)以行業(yè)背書強(qiáng)化參考架構(gòu)話語權(quán)的一貫做法。


據(jù)SemiAnalysis分析,BlueField-4、CMX與STX的組合,代表英偉達(dá)在完成算力層(GPU)與網(wǎng)絡(luò)層(Spectrum-X及NVLink)的主導(dǎo)地位之后,正在系統(tǒng)性地向存儲層、軟件層和基礎(chǔ)設(shè)施運(yùn)營層推進(jìn)。

三款新系統(tǒng)合力拓寬了英偉達(dá)的產(chǎn)品護(hù)城河,也意味著AI基礎(chǔ)設(shè)施供應(yīng)鏈中更大比例的市場份額將持續(xù)向英偉達(dá)集中。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
張雪峰離世不到48小時,治喪組曝光追悼會內(nèi)幕,女兒成了“心病”

張雪峰離世不到48小時,治喪組曝光追悼會內(nèi)幕,女兒成了“心病”

丁丁鯉史紀(jì)
2026-03-26 14:49:19
西甲希望之星杯:巴薩5-0上海海港,皇馬4球大勝維達(dá)德

西甲希望之星杯:巴薩5-0上海海港,皇馬4球大勝維達(dá)德

懂球帝
2026-03-26 14:33:09
丞相是丞相,宰相是宰相,兩者一字之差卻天壤之別,可別分不清楚

丞相是丞相,宰相是宰相,兩者一字之差卻天壤之別,可別分不清楚

觀史搜尋著
2026-03-26 01:10:50
安徽一縣2名干部同日被查!多名干部被通報

安徽一縣2名干部同日被查!多名干部被通報

鳳凰網(wǎng)安徽
2026-03-26 18:33:54
撿漏成功!廣州市一棟三層別墅拍賣,被人撿漏170.6萬就競得,還要啥套間

撿漏成功!廣州市一棟三層別墅拍賣,被人撿漏170.6萬就競得,還要啥套間

阿離家居
2026-03-26 16:52:37
伊朗獲得強(qiáng)援,又一中東國家下場,還是美國親自送上門的幫手

伊朗獲得強(qiáng)援,又一中東國家下場,還是美國親自送上門的幫手

快看張同學(xué)
2026-03-26 14:46:05
瘋狂!狂轟59+10+5,場均31.8分+歷史得分王,竟然打不了NBA

瘋狂!狂轟59+10+5,場均31.8分+歷史得分王,竟然打不了NBA

球童無忌
2026-03-26 11:10:26
布朗31分8板8助凱爾特人終結(jié)雷霆12連勝,亞歷山大33分8助攻

布朗31分8板8助凱爾特人終結(jié)雷霆12連勝,亞歷山大33分8助攻

湖人崛起
2026-03-26 10:00:59
蘇敏旅游6年后簡直不敢認(rèn),連面相都變了,網(wǎng)友:這16萬花得值

蘇敏旅游6年后簡直不敢認(rèn),連面相都變了,網(wǎng)友:這16萬花得值

小樾說歷史
2026-03-25 15:06:05
伊朗的第一次回球:以攻代守,極限反拉

伊朗的第一次回球:以攻代守,極限反拉

西樓飲月
2026-03-26 21:28:25
烏克蘭的陽謀:特朗普解除對俄制裁,烏克蘭對俄施加制裁

烏克蘭的陽謀:特朗普解除對俄制裁,烏克蘭對俄施加制裁

山河路口
2026-03-26 18:36:03
唱衰國安新援!揭經(jīng)紀(jì)公司勾結(jié)媒體人黑幕:85萬引援動了誰的奶酪

唱衰國安新援!揭經(jīng)紀(jì)公司勾結(jié)媒體人黑幕:85萬引援動了誰的奶酪

體壇鑒春秋
2026-03-26 18:17:46
中國公布喜訊

中國公布喜訊

楊興文
2026-03-26 21:08:26
隨著北控7分惜敗同曦!青島2分絕殺廣州,CBA積分榜大變

隨著北控7分惜敗同曦!青島2分絕殺廣州,CBA積分榜大變

老吳說體育
2026-03-26 21:47:19
內(nèi)馬爾落選大名單,羅馬里奧:安帥最好小心點(diǎn),巴西不能沒他

內(nèi)馬爾落選大名單,羅馬里奧:安帥最好小心點(diǎn),巴西不能沒他

懂球帝
2026-03-25 22:26:05
玄學(xué)提醒:為什么家里要放石頭?不是裝點(diǎn)門面,是鎮(zhèn)宅的!

玄學(xué)提醒:為什么家里要放石頭?不是裝點(diǎn)門面,是鎮(zhèn)宅的!

手工制作阿愛
2026-03-21 18:51:48
一瓶3塊,爆賣2億!喝一口能把人送走的廣東神飲,讓老表們瘋搶了

一瓶3塊,爆賣2億!喝一口能把人送走的廣東神飲,讓老表們瘋搶了

毒sir財經(jīng)
2026-03-16 21:37:01
今年首次超10米!中國第一大淡水湖水位大漲:修建水利有何好處?

今年首次超10米!中國第一大淡水湖水位大漲:修建水利有何好處?

阿鳧愛吐槽
2026-03-26 15:54:03
華山醫(yī)院候診屏現(xiàn)“照顧號”引熱議,院方:為75歲以上老人等優(yōu)待群體提供便利

華山醫(yī)院候診屏現(xiàn)“照顧號”引熱議,院方:為75歲以上老人等優(yōu)待群體提供便利

上游新聞
2026-03-26 15:33:08
奇瑞回應(yīng)48%熱效率爭議,順帶下戰(zhàn)書:定會做成,油耗低至1L

奇瑞回應(yīng)48%熱效率爭議,順帶下戰(zhàn)書:定會做成,油耗低至1L

明鏡pro
2026-03-26 09:22:44
2026-03-26 22:19:00
華爾街見聞官方 incentive-icons
華爾街見聞官方
中國領(lǐng)先的金融商業(yè)信息提供商
143584文章數(shù) 2653028關(guān)注度
往期回顧 全部

科技要聞

Meta高管狂分百億期權(quán),700名員工卻下崗

頭條要聞

美國總統(tǒng)特朗普公開宣布訪華行程 外交部回應(yīng)

頭條要聞

美國總統(tǒng)特朗普公開宣布訪華行程 外交部回應(yīng)

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財經(jīng)要聞

油價"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

藝術(shù)
親子
旅游
教育
公開課

藝術(shù)要聞

哪一座橋不是風(fēng)景?

親子要聞

你好,我是饅頭,快開門!

旅游要聞

別再人擠人,泰州的這條老街,傳承1200年!

教育要聞

江蘇省教育廳公布全省中小學(xué)生競賽活動名單

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版