国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

英偉達的“神秘芯片”背后--推理時代開啟“四大算力新趨勢”

0
分享至

英偉達整合LPU(語言處理單元)技術、OpenAI多線押注推理芯片,正在將AI算力競爭的主戰(zhàn)場從訓練切換至推理。申萬宏源研究認為,2026年算力產(chǎn)業(yè)的核心關鍵詞將是推理,Token消耗總量與技術范式均將圍繞這一主題深度重構。

2月28日,據(jù)《華爾街日報》報道,英偉達計劃在下月的GTC開發(fā)者大會上發(fā)布一款整合了Groq“語言處理單元”(LPU)技術的全新推理芯片,英偉達首席執(zhí)行官黃仁勛稱其為“世界從未見過”的全新系統(tǒng)。OpenAI已同意成為該處理器的最大客戶之一,并將向英偉達購買大規(guī)?!皩S猛评懋a(chǎn)能”。

與此同時,OpenAI上月還與初創(chuàng)公司Cerebras達成數(shù)十億美元計算合作,后者稱其推理芯片速度已超越英偉達GPU(圖形處理器)。這一系列動向表明,AI巨頭正在從訓練算力的軍備競賽,轉向推理算力的多線布局。

申萬宏源報告指出,Token經(jīng)濟時代,推理算力正迎來四大趨勢:一是純CPU(中央處理器)部署場景增多,低成本推理需求加速算力下沉;二是LPU等專用架構崛起,挑戰(zhàn)GPU在推理環(huán)節(jié)的主導地位;三是國產(chǎn)算力芯片加速突破,供應鏈多元化趨勢明確;四是推理算力的需求結構從“單次訓練”向“海量Token消耗”轉變,性價比成為核心競爭要素。

報告表示,能夠提供充足、高性價比推理芯片的廠商將最為受益,而CPU、LPU及國產(chǎn)芯片的共同突破,正構成這一輪算力格局重塑的核心線索。

推理需求全面爆發(fā),Token消耗創(chuàng)歷史新高

申萬宏源研究認為,需求持續(xù)擴張的背后是兩大結構性驅動力:一是大模型貨幣化加速,Claude等模型開始向應用端切入,發(fā)布多款行業(yè)插件;二是Agent落地提速,openclaw、千問Agent等產(chǎn)品標志著Agent正進入真實的工作與生產(chǎn)場景,而每一次模型調用和Agent任務執(zhí)行,背后均需大量推理算力支撐。

申萬宏源研究援引數(shù)據(jù)顯示,春節(jié)期間國內頭部大模型推理量大幅增長:豆包除夕當天推理吞吐量達633億tokens,元寶月活躍用戶達1.14億,千問“春節(jié)大免單”活動參與人數(shù)超1.2億。

全球AI模型API聚合平臺OpenRouter的數(shù)據(jù)進一步揭示了這一趨勢的量級。2月9日至15日當周,中國模型以4.12萬億Token的調用量首次超過美國模型的2.94萬億Token;16日至22日當周,中國模型調用量進一步?jīng)_高至5.16萬億Token,三周大漲127%,全球調用量前五的模型中中國占據(jù)四席。


LPU成新貴,訓練與推理芯片走向分化

英偉達斥資200億美元獲取Groq核心技術許可,并在“核心聘用”交易中吸納了包括創(chuàng)始人Jonathan Ross在內的高管團隊。申萬宏源研究認為,這一交易標志著純推理芯片的重要性已獲得頂級玩家的正式認可。

LPU與傳統(tǒng)GPU的架構差異,正是其在推理場景中具備效率優(yōu)勢的根本原因。AI推理分為預填充和解碼兩個階段,大型模型的解碼過程尤其緩慢,而LPU針對延遲和內存帶寬這兩大推理瓶頸進行了專項優(yōu)化。據(jù)華爾街見聞此前報道,英偉達即將發(fā)布的新品可能涉及下一代Feynman架構,或采用更廣泛的SRAM集成方案,甚至通過3D堆疊技術將LPU深度整合其中。

申萬宏源研究據(jù)此判斷,未來AI芯片將形成明確的技術分工格局:訓練端繼續(xù)沿用GPU-HBM組合,推理端則演進為ASIC+LPU-SRAM+SSD的組合方案。隨著算力需求從訓練向推理切換,專注推理芯片的廠商將迎來發(fā)展機遇。

推理系統(tǒng)全面革新,CPU與網(wǎng)絡需求同步提升

從單一芯片到系統(tǒng)層面的革新,是本輪推理算力升級的另一重要維度。申萬宏源研究指出,隨著應用場景從chatbot轉向Agent,算力系統(tǒng)對延遲、吞吐與思考深度的要求同時提升,推動系統(tǒng)架構向三層網(wǎng)絡演進。

第一層為快反應層,由搭載SRAM的純推理芯片提供極致低延遲反饋;第二層為慢思考層,使用超大吞吐算力集群負責復雜邏輯推演,多核多線程CPU在此層的需求將顯著增加;第三層為記憶層,對應英偉達發(fā)布的ContextMemory System,通過Bluefield4 DPU管理的SSD存儲Agent的長期記憶與KV Cache。

英偉達在硬件層面也在調整策略。此前將Vera CPU與Rubin GPU捆綁部署的標準做法,在特定AI智能體工作負載下被證明成本過高。英偉達本月宣布擴大與Meta Platforms的合作,完成首次大規(guī)模純CPU部署,以支持Meta的廣告定向AI智能體,標志著公司正超越單一GPU銷售模式。


國產(chǎn)算力加速突破

申萬宏源研究認為,國產(chǎn)推理芯片的技術升級值得重點關注,且存在市場預期差。

在技術層面,新一代國產(chǎn)推理芯片實現(xiàn)了多項根本性提升:新增支持FP8/MXFP8/MXFP4等低精度數(shù)據(jù)格式,算力分別達到1P和2P;大幅提升向量算力,采用支持SIMD/SIMT雙編程模型的新同構設計;互聯(lián)帶寬相比前代提升2.5倍,達到2TB/s。

尤為值得關注的是,芯片層面實現(xiàn)了PD分離:通過自研兩種不同規(guī)格的HBM,分別構成面向Prefill和推薦場景的PR版本,以及面向Decode和訓練場景的DT版本。其中PR版本采用低成本HBM,可大幅降低推理Prefill階段的投資成本,預計于2026年Q1推出。

供應鏈層面,國產(chǎn)封測廠商的進展提供了佐證。根據(jù)某頭部封測企業(yè)首輪問詢答復函,其2.5D封裝業(yè)務收入主要來自高性能計算芯片封裝服務,該項收入從2022年的0.5億元快速增長至2024年的18.2億元,側面印證國產(chǎn)算力芯片供給能力持續(xù)提升,供應鏈國產(chǎn)化進程加快。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
白敬亭和宋軼的瓜,有點炸

白敬亭和宋軼的瓜,有點炸

背包旅行
2026-03-01 15:06:07
人不會無緣無故患糖尿??!研究發(fā)現(xiàn):得糖尿病的人,離不開這5點

人不會無緣無故患糖尿病!研究發(fā)現(xiàn):得糖尿病的人,離不開這5點

醫(yī)學原創(chuàng)故事會
2026-02-21 23:54:05
真當中國不敢動手?中方向全世界宣布一件大事:退出1900億大項目

真當中國不敢動手?中方向全世界宣布一件大事:退出1900億大項目

科普100克克
2025-12-30 00:14:37
朱婷加比相撞,緊急送醫(yī)治療,檢查結果出爐

朱婷加比相撞,緊急送醫(yī)治療,檢查結果出爐

跑者排球視角
2026-03-02 23:29:37
我見過最傻的父母,攥著大把的存款和退休金,卻等著給子女當遺產(chǎn)

我見過最傻的父母,攥著大把的存款和退休金,卻等著給子女當遺產(chǎn)

i書與房
2026-02-25 17:22:34
國家安全部:NFC可能成為信息泄露乃至危害國家安全的渠道

國家安全部:NFC可能成為信息泄露乃至危害國家安全的渠道

上觀新聞
2026-02-02 07:09:04
跌回一年前!恒生科技回撤23%變“老登科技”?港股跌到位了嗎?

跌回一年前!恒生科技回撤23%變“老登科技”?港股跌到位了嗎?

每日經(jīng)濟新聞
2026-03-02 19:14:36
臺專家預言美以伊開戰(zhàn)中國將獲20年戰(zhàn)略緩沖期

臺專家預言美以伊開戰(zhàn)中國將獲20年戰(zhàn)略緩沖期

樂享人生風雨
2026-03-03 02:53:53
這就是命?。「鐐惐葋喴患?口出去玩,中途兒子內急下車如廁

這就是命啊!哥倫比亞一家4口出去玩,中途兒子內急下車如廁

忠于法紀
2025-12-28 20:35:41
所有AI全軍覆沒!學者出2500道題,GPT-5得分25.3%,GPT-4o 2.7%

所有AI全軍覆沒!學者出2500道題,GPT-5得分25.3%,GPT-4o 2.7%

DeepTech深科技
2026-03-01 17:25:27
去年漲價3次,今年突然集體降價!多個品牌陸續(xù)宣布,網(wǎng)友:再等等,還會降

去年漲價3次,今年突然集體降價!多個品牌陸續(xù)宣布,網(wǎng)友:再等等,還會降

佛山電視臺小強熱線
2026-03-02 19:30:36
因加速、倒放宣傳視頻引發(fā)爭議 兩家鴻蒙智行用戶中心公開致歉

因加速、倒放宣傳視頻引發(fā)爭議 兩家鴻蒙智行用戶中心公開致歉

中國能源網(wǎng)
2026-03-02 11:47:11
繞道阿曼!迪拜機場關閉后,滯留游客曲線回國:轉機3次,耗時四五十個小時

繞道阿曼!迪拜機場關閉后,滯留游客曲線回國:轉機3次,耗時四五十個小時

每日經(jīng)濟新聞
2026-03-02 18:10:27
560名美軍傷亡,林肯號挨炸,美國爆發(fā)游行,特朗普算錯一件事!

560名美軍傷亡,林肯號挨炸,美國爆發(fā)游行,特朗普算錯一件事!

欽點歷史
2026-03-02 13:53:29
王楚欽擊敗林昀儒奪冠,賽后居然對王皓吐槽,說了三個字讓人心疼

王楚欽擊敗林昀儒奪冠,賽后居然對王皓吐槽,說了三個字讓人心疼

胡一舸南游y
2026-03-02 19:15:45
中國外貿商在伊朗戰(zhàn)火中的48小時:貨在倉庫,客戶失聯(lián)了

中國外貿商在伊朗戰(zhàn)火中的48小時:貨在倉庫,客戶失聯(lián)了

鳳凰網(wǎng)財經(jīng)
2026-03-02 21:18:50
美經(jīng)濟學家:美國出現(xiàn)了嚴重戰(zhàn)略誤判,壓根沒料到中國會這么強大

美經(jīng)濟學家:美國出現(xiàn)了嚴重戰(zhàn)略誤判,壓根沒料到中國會這么強大

樂天閑聊
2025-12-01 10:29:34
烏稱精準襲擊俄一港口軍事及石油設施;澤連斯基:烏美俄三方會談能否如期舉行尚未確認

烏稱精準襲擊俄一港口軍事及石油設施;澤連斯基:烏美俄三方會談能否如期舉行尚未確認

起喜電影
2026-03-03 01:21:24
中國人月薪過萬很普遍了嗎?網(wǎng)友:據(jù)說沿?;旧隙歼^萬哦

中國人月薪過萬很普遍了嗎?網(wǎng)友:據(jù)說沿?;旧隙歼^萬哦

帶你感受人間冷暖
2026-03-01 04:35:13
老了才明白:父母一旦超過77,立刻停止幾種行為,要注意

老了才明白:父母一旦超過77,立刻停止幾種行為,要注意

荊醫(yī)生科普
2026-03-02 19:20:08
2026-03-03 03:48:49
華爾街見聞官方 incentive-icons
華爾街見聞官方
中國領先的金融商業(yè)信息提供商
142337文章數(shù) 2652709關注度
往期回顧 全部

科技要聞

蘋果中國官網(wǎng)上線iPhone 17e,4499元起

頭條要聞

特朗普:對伊朗打擊或持續(xù)4至5周 已擊沉其10艘艦艇

頭條要聞

特朗普:對伊朗打擊或持續(xù)4至5周 已擊沉其10艘艦艇

體育要聞

“想要我簽名嗎” 梅西逆轉后嘲諷對手主帥

娛樂要聞

李亞鵬與哥哥和解 只有一條真心話短信

財經(jīng)要聞

油價飆升 美伊沖突將如何攪動全球經(jīng)濟

汽車要聞

國民SUV再添一員 瑞虎7L靜態(tài)體驗

態(tài)度原創(chuàng)

游戲
本地
教育
藝術
公開課

外媒給《寶可夢》新作60分:不夠有趣的縫合怪

本地新聞

津南好·四時總相宜

教育要聞

3月13日截止!山東綜評云平臺填寫教程!有視頻!

藝術要聞

這四位老人的花鳥畫,竟讓人欲罷不能!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版