国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

統(tǒng)治 AI 十年的英偉達(dá),要被谷歌NPU 掀桌子了?

0
分享至

作者 | 硅基象限 張思

過去十年,AI算力的敘事幾乎被一家公司定義——NVIDIA(英偉達(dá))。

從A100到H100,再到H200,GPU像一條不斷擴(kuò)展的算力工業(yè)流水線,把深度學(xué)習(xí)從實(shí)驗(yàn)室推向大模型時(shí)代。

但一個(gè)被長期忽視的問題是:GPU最初并不是為AI而生,是為圖形渲染而生。

這意味著它從一開始就是"通用并行計(jì)算架構(gòu)",而不是"AI原生架構(gòu)"。

于是,一個(gè)更底層的趨勢(shì)開始出現(xiàn):

當(dāng)AI計(jì)算規(guī)模指數(shù)級(jí)增長時(shí),GPU的邊際效率開始下降。

產(chǎn)業(yè)開始向另一個(gè)方向轉(zhuǎn)型,重新設(shè)計(jì)計(jì)算范式,一種依靠專用計(jì)算芯片設(shè)計(jì)邏輯(ASIC)的算力芯片——NPU誕生了!

美國時(shí)間4月22日,在Google Cloud Next活動(dòng)上,谷歌推出兩款第八代NPU芯片,TPU8t、TPU8i分別用于AI訓(xùn)練和AI推理。TPU8t每瓦性能上比前代產(chǎn)品提升124%,TPU8i提升117% ,TPU8i的每美元性能提升80%。業(yè)內(nèi)評(píng)論,"其如果對(duì)外出售,或?qū)⑷〈ミ_(dá)"。

云服務(wù)廠搞芯片,并非是谷歌的獨(dú)特路線。

全球云服務(wù)市場(chǎng)的"老大"亞馬遜,在2018年發(fā)布首款用于推理的 NPU—Inferentia1,并在2023年推出了第二代Inferentia2,并在去年底發(fā)布用于訓(xùn)練的NPU,Trainium3;排名第二的微軟云也在2023年發(fā)布了首款云端NPU(Maia 100),并在今年初發(fā)布了Maia 200。

國內(nèi)亦如此。阿里在2019年發(fā)布首款NPU(含光800),專注云端推理和視覺計(jì)算;2018 年開始百度發(fā)布基于ASIC邏輯的自研AI芯片昆侖1,并已迭代至昆侖芯3代。

2026年,算力芯片的大客戶,字節(jié)跳動(dòng)也將對(duì)NPU下手。外媒透露字節(jié)跳動(dòng)已開始與三星洽談自研NPU芯片,代號(hào)SeedChip,專為AI推理任務(wù)設(shè)計(jì),預(yù)計(jì)2026年3月底前交付首批樣品。

2026年的趨勢(shì)是芯片不再是一整塊,谷歌、字節(jié)、阿里們想在英偉達(dá)的平臺(tái)上,"拼"入自己的專用模塊。

云廠商自研NPU,或?qū)⒏淖傾I成本結(jié)構(gòu)、能耗曲線,甚至商業(yè)模式。

什么是 NPU?

谷歌TPU、阿里含光800等本質(zhì)是一種NPU形態(tài)。

NPU(Neural Processing Unit)芯片,英文直接翻譯過來就是神經(jīng)網(wǎng)絡(luò)處理芯片。

要理解NPU和GPU的差別,可以先從它們的底層邏輯開始,NPU廣義上屬于專用處理芯片(ASIC),而GPU屬于通用處理芯片。

芯片按設(shè)計(jì)邏輯可以被分為三類,通用計(jì)算芯片、FPGA(可重構(gòu)硬件)和ASIC (專用處理芯片)。

第一是通用計(jì)算芯片,諸如CPU和GPU,一條指令驅(qū)動(dòng)成百上千線程并行執(zhí)行,非常擅長處理大規(guī)模并行計(jì)算,通常不改變硬件,而是通過軟件(CUDA)改變"任務(wù)調(diào)度"。這就是為什么大家都說英偉達(dá)其實(shí)是一家軟件公司,GPU核心特征是高度可編程、適配所有計(jì)算任務(wù)、架構(gòu)復(fù)雜(需要很多緩存)。但代價(jià)是通用性越強(qiáng),效率越低。

第二類是 ASIC(專用定制芯片),它是為了某一個(gè)特定任務(wù)(比如識(shí)別圖像、處理語音)而專門定制的,數(shù)據(jù)流固定、能效極高,是一種"把算法固化進(jìn)硅片"的設(shè)計(jì)方法。缺點(diǎn)是一旦電路壓印在硅片上,功能就無法更改,不夠靈活。ASIC的本質(zhì)是把AI計(jì)算從"軟件問題"變成"物理問題",但它也意味著靈活性最低、更新周期長。

第三類是FPGA(可重構(gòu)硬件),其可以通過"重新布線" 改變芯片硬件布局和改變軟件代碼,來改變芯片功能,像一套"樂高積木",它介于通用和專用之間,常用于算法迭代快的原型開發(fā)或邊緣計(jì)算。

GPU功能強(qiáng)大,可以并行做很多事,要是把這些能力都用上,可以無比強(qiáng)大,但是單價(jià)更高,也更費(fèi)電,而 NPU只做一件事或一類事,功能單一,但是單價(jià)低也更省電。

不賣芯片,只做更具性價(jià)比的云

云服務(wù)商并不賣芯片,而是想要提供更具性價(jià)比的算力。

在2015年,谷歌就開始研究NPU,當(dāng)時(shí),谷歌發(fā)現(xiàn)一個(gè)問題:其數(shù)據(jù)中心中,神經(jīng)網(wǎng)絡(luò)推理需求暴漲,但GPU效率不足。

于是,谷歌內(nèi)部啟動(dòng)了TPU項(xiàng)目。2015年第一代僅用于數(shù)據(jù)推理的TPU誕生,2018年對(duì)外開放Google Cloud TPU,2020–2024年開始進(jìn)入"訓(xùn)練+推理一體化"階段。

2026年,隨著TPU 8發(fā)布,谷歌首次明確分成兩條路線:用于訓(xùn)練的TPU 8t和用于推理的TPU 8i,這背后反映的是一個(gè)更大的趨勢(shì):AI算力的重心,正在從訓(xùn)練轉(zhuǎn)向推理。

行業(yè)機(jī)構(gòu)預(yù)計(jì),到2030年,75%-80%的AI算力將用于推理。這意味著GPT訓(xùn)練一次,推理運(yùn)行數(shù)億次。因此,誰能把 1 分錢的推理成本壓到 0.1 分,誰就是未來的算力王者。

谷歌的兩款芯片分別由兩個(gè)合作方設(shè)計(jì),TPU8t由博通設(shè)計(jì), TPU8i由聯(lián)發(fā)科設(shè)計(jì),兩顆都或?qū)⒒谂_(tái)積電2nm工藝,預(yù)計(jì)2027年底量產(chǎn)。TPU 8最核心變化在于試圖解決"內(nèi)存墻"問題,通過更高帶寬HBM、更密集的片間互聯(lián)。


據(jù)悉,此次TPU8對(duì)比上一代Ironwood產(chǎn)品,TPU 8i 推理芯片HBM容量從216GB增到288GB,帶寬從6528提到8601GB/s,片上 SRAM提升三倍達(dá)384M。集群規(guī)模從數(shù)萬顆擴(kuò)到13.4萬顆,最多可連100萬顆。

NPU并不是谷歌獨(dú)角戲,亞馬遜、微軟等都有NPU產(chǎn)品,而國內(nèi)華為昇騰(Ascend)、寒武紀(jì)、地平線等也有類似產(chǎn)品發(fā)布。

以前云廠商買英偉達(dá)的"全家桶",現(xiàn)在他們想買英偉達(dá)的"地基",自己蓋"房子"。

掌握算力時(shí)代主動(dòng)權(quán)

TPU 8系列發(fā)布背后,是一個(gè)非常清晰的戰(zhàn)略:去英偉達(dá)化。

如果TPU成功,AI算力將從"GPU壟斷"變成"多架構(gòu)競(jìng)爭"。

但取代"英偉達(dá)",卻并不容易。

最重要的問題是生態(tài),英偉達(dá)的CUDA仍然是行業(yè)標(biāo)準(zhǔn),CUDA 有 400 萬開發(fā)者。另一方面,TPU功能太過單一,GPU可以用于AI訓(xùn)練和推理、圖形處理和渲染,但是TPU的功能單一。

業(yè)內(nèi)人士普遍認(rèn)為,NPU的意義不是"替代GPU",而是重新定義AI算力結(jié)構(gòu)。未來可能出現(xiàn),GPU作為通用算力底座、TPU/NPU作為AI專用加速層。

英偉達(dá)也看到了這個(gè)趨勢(shì),在2025年底,英偉達(dá)斥資 200 億美元對(duì) Groq 進(jìn)行收購,Groq研發(fā)的 LPU (Language Processing Unit) ,在運(yùn)行大模型(LLM)時(shí),其速度是傳統(tǒng) GPU 的 10 倍以上。

這就像是過去十年,大多手機(jī)廠商的競(jìng)爭。當(dāng)手機(jī)里最重要的Soc芯片已經(jīng)被高通、聯(lián)發(fā)科壟斷,具備強(qiáng)大的護(hù)城河,自研Soc芯片需要付出很大的成本且面臨高風(fēng)險(xiǎn)。

那么,想要有獨(dú)特優(yōu)勢(shì)、在市場(chǎng)上更具競(jìng)爭力,大多數(shù)手機(jī)企業(yè)不會(huì)選擇自研Soc芯片,而是針對(duì)Soc芯片的局部功能做優(yōu)化。

此前,三星、vivo、OPPO等手機(jī)廠商都選擇自研用于提升拍照能力的NPU芯片,實(shí)現(xiàn)差異化,比如vivo藍(lán)圖影像芯片、OPPO馬里亞納 MariSilicon芯片。

云廠商的算力競(jìng)爭也接近白熱化,越來越多用于訓(xùn)練和推理的NPU將會(huì)出現(xiàn),并不斷提升能力。

未來真正的算力產(chǎn)業(yè)分水嶺將是:誰能把AI推理成本壓到極致,誰就掌握下一代算力時(shí)代主動(dòng)權(quán)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
牡丹花下死!汪峰官宣戀情才2年,森林北又走上了章子怡的老路

牡丹花下死!汪峰官宣戀情才2年,森林北又走上了章子怡的老路

落雪聽梅a
2026-04-24 07:58:40
第一筆補(bǔ)強(qiáng)來了,勇士要變天,四冠功臣,終于回來了

第一筆補(bǔ)強(qiáng)來了,勇士要變天,四冠功臣,終于回來了

體育新角度
2026-04-25 17:43:17
人到晚年,最損壽命的根本不是生病,而是這2種“勤快”

人到晚年,最損壽命的根本不是生病,而是這2種“勤快”

荷蘭豆愛健康
2026-03-26 13:36:36
美媒痛哭發(fā)現(xiàn),美國瞎折騰了七八年,中國卻已不可阻擋

美媒痛哭發(fā)現(xiàn),美國瞎折騰了七八年,中國卻已不可阻擋

曉風(fēng)洞察
2026-04-26 07:58:28
美軍要徹底絕望,解放軍首次公開,潛艇魚雷管發(fā)射鷹擊18摧毀靶船

美軍要徹底絕望,解放軍首次公開,潛艇魚雷管發(fā)射鷹擊18摧毀靶船

胖福的小木屋
2026-04-26 00:07:15
女子假信佛與多位高僧發(fā)生不當(dāng)關(guān)系,秘密錄制5600段視頻。

女子假信佛與多位高僧發(fā)生不當(dāng)關(guān)系,秘密錄制5600段視頻。

特約前排觀眾
2026-02-09 00:05:05
海牙做出審判,老杜回國無望,人民日?qǐng)?bào)一錘定音:中國不救菲律賓

海牙做出審判,老杜回國無望,人民日?qǐng)?bào)一錘定音:中國不救菲律賓

泠泠說史
2026-04-25 20:05:47
北京車展最讓我失望的車:雷克薩斯全新ES,這是來搞笑的嗎?

北京車展最讓我失望的車:雷克薩斯全新ES,這是來搞笑的嗎?

沙雕小琳琳
2026-04-25 21:35:26
3比0!18中15怒砍42分!下一輪大戰(zhàn)湖人隊(duì)

3比0!18中15怒砍42分!下一輪大戰(zhàn)湖人隊(duì)

籃球教學(xué)論壇
2026-04-26 07:58:36
特斯拉中國:官方版擴(kuò)展塢上架了,售價(jià) 249 元!

特斯拉中國:官方版擴(kuò)展塢上架了,售價(jià) 249 元!

新浪財(cái)經(jīng)
2026-04-25 15:53:30
斯瑪特稱懼怕生涯就快終結(jié)!比肩喬丹僅拿500萬 詹皇贊存殺手本色

斯瑪特稱懼怕生涯就快終結(jié)!比肩喬丹僅拿500萬 詹皇贊存殺手本色

顏小白的籃球夢(mèng)
2026-04-26 07:20:37
日本澀澀真人影游重返Steam!三大美女伺候 但鎖國區(qū)

日本澀澀真人影游重返Steam!三大美女伺候 但鎖國區(qū)

游民星空
2026-04-26 09:13:16
孫楊機(jī)場(chǎng)驚問:行李箱真的需要打膜嗎?秦昊一臉懵懂

孫楊機(jī)場(chǎng)驚問:行李箱真的需要打膜嗎?秦昊一臉懵懂

科學(xué)發(fā)掘
2026-04-26 00:10:07
一夜虧損上億!華晨宇云南拿地翻車,直播曝出真相,頂流也扛不住

一夜虧損上億!華晨宇云南拿地翻車,直播曝出真相,頂流也扛不住

TVB的四小花
2026-04-25 17:50:05
球迷與勒布朗·詹姆斯在湖人隊(duì)的尷尬瞬間:球迷意外“撞臉”

球迷與勒布朗·詹姆斯在湖人隊(duì)的尷尬瞬間:球迷意外“撞臉”

好火子
2026-04-26 00:47:02
四川一媽媽帶兒子買高鐵票,結(jié)果相隔14個(gè)車廂,“距離遠(yuǎn)還不相通”,12306回應(yīng):余票不足時(shí)才會(huì)被分開,可在上車后協(xié)商換座

四川一媽媽帶兒子買高鐵票,結(jié)果相隔14個(gè)車廂,“距離遠(yuǎn)還不相通”,12306回應(yīng):余票不足時(shí)才會(huì)被分開,可在上車后協(xié)商換座

臺(tái)州交通廣播
2026-04-24 23:52:56
男子用2條毒蛇泡酒,12年后打開本想品嘗美酒,誰知出現(xiàn)驚人現(xiàn)象

男子用2條毒蛇泡酒,12年后打開本想品嘗美酒,誰知出現(xiàn)驚人現(xiàn)象

詭譎怪談
2025-04-01 17:37:59
不玩游戲、偶像包袱重、前胸貼白鹿后背,《奔跑吧》他干嘛來了?

不玩游戲、偶像包袱重、前胸貼白鹿后背,《奔跑吧》他干嘛來了?

洲洲影視娛評(píng)
2026-04-25 14:24:44
駐泰大使館急了!

駐泰大使館急了!

梳子姐
2026-04-25 08:37:22
中超積分榜,津門虎4:2國安,擺脫墊底,蓉城4:0,五連勝5分領(lǐng)跑

中超積分榜,津門虎4:2國安,擺脫墊底,蓉城4:0,五連勝5分領(lǐng)跑

阿晞體育
2026-04-26 09:30:39
2026-04-26 09:52:49
藍(lán)鯨新聞 incentive-icons
藍(lán)鯨新聞
財(cái)經(jīng)信息服務(wù)平臺(tái)
131488文章數(shù) 193845關(guān)注度
往期回顧 全部

科技要聞

漲價(jià)浪潮下,DeepSeek推動(dòng)AI“價(jià)格戰(zhàn)”

頭條要聞

牛彈琴:伊朗放了美國人鴿子 特朗普被氣壞了

頭條要聞

牛彈琴:伊朗放了美國人鴿子 特朗普被氣壞了

體育要聞

那一刻開始,兩支球隊(duì)的命運(yùn)悄然改變了

娛樂要聞

《我們的爸爸2》第一季完美爸爸翻車了

財(cái)經(jīng)要聞

90%訂單消失,中東旺季沒了

汽車要聞

2026款樂道L90亮相北京車展 樂道L80正式官宣

態(tài)度原創(chuàng)

本地
游戲
房產(chǎn)
親子
公開課

本地新聞

云游中國|逛世界風(fēng)箏都 留學(xué)生探秘中國傳統(tǒng)文化

制作人親口證實(shí)!Steam超好評(píng)游戲新篇章要來了

房產(chǎn)要聞

新一輪教育大爆發(fā)來了!海口,開始瘋狂建學(xué)校!

親子要聞

喂得她自己都咽口水了!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版