国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

谷歌第八代TPU雙艦齊發(fā),終結(jié)AI推理延遲,讓智能體實現(xiàn)隨叫隨到

0
分享至

今天,谷歌在 Cloud Next '26 峰會上發(fā)布了其第八代 TPU 架構(gòu)(TPU 8t 與 TPU 8i),TPU 8t 主攻訓(xùn)練,TPU 8i 主攻推理,將在 2026 年晚些時候上市。第八代 TPU 采用申請制,Google Cloud 用戶如需使用,需要在官網(wǎng)提交登記需求。原生 PyTorch 對于 TPU 的支持等軟件棧功能,目前也處于 Preview 階段。眼下,谷歌是在小范圍內(nèi)開放給特定合作伙伴和早期客戶進(jìn)行測試,旨在管理早期算力資源的分配。

TPU 8t 憑借 SparseCore 核心與 Virgo 網(wǎng)絡(luò)拓?fù)洌瑢⒋笠?guī)模預(yù)訓(xùn)練效能推向極致,以 2.7 倍的單位成本算力改寫了模型訓(xùn)練版圖。

TPU 8i 專為實時推理與復(fù)雜決策而生,其通過 CAE 加速引擎與新型 Boardfly 拓?fù)浣Y(jié)構(gòu),在一定程度上擊碎了長上下文推理的延遲瓶頸,讓 AI 從單一的下一個詞預(yù)測進(jìn)化到場景模擬和深度邏輯推理,AI 回應(yīng)將變得更及時、更連貫。在谷歌自研 Arm Axion 架構(gòu) CPU 的算力支持下,這套架構(gòu)還實現(xiàn)了兩倍的能效飛躍。

第八代 TPU 將開放給所有谷歌云客戶使用。TPU 8t 和 TPU 8i 支持主流的 AI 框架比如 PyTorch 和 JAX。開發(fā)者不需要學(xué)習(xí)新的編程語言,使用自己熟悉的工具就能直接調(diào)用 TPU 算力。谷歌還提供了開源的參考模型代碼,讓用戶可以快速上手。


(來源:谷歌)

我們可能都遇到過 AI 反應(yīng)很慢的情況,要轉(zhuǎn)好幾圈才給出答案,很多時候問題不在于網(wǎng)速,其實是處理請求的芯片距離太遠(yuǎn)。我們的聲音數(shù)據(jù)要跑到遠(yuǎn)處的數(shù)據(jù)中心,在那里排隊、計算、再傳回來,一來一回時間就過去了,此次第八代 TPU 正是為解決這個問題而來。

當(dāng)前,AI 訓(xùn)練和 AI 推理對于芯片的要求越來越不一樣。訓(xùn)練需要極致的算力,這要求芯片之間能夠高效地協(xié)同工作。推理則需要極低的延遲,這要求芯片能夠快速處理多個請求,并且還得盡可能地省電。于是,第八代 TPU 分成了 TPU 8t 和 TPU 8i。

TPU 8t:專為大規(guī)模 AI 訓(xùn)練設(shè)計

TPU 8t 主要負(fù)責(zé)訓(xùn)練,它被設(shè)計得可以成千上萬個連在一起工作。谷歌用一個名為 3D Torus 的網(wǎng)絡(luò)把其連接起來,組成了一個超級計算集群。一個單獨的超級計算單元里就裝了 9600 顆 TPU 8t 芯片,一起共享高達(dá) 2PB 的內(nèi)存,總共能夠提供高達(dá) 121 ExaFlops 的算力。


圖 | TPU 8t ASIC 框圖(來源:谷歌)

TPU 8t 還用到了 SparseCore 這一技術(shù),F(xiàn)在的很多大模型用的是混合專家技術(shù),每次計算只激活一小部分參數(shù),混合專家技術(shù)雖然能效高,但是會產(chǎn)生大量不規(guī)則的內(nèi)存訪問,這讓普通芯片招架不來。

而谷歌此次使用的 SparseCore 技術(shù)專門負(fù)責(zé)處理這種任務(wù),比如它可以讓負(fù)責(zé)核心數(shù)學(xué)運(yùn)算的矩陣乘法單元專心做自己擅長的事情,通過這樣互相配合的方式,芯片就不會閑置,始終保持滿負(fù)荷運(yùn)轉(zhuǎn)的狀態(tài)。

TPU 8t 還改進(jìn)了數(shù)據(jù)傳輸方式,用上了谷歌自研的 Virgo 網(wǎng)絡(luò),把芯片之間的通信帶寬翻了一倍,把連接到外部數(shù)據(jù)中心的帶寬提升了四倍。TPU 的 Direct Storage 技術(shù)允許芯片直接從高速存儲里讀取數(shù)據(jù),從而能夠繞開 CPU 這個“中間人”。

這樣一來,喂給芯片的數(shù)據(jù)流就不會斷,訓(xùn)練速度能提升十倍。在能耗上,TPU 8t 相比上一代的每瓦性能提升了兩倍。訓(xùn)練超大模型時,它的性價比提升了 2.7 倍。對于需要訓(xùn)練幾百甚至上千億參數(shù)模型的團(tuán)隊來說,這意味著能夠節(jié)約大量的時間和電費(fèi)。


圖 | TPU 8t 機(jī)架級與 Virgo 光纖通道的連接(來源:谷歌)

TPU 8i:能快速響應(yīng)需求和處理長上下文推理

相比之下,TPU 8i 主打一個反應(yīng)極快,它專門為那些復(fù)雜的、需要多步推理的問題而生。當(dāng)你和 AI 聊一個很長的上下文,比如討論一個復(fù)雜的心理問題,那么 AI 需要記住之前所有的對話內(nèi)容。

上述對話記憶被存放在一個叫 KV Cache 的地方,而 TPU 8i 配備了 288GB 的高帶寬內(nèi)存和 384MB 的超大片上 SRAM,后者比上一代多了三倍,因此它可以把整個對話的上下文都裝進(jìn)芯片內(nèi)部,不用頻繁地去外面拿數(shù)據(jù),處理速度自然也就變快了。


圖 | TPU 8i ASIC 框圖(來源:谷歌)

TPU 8i 的另一項關(guān)鍵創(chuàng)新是集體通信加速引擎。當(dāng)大模型進(jìn)行推理的時候,尤其是在處理混合專家模型時,芯片之間需要頻繁地同步數(shù)據(jù)和匯總結(jié)果,這個過程叫做集體通信。要是做得不好,芯片的大部分時間都在干等。

TPU 8i 的 CAE 專門負(fù)責(zé)加速這個環(huán)節(jié),把延遲降低了五倍。它還把芯片之間的互聯(lián)帶寬翻了一番,達(dá)到了 19.2 Tb/s。

與此同時,谷歌還為 TPU 8i 設(shè)計了一種名為 Boardfly 的全新網(wǎng)絡(luò)連接方式。傳統(tǒng)的 3D Torus 網(wǎng)絡(luò)在連接大量芯片時,數(shù)據(jù)包在芯片之間傳輸時需要經(jīng)過很多跳。Boardfly 通過借鑒 Dragonfly 拓?fù)涞乃枷,利用增加長距離直連鏈路的方式,把由 1024 顆芯片組成的系統(tǒng)里的最遠(yuǎn)的兩個芯片之間的通信距離從 16 跳減少至 7 跳,降低了 56%,讓任何兩顆芯片之間都能更快地交換信息,助力更好地處理復(fù)雜的推理任務(wù)。

這些改進(jìn)讓 TPU 8i 在推理任務(wù)上的性價比比上一代提升了 80%。對于一家企業(yè)用戶來說,將能用同樣的成本服務(wù)將近兩倍的客戶。谷歌還為 TPU 8i 搭配了自研的 Axion ARM 架構(gòu) CPU,并做了針對性優(yōu)化,讓系統(tǒng)運(yùn)行得更順暢。


圖 | TPU 8i 分層式 Boardfly 拓?fù)浣Y(jié)構(gòu)(來源:谷歌)

眾所周知,谷歌這套 TPU 體系已經(jīng)運(yùn)行了很多年,谷歌的 Gemini 正是跑在 TPU 之上。如前所述,他們這次將第八代 TPU 開放給了所有云客戶,旨在為全球開發(fā)者構(gòu)建一座通往更高 AI 想象力的算力基石?偟膩碚f,在智能體時代這種芯片設(shè)計上的精細(xì)化分工,將有利于打造一個隨叫隨到、反應(yīng)靈敏的 AI 應(yīng)用。

參考資料:

https://blog.google/innovation-and-ai/infrastructure-and-cloud/google-cloud/eighth-generation-tpu-agentic-era/

https://cloud.google.com/blog/products/compute/tpu-8t-and-tpu-8i-technical-deep-dive/

https://www.bloomberg.com/news/articles/2026-04-22/google-cloud-releases-new-tpu-chip-lineup-in-bid-to-speed-up-ai

https://x.com/patrickmoorhead/status/2046928498292412771

排版:胡巍巍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
格力萬店入駐美團(tuán)閃購,全品類生活電器“即買即送即裝”

格力萬店入駐美團(tuán)閃購,全品類生活電器“即買即送即裝”

中國家電網(wǎng)
2026-04-23 16:07:04
新股中科儀公布中簽結(jié)果,中簽需要422萬元,小散或許懵了!

新股中科儀公布中簽結(jié)果,中簽需要422萬元,小散或許懵了!

數(shù)據(jù)挖掘分析
2026-04-23 08:43:13
今日最慘股,近3個月已跌80%,昨日20cm跌停,今日又20cm跌停!

今日最慘股,近3個月已跌80%,昨日20cm跌停,今日又20cm跌停!

丁丁鯉史紀(jì)
2026-04-23 16:25:39
黃曉明這張合影火了!網(wǎng)友:這才叫真?含金量

黃曉明這張合影火了!網(wǎng)友:這才叫真?含金量

愛吃冰棍的小痞子
2026-04-21 23:14:19
女生長的太漂亮是什么體驗?網(wǎng)友:母以子貴,父以女榮

女生長的太漂亮是什么體驗?網(wǎng)友:母以子貴,父以女榮

另子維愛讀史
2026-03-10 22:56:08
西部變天!傷病突襲!湖人得利!老詹的第五冠有嗎?

西部變天!傷病突襲!湖人得利!老詹的第五冠有嗎?

籃球盛世
2026-04-23 15:32:18
獲人民日報點贊!深圳地鐵公廁火了...

獲人民日報點贊!深圳地鐵公廁火了...

深圳好玩
2026-04-23 12:55:25
到賬230億,股價暴漲85%,賈躍亭直接起飛!

到賬230億,股價暴漲85%,賈躍亭直接起飛!

新浪財經(jīng)
2026-04-23 00:58:58
定了!5月1日起,醫(yī)生收紅包回扣,不再是違規(guī),直接判刑

定了!5月1日起,醫(yī)生收紅包回扣,不再是違規(guī),直接判刑

娛樂圈見解說
2026-04-22 20:31:43
翟曉川為嬌妻慶生,場均5分拿600萬薪水,嬌妻絕美,生倆娃很幸福

翟曉川為嬌妻慶生,場均5分拿600萬薪水,嬌妻絕美,生倆娃很幸福

大西體育
2026-04-23 16:09:16
23號收評:滬指跌破4100點,所有人都注意了,大盤后市或?qū)⑦@樣走

23號收評:滬指跌破4100點,所有人都注意了,大盤后市或?qū)⑦@樣走

春江財富
2026-04-23 15:26:20
太慘烈,利潤雪崩,阿里巴巴的2025年報大暴雷,完全崩掉了

太慘烈,利潤雪崩,阿里巴巴的2025年報大暴雷,完全崩掉了

我不叫阿哏
2026-04-23 17:21:26
蕭旭岑事件新進(jìn)展,廖繼斌或?qū)⒔犹娲麇邶g!金溥聰徹底不裝了!

蕭旭岑事件新進(jìn)展,廖繼斌或?qū)⒔犹娲麇邶g!金溥聰徹底不裝了!

李博世財經(jīng)
2026-04-23 13:57:41
潑水節(jié)變“流氓節(jié)”?女子當(dāng)街被圍攻潑水,請別拿傳統(tǒng)當(dāng)遮羞布!

潑水節(jié)變“流氓節(jié)”?女子當(dāng)街被圍攻潑水,請別拿傳統(tǒng)當(dāng)遮羞布!

文史道
2026-04-21 17:33:43
生育大局已定:如不出意外,2026年起中國人口將迎來3大變化

生育大局已定:如不出意外,2026年起中國人口將迎來3大變化

蜉蝣說
2026-03-17 15:58:31
知名歌手因搶不到五一高鐵票取消演唱會!

知名歌手因搶不到五一高鐵票取消演唱會!

深圳晚報
2026-04-23 19:29:44
CBA猛料!廣東薩姆納傷病嚴(yán)重,廣廈裁掉新外援,曾凡博確定復(fù)出

CBA猛料!廣東薩姆納傷病嚴(yán)重,廣廈裁掉新外援,曾凡博確定復(fù)出

中國籃壇快訊
2026-04-23 19:51:44
張敬軒被抵制原因被扒!“反骨”言論僅冰山一角,謝霆鋒也被牽連

張敬軒被抵制原因被扒!“反骨”言論僅冰山一角,謝霆鋒也被牽連

以茶帶書
2026-04-23 14:11:56
唏噓!曼聯(lián)最佳青訓(xùn),連續(xù)兩年降級,卻憑一己之力,勇闖世界杯

唏噓!曼聯(lián)最佳青訓(xùn),連續(xù)兩年降級,卻憑一己之力,勇闖世界杯

嗨皮看球
2026-04-23 17:46:11
朝鮮戰(zhàn)場整支部隊失蹤 7 天,歸來竟押 119 名俘虜凱旋

朝鮮戰(zhàn)場整支部隊失蹤 7 天,歸來竟押 119 名俘虜凱旋

嘮叨說歷史
2026-01-28 14:32:25
2026-04-23 20:55:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
16616文章數(shù) 514897關(guān)注度
往期回顧 全部

科技要聞

馬斯克喊出"史上最大產(chǎn)品",但量產(chǎn)難預(yù)測

頭條要聞

特朗普"狂怒"稱滅掉了伊朗軍隊 美國官員:不 并沒有

頭條要聞

特朗普"狂怒"稱滅掉了伊朗軍隊 美國官員:不 并沒有

體育要聞

萊斯特城降入英甲,一場虧麻了的豪賭

娛樂要聞

王大陸因涉黑討債被判 女友也一同獲刑

財經(jīng)要聞

關(guān)于AI算力鏈"瓶頸" 這是高盛的最新看法

汽車要聞

令人驚艷的奇瑞車 風(fēng)云A9可不只是樣子貨

態(tài)度原創(chuàng)

家居
房產(chǎn)
教育
數(shù)碼
軍事航空

家居要聞

浪漫協(xié)奏 法式風(fēng)格

房產(chǎn)要聞

三亞安居房,突然官宣!

教育要聞

藏不住了!海淀這所名校附中憑啥成為“大贏家”

數(shù)碼要聞

銘凡M1 Lite-125U迷你主機(jī)發(fā)售,2119元起

軍事要聞

人民海軍成立77周年 主力艦艇亮相上海

無障礙瀏覽 進(jìn)入關(guān)懷版