国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

TPU惹急黃仁勛,200億美元拿下「TPU之父」核心團隊、技術授權(quán)

0
分享至



編輯|張倩、+0

在被谷歌 TPU 挑戰(zhàn)霸主地位后,英偉達終于急了?

今天,人工智能芯片初創(chuàng)公司 Groq 發(fā)布了一則重磅消息,他們已經(jīng)與英偉達就 Groq 的推理技術達成了非排他性許可協(xié)議。



這個協(xié)議并不是說英偉達要把 Groq 買下來,而是挖走 Groq 的幾員大將 —— 創(chuàng)始人兼 CEO Jonathan Ross、總裁 Sunny Madra 及多名核心工程師。要知道,Jonathan Ross 曾在谷歌主導 TPU 的開發(fā)。2016 年底,他從谷歌離職,并帶走了當時 TPU 核心 10 人團隊中的 7 位 。這批人帶走了 TPU 最核心的技術理念和設計經(jīng)驗,在加州山景城共同創(chuàng)辦了 AI 芯片公司 Groq。

這批人和他們的知識產(chǎn)權(quán)有多值錢?看看交易額就知道了。據(jù) Groq 投資者、Disruptive Technology Advisers 的首席執(zhí)行官 Alex Davis 透露,這筆交易價值約 200 億美元,這比該初創(chuàng)公司 9 月份的估值還高出 131 億美元。

交易過后,Groq 將繼續(xù)作為獨立公司運營,由首席財務官 Simon Edwards 接任 CEO,其 GroqCloud 云服務也將正常運行。

通過這種方式,英偉達可以在不直接購買的情況下獲得初創(chuàng)企業(yè)的人才和技術,被稱為 Reverse Acquihire(反向收購雇傭)。這種方式避免了與傳統(tǒng)收購相關的反壟斷審查。在過去三年中,微軟、Meta 等科技巨頭已經(jīng)達成了多項此類交易,以推進其人工智能發(fā)展路線圖。

Groq 最引人注目的是其自主研發(fā)的 LPU(語言處理單元)芯片。與英偉達主導的 GPU 不同,LPU 專為 AI 推理場景設計,號稱運行大語言模型的速度可達 GPU 的 10 倍,能耗卻只有十分之一。而這正是英偉達所需要的,因為 TPU 之所以能挑戰(zhàn)英偉達的霸主地位,「能耗、延遲方面能打」是一個關鍵優(yōu)勢。

英偉達 CEO 黃仁勛在內(nèi)部郵件中表示,計劃將 Groq 的低延遲處理器整合到英偉達 AI 工廠架構(gòu)中,以支持更廣泛的 AI 推理和實時工作負載。

TPU 之父帶隊

Groq 用 LPU 闖出一片天

Groq 成立于 2016 年,其誕生源于對傳統(tǒng)計算架構(gòu)的深刻反思。創(chuàng)始人 Jonathan Ross 曾師從 Yann LeCun,后來在 Google 任職。他參與了谷歌 TPU 項目(當時為 20% 項目),負責設計和實現(xiàn)第一代 TPU 芯片的核心組件。TPU 的成功證明了專用架構(gòu)在 AI 計算上的巨大潛力,也成為了 Groq 技術的起點。



Google 有一個著名的「20% 自由時間」文化,允許工程師用工作時間的 20% 去做自己感興趣、但并非老板指派的「私活」或「創(chuàng)新項目」。

Ross 認為,傳統(tǒng)的 CPU 和 GPU 架構(gòu)為了兼顧圖形渲染和通用計算,保留了復雜的緩存管理、分支預測及動態(tài)硬件調(diào)度。這些設計雖然提高了通用性,但導致了計算性能的不可預測性,并非 AI 推理的必要組件。基于此,Groq 確立了「軟件定義的確定性」這一核心理念。

LPU(Language Processing Unit)摒棄了傳統(tǒng)的硬件調(diào)度器,改由編譯器在編譯階段精確計算每一步數(shù)據(jù)的流動和時序。這種設計消除了「緩存未命中」和「分支預測失敗」的風險,核心計算單元 TSP(Tensor Streaming Processor)采用流式處理模式,確保數(shù)據(jù)如流水線般處理,沒有任何閑置周期。





在存儲方案上,Groq 未采用 Nvidia GPU 常用的高帶寬內(nèi)存(HBM),而是將靜態(tài)隨機存取存儲器(SRAM)直接集成在芯片內(nèi)部。這種設計使單芯片內(nèi)存帶寬高達 80TB/s,是傳統(tǒng) HBM 方案的 20 倍以上。盡管 SRAM 占地面積大導致單芯片容量極?。s 230MB),但其極高的帶寬允許 LPU 在 Batch Size 為 1(即單次處理一個請求)的情況下依然保持計算單元滿載,從而實現(xiàn)極低的延遲。

由于單芯片內(nèi)存有限,運行 Llama 3 70B 這樣的大模型通常需要數(shù)百張芯片級聯(lián)。為此,Groq 研發(fā)了 RealScale 互聯(lián)技術。該技術不依賴傳統(tǒng)的網(wǎng)絡交換機,而是通過直接線纜連接,并解決了「晶振漂移」導致的時鐘不同步問題。在這一架構(gòu)下,整個集群實現(xiàn)了全局時鐘同步,數(shù)百張芯片宛如一枚巨大的虛擬芯片協(xié)同工作。

得益于上述設計,Groq 在處理大語言模型時展現(xiàn)出差異化的性能優(yōu)勢:在 Llama 系列模型的推理中,其響應速度可達每秒 500 Tokens(相比之下 ChatGPT 約為 40 Tokens/s),且?guī)缀鯖]有延遲抖動,在實時交互場景中建立了獨特的競爭壁壘。

但為了換取這種極致速度,Groq 方案在物理空間和功耗上付出了代價:一個標準機架滿載功耗約為 26kW 至 30kW,且需要比 GPU 方案更多的機架數(shù)量來承載同等規(guī)模的模型參數(shù)。

TPU 步步緊逼

英偉達急了?

英偉達這次的大手筆屬于形勢所迫,因為他們的 AI 芯片霸主地位正面臨嚴峻挑戰(zhàn)。

目前,AI 算力市場的需求正從訓練轉(zhuǎn)向推理。預計到 2030 年,推理將占 AI 計算總量的 75%,市場規(guī)模達 2550 億美元。但在推理方面,英偉達的芯片并不具備絕對優(yōu)勢,面臨谷歌 TPU、Groq LPU 等多方面競爭。

先來說谷歌 TPU。此前,SemiAnalysis 的一篇文章報道稱,谷歌新出的 TPU v7 實現(xiàn)了很高的實際模型算力利用率,總體擁有成本比英偉達 GB200 系統(tǒng)低約 30%~40%。也就是說,用上 TPU 之后,企業(yè)可以省一大筆錢。而且,谷歌的 TPU 不再局限于自家使用,而是開始大規(guī)模出貨,預計 2027 年實現(xiàn)年產(chǎn) 500 萬顆的目標。

市場的反應也能說明一切:2025 年 10 月,Anthropic 協(xié)議通過多達 100 萬個 TPU 獲取超過 10 億瓦的谷歌算力;11 月,Meta 開始洽談于 2027 年在其數(shù)據(jù)中心使用谷歌 TPU。這樣的轉(zhuǎn)向足以給英偉達帶來壓力。

除了谷歌,Groq 也是不容小覷的競爭對手。早期 Groq 保持相對低調(diào)。但隨著 2023 年至 2024 年生成式 AI 市場的爆發(fā),行業(yè)重心從訓練端向推理端延伸,Groq 憑借在模型推理上的速度優(yōu)勢受到關注,資本市場隨即跟進。

最引人注目的是,今年 2 月,Groq 與沙特阿美數(shù)字公司簽訂 15 億美元協(xié)議,合作建設全球最大 AI 推理數(shù)據(jù)中心,初期部署 19000 個 LPU 處理器。2025 年 12 月,Groq 又簽署協(xié)議加入美國 AI「創(chuàng)世紀計劃」,成為 24 家簽署公司之一。

今年 9 月,Groq 剛剛完成 7.5 億美元融資,估值達到 69 億美元。公司透露,其平臺已服務超過 200 萬名開發(fā)者,較去年的 35.6 萬人增長了五倍多。

這些重要事件彰顯了 Groq 在 AI 芯片領域的潛力以及團隊的硬核研發(fā)能力,足以讓英偉達動心。

在這場交易之后,英偉達的霸主地位是否可以鞏固?我們拭目以待。

https://groq.com/blog/the-groq-lpu-explained

https://news.ycombinator.com/item?id=39431989

https://groq.com/blog/the-groq-lpu-explained

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
瓦良格號送到中國后有多震撼?專家刮掉表面的銹跡:鋼材品質(zhì)極佳

瓦良格號送到中國后有多震撼?專家刮掉表面的銹跡:鋼材品質(zhì)極佳

古書記史
2026-01-06 16:31:56
交易所出手:調(diào)整漲跌停板幅度!

交易所出手:調(diào)整漲跌停板幅度!

中國基金報
2026-01-10 15:35:48
一個商場,全是自助!餐飲人其實也很無奈

一個商場,全是自助!餐飲人其實也很無奈

餐飲老板內(nèi)參
2026-01-10 16:13:32
比爾·蓋茨深夜發(fā)出警告:世界正在倒退!留給人類的時間只有5年了

比爾·蓋茨深夜發(fā)出警告:世界正在倒退!留給人類的時間只有5年了

徐德文科學頻道
2026-01-10 22:18:45
隨著卡塔爾0-1,伊朗0-0,亞洲杯最新積分榜出爐:中國男足倒數(shù)第二

隨著卡塔爾0-1,伊朗0-0,亞洲杯最新積分榜出爐:中國男足倒數(shù)第二

側(cè)身凌空斬
2026-01-11 02:40:58
難以置信!閆學晶賬號剛禁封,又驚現(xiàn)閆學晶小號,直言“能咋地”

難以置信!閆學晶賬號剛禁封,又驚現(xiàn)閆學晶小號,直言“能咋地”

火山詩話
2026-01-11 10:45:26
自拍:一份私我的授權(quán)書

自拍:一份私我的授權(quán)書

疾跑的小蝸牛
2026-01-10 22:26:46
沉默4天后,大陸通知全世界,賴清德隨時可能被抓,鄭麗文懸了?

沉默4天后,大陸通知全世界,賴清德隨時可能被抓,鄭麗文懸了?

軒逸阿II
2026-01-11 00:43:40
冠軍賽男單4強出爐!中日韓瓜分席位,林昀儒大勝約戰(zhàn)張本智和

冠軍賽男單4強出爐!中日韓瓜分席位,林昀儒大勝約戰(zhàn)張本智和

全言作品
2026-01-11 03:27:34
美副防長:美國若能到2030年代還不與中國開戰(zhàn),都算是“走運”

美副防長:美國若能到2030年代還不與中國開戰(zhàn),都算是“走運”

近史博覽
2026-01-11 10:05:18
傅首爾的困境有多難解?一露頭就全網(wǎng)抵制,她不再被網(wǎng)友寬容了?

傅首爾的困境有多難解?一露頭就全網(wǎng)抵制,她不再被網(wǎng)友寬容了?

小熊侃史
2026-01-09 07:35:03
停薪禁賽3場!損失29萬美金!東契奇禍從口出,NBA官宣重磅罰單

停薪禁賽3場!損失29萬美金!東契奇禍從口出,NBA官宣重磅罰單

世界體育圈
2026-01-11 11:02:25
1.6萬億消費大遷徙!商場空到只剩導購,中產(chǎn)的錢都流向了這里

1.6萬億消費大遷徙!商場空到只剩導購,中產(chǎn)的錢都流向了這里

墨印齋
2026-01-10 21:32:39
越扒越有!閆學晶快手賣了1200萬單,收入上千萬元,家族控股分紅

越扒越有!閆學晶快手賣了1200萬單,收入上千萬元,家族控股分紅

單手搓核彈
2026-01-11 09:45:30
不得不服俄羅斯!油輪被抓后,榛樹高超連夜報復,10馬赫警告美國

不得不服俄羅斯!油輪被抓后,榛樹高超連夜報復,10馬赫警告美國

劍道萬古似長夜
2026-01-09 14:36:31
A股:從下周起,或許歷史將驚人相似!4500點大級別主升浪要來了

A股:從下周起,或許歷史將驚人相似!4500點大級別主升浪要來了

夜深愛雜談
2026-01-10 21:41:39
涉事領導已被停職!亞軍3金得主:他總摸女生私密部位 搞迷信活動

涉事領導已被停職!亞軍3金得主:他總摸女生私密部位 搞迷信活動

風過鄉(xiāng)
2026-01-10 10:31:32
兩岸喜訊!大陸沒想到,沒等正式收臺,臺當局先送來2份“大禮”

兩岸喜訊!大陸沒想到,沒等正式收臺,臺當局先送來2份“大禮”

趣生活
2026-01-10 22:29:06
伊朗流亡王儲向警察軍人喊話:保護人民,不要隨這艘船一起沉沒

伊朗流亡王儲向警察軍人喊話:保護人民,不要隨這艘船一起沉沒

通往遠方的路
2026-01-09 10:17:26
1949年六大名著改為四大名著,去掉的那兩本家喻戶曉,你可能想不到

1949年六大名著改為四大名著,去掉的那兩本家喻戶曉,你可能想不到

歷史回憶室
2026-01-09 20:33:14
2026-01-11 11:15:00
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12088文章數(shù) 142534關注度
往期回顧 全部

科技要聞

“我們與美國的差距也許還在拉大”

頭條要聞

牛彈琴:特朗普沒想到 抓馬杜羅后全球情緒總體很穩(wěn)定

頭條要聞

牛彈琴:特朗普沒想到 抓馬杜羅后全球情緒總體很穩(wěn)定

體育要聞

詹皇曬照不滿打手沒哨 裁判報告最后兩分鐘無誤判

娛樂要聞

網(wǎng)友偶遇賈玲張小斐崇禮滑雪

財經(jīng)要聞

外賣平臺"燒錢搶存量市場"迎來終局?

汽車要聞

2026款宋Pro DM-i長續(xù)航補貼后9.98萬起

態(tài)度原創(chuàng)

手機
健康
教育
時尚
本地

手機要聞

恭喜小米17 Pro系列!恭喜華為Mate 80!友商加油

這些新療法,讓化療不再那么痛苦

教育要聞

拋物線旋轉(zhuǎn)問題,一個視頻學會!

動物紋回潮,那很狂野了

本地新聞

云游內(nèi)蒙|“包”你再來?一座在硬核里釀出詩意的城

無障礙瀏覽 進入關懷版