国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

突發(fā),Meta放棄一顆自研芯片,擁抱谷歌TPU

0
分享至

公眾號記得加星標(biāo)??,第一時間看推送不會錯過。

據(jù)Theinformation報道,Meta公司在多款芯片的研發(fā)上都遇到了問題。該公司放棄了一款內(nèi)部代號為Iris的第二代訓(xùn)練芯片。之后,該公司開始研發(fā)一款更先進(jìn)的訓(xùn)練芯片,代號為Olympus,但現(xiàn)在這款芯片也已被放棄。

一位知情人士透露,Meta 最初計劃與 Olympus 合作構(gòu)建大型服務(wù)器集群,但高管最終認(rèn)為,在與 OpenAI 和 Google 等老牌競爭對手展開激烈競爭之際,這樣做會給新模型的訓(xùn)練帶來重大風(fēng)險。例如,用于訓(xùn)練芯片的軟件穩(wěn)定性不如英偉達(dá)的產(chǎn)品,而且 Olympus 復(fù)雜的設(shè)計也可能導(dǎo)致難以大規(guī)模生產(chǎn)。

與此同時,據(jù)報道,Meta Platforms 已經(jīng)與谷歌簽訂一項價值數(shù)十億美元的協(xié)議,租用谷歌的 AI 芯片(即張量處理單元)來開發(fā)新的 AI 模型。這必將加劇谷歌和英偉達(dá)的芯片競爭。

Meta的定制芯片之旅

Meta 進(jìn)軍定制芯片領(lǐng)域是一項深思熟慮的戰(zhàn)略,旨在克服現(xiàn)成 AI 加速器在技術(shù)和財務(wù)方面的局限性。首先從財務(wù)上看,Meta自研芯片應(yīng)該是大有可為。

鑒于 Meta Platforms 在研發(fā)和資本支出方面投入了巨額資金——預(yù)計 2025 年,其研發(fā)投入約為 500 億美元,資本支出約為 660 億至 720 億美元,而其收入約為 1900 億至 2000 億美元,因此,按上述各項的中值計算,資本支出約占總收入的 61%——即使基礎(chǔ)設(shè)施成本降低幾個百分點,也能對其盈利能力產(chǎn)生重大影響。

因此不難理解為什么 Meta Platforms 至少想要設(shè)計自己的 CPU 和 XPU,并且還要迫使互連 ASIC 制造商(我們將交換、路由和內(nèi)存互連都包含在內(nèi))滿足其需求,并威脅說如果他們不這樣做,就設(shè)計自己的交換和內(nèi)存結(jié)構(gòu)互連。

而回看Meta這些年的芯片自研之路,Meta Platforms 希望跳過可授權(quán)但閉源的 Arm 架構(gòu),直接采用開源但仍不完善且尚未成為主流的 RISC-V 架構(gòu)來構(gòu)建其未來的計算引擎,這已不是什么秘密。

相關(guān)資料顯示,該公司于 2020 年開始定制芯片研發(fā),并于 2023 年 5 月推出了 Meta 訓(xùn)練和推理加速器 (MTIA:Meta Training and Inference Accelerator ) v1。事實上,這款芯片名稱并不貼切,因為它只能進(jìn)行推理,而不能進(jìn)行訓(xùn)練。

而按照Meta自身所說,之所以會研發(fā)這顆芯片,是因為我們發(fā)現(xiàn),GPU并非總能以其所需的效率水平,高效運(yùn)行Meta的特定推薦工作負(fù)載。為了應(yīng)對這一挑戰(zhàn),我們設(shè)計了一系列專用于推薦的MTIA ASIC芯片。

“我們與下一代推薦模型共同設(shè)計了第一代ASIC芯片,并將其集成到PyTorch中,從而創(chuàng)建了一個完全優(yōu)化的排名系統(tǒng)。此外,我們還保留了PyTorch即時開發(fā)模式所帶來的用戶體驗和開發(fā)者效率。隨著我們持續(xù)支持PyTorch 2.0,開發(fā)者效率的提升是一個持續(xù)的過程。PyTorch 2.0在編譯器層面(底層)大幅提升了PyTorch的運(yùn)行效率?!盡eta方面表示。

據(jù)介紹,MTIA V1是包含芯片、PyTorch 和推薦模型在內(nèi)的全棧式協(xié)同設(shè)計解決方案的一部分。該加速器采用臺積電 7nm 工藝制造,運(yùn)行頻率為 800 MHz,在 INT8 精度下可提供 102.4 TOPS 的運(yùn)算能力,在 FP16 精度下可提供 51.2 TFLOPS 的運(yùn)算能力。其熱設(shè)計功耗 (TDP) 為 25 W。MTIA加速器安裝在小型雙M.2板上,便于集成到服務(wù)器中。這些板卡通過PCIe Gen4 x8鏈路連接到服務(wù)器的主機(jī)CPU,功耗低至35瓦。

到了2024年 4 月,Meta又發(fā)不了性能大幅提升的 MTIA v2 發(fā)布,這款芯片的推理能力有所提高,但仍然無法進(jìn)行訓(xùn)練。

“這款芯片的架構(gòu)從根本上來說是為了在計算能力、內(nèi)存帶寬和內(nèi)存容量之間找到最佳平衡點,從而更好地服務(wù)于排名和推薦模型,”Meta 的三位技術(shù)人員在發(fā)布 MTIA v2 的博客文章中寫道。“在推理過程中,即使批處理大小相對較小,我們也需要能夠提供相對較高的利用率。通過提供遠(yuǎn)超典型 GPU 的 SRAM 容量,我們可以在批處理大小有限的情況下實現(xiàn)高利用率,并在遇到大量潛在并發(fā)任務(wù)時提供足夠的計算能力?!?/p>

數(shù)據(jù)顯示,采用7納米工藝打造的MTIA v1 芯片面積為 373 平方毫米( 19.34 x 19.1 平方毫米),運(yùn)行頻率僅為 800 MHz。MTIA v2 芯片則采用 5 納米工藝制造,Meta 公司將時鐘頻率提升了 68.8%,達(dá)到 1.35 GHz,同時芯片面積也大幅增大至 421 平方毫米(25.6 x 16.4平方毫米),從而增加了芯片上的 SRAM 容量。面積增加 12.9%,時鐘頻率提升 68.8%,導(dǎo)致功耗增加了 2.6 倍,達(dá)到 90 瓦。此外,PE 單元增加了稀疏性支持,在許多情況下,矩陣運(yùn)算的性能提升了近 7 倍。在矢量核心上,SIMD 操作性能提高了 72.5%,比時鐘速度的提升略好一些。


值得一提的是,這兩款芯片均采用基于 RISC-V 內(nèi)核的處理單元陣列,具體來說,它們由兩個內(nèi)核組成:一個內(nèi)核負(fù)責(zé)標(biāo)量運(yùn)算,另一個內(nèi)核則配備向量引擎,用于處理整數(shù)和浮點數(shù)據(jù)。MTIA v1 在 Meta 數(shù)據(jù)中心服務(wù)器集群中部署規(guī)模適中,而性能更強(qiáng)大的 MTIA v2 的部署規(guī)模則更為龐大。

從這兩代產(chǎn)品可以看到,Meta一直還是在推理上深耕,還沒有涉足訓(xùn)練芯片。而且,據(jù)相關(guān)報道,即使如此,該公司還是碰到了不少波折。但是他們依然毅然決然地進(jìn)軍訓(xùn)練芯片。如上所述,他們這個芯片不出意外地屢受波折。

于是,收購芯片公司,成為了他們的新發(fā)展方向,芯片初創(chuàng)公司Rivos就成為了他們的目標(biāo)。

收購Rivos增加籌碼

2025年10月,有消息稱,Meta 收購了人工智能芯片初創(chuàng)公司 Rivos。在很多人看來,這與AWS當(dāng)年收購Annapurna Labs異曲同工,只是晚了十年。

據(jù)Walden Catalyst所說,2025年初,Rivos準(zhǔn)備進(jìn)行下一輪融資時,投資者反響熱烈,最終超額認(rèn)購。在融資過程中,公司還收到了多家收購要約。經(jīng)過慎重考慮,創(chuàng)始人、董事會和投資者最終選擇了Meta的收購方案:這一決定既肯定了Rivos的技術(shù)實力,也認(rèn)可了其愿景的戰(zhàn)略重要性。

資料顯示,Rivos成立于2021年9月,由陳立武和Amarjit Gill共同創(chuàng)立。

Amarjit Gill是MIPS芯片制造商SiByte(2000年被博通收購)和Power芯片設(shè)計公司PA Semi(2008年被蘋果收購)的聯(lián)合創(chuàng)始人;Rivos的聯(lián)合創(chuàng)始人之一Tse-Yu Yeh曾在蘋果工作超過17年,從架構(gòu)和驗證高級工程師一路晉升為CPU設(shè)計高級總監(jiān);聯(lián)合創(chuàng)始人Puneet Kumar曾效力于鼎盛時期的Digital Equipment Corp;Rivos的另一位聯(lián)合創(chuàng)始人Mark Hayter 的職業(yè)道路與Belli Kuttanna類似,他曾先后在DEC、SiByte、博通、PA Semi、蘋果、Agnilux和谷歌工作;Rivos的最后一位聯(lián)合創(chuàng)始人是Belli Kuttanna,在加入Rivos之前,他曾在德州儀器、摩托羅拉、Sun Microsystems、高通(短暫任職)和英特爾擔(dān)任芯片設(shè)計師和架構(gòu)師。

在 Walden International 的支持下,Rivos 成立之初就擁有超過百名員工,Tan 被任命為董事會主席。這在一定程度上使 Rivos 能夠使用先進(jìn)的 EDA 工具,并利用臺積電的代工技術(shù)和產(chǎn)能。

2023 年,Rivos 從蘋果公司挖走了近 50 名工程師,導(dǎo)致與蘋果公司發(fā)生訴訟,最終由 Tan 促成和解。當(dāng)時,Rivos 正在研發(fā) CPU 設(shè)計,但 Tan 建議公司專注于 AI 加速,而與 Meta 的合作正是這一轉(zhuǎn)型的結(jié)果。根據(jù) Walden 的聲明,Rivos憑借卓越的技術(shù)進(jìn)步實現(xiàn)了其愿景。該公司成功流片了3.1 GHz處理器,并構(gòu)建了兼容CUDA的軟件棧,使得原本為NVIDIA生態(tài)系統(tǒng)開發(fā)的AI工作負(fù)載能夠在RISC-V硬件上無縫運(yùn)行。這種“重新編譯而非重新設(shè)計”的方法降低了客戶的采用門檻,同時展現(xiàn)了Rivos業(yè)界領(lǐng)先的性能和能效。

Rivos表示,其設(shè)計為從模型訓(xùn)練到推理等一系列工作負(fù)載提供了可擴(kuò)展性和能效?!霸摷軜?gòu)通過最大限度地減少外部數(shù)據(jù)傳輸和降低功耗,消除了計算和內(nèi)存資源之間的不平衡,”該公司在一份白皮書中表示?!八苊饬顺R姷馁Y源不匹配問題,即僅僅為了彌補(bǔ)內(nèi)存限制而部署額外的GPU單元,從而導(dǎo)致資源利用率低下?!?/p>

在完成A輪融資的時候,Rivos也曾表示,Rivos 提供功耗優(yōu)化的芯片,該芯片結(jié)合了高性能服務(wù)器級 RISC-V CPU 和數(shù)據(jù)并行加速器(一種針對大型語言模型 (LLM) 和數(shù)據(jù)分析優(yōu)化的 GPGPU),可滿足當(dāng)今軟件編程模型和機(jī)架服務(wù)器的限制。CPU 和并行計算的緊密集成,以及在 DDR DRAM 和 HBM 上共享統(tǒng)一內(nèi)存,使其成為當(dāng)今需要 TB 級內(nèi)存的模型和數(shù)據(jù)庫的理想選擇。

由此可見,Rivos 似乎正在打造一種類似英偉達(dá) Grace-Hopper 和 Grace-Blackwell CPU-GPU“超級芯片”的芯片或封裝式混合 CPU-GPU 計算系統(tǒng)。而且,該系統(tǒng)很可能基于 RISC-V 架構(gòu),更重要的是,它兼容英偉達(dá)的 CUDA-X 軟件棧。CUDA-X 是一種并行編程模型,它與一系列算法、庫和框架相結(jié)合,用于將軟件從 CPU 卸載到 GPU 上進(jìn)行加速。正是 CUDA-X 賦予了英偉達(dá)強(qiáng)大的定價權(quán)。

通過這單收購,Meta 將受益于一支能夠制造高端 RISC-V 芯片的團(tuán)隊,這些芯片可以根據(jù)其 AI 工作負(fù)載進(jìn)行定制,讓公司在英偉達(dá)和AMD等巨頭把持的市場中找到新的機(jī)會。

雖然Meta野心勃勃,但如文章開頭所說,他們還是需要繼續(xù)交學(xué)費。最近他們與英偉達(dá)和AMD的交易,也側(cè)面證明了公司在自研芯片上的波折。繼一周多前與英偉達(dá)達(dá)成了數(shù)百萬顆GPU的交易外,Meta日前與AMD也達(dá)成了6吉瓦的GPU交易。通過這兩單交易,讓他們在未來的算力競爭中獲得了更多的籌碼。而通過和兩個巨頭合作,則分擔(dān)了風(fēng)險并增加了談判籌碼。

再加上文章開頭談到的TPU交易,Meta正在下一盤大棋。

在最新的模型中,谷歌已成功證明,其在處理最關(guān)鍵的內(nèi)部工作負(fù)載時可以繞過英偉達(dá)。目前,Gemini 3 和 4 幾乎完全(95-100%)在谷歌內(nèi)部 TPU 上進(jìn)行訓(xùn)練,而英偉達(dá) GPU 實際上僅處理該特定工作負(fù)載的 0-5%。對于搜索和 YouTube 等內(nèi)部推理任務(wù),TPU 仍處理約 85-90% 的業(yè)務(wù)量。

正是基于這個成功經(jīng)驗,谷歌瞄準(zhǔn)英偉達(dá)的地盤,計劃推出 TPU 即服務(wù)模式,作為 GPU 的可行替代方案。

據(jù)theinformation引述一位參與談判的人士的消息透露,Meta 還一直在與谷歌洽談,計劃最早于明年為其數(shù)據(jù)中心購買 TPU,但目前尚不清楚談判進(jìn)展如何。對谷歌而言是一項勝利,它為其增添了一位知名客戶,有助于其打造數(shù)十億美元的 TPU 銷售業(yè)務(wù)。與此同時,這也對英偉達(dá)構(gòu)成了威脅。英偉達(dá)目前主導(dǎo)著人工智能芯片市場,并向 Meta 提供圖形處理單元 (GPU) 以支持其人工智能的開發(fā)(即訓(xùn)練過程)。

除了與 Meta 達(dá)成協(xié)議外,谷歌還與一家未透露名稱的大型投資公司簽署了一項協(xié)議,為一家合資企業(yè)提供資金,該合資企業(yè)將向其他客戶租賃 TPU。谷歌正在與其他投資公司洽談,以資助其他類似的合資企業(yè)。

毫無疑問這次和Meta的合作,為TPU增加了更多可能,也為英偉達(dá)的GPU壟斷增加了變數(shù)。

但對Meta來說,他們更需要關(guān)心的事,自研的訓(xùn)練芯片,什么時候才能如愿。

*免責(zé)聲明:本文由作者原創(chuàng)。文章內(nèi)容系作者個人觀點,半導(dǎo)體行業(yè)觀察轉(zhuǎn)載僅為了傳達(dá)一種不同的觀點,不代表半導(dǎo)體行業(yè)觀察對該觀點贊同或支持,如果有任何異議,歡迎聯(lián)系半導(dǎo)體行業(yè)觀察。

今天是《半導(dǎo)體行業(yè)觀察》為您分享的第4330期內(nèi)容,歡迎關(guān)注。

加星標(biāo)??第一時間看推送



求推薦


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
艾哈邁德·瓦希迪將擔(dān)任伊朗伊斯蘭革命衛(wèi)隊總司令

艾哈邁德·瓦希迪將擔(dān)任伊朗伊斯蘭革命衛(wèi)隊總司令

財聯(lián)社
2026-03-01 15:42:18
以軍稱已完成對伊朗各條戰(zhàn)線所有高級領(lǐng)導(dǎo)層“清除行動”

以軍稱已完成對伊朗各條戰(zhàn)線所有高級領(lǐng)導(dǎo)層“清除行動”

財聯(lián)社
2026-03-02 01:20:05
至少裁掉5人!男籃下一階段陣容大洗牌,保送郭士強(qiáng)搶下小組第一

至少裁掉5人!男籃下一階段陣容大洗牌,保送郭士強(qiáng)搶下小組第一

緋雨兒
2026-03-02 11:26:07
又空砍35+13+9,約基奇復(fù)出后僅5勝8負(fù)!4點原因丟卡位戰(zhàn)跌出前四

又空砍35+13+9,約基奇復(fù)出后僅5勝8負(fù)!4點原因丟卡位戰(zhàn)跌出前四

鍋子籃球
2026-03-02 13:09:56
“餓瘦”和“運(yùn)動瘦”有什么區(qū)別?

“餓瘦”和“運(yùn)動瘦”有什么區(qū)別?

馬拉松跑步健身
2026-02-21 20:56:17
汪小菲吐槽小汪寶心眼太多,回應(yīng)玥箖上學(xué)問題,筱梅或成了導(dǎo)火索

汪小菲吐槽小汪寶心眼太多,回應(yīng)玥箖上學(xué)問題,筱梅或成了導(dǎo)火索

查爾菲的筆記
2026-02-28 13:39:27
“00后”陳某某被押赴刑場 執(zhí)行死刑

“00后”陳某某被押赴刑場 執(zhí)行死刑

閃電新聞
2026-02-07 16:53:35
你有知道哪些炸裂的秘密?網(wǎng)友:我有個秘密說出來肯定大家要笑死

你有知道哪些炸裂的秘密?網(wǎng)友:我有個秘密說出來肯定大家要笑死

帶你感受人間冷暖
2026-01-29 00:10:05
中國男籃逆轉(zhuǎn)中國臺北引熱議!媒體人盛贊李弘權(quán)逆轉(zhuǎn)英雄

中國男籃逆轉(zhuǎn)中國臺北引熱議!媒體人盛贊李弘權(quán)逆轉(zhuǎn)英雄

狼叔評論
2026-03-01 18:26:08
綠議員批“二二八”紀(jì)念活動流于形式,桃園市府反問:怎么三年來沒參加過

綠議員批“二二八”紀(jì)念活動流于形式,桃園市府反問:怎么三年來沒參加過

海峽導(dǎo)報社
2026-03-01 10:42:02
41歲阿Sa真敢穿!紅白條紋泳裝秀22寸螞蟻腰,網(wǎng)友:沒身材別硬秀

41歲阿Sa真敢穿!紅白條紋泳裝秀22寸螞蟻腰,網(wǎng)友:沒身材別硬秀

葉公子
2026-03-02 12:06:04
內(nèi)塔尼亞胡:諸多跡象顯示哈梅內(nèi)伊已“不在人世”

內(nèi)塔尼亞胡:諸多跡象顯示哈梅內(nèi)伊已“不在人世”

財聯(lián)社
2026-03-01 03:39:04
美媒:美國再次成為唯一超級大國,中國曾有機(jī)會,但如今輸?shù)舾偁?>
    </a>
        <h3>
      <a href=縱擁千千晚星
2026-01-20 14:16:25
0.02平方公里擠著5萬人?警察不敢進(jìn)的九龍寨城,1987年被連根拔起

0.02平方公里擠著5萬人?警察不敢進(jìn)的九龍寨城,1987年被連根拔起

老杉說歷史
2026-02-06 00:17:10
中國新婚夫妻中東度蜜月突遇戰(zhàn)爭爆發(fā),新娘在領(lǐng)空關(guān)閉前離境,新郎滯留:不時傳來爆炸聲,買了餅干和水,機(jī)票改簽到10多天后

中國新婚夫妻中東度蜜月突遇戰(zhàn)爭爆發(fā),新娘在領(lǐng)空關(guān)閉前離境,新郎滯留:不時傳來爆炸聲,買了餅干和水,機(jī)票改簽到10多天后

大象新聞
2026-03-01 23:45:04
終于簽了!山東男籃新援搞定,CBA新面孔,擁有NBA履歷,能打硬仗

終于簽了!山東男籃新援搞定,CBA新面孔,擁有NBA履歷,能打硬仗

萌蘭聊個球
2026-03-02 09:08:23
這女的真不講究

這女的真不講究

太急張三瘋
2026-02-14 19:35:03
高考數(shù)學(xué)命題老師葛軍入駐抖音 評論區(qū)炸出一堆2003年的高考生

高考數(shù)學(xué)命題老師葛軍入駐抖音 評論區(qū)炸出一堆2003年的高考生

閃電新聞
2026-02-28 11:48:30
1200枚導(dǎo)彈從天而降,特朗普留下“退路”,伊朗全國哀悼,俄發(fā)聲

1200枚導(dǎo)彈從天而降,特朗普留下“退路”,伊朗全國哀悼,俄發(fā)聲

小嵩
2026-03-02 13:31:56
伊朗最高領(lǐng)袖遇害的悲劇,令人想起了一位中國秘密人物。

伊朗最高領(lǐng)袖遇害的悲劇,令人想起了一位中國秘密人物。

華人星光
2026-03-01 11:52:34
2026-03-02 14:20:49
半導(dǎo)體行業(yè)觀察 incentive-icons
半導(dǎo)體行業(yè)觀察
專注觀察全球半導(dǎo)體行業(yè)資訊
13051文章數(shù) 34825關(guān)注度
往期回顧 全部

科技要聞

榮耀發(fā)布機(jī)器人手機(jī)、折疊屏、人形機(jī)器人

頭條要聞

牛彈琴:伊朗之戰(zhàn)比俄烏之戰(zhàn)更生猛 給世界5個深刻教訓(xùn)

頭條要聞

牛彈琴:伊朗之戰(zhàn)比俄烏之戰(zhàn)更生猛 給世界5個深刻教訓(xùn)

體育要聞

卡里克主場5連勝!隊史第2人通過最大考驗

娛樂要聞

美伊以沖突爆發(fā),多位明星被困中東

財經(jīng)要聞

中東局勢影響如何?十大券商策略來了

汽車要聞

預(yù)售11.28萬起 狐全新阿爾法S5標(biāo)配寧德時代

態(tài)度原創(chuàng)

本地
游戲
旅游
藝術(shù)
公開課

本地新聞

津南好·四時總相宜

曝戰(zhàn)神新作風(fēng)格將大變!比起戰(zhàn)神可能更像鬼泣

旅游要聞

亭亭玉立、暗香浮動!醉白池白玉蘭驚艷綻放

藝術(shù)要聞

2025北京青年美術(shù)作品展 | 油畫作品選刊

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版