国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AI芯片,新混戰(zhàn)

0
分享至

公眾號記得加星標(biāo)??,第一時間看推送不會錯過。

2026年春,AI行業(yè)又傳出一則重磅消息:據(jù)路透社報道,Anthropic正在探索自主設(shè)計芯片的可能性。這家年度化營收已突破300億美元、旗下Claude模型用戶激增的AI實驗室,正認(rèn)真考慮從算力的消費者,演變?yōu)樗懔Φ亩x者。

消息人士坦承,相關(guān)計劃仍處于早期階段,公司尚未確定具體方案,也未組建專門團(tuán)隊。Anthropic最終仍可能選擇只采購芯片,而非自行設(shè)計。但即便只是可能性,也足以說明一些問題。

目前,Anthropic同時使用谷歌母公司Alphabet設(shè)計的TPU張量處理單元,以及亞馬遜的Trainium芯片來開發(fā)并運行Claude。就在本周,該公司還與谷歌及博通簽署了一項長期協(xié)議,后者正是谷歌TPU的核心設(shè)計支持方。一邊簽下百億級的外部采購協(xié)議,一邊悄悄探路自研,這種左右兩手并舉的姿態(tài),像極了幾年前的Meta和微軟,而它們在今天都已擁有了自己的專屬芯片。

設(shè)計一款頂級AI芯片,業(yè)內(nèi)估算約需五億美元,但在價格之外更值得關(guān)注的,是Anthropic此舉背后的行業(yè)信號。當(dāng)一家純模型公司開始認(rèn)真思考自研硅片,這場關(guān)于AI推理的硬件爭奪戰(zhàn),實際上已進(jìn)入了新的烈度。

推理,成為新的主戰(zhàn)場

這兩年,AI行業(yè)發(fā)生了一次劇變,大量算力需求從訓(xùn)練側(cè)迅速轉(zhuǎn)向推理側(cè)。

訓(xùn)練階段,動輒耗費數(shù)周乃至數(shù)月,需要大規(guī)模GPU集群并行運算,英偉達(dá)在這一側(cè)的統(tǒng)治地位已近乎無可撼動。但推理不同。推理是模型每一次響應(yīng)用戶請求時實時發(fā)生的計算,它追求的是低延遲、高吞吐、低能耗,而這些目標(biāo),與GPU所擅長的領(lǐng)域并不完全吻合。

根據(jù)巴克萊的預(yù)測,到2026年,推理計算需求將占AI總算力需求的70%以上,是訓(xùn)練需求的4.5倍,可以說,未來AI芯片市場的真正決戰(zhàn)就在推理。

英偉達(dá)在訓(xùn)練端積累了十年的護(hù)城河,若這條護(hù)城河無法延伸到推理端,那么整個行業(yè)格局就面臨重寫。正因如此,英偉達(dá)在去年年底正式出手,宣布與AI推理芯片初創(chuàng)公司Groq達(dá)成非獨家許可協(xié)議。Groq創(chuàng)始人兼CEO喬納森·羅斯、總裁桑尼·馬德拉及多名核心工程師,隨即加入英偉達(dá)。外媒援引知情人士的說法,這筆交易的對價約為200億美元。

英偉達(dá)官方措辭謹(jǐn)慎,強調(diào)只是技術(shù)授權(quán)加人才引入,而非傳統(tǒng)收購。但這種非典型收購的玩法,在硅谷已經(jīng)相當(dāng)普遍,它既能規(guī)避繁瑣的反壟斷審查,又能實質(zhì)性地將目標(biāo)技術(shù)和核心團(tuán)隊收入囊中。

Groq的故事本來相當(dāng)精彩。創(chuàng)始人羅斯曾是谷歌TPU項目的核心成員,深知GPU架構(gòu)在推理場景下的天然局限:數(shù)千個并行計算單元、極為復(fù)雜的內(nèi)存調(diào)度邏輯,這些特性在訓(xùn)練時是優(yōu)勢,在推理時反而造成不可預(yù)測的延遲抖動。

也因為如此,Groq選擇了一條截然不同的路:徹底取消硬件層面的調(diào)度器,改由編譯器在代碼階段就確定每一比特數(shù)據(jù)的流轉(zhuǎn)路徑,讓芯片像一條精確到納秒的自動化流水線運轉(zhuǎn)。這種架構(gòu)被命名為LPU,即語言處理單元,在主流大模型的推理測試中,其單詞生成速度可達(dá)英偉達(dá)GPU的十倍以上,而每token的能耗僅為后者的十分之一。

憑借這種極致性能,Groq吸引了超過150萬開發(fā)者用戶,并先后獲得思科、三星、貝萊德等頂級機構(gòu)的多輪投資,估值一度達(dá)69億美元。然而成也蕭何,敗也蕭何。正是Groq過于耀眼的推理性能,讓它成為了黃仁勛眼中最需要被鎖定的目標(biāo)。

表面上,英偉達(dá)收購Groq是在補全推理側(cè)的技術(shù)版圖,而更深入看,這是一次防御性整合,通過將最強外部挑戰(zhàn)者之一收編進(jìn)自己的生態(tài),英偉達(dá)拿走了那些沒有自研芯片能力的二線云廠商和AI軟件公司手中的議價籌碼。失去了Groq作為替代選項,那些不愿被英偉達(dá)征稅的企業(yè),如今面臨的選項驟然收窄。

巨頭各自磨刀

然而釜底抽薪的困局,未必會持續(xù)太久。

事實上,早在Groq崛起之前,各大云巨頭就已經(jīng)在獨立謀劃自己的算力出路。谷歌有TPU,亞馬遜有Trainium,微軟有Maia,這三條自研路線,如今都已走到了可以向外兜售的成熟階段。

谷歌的第七代TPU,代號Ironwood,2025年底正式發(fā)布并上市。與前代相比,其單芯片性能提升4倍以上,單集群最高可互聯(lián)9216顆芯片。谷歌對這一代產(chǎn)品的定位毫不掩飾:推理時代最省錢的商業(yè)引擎。從2015年因內(nèi)部算力瓶頸被迫自研,到2025年將TPU開放部署到客戶自有數(shù)據(jù)中心,谷歌用十年時間,把一個應(yīng)急項目打磨成了戰(zhàn)略武器。Anthropic宣布未來Claude系列的訓(xùn)練與部署將使用多達(dá)一百萬顆TPU,更讓Ironwood的商業(yè)價值得到了市場層面的權(quán)威背書。

亞馬遜走的是另一條路。AWS長期高度依賴旗下Annapurna Labs自研的芯片,Trainium系列大致對標(biāo)英偉達(dá)GPU,但側(cè)重點在于降低云基礎(chǔ)設(shè)施成本、減少對外部供應(yīng)商的依賴。此番AWS與Cerebras簽署多年合作協(xié)議,計劃將Cerebras的晶圓級引擎WSE芯片引入數(shù)據(jù)中心,與自研Trainium芯片并行部署,正是這種自研為主、外采為輔邏輯的具體體現(xiàn)。

AWS的目標(biāo)非常明確,用Trainium承接低速、低價的推理需求,用Cerebras芯片鎖定那些對延遲極度敏感、愿意為速度付溢價的高端客戶。

對于推理芯片而言,它不像訓(xùn)練芯片那樣追求短期的速度,其更看重長期的能耗效益。一塊英偉達(dá)GPU功耗約700瓦,而同等算力的專用推理芯片功耗可控制在200瓦以內(nèi),對于需要數(shù)十萬片推理芯片支撐的超大規(guī)模應(yīng)用,這種差距每年能帶來數(shù)億美元的成本節(jié)省。這也是谷歌、亞馬遜、Meta等云巨頭爭相押注ASIC專用芯片的核心原因之一。

據(jù)最新消費透露,Meta和博通達(dá)成了1Gw的訓(xùn)練和推理芯片合作協(xié)議,這勢必會給本就“混亂”的推理芯片市場,帶來新的催化劑。

異構(gòu)時代,新聯(lián)盟崛起

如果說云巨頭的自研路線是一種有充足資源保障的長期賭注,那么英特爾與SambaNova的聯(lián)手,則代表了另一種更具現(xiàn)實感的突圍路徑。

2026年,SambaNova宣布與英特爾推出異構(gòu)硬件推理方案,采用GPU負(fù)責(zé)預(yù)填充、英特爾至強6處理器作為主控與執(zhí)行CPU、SambaNova RDU負(fù)責(zé)解碼的三層架構(gòu),專為智能體AI工作負(fù)載設(shè)計。這套方案將于2026年下半年面向企業(yè)、云服務(wù)商及主權(quán)AI項目開放。

SambaNova指出,純GPU體系擅長并行化的預(yù)填充環(huán)節(jié),但在生產(chǎn)環(huán)境的推理任務(wù)中,CPU的工具調(diào)度與專用推理加速器的解碼效率,才是決定整體速度與成本的關(guān)鍵變量。

而其測試數(shù)據(jù)顯示,英特爾至強6處理器的LLVM編譯速度較基于Arm架構(gòu)的服務(wù)器CPU提升超50%,向量數(shù)據(jù)庫性能最高快70%,這兩個指標(biāo),恰好切中代碼智能體工作流的核心性能瓶頸。

英特爾在這場合作中的角色耐人尋味。曾經(jīng)的PC霸主,在GPU時代幾乎被邊緣化出AI芯片主戰(zhàn)場,如今借助至強6的CPU控制調(diào)度優(yōu)勢,正在異構(gòu)推理方案中重新找回存在感。數(shù)據(jù)中心軟件生態(tài)以x86架構(gòu)為基礎(chǔ),也讓英特爾重新回到了AI舞臺中心。

大芯片,闖入視線

Cerebras是另一個值得單獨書寫的名字。

這家專注晶圓級AI芯片的初創(chuàng)公司,曾在2024年提交IPO申請,隨即撤回,資本市場對其前景一度疑慮重重。但隨后,OpenAI與Cerebras簽署了價值超百億美元的合作協(xié)議,為ChatGPT提供算力,這一消息讓Cerebras重回公眾視野,也讓那些曾經(jīng)觀望的機構(gòu)重新審視其技術(shù)價值。2026年2月,Cerebras完成10億美元新一輪融資,總?cè)谫Y額達(dá)26億美元,投后估值約230億美元。

Cerebras的核心技術(shù)是晶圓級引擎WSE,將整塊晶圓作為一顆芯片使用,突破了傳統(tǒng)芯片的物理切割限制,在特定推理任務(wù)中的延遲表現(xiàn)極為出色。據(jù)Cerebras聲稱,其芯片在推理解碼環(huán)節(jié)的速度,最高可達(dá)英偉達(dá)GPU的25倍。

此番AWS宣布與Cerebras簽署多年合作協(xié)議,將WSE芯片引入數(shù)據(jù)中心用于AI推理,標(biāo)志著這家初創(chuàng)公司完成了一次關(guān)鍵的身份躍遷,從融資故事,變成了全球最大云平臺的供應(yīng)商。

AWS選擇Cerebras,其背后邏輯與OpenAI的選擇一脈相承:對于編程輔助、智能體任務(wù)這類對響應(yīng)速度極度敏感的場景,每一毫秒的延遲縮減都直接對應(yīng)用戶體驗和商業(yè)價值,而這恰好是GPU的軟肋所在。

對于Cerebras而言,越來越多的人用AI解決越來越難的問題,對速度的需求只會增不會減。若速度本身就是產(chǎn)品價值所在,那么為速度付溢價就是理所當(dāng)然的商業(yè)行為。這套邏輯,正在越來越多的企業(yè)端被接受。

CoreWeave,

算力市場的新引力中心

算力爭奪戰(zhàn)的背面,是基礎(chǔ)設(shè)施供給側(cè)的重構(gòu)。而在這一端,CoreWeave的角色愈發(fā)不可忽視。

2025年,Meta率先與CoreWeave簽署供應(yīng)協(xié)議,約定在2031年前采購142億美元的AI算力;近日提交SEC的文件顯示,Meta已追加協(xié)議,將在2032年前額外采購210億美元的算力。這筆新協(xié)議的加入,將CoreWeave的訂單儲備推至878億美元,其中Meta一家便占去約40%。

CoreWeave的崛起,是GPU算力由稀缺商品向基礎(chǔ)設(shè)施演變這一過程的縮影。作為純粹的算力租賃商,它提供的并非模型能力,而是讓模型跑得起來的底層支撐。在三大云巨頭之外,AI企業(yè)需要一個不綁定平臺生態(tài)的算力選項,而CoreWeave恰好填補了這個空缺。

2025年全年,CoreWeave實現(xiàn)銷售額51.3億美元,較上年增長約1.7倍。其數(shù)據(jù)中心規(guī)模已擴至43座,在用電力容量達(dá)850兆瓦。公司配備的約60萬張GPU,以英偉達(dá)H100、H200為主干,Blackwell系列占比持續(xù)提升。簽約總電力容量則已達(dá)3500兆瓦,這個數(shù)字,是其當(dāng)前在用容量的四倍有余。

然而CoreWeave的擴張邏輯,也正是其面臨的最大結(jié)構(gòu)壓力所在。為覆蓋數(shù)據(jù)中心擴建成本,公司近日宣布定向發(fā)行總計47.5億美元債券。在手現(xiàn)金不足40億美元的情況下,要在2026年完成300億至350億美元的資本支出,意味著需要持續(xù)依靠外部融資維持高速擴張。CoreWeave的投資方們,顯然下注的是算力需求仍將長期高增長這一核心判斷。

混戰(zhàn),仍在繼續(xù)

Anthropic開始自研芯片,英偉達(dá)200億美元收購Groq,谷歌十年磨一劍將TPU打造成標(biāo)桿產(chǎn)品,亞馬遜將Cerebras引入自家數(shù)據(jù)中心構(gòu)建差異化推理組合,英特爾聯(lián)手SambaNova在異構(gòu)推理市場爭奪一席之地等等,這些看似分散的事件,其實都指向了推理這一新戰(zhàn)場。

越多越多人意識到,AI的重心,正在從如何訓(xùn)練出更好的模型轉(zhuǎn)向如何以更低的成本、更快的速度推理更多的請求。這個轉(zhuǎn)變,使得之前以GPU為核心的算力體系,開始進(jìn)行一場浩浩蕩蕩的轉(zhuǎn)變。

這一輪競爭,與早年GPU對CPU的替代并不相同。那是一場新產(chǎn)品對舊產(chǎn)品的單向碾壓。而今天的推理芯片之爭,更像是一個復(fù)雜生態(tài)內(nèi)部的分工重組,沒有任何一種架構(gòu)能獨占所有場景,異構(gòu)組合正在成為主流。GPU處理高度并行的預(yù)填充,專用推理芯片承擔(dān)解碼,CPU負(fù)責(zé)調(diào)度協(xié)調(diào),云端與邊緣端各有側(cè)重,每個環(huán)節(jié)都有多個玩家競逐。

這也意味著,勝負(fù)遠(yuǎn)未分曉。

對Anthropic而言,探索自研芯片是一種對算力自主權(quán)的主動追求,也是一張防止被上游供應(yīng)商裹挾的保險單。但芯片研發(fā)的長周期與高投入,意味著這條路走起來并不輕松。對英偉達(dá)而言,CUDA生態(tài)護(hù)城河依然深厚,但推理端越來越明顯的性能-成本缺口,正在成為所有潛在挑戰(zhàn)者共同瞄準(zhǔn)的突破口。對類似Groq的其他技術(shù)競爭者而言,技術(shù)領(lǐng)先并不必然轉(zhuǎn)化為商業(yè)勝利,被收購的可能性也在不斷增大。

戰(zhàn)線已經(jīng)拉開,參與者的名單還在增加。這場AI推理的算力混戰(zhàn),才剛剛走進(jìn)它最熱烈的章節(jié)。

*免責(zé)聲明:本文由作者原創(chuàng)。文章內(nèi)容系作者個人觀點,半導(dǎo)體行業(yè)觀察轉(zhuǎn)載僅為了傳達(dá)一種不同的觀點,不代表半導(dǎo)體行業(yè)觀察對該觀點贊同或支持,如果有任何異議,歡迎聯(lián)系半導(dǎo)體行業(yè)觀察。

今天是《半導(dǎo)體行業(yè)觀察》為您分享的第4377內(nèi)容,歡迎關(guān)注。

加星標(biāo)??第一時間看推送

求推薦

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
2026斯諾克世錦賽:中國選手占1/3,轉(zhuǎn)播權(quán)怎么分?

2026斯諾克世錦賽:中國選手占1/3,轉(zhuǎn)播權(quán)怎么分?

競技風(fēng)云錄
2026-04-20 20:01:20
震驚!上海成人展身著短裙絲襪女性從業(yè)者,被質(zhì)問是否遭男性凝視

震驚!上海成人展身著短裙絲襪女性從業(yè)者,被質(zhì)問是否遭男性凝視

火山詩話
2026-04-21 10:13:36
女子21萬全款購車后發(fā)現(xiàn)該車為“展車”,4S店稱“工作失誤” 當(dāng)?shù)厥斜O(jiān)部門已介入

女子21萬全款購車后發(fā)現(xiàn)該車為“展車”,4S店稱“工作失誤” 當(dāng)?shù)厥斜O(jiān)部門已介入

紅星新聞
2026-04-21 14:51:54
霍爾木茲海峽出入口已被伊朗封鎖!?;饏f(xié)議到期不足11小時,特朗普:不想延長,沒那么多時間了;伊朗:已為戰(zhàn)事重燃做好準(zhǔn)備

霍爾木茲海峽出入口已被伊朗封鎖!?;饏f(xié)議到期不足11小時,特朗普:不想延長,沒那么多時間了;伊朗:已為戰(zhàn)事重燃做好準(zhǔn)備

每日經(jīng)濟(jì)新聞
2026-04-21 21:28:11
年僅39歲!藍(lán)天救援隊員陳延壽搜救時遇難

年僅39歲!藍(lán)天救援隊員陳延壽搜救時遇難

新民晚報
2026-04-21 15:00:21
注意!6月1日起大醫(yī)院不再隨意接診,看病不按規(guī)矩可能白跑

注意!6月1日起大醫(yī)院不再隨意接診,看病不按規(guī)矩可能白跑

夜深愛雜談
2026-04-21 07:45:20
庫明加登老鷹海報扎心科爾!美媒曝主帥信任差距大:還曬分?jǐn)?shù)對比

庫明加登老鷹海報扎心科爾!美媒曝主帥信任差距大:還曬分?jǐn)?shù)對比

顏小白的籃球夢
2026-04-21 15:40:44
越來越清晰:只剩革命衛(wèi)隊問題還沒解決,未來會被內(nèi)外聯(lián)合絞殺嗎

越來越清晰:只剩革命衛(wèi)隊問題還沒解決,未來會被內(nèi)外聯(lián)合絞殺嗎

民間胡扯老哥
2026-04-21 05:45:15
連車企的名字都不敢報道,這樣的新聞有什么意義

連車企的名字都不敢報道,這樣的新聞有什么意義

林中木白
2026-04-21 15:51:28
美稱扣押的船只與制造導(dǎo)彈有關(guān)?外交部:中方反對惡意關(guān)聯(lián)和炒作

美稱扣押的船只與制造導(dǎo)彈有關(guān)?外交部:中方反對惡意關(guān)聯(lián)和炒作

澎湃新聞
2026-04-21 15:36:26
105歲才能取本金“隨用隨取”成空話 保險公司算欺詐嗎?法院判了

105歲才能取本金“隨用隨取”成空話 保險公司算欺詐嗎?法院判了

環(huán)球網(wǎng)資訊
2026-04-21 15:08:47
特朗普稱預(yù)計?;鸬狡诤髮⒗^續(xù)轟炸伊朗

特朗普稱預(yù)計?;鸬狡诤髮⒗^續(xù)轟炸伊朗

財聯(lián)社
2026-04-21 21:50:07
美國開始退錢了:涉33萬企業(yè)1650億美元,多數(shù)涉及中國

美國開始退錢了:涉33萬企業(yè)1650億美元,多數(shù)涉及中國

觀察者網(wǎng)
2026-04-21 10:56:03
伊朗籍中國貨輪!在公海被美軍扣押后,不到24小時,中方表態(tài)

伊朗籍中國貨輪!在公海被美軍扣押后,不到24小時,中方表態(tài)

離離言幾許
2026-04-20 22:15:30
柬埔寨國王在京手術(shù),洪森攜子看望:感謝中方

柬埔寨國王在京手術(shù),洪森攜子看望:感謝中方

觀察者網(wǎng)
2026-04-21 18:34:24
電梯安裝違規(guī)操作致3人墜亡,事故調(diào)查報告公布

電梯安裝違規(guī)操作致3人墜亡,事故調(diào)查報告公布

極目新聞
2026-04-21 11:25:37
虧慘了!車管所正式提醒,2026 新規(guī)后只買交強加三者險行不通

虧慘了!車管所正式提醒,2026 新規(guī)后只買交強加三者險行不通

夜深愛雜談
2026-04-21 07:42:53
蘋果在印度養(yǎng)了9年,三哥終于下刀收割了!380億天價罰單來了

蘋果在印度養(yǎng)了9年,三哥終于下刀收割了!380億天價罰單來了

阿晪美食
2026-04-21 15:56:15
絕不談判!永久關(guān)閉豁免窗口!中國打響光刻機反擊戰(zhàn)

絕不談判!永久關(guān)閉豁免窗口!中國打響光刻機反擊戰(zhàn)

阿七說史
2026-04-20 15:10:26
港媒曝張曼玉“五官徹底分離”,61歲生圖惹爭議,倆部位面目全非

港媒曝張曼玉“五官徹底分離”,61歲生圖惹爭議,倆部位面目全非

冷紫葉
2026-04-20 17:12:17
2026-04-21 21:59:00
半導(dǎo)體行業(yè)觀察 incentive-icons
半導(dǎo)體行業(yè)觀察
專注觀察全球半導(dǎo)體行業(yè)資訊
13465文章數(shù) 34883關(guān)注度
往期回顧 全部

科技要聞

創(chuàng)造4萬億帝國、訪華20次,庫克留下了什么

頭條要聞

媒體:急于擺脫對華稀土依賴 美企28億美元在巴西搶礦

頭條要聞

媒體:急于擺脫對華稀土依賴 美企28億美元在巴西搶礦

體育要聞

62歲,成為中國足壇最火的人

娛樂要聞

周潤發(fā)時隔16年再賣樓,變現(xiàn)數(shù)億資產(chǎn)

財經(jīng)要聞

現(xiàn)實是最大的荒誕:千億平臺的沖突始末

汽車要聞

全新坦克700正式上市 售價42.8萬-50.8萬元

態(tài)度原創(chuàng)

游戲
健康
藝術(shù)
本地
公開課

玩家怒噴《黑旗》重制實機不如原版!育碧拉完了?

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

藝術(shù)要聞

任伯年寫竹,真帶勁

本地新聞

春色滿城關(guān)不?。座N梅浪漫盛放,吳山藏了一片四月雪

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版