国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

清微智能、Groq與改變GPU單行道的可能性

0
分享至

21世紀(jì)什么最貴?大多數(shù)公司始料未及,最貴的原來是算力,是數(shù)萬美元也“一芯難求”的GPU。

OpenAI創(chuàng)始人Sam Altman曾經(jīng)預(yù)言,算力將成為一種新的貨幣。去年,Gartner預(yù)測2026年的全球AI支出預(yù)計將達(dá)到2.52萬億美元,其中光是基礎(chǔ)設(shè)施就需要增加4010億美元的投入,相當(dāng)于英偉達(dá)三年多的營收。

算力的花費(fèi)可以分為兩部分,訓(xùn)練曾經(jīng)是最昂貴的支出。但隨著大模型嵌進(jìn)搜索、廣告、推薦、客服、游戲等高頻場景,推理逐漸取代訓(xùn)練,占據(jù)更大的成本。IDC預(yù)計,2026年,推理算力的消耗占比將會提升到62.2%,訓(xùn)練算力則降低到37.8%。

AI需要商業(yè)化,企業(yè)便需要更高性價比的算力,否則辛苦開拓的商業(yè)模式,最后全喂飽了英偉達(dá)。然而,GPU遵循的傳統(tǒng)架構(gòu)在執(zhí)行運(yùn)算時有不小的數(shù)據(jù)搬運(yùn)成本,在大規(guī)模實時生成任務(wù)中會產(chǎn)生更多花費(fèi),并且制造成本也在不斷上升。



于是,挑戰(zhàn)者不斷出現(xiàn),并拋出新的想法:如果,我們不用GPU的架構(gòu)呢?

一、尋找GPU之外的可能性

GPU誕生于圖形渲染年代,并行運(yùn)算能力突出,通用能力強(qiáng)。但這種多功能性用來支持AI,就成了歷史包袱,難以滿足Token邊際成本持續(xù)降低的需求。

這是索羅斯“反身性”理論在算力領(lǐng)域的兌現(xiàn):GPU“意外”適應(yīng)了AI的需求,早期AI依賴GPU并助推后者市場擴(kuò)大乃至絕對占有,然而當(dāng)算力需求發(fā)展到一定階段,GPU架構(gòu)又限制了AI效率的提高。早期的選擇也許只是那個時代的認(rèn)知偏差,但它又造成了后來的因果循環(huán),直到有新的架構(gòu)能打破這種怪圈。

相比之下,非GPU路線能更好地針對AI需求做定制化,ASIC(專用集成電路)因此崛起。這條路上的知名企業(yè)數(shù)不勝數(shù),華為、谷歌、博通、百度、寒武紀(jì)……無論采取何種架構(gòu)、打造何種產(chǎn)品,都是為了AI的降本增效。



2025年11月,谷歌發(fā)布Gemini 3,性能跑贏了OpenAI被市場寄予厚望的GPT 5.1。Gemini 3基于谷歌自研芯片TPU訓(xùn)練,高盛推算其單位token推理成本下降約70%,在后發(fā)條件下追平了英偉達(dá)GB200 NVL72的成本。

去年,Anthropic便宣布要采用最多100萬張TPU,11月又有消息稱Meta考慮將部分AI基礎(chǔ)設(shè)施遷移至谷歌TPU。就連英偉達(dá)股價,也因此受到影響。

但ASIC有一個天然短板:既然是定制,那么就難以匹配還在持續(xù)更新的AI算法和架構(gòu)需求,而設(shè)計一個架構(gòu)需要很長的周期,一旦算法變更,芯片就有可能過時?!靶灸f(xié)同”,對于AI生態(tài)的構(gòu)建意義重大。

去年的上海世界人工智能大會上,就有不少國產(chǎn)芯片廠商格外強(qiáng)調(diào)這一點(diǎn)。DeepSeek作為開源之光,也得到了國產(chǎn)芯片廠商的大力適配。其V4版本發(fā)布在即,很快又要接近適配節(jié)點(diǎn)。

既要高性能,又要強(qiáng)適配,有沒有一種辦法,能讓芯片和數(shù)據(jù)算法更好地協(xié)同,高效適應(yīng)模型的進(jìn)化?

不僅有,而且還得到了英偉達(dá)的變相認(rèn)可。

去年末,英偉達(dá)意外斥資約200億美元,獲得Groq知識產(chǎn)權(quán)的非獨(dú)家授權(quán),并將其主要人物一舉收入囊中。



Groq由谷歌TPU早期團(tuán)隊成員創(chuàng)立,他們基于可重構(gòu)數(shù)據(jù)流方法打造了LPU(Language Processing Unit,語言處理單元)產(chǎn)品,適配開源模型后展現(xiàn)的推理成本遠(yuǎn)低于GPU。

而幾乎同一時間,“北京四大明星芯片公司”之一的清微智能,也基于可重構(gòu)芯片(RPU)優(yōu)勢拿下超20億元C輪融資,國家大基金二期、京能集團(tuán)、京國瑞等多層級國資密集入場。我們從行業(yè)了解到,清微智能過去一年估值翻了三倍有余,接近190億元,目前正在籌備Pre-IPO輪融資,為最終上市做準(zhǔn)備。



“可重構(gòu)數(shù)據(jù)流”為什么這么獨(dú)特,能在大洋兩岸同時受到超級資本們的認(rèn)可甚至追捧?答案是架構(gòu)——它不再以上下指令的通用處理器為中心,而是先看要處理的數(shù)據(jù)流長什么樣,再讓硬件圍繞數(shù)據(jù)流去重構(gòu)自己的電路拓?fù)?。簡單來說,軟件定義硬件:

傳統(tǒng)GPU存在“內(nèi)存墻、效率墻、互聯(lián)墻”問題,因為指揮數(shù)據(jù)的“旗手”和搬運(yùn)數(shù)據(jù)的“員工”要不斷地交流信息,徒增成本。ASIC方案把搬運(yùn)流程變成了固定流水線,效率提高了,不過每次需求一改就要重新定制流水線。而RPU方案是根據(jù)數(shù)據(jù)算法的需求定義流水線,想要什么傳送方式,便可以朝那個方向重構(gòu)。

用清微智能創(chuàng)始人王博的比喻,這是在芯片里搭了一張充滿“電子道岔”的鐵路網(wǎng)。傳統(tǒng)芯片是一條單線鐵路,火車只能沿既定軌道跑;可重構(gòu)數(shù)據(jù)流芯片則在每個節(jié)點(diǎn)都埋了道岔,今天把這些“小計算器”連成卷積流水線,明天又重連成注意力模塊專用路徑,執(zhí)行完一段網(wǎng)絡(luò)就擦除配置,十幾納秒內(nèi)切成另一種拓?fù)洹?/p>

本質(zhì)上,它把程序驅(qū)動硬件變成數(shù)據(jù)驅(qū)動硬件,讓數(shù)據(jù)在芯片內(nèi)部節(jié)點(diǎn)之間直接流動,盡量少繞回顯存排隊。這對參數(shù)海量、訪問模式高度規(guī)則的大模型尤其友好——每少繞一次路,背后都是成本曲線被向下拉了一段。

于是,算力產(chǎn)業(yè)擁有了一個具備差異化特征的“第二陣營”,嘗試在蠻力堆砌GPU之外找出路。以清微智能為代表的創(chuàng)業(yè)公司,正在給大模型算力問題寫出“第二解”。

二、太平洋兩岸的可重構(gòu)競賽:清微智能領(lǐng)銜中國式創(chuàng)新

可重構(gòu)的概念并不新鮮,重要的是它有了產(chǎn)業(yè)化的能力。Groq把語言推理抽象成LPU,適配開源模型后的推理效率一鳴驚人,SambaNova也在用RDU與整機(jī)方案做企業(yè)市場。

在這股潮流中,清微智能作為稀缺的新架構(gòu)算力芯片企業(yè),自然而然扮演了一個新角色:中國并非只能在GPU主線上做追隨者,在剛剛打開的第二條算力支流上,我們擁有一支能拿得出手的本土隊伍。它脫胎于清華大學(xué)微電子學(xué)院研究成果,如今正在為中國的芯模協(xié)同貢獻(xiàn)力量。

在端側(cè),清微早期用TX5系列產(chǎn)品驗證了這條路并非紙上談兵。一顆工作功耗不到2毫瓦的語音芯片,讓門鎖、音箱、手機(jī)保持常年待機(jī)聆聽狀態(tài);多款視覺與語音終端芯片被裝進(jìn)攝像頭、手機(jī)、IoT設(shè)備里,累計出貨超三千萬顆。這些看似不起眼的產(chǎn)品,在較長的鏈路中完成了可重構(gòu)架構(gòu)的可靠性和工具鏈壓力測試。

而真正讓清微智能具備“爆棚”潛力的,是面向云端市場的TX8高算力芯片。它把“數(shù)據(jù)流+可重構(gòu)”直接做到大面積裸片上,并配上一種不同于GPU的互聯(lián)方式——C2C算力網(wǎng)格。

傳統(tǒng)GPU集群的路徑是“PCIe—網(wǎng)卡—交換機(jī)—網(wǎng)卡—PCIe”,每加一層節(jié)點(diǎn)就多一層延遲和擁塞。清微選擇在芯片之間直接織網(wǎng),讓多卡互聯(lián)更接近板上直連。這樣一來,在千卡規(guī)模內(nèi)可以削減大量昂貴交換機(jī)投資,同時把大模型訓(xùn)練/推理中最容易觸頂?shù)摹盎ヂ?lián)墻”壓薄一層。

搭載TX81的REX1032訓(xùn)推一體服務(wù)器,在同等功耗下可以承載萬億參數(shù)模型部署,單機(jī)跑DeepSeekR1/V3級別模型無需“縮水版”;整機(jī)方案測算下來,比同類GPU產(chǎn)品綜合成本低約一半,能效比提升約三倍。



IDC統(tǒng)計顯示,2025年上半年,清微在國產(chǎn)非GPU(含可重構(gòu)、ASIC)加速卡銷量中位列第六,進(jìn)入本土算力第一梯隊。



目前,清微智能已經(jīng)為多地智算中心打造了“實戰(zhàn)裝備”。黑龍江、浙江、安徽、北京等地陸續(xù)上線千卡規(guī)模集群,新疆雙河的中樹云智算中心則在首期工程中直接采用可重構(gòu)架構(gòu),成為“東數(shù)西算”和算力出海的重要節(jié)點(diǎn)之一。

在軟件與生態(tài)上,清微一方面在眾智FlagOS上做到卓越適配,與寒武紀(jì)、昆侖芯、摩爾線程、昇騰、中科海光并列為領(lǐng)域內(nèi)的“六脈神劍”;另一方面采用“三層兼容”策略——上層CUDA API級兼容,中層深度押注OpenAI主推的Triton編譯器并與智源共建生態(tài),底層用RISC?V替代PTX,為開發(fā)者預(yù)留足夠“壓榨性能”的空間。

這些看似瑣碎的工程選擇,針對的是新架構(gòu)影響的客戶遷移成本、交付與支持可靠性等問題。太多AI芯片創(chuàng)業(yè)公司倒在這一關(guān),而清微智能在可重構(gòu)數(shù)據(jù)流這條支流上,率先完成了從可用到可規(guī)模部署的躍遷,為中國算力產(chǎn)業(yè)探得了一方獨(dú)立、有潛力的天地。

三、從“補(bǔ)課生”到“解題人”:高階國產(chǎn)替代的第二條路

王博曾經(jīng)表示,“相比短平快的仿制路線,選擇新架構(gòu)實現(xiàn)‘換道超車’才是真正的高階國產(chǎn)替代?!鼻逦⒅悄苎鹤⑽磥?到5年的算力革命,實施“研發(fā)一代、儲備一代、釋放一代”的技術(shù)戰(zhàn)略。

在這個過程中,清微智能扭轉(zhuǎn)了算力問題的維度:不做英偉達(dá)的“補(bǔ)課生”,而是在另一條技術(shù)主線上,成為“解題人”。

這條路的難度一點(diǎn)不低,它意味著幾件事要同時發(fā)生:

第一,要接受長時間的生態(tài)劣勢,只能靠性能、能效、成本上的顯著優(yōu)勢來抵消遷移成本。王博給客戶的下一階段承諾是“5倍性價比”:把采購、運(yùn)維和性能整體算進(jìn)來,讓不轉(zhuǎn)平臺顯得更虧。這會提高對架構(gòu)、互聯(lián)、存儲、系統(tǒng)設(shè)計每一層的要求,但也會提高中國算力發(fā)展的天花板。

第二,要在非GPU賽道上盡快走完從“單點(diǎn)突破”到“系統(tǒng)方案”的閉環(huán)??芍貥?gòu)不是一顆孤立芯片,它要和3D存儲、Chiplet、晶圓級架構(gòu)等前沿方向咬合,形成一棵有延展性的技術(shù)樹。清微規(guī)劃中的TX83,就嘗試把可重構(gòu)算力網(wǎng)格與晶圓級芯片結(jié)合,為“后GPU時代”的大規(guī)模集群預(yù)留試驗場。

第三,要承認(rèn)算力問題已從芯片問題升級為系統(tǒng)問題。在大規(guī)模推理場景下,算力產(chǎn)業(yè)需要可長期演進(jìn)的整體,支撐應(yīng)用。此時,如果基座完全由海外產(chǎn)品來搭建,我們的應(yīng)用將進(jìn)一步形成依賴。而清微智能則在押一條未來十年中國算力不再完全鎖死在GPU帝國里的技術(shù)路線。

這條路當(dāng)然不保證成功,GPU也不會被“第二陣營”顛覆。但從產(chǎn)業(yè)角度,它至少已留下兩個里程碑:

一是把中國在新一代算力架構(gòu)上的時間點(diǎn),第一次對齊到全球同一批玩家。

王博曾經(jīng)總結(jié)過,芯片技術(shù)發(fā)展有一個“類摩爾定律”:20年,架構(gòu)更新一次。過去在CPU、GPU、存儲、接口標(biāo)準(zhǔn)上,我們幾乎總是在別人定完方向后才開始追;這一次,在TPU、LPU剛剛從論文走向產(chǎn)品的時間窗口,RPU也由中國工程師以同樣節(jié)奏做成了可出貨的工業(yè)品。



二是讓國家層面在算力上多了一條真正可選之路。當(dāng)GPU供應(yīng)出現(xiàn)風(fēng)險、單一生態(tài)的議價能力高得離譜時,已經(jīng)被初步跑通的新架構(gòu),會成為“火種”。

把視角再拉遠(yuǎn)一點(diǎn),如果未來十年AI真能避開上一輪“寒冬”的命運(yùn),很可能不是因為模型的聰明顛覆了人類想象,而是低成本大規(guī)模應(yīng)用改變了人類的生產(chǎn)方式。在如此宏大的時代旋律中,站在中國產(chǎn)業(yè)的支流上,機(jī)會也是無限的。清微智能被時代賦予的稀缺性,最終將以算力紅利的形式,反哺于中國產(chǎn)業(yè)。

來源:松果財經(jīng)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
世界上最燒錢的十項運(yùn)動,沒錢你真玩不起!

世界上最燒錢的十項運(yùn)動,沒錢你真玩不起!

馬拉松跑步健身
2026-02-28 11:37:18
小米事故炸翻37萬車主,雷軍左右為難!

小米事故炸翻37萬車主,雷軍左右為難!

鳴金網(wǎng)
2026-02-28 10:45:03
中國不當(dāng)冤大頭了!中科院停付國際期刊發(fā)表費(fèi),老外專家也急了

中國不當(dāng)冤大頭了!中科院停付國際期刊發(fā)表費(fèi),老外專家也急了

青青子衿
2026-02-27 20:32:03
江西女子用公驢器官泡酒,三個月后給丈夫喝,不料發(fā)生意外

江西女子用公驢器官泡酒,三個月后給丈夫喝,不料發(fā)生意外

古怪奇談錄
2025-06-28 13:49:02
伊朗呼吁民眾警惕敵人的心理戰(zhàn)

伊朗呼吁民眾警惕敵人的心理戰(zhàn)

財聯(lián)社
2026-03-01 03:56:08
6分鐘19個導(dǎo)彈連全軍覆沒,82架戰(zhàn)機(jī)被擊落,此戰(zhàn)給我們敲響警鐘

6分鐘19個導(dǎo)彈連全軍覆沒,82架戰(zhàn)機(jī)被擊落,此戰(zhàn)給我們敲響警鐘

混沌錄
2026-02-04 22:25:03
伊朗的投降王牌:只要美國松綁,出賣中國利益絕不會有半點(diǎn)猶豫

伊朗的投降王牌:只要美國松綁,出賣中國利益絕不會有半點(diǎn)猶豫

老范談史
2026-02-28 06:45:51
太扎心!過了40歲已經(jīng)死了,只是沒人埋,80后發(fā)千字肺腑之言…

太扎心!過了40歲已經(jīng)死了,只是沒人埋,80后發(fā)千字肺腑之言…

慧翔百科
2026-02-28 08:52:23
意外:臺灣56歲女主持吳中純昏迷3天去世,死因曝光

意外:臺灣56歲女主持吳中純昏迷3天去世,死因曝光

悠悠說世界
2026-03-01 02:52:25
網(wǎng)傳張禹珍詢問裁判退賽是否有積分后未果,隨后離場治療

網(wǎng)傳張禹珍詢問裁判退賽是否有積分后未果,隨后離場治療

懂球帝
2026-02-28 16:06:22
18連勝!孫穎莎4-2擊敗早田希娜!賽后日本媒體集體陷入驚恐,發(fā)出一陣陣哀鳴

18連勝!孫穎莎4-2擊敗早田希娜!賽后日本媒體集體陷入驚恐,發(fā)出一陣陣哀鳴

寒律
2026-03-01 02:01:28
伯克希爾2025年凈利潤超4500億元!現(xiàn)金儲備超2.5萬億元,巴菲特已正式退休,卸任公司CEO

伯克希爾2025年凈利潤超4500億元!現(xiàn)金儲備超2.5萬億元,巴菲特已正式退休,卸任公司CEO

每日經(jīng)濟(jì)新聞
2026-02-28 22:56:28
一場2-3,上演極限絕殺,英超土豪倒下,7億豪陣也沒用

一場2-3,上演極限絕殺,英超土豪倒下,7億豪陣也沒用

足球狗說
2026-03-01 01:27:54
開火了!承諾放棄核材料不到一天,美國翻臉,聯(lián)手以色列轟炸伊朗

開火了!承諾放棄核材料不到一天,美國翻臉,聯(lián)手以色列轟炸伊朗

派大星紀(jì)錄片
2026-02-28 16:53:27
起死回生!伊朗唯一能抗衡美國和以色列的,就剩下一招

起死回生!伊朗唯一能抗衡美國和以色列的,就剩下一招

起喜電影
2026-03-01 02:54:00
瓜帥:塞門約在很多方面都發(fā)揮了作用;希望哈蘭德盡快回來

瓜帥:塞門約在很多方面都發(fā)揮了作用;希望哈蘭德盡快回來

懂球帝
2026-03-01 04:07:13
美方報道的中國大使館被炸事件,中國軍事顧問團(tuán)遭重創(chuàng),秘而不宣

美方報道的中國大使館被炸事件,中國軍事顧問團(tuán)遭重創(chuàng),秘而不宣

干史人
2025-10-22 20:10:03
巴拿馬終于發(fā)現(xiàn),強(qiáng)吞中國18億資產(chǎn),竟是在自掘墳?zāi)?>
    </a>
        <h3>
      <a href=聚焦真實瞬間
2026-03-01 02:52:14
中國已經(jīng)提前收到了消息,伊朗這次基本上難逃此劫了

中國已經(jīng)提前收到了消息,伊朗這次基本上難逃此劫了

音樂時光的娛樂
2026-03-01 03:02:48
吳宜澤從1-4追到4-4,打丟關(guān)鍵黑球出局!趙心童的含金量還在上升

吳宜澤從1-4追到4-4,打丟關(guān)鍵黑球出局!趙心童的含金量還在上升

球場沒跑道
2026-03-01 01:51:22
2026-03-01 04:28:49
松果財經(jīng) incentive-icons
松果財經(jīng)
專注商業(yè)研究,挖掘新商業(yè)機(jī)會
5099文章數(shù) 4897關(guān)注度
往期回顧 全部

科技要聞

狂攬1100億美元!OpenAI再創(chuàng)融資神話

頭條要聞

伊朗媒體公布反擊美軍軍事行動結(jié)果

頭條要聞

伊朗媒體公布反擊美軍軍事行動結(jié)果

體育要聞

球隊主力全報銷?頂風(fēng)擺爛演都不演了

娛樂要聞

周杰倫兒子正面照曝光,與父親好像

財經(jīng)要聞

沖突爆發(fā) 市場變天?

汽車要聞

嵐圖泰山黑武士版3月上市 搭載華為四激光智駕方案

態(tài)度原創(chuàng)

本地
教育
數(shù)碼
手機(jī)
軍事航空

本地新聞

津南好·四時總相宜

教育要聞

初三不安排春假,最多可連休10天!一地率先公布!

數(shù)碼要聞

小米超薄充電寶亮相MWC,98g有多能打?

手機(jī)要聞

澎湃OS再次公布進(jìn)展通報:10個問題,僅修復(fù)一則!

軍事要聞

美國以色列聯(lián)合襲擊伊朗 實時戰(zhàn)況

無障礙瀏覽 進(jìn)入關(guān)懷版