国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

存算一體寫入十五五規(guī)劃,誰在埋頭解決通用與軟件生態(tài)難題?

0
分享至


智東西
作者 陳駿達(dá)
編輯 漠影

狂飆的AI,正給傳統(tǒng)計(jì)算架構(gòu)帶來空前壓力。

國家數(shù)據(jù)局最新統(tǒng)計(jì)顯示,截至2026年3月,我國日均AI token調(diào)用量已突破140萬億。這一數(shù)據(jù)較2025年底的100萬億,在短短三個(gè)月內(nèi)增長了40%以上;若與2024年初的1000億相比,兩年間累計(jì)增幅更是超過1000倍。

這些數(shù)據(jù)背后,是AI智能體、多模態(tài)交互、長文本推理等場景的全面爆發(fā)。目前,業(yè)內(nèi)對單卡大吞吐、高并發(fā)、低功耗推理算力有著剛性需求,傳統(tǒng)算力卡受限于存儲墻與帶寬瓶頸,難以匹配token處理需求的指數(shù)級增長,算力供需錯(cuò)配持續(xù)加劇,而存算一體技術(shù)恰能針對性破解這一難題。

過去幾年,“存算一體”開始頻繁出現(xiàn)在各類政策文件中,而在“十五五”開局之年,這一技術(shù)被提升至前所未有的戰(zhàn)略高度:在十五五規(guī)劃綱要中,存算一體、三維堆疊、光電融合,一同被列為下一代集成電路技術(shù)的前沿架構(gòu)。

與此同時(shí),中國的存算一體產(chǎn)業(yè)也正處于由概念導(dǎo)入邁向工程落地的關(guān)鍵階段。一方面,圍繞新架構(gòu)的初創(chuàng)企業(yè)持續(xù)涌現(xiàn);另一方面,部分團(tuán)隊(duì)已從原型驗(yàn)證走向產(chǎn)品化過程。

在這一賽道中,自2022年開始運(yùn)營的億鑄科技,是國內(nèi)較早布局的玩家。近期,智東西對話億鑄科技創(chuàng)始人、董事長兼CEO熊大鵬博士,圍繞存算一體的技術(shù)演進(jìn)、落地挑戰(zhàn)與產(chǎn)業(yè)機(jī)會展開深入討論,也為這一方向的現(xiàn)實(shí)進(jìn)展提供了更具體的觀察視角。


一、從“馮?諾依曼架構(gòu)”說起:存算一體的技術(shù)本質(zhì)與現(xiàn)實(shí)挑戰(zhàn)

要理解存算一體的價(jià)值,我們首先要看看傳統(tǒng)計(jì)算架構(gòu)為何在AI時(shí)代,變得力不從心了。

馮·諾依曼架構(gòu)是現(xiàn)代計(jì)算機(jī)的主流設(shè)計(jì)藍(lán)圖,它的核心思想是“存儲程序”,即將程序指令和數(shù)據(jù)放在存儲單元中,與計(jì)算單元分離,計(jì)算單元可以自動地從存儲單元逐條取出指令和所需的數(shù)據(jù)并執(zhí)行。

在AI時(shí)代,模型參數(shù)規(guī)模指數(shù)級增長。數(shù)據(jù)規(guī)模和訪存需求增加,算力的增長,卻撞上了“兩堵墻”——存儲墻與能耗墻。

具體來看,當(dāng)前算力增長同時(shí)受限于數(shù)據(jù)搬運(yùn)效率和能耗約束:數(shù)據(jù)在存儲與計(jì)算單元之間頻繁往返,搬運(yùn)開銷不斷攀升,帶寬與延遲瓶頸使算力難以充分釋放。

同時(shí),數(shù)據(jù)搬運(yùn)本身就會產(chǎn)生遠(yuǎn)超執(zhí)行計(jì)算的額外能耗,也就是說,大量能量被消耗在運(yùn)輸路上而非實(shí)際工作中,根據(jù)圖靈獎(jiǎng)得主、計(jì)算機(jī)體系結(jié)構(gòu)先驅(qū)約翰·軒尼詩(John L. Hennessy)的觀點(diǎn),目前AI計(jì)算過程中數(shù)據(jù)搬運(yùn)的成本已經(jīng)達(dá)到了計(jì)算成本的100倍。

存算一體(Computing in Memory)正是針對這一問題提出的架構(gòu)思路,其核心在于將計(jì)算電路“嵌入”存儲陣列或其周圍,盡可能減少數(shù)據(jù)搬運(yùn)和數(shù)據(jù)搬運(yùn)距離。其核心目的,是讓計(jì)算和存儲的協(xié)同變得能耗更低、效率更高、延時(shí)更短。

以億鑄的存算一體產(chǎn)品為例,該產(chǎn)品依托架構(gòu)原生的計(jì)算能力,提升了帶寬利用效率與并發(fā)處理能力,有效滿足了單卡大吞吐、大并發(fā)的實(shí)際需求。在長上下文、高并發(fā)推理場景中,該產(chǎn)品的能效與吞吐指標(biāo)均實(shí)現(xiàn)突破。

盡管架構(gòu)優(yōu)勢明確,但存算一體架構(gòu)的AI大芯片在落地過程中仍面臨多重挑戰(zhàn)。

首先是算法快速迭代。在仍然處于算法快速迭代周期的AI領(lǐng)域,這一問題尤為突出。AI領(lǐng)域平均每2—3年便出現(xiàn)新的主流范式,這對底層硬件提出通用性需求。

其次是軟件生態(tài)壁壘。當(dāng)前AI開發(fā)高度依賴成熟的軟件體系,尤其是以CUDA為代表的編程生態(tài)。

存算一體的新一代AI芯片必須做好通用性,并兼容主流軟件生態(tài),從指令集、架構(gòu)、微架構(gòu)、核心IP、編譯器到算子優(yōu)化工具,整個(gè)技術(shù)棧都需具備相應(yīng)的設(shè)計(jì)能力和技術(shù)儲備。

新架構(gòu)若無法兼容主流工具鏈,將面臨開發(fā)者接受度不高的問題。

再次是工程實(shí)現(xiàn)難度。不同存儲介質(zhì)在密度、功耗、讀寫性能等方面存在復(fù)雜工程問題,且存儲介質(zhì)的選擇取決于AI應(yīng)用落地場景。

最后是存算一體和通用計(jì)算的異構(gòu)融合難題。存算一體本質(zhì)上是一種專門為矩陣計(jì)算而生的計(jì)算單元,它需要和其他計(jì)算單元比如CPU、邏輯計(jì)算等構(gòu)成一個(gè)完整的計(jì)算系統(tǒng),也需要消除異構(gòu)融合存在的任務(wù)分工和切換的“氣泡”,從而達(dá)成性能的優(yōu)化。

熊大鵬認(rèn)為,存算一體AI芯片不是簡單把存儲介質(zhì)和邏輯計(jì)算部分耦合在一起,而是從ISA指令集、架構(gòu)、微架構(gòu)、核心IP、軟件棧全鏈條技術(shù)的體系化創(chuàng)新和自主可控。

如何實(shí)現(xiàn)不同計(jì)算精度、與其他計(jì)算單元高效協(xié)同、快速融入既有的軟件生態(tài)、完成傳統(tǒng)AI計(jì)算芯片承載的計(jì)算內(nèi)容、實(shí)現(xiàn)全棧技術(shù)的自主可控,是除了“用存算一體技術(shù)實(shí)現(xiàn)矩陣計(jì)算”之外更難的技術(shù)高峰。

二、通用化探索:從架構(gòu)創(chuàng)新到生態(tài)兼容

目前,從計(jì)算方式來看,存算一體主要分為模擬存算一體和數(shù)字存算一體兩大路徑。

模擬存算一體利用存儲介質(zhì)的物理特性在模擬域完成乘加運(yùn)算,但在器件一致性、精度及精度可信度、數(shù)據(jù)動態(tài)范圍以及浮點(diǎn)計(jì)算等維度存在短板。

數(shù)字存算一體則是圍繞存儲單元集成邏輯電路來實(shí)現(xiàn)乘加運(yùn)算,保持高精度及可靠精度、高能效比和大算力優(yōu)勢,更易與通用計(jì)算融合,可支撐高精度通用計(jì)算和大模型推理,也是目前業(yè)內(nèi)的主流方向之一。

從存儲介質(zhì)來看,SRAM、NOR Flash、RRAM、3D DRAM、PCRAM等不同存儲器各有所長。熊大鵬一共總結(jié)出了14個(gè)存儲介質(zhì)之間的差異點(diǎn),包括密度、讀寫速度、讀寫次數(shù)、讀寫功耗、成本、良率、一致性、工藝兼容性、產(chǎn)能現(xiàn)狀等等。

面臨如此龐雜的選項(xiàng),億鑄并未急于綁定某一技術(shù)路徑,而是選擇了“通用存算一體”的方向,熊大鵬也向我們解釋了通用存算一體的三個(gè)維度:

第一是存儲層面的通用性,即能否兼容不同存儲介質(zhì);

第二是算力層面的通用性,即能否支持各類算法和模型;

第三是軟件生態(tài)的通用性,即能否兼容主流生態(tài)和被更多開發(fā)者使用。

這三個(gè)通用性,恰好回應(yīng)了目前存算一體在存儲介質(zhì)、算法迭代和軟件生態(tài)三個(gè)維度上的核心難題。

存算一體架構(gòu)目前的主要價(jià)值是兩個(gè)維度,一個(gè)是貢獻(xiàn)更低功耗,一個(gè)是貢獻(xiàn)更大容量和吞吐,兩者目前無法在同一存儲介質(zhì)上實(shí)現(xiàn),因此就必然帶來不同場景需求、不同取舍的優(yōu)先級決定了不同存儲介質(zhì)存算一體芯片的設(shè)計(jì)選擇。

億鑄已在實(shí)踐中已嘗試過兩種將新型存儲介質(zhì)應(yīng)用于存算一體的方案。這一架構(gòu)的優(yōu)勢也在探索中顯現(xiàn):企業(yè)可以根據(jù)目標(biāo)市場對容量、功耗、成本、性能的不同要求,靈活選擇存儲介質(zhì)。在當(dāng)下新型存儲介質(zhì)并進(jìn),標(biāo)準(zhǔn)尚未統(tǒng)一的階段,這也成為了一種面向不確定性的架構(gòu)保險(xiǎn)。

在軟件層面,兼容現(xiàn)有生態(tài)被億鑄視為關(guān)鍵策略之一。熊大鵬透露,其團(tuán)隊(duì)的實(shí)現(xiàn)路徑是通過指令集層面對Triton和CUDA等主流生態(tài)進(jìn)行兼容。不過,他也強(qiáng)調(diào),兼容只是第一步:“能跑不代表跑得好,算子效率還需要持續(xù)優(yōu)化!蓖ㄟ^編譯器和自動優(yōu)化工具實(shí)現(xiàn)算子自動生成和自動優(yōu)化,極大減少軟件工作量和加快應(yīng)用部署時(shí)間,是通用存算一體的一大優(yōu)勢。

“軟件生態(tài)不是口號,而是工程師用腳投票的結(jié)果”,熊大鵬認(rèn)為,“只有被廣泛使用的軟件生態(tài),才真正具備商業(yè)價(jià)值!

三、存算一體重心調(diào)整,政策信號趨于明朗

回顧億鑄的發(fā)展路徑可以發(fā)現(xiàn),其通用存算一體的路徑并非一蹴而就,而是在不斷嘗試中成型。

熊大鵬回憶稱,他曾在17年-19年專注于研發(fā)某創(chuàng)新架構(gòu),但在落地過程中遭遇軟件生態(tài)和通用性巨大阻礙:“我們當(dāng)時(shí)的創(chuàng)業(yè)認(rèn)知是硬件性能更強(qiáng)就可以勝出,但后來發(fā)現(xiàn),軟件生態(tài)的兼容性和通用性同樣關(guān)鍵。”這一經(jīng)驗(yàn)也成為億鑄在存算一體賽道堅(jiān)持在硬件架構(gòu)創(chuàng)新的同時(shí),兼顧生態(tài)兼容和通用性的重要原因。

而在存儲架構(gòu)的通用性方面,億鑄也經(jīng)歷了認(rèn)知演變的過程。23年之前,產(chǎn)業(yè)對服務(wù)器級的AI算力卡的主流需求是基于75W功耗實(shí)現(xiàn)比T4更好的AI推理性能。

然而,自2023年開始,行業(yè)的重心向大模型和高存儲容量傾斜。熊大鵬觀察到:“大模型(2023年前后)流行后,核心問題變成了大容量、大帶寬和token高吞吐率,同時(shí)功耗維持在合理的范圍內(nèi)!

大容量、大帶寬、低成本的3D DRAM,開始在這一發(fā)展階段體現(xiàn)出價(jià)值。

早在2022年,億鑄便關(guān)注到了3D DRAM的潛力,并進(jìn)行持續(xù)探索和技術(shù)儲備。這些前置的技術(shù)探索,讓億鑄在算法迭代中可以快速實(shí)現(xiàn)方案的迭代,滿足大模型時(shí)代對“大容量、大吞吐、低功耗、高性價(jià)比”的AI大算力芯片的要求。

在中國半導(dǎo)體產(chǎn)業(yè)尋求自主突破與差異化路徑的背景下,這一演進(jìn)路徑顯得尤為務(wù)實(shí)。

在全球算力競爭格局中,傳統(tǒng)路徑高度依賴先進(jìn)制程與高帶寬存儲。在外部環(huán)境不確定性加大的背景下,探索新的架構(gòu)路徑被視為提升國內(nèi)半導(dǎo)體產(chǎn)業(yè)自主能力的重要方向。

熊大鵬認(rèn)為,存算一體的價(jià)值在于從架構(gòu)層面實(shí)現(xiàn)突破:“它可以用成熟工藝達(dá)到和超越先進(jìn)工藝的性能,緩解對先進(jìn)工藝和HBM等高帶寬存儲的依賴,為算力提供新的解法。

從這一視角來看,十五五規(guī)劃對存算一體的高度關(guān)注也顯得更為順理成章。熊大鵬說道,列入規(guī)劃代表國家已經(jīng)完成了技術(shù)原理論證與產(chǎn)業(yè)價(jià)值論證,政策信號已較為明確。

結(jié)語:存算一體,走向產(chǎn)業(yè)化的關(guān)鍵階段

從政策支持到企業(yè)探索,存算一體正逐步走出概念驗(yàn)證階段,邁向產(chǎn)業(yè)化落地。在這一過程中,通用計(jì)算能力、軟件生態(tài)兼容以及工程實(shí)現(xiàn)路徑,將成為決定勝負(fù)的關(guān)鍵因素。

對于產(chǎn)業(yè)發(fā)展階段,熊大鵬給出了一個(gè)形象類比,現(xiàn)在的AI就像3G移動互聯(lián)網(wǎng),雛形已現(xiàn)、令人興奮,但貴、慢、還沒有成為人們生活、工作中不可或缺的組成部分。真正的爆發(fā),還需要持續(xù)提高性能、降低成本。

他將未來理想的AI算力定義為“3+1”特征,即更低功耗、更高吞吐、更低成本,以及良好的軟件生態(tài)。目前,國際主流廠商至多做到1+1,比如軟件生態(tài)做的好,但無法實(shí)現(xiàn)功耗、吞吐、成本三者兼顧。而億鑄的團(tuán)隊(duì)正致力于用“通用存算一體”技術(shù),實(shí)現(xiàn)真正的“3+1”閉環(huán)。

熊大鵬也認(rèn)為,隨著智能化時(shí)代進(jìn)一步的發(fā)展,算法的發(fā)展已經(jīng)帶來更加多元的算力需求,存算一體不是萬用良方,它有著很強(qiáng)的適用性,且和存儲介質(zhì)本身的物理特點(diǎn)和工藝現(xiàn)狀息息相關(guān),但它一定會和更早的CPU、GPU、TPU、NPU一樣,在與其特點(diǎn)高度匹配的場景里發(fā)揮不可或缺的作用。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
蘇州中學(xué)附屬三亞學(xué)校項(xiàng)目發(fā)生事故,海南住建廳啟動督辦程序

蘇州中學(xué)附屬三亞學(xué)校項(xiàng)目發(fā)生事故,海南住建廳啟動督辦程序

澎湃新聞
2026-05-07 17:38:26
在拼多多批量“造爆款”,露營賽道擠滿國產(chǎn)新銳玩家

在拼多多批量“造爆款”,露營賽道擠滿國產(chǎn)新銳玩家

定焦One
2026-05-07 08:44:10
臺官員曝賴清德成功返臺內(nèi)幕,大陸出手阻止未果,背后有難言之隱

臺官員曝賴清德成功返臺內(nèi)幕,大陸出手阻止未果,背后有難言之隱

共工之錨
2026-05-07 00:04:56
前體操冠軍吳柳芳再回應(yīng)擦邊風(fēng)波:“把債還完了,我才能把體面重新?lián)炱饋怼;談及與管晨辰的爭執(zhí),吳柳芳表示:“我不會去恨一個(gè)人”

前體操冠軍吳柳芳再回應(yīng)擦邊風(fēng)波:“把債還完了,我才能把體面重新?lián)炱饋怼;談及與管晨辰的爭執(zhí),吳柳芳表示:“我不會去恨一個(gè)人”

揚(yáng)子晚報(bào)
2026-05-07 07:43:31
曝莫斯科全面斷網(wǎng)并關(guān)閉所有機(jī)場!勝利日前夕全城緊張

曝莫斯科全面斷網(wǎng)并關(guān)閉所有機(jī)場!勝利日前夕全城緊張

項(xiàng)鵬飛
2026-05-06 16:51:22
對話“洪迪厄斯”號郵輪乘客:“我頭天下船,漢坦病毒陽性乘客第二天登船”

對話“洪迪厄斯”號郵輪乘客:“我頭天下船,漢坦病毒陽性乘客第二天登船”

紅星新聞
2026-05-07 19:26:32
“機(jī)車女神”痞幼拿下張雪!評論區(qū)淪陷了!

“機(jī)車女神”痞幼拿下張雪!評論區(qū)淪陷了!

4A廣告文案
2026-05-07 09:13:48
中國16城準(zhǔn)一線城市排名:蘇州第六,成都超南京,福州新入圍

中國16城準(zhǔn)一線城市排名:蘇州第六,成都超南京,福州新入圍

最新聲音
2026-05-07 02:39:00
北京三位女大學(xué)生青海自駕游兩死一傷 傷者一審被判入刑4年

北京三位女大學(xué)生青海自駕游兩死一傷 傷者一審被判入刑4年

經(jīng)濟(jì)觀察報(bào)
2026-05-07 10:43:05
先是海參崴,再是圖瓦和庫頁島,俄羅斯對中國,心態(tài)完全變了

先是海參崴,再是圖瓦和庫頁島,俄羅斯對中國,心態(tài)完全變了

番外行
2026-05-07 10:07:04
全場轟11記Ace球!鄭欽文兩盤橫掃30號種子,躋身羅馬站32強(qiáng)

全場轟11記Ace球!鄭欽文兩盤橫掃30號種子,躋身羅馬站32強(qiáng)

全景體育V
2026-05-07 18:48:36
魏鳳和案、李尚福案一審宣判

魏鳳和案、李尚福案一審宣判

新京報(bào)
2026-05-07 18:08:25
不能失憶!人民日報(bào)平安校園:海參崴的街頭,中國孩子在為誰歡呼

不能失憶!人民日報(bào)平安校園:海參崴的街頭,中國孩子在為誰歡呼

瑜說還休
2026-05-07 17:45:15
又一個(gè)“愛國大V”人設(shè)翻車!靠愛國撈金千萬,私下悄悄辦移民!

又一個(gè)“愛國大V”人設(shè)翻車!靠愛國撈金千萬,私下悄悄辦移民!

麥杰遜
2026-05-07 13:13:17
5月20官宣三婚!頭發(fā)都白了,何潔現(xiàn)狀惹人心疼

5月20官宣三婚!頭發(fā)都白了,何潔現(xiàn)狀惹人心疼

陳意小可愛
2026-05-07 16:55:39
三峽“無縫大壩”締造者落馬!功勛滿身,卻沒管住心中一道縫

三峽“無縫大壩”締造者落馬!功勛滿身,卻沒管住心中一道縫

甜檸聊史
2026-03-25 18:43:05
旋轉(zhuǎn)木馬暫時(shí)不拆了,上海這個(gè)“火出圈”的花藝裝置將開放至8月底

旋轉(zhuǎn)木馬暫時(shí)不拆了,上海這個(gè)“火出圈”的花藝裝置將開放至8月底

澎湃新聞
2026-05-07 15:40:27
第三輪第六批中央生態(tài)環(huán)境保護(hù)督察全面啟動

第三輪第六批中央生態(tài)環(huán)境保護(hù)督察全面啟動

生態(tài)環(huán)境部
2026-05-07 10:04:40
國際足聯(lián)要瘋了,沒有軟肋的中國足球已經(jīng)天下無敵

國際足聯(lián)要瘋了,沒有軟肋的中國足球已經(jīng)天下無敵

楓冷慕詩
2026-05-07 11:32:38
恒大集團(tuán)創(chuàng)始人許家印被曝出猛料

恒大集團(tuán)創(chuàng)始人許家印被曝出猛料

地產(chǎn)微資訊
2026-05-07 09:28:09
2026-05-07 20:19:00
智東西 incentive-icons
智東西
智東西,AI產(chǎn)業(yè)新媒體,專注報(bào)道人工智能的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來的千行百業(yè)產(chǎn)業(yè)變革。
11765文章數(shù) 117061關(guān)注度
往期回顧 全部

科技要聞

月之暗面完成20億美元融資,估值突破200億

頭條要聞

19名中國船員被困霍爾木茲超2個(gè)月:船艙如同巨型蒸籠

頭條要聞

19名中國船員被困霍爾木茲超2個(gè)月:船艙如同巨型蒸籠

體育要聞

巴黎再進(jìn)歐冠決賽,最尷尬的情況還是發(fā)生了

娛樂要聞

Lisa主持!寧藝卓觀看脫衣秀風(fēng)波升級

財(cái)經(jīng)要聞

金融“風(fēng)暴”,AI制造

汽車要聞

雷克薩斯全新純電三排SUV 全新TZ全球首發(fā)

態(tài)度原創(chuàng)

健康
本地
親子
藝術(shù)
時(shí)尚

干細(xì)胞治燒燙傷面臨這些“瓶頸”

本地新聞

用青花瓷的方式,打開西溪濕地

親子要聞

Little Girl Slides into Feed with Flawless Express...

藝術(shù)要聞

這位老教授筆下的青年,活力滿滿

穿黑褲子別只會搭白T恤!看看這些顯瘦的搭配,高級感拉滿

無障礙瀏覽 進(jìn)入關(guān)懷版