国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

這些趨勢(shì)推動(dòng)2026年進(jìn)入“內(nèi)存超級(jí)周期”

0
分享至

“超級(jí)周期”這個(gè)詞,再次回到了存儲(chǔ)半導(dǎo)體的敘事中心。

過(guò)去,內(nèi)存價(jià)格起起伏伏,總被視為資本開支與庫(kù)存的游戲。2021年,行業(yè)沉浸于短缺經(jīng)濟(jì)的繁榮之中,兩年后,行業(yè)又旋即陷入“傳統(tǒng)周期”低谷,三巨頭的美光、三星與SK海力士,利潤(rùn)率無(wú)一不是跌破零點(diǎn)。


正是GPT的橫空出世,重新定義了內(nèi)存的價(jià)值。AI的性能,很大程度上去取決于它們存儲(chǔ)數(shù)據(jù)的方式,訪問(wèn)數(shù)據(jù)的速度,以及可以儲(chǔ)存的數(shù)據(jù)的規(guī)模。計(jì)算是能源的處理形式,但能源也越來(lái)越多地用于數(shù)據(jù)不斷寫入、讀出與傳輸。彼時(shí),為內(nèi)存這一標(biāo)準(zhǔn)化的“大宗商品”帶去新生的是HBM。

如果機(jī)械照搬四五年一輪回的“傳統(tǒng)周期”,很快內(nèi)存行業(yè)又將陷入低谷。但這一次,行業(yè)相信AI正在改寫這條曲線。需求不再僅僅是短期庫(kù)存回補(bǔ),而是對(duì)計(jì)算、帶寬及能效的結(jié)構(gòu)性重塑。

賣方市場(chǎng)

整個(gè)AI都是芯片的賣方市場(chǎng)。硅谷巨頭們陷入了第二波AI基建熱潮,不僅GPU短缺,HBM同樣短缺。SK海力士明年的訂單也早已售罄。

面向數(shù)據(jù)中心的HBM,由堆疊的DRAM構(gòu)建而成,創(chuàng)造了更高的價(jià)值。它與主要面向消費(fèi)電子市場(chǎng)的DDR,存在產(chǎn)能分配矛盾。從Ampere到Blackwell Ultra,HBM不僅在AI基礎(chǔ)設(shè)施硬件中的材料清單(BOM)中成本超過(guò)一半,而且還在繼續(xù)增長(zhǎng);在BOM增長(zhǎng)中,絕對(duì)和相對(duì)增長(zhǎng)的最大部分,都來(lái)自HBM。因此,內(nèi)存巨頭們也更有動(dòng)力將產(chǎn)能分配給它。

另一方面,消費(fèi)電子也在接受AI的棲身;又撞上了PC換機(jī)周期。最近,蘋果已經(jīng)開始搶購(gòu)三星明年二季度出貨的LPDDR5X內(nèi)存(低功耗版),以應(yīng)對(duì)已經(jīng)遲到的個(gè)人AI體驗(yàn);小米干脆宣布上調(diào)新品售價(jià)。

盡管NAND領(lǐng)域與DRAM沒(méi)有直接的產(chǎn)能分配矛盾,但它們往往在資本開支層面此消彼長(zhǎng)。這也導(dǎo)致內(nèi)存的“超級(jí)周期”從DRAM領(lǐng)域蔓延至NAND領(lǐng)域。另一方面,隨著Veo 3與Sora 2將視頻生成推向競(jìng)爭(zhēng)前沿,AI對(duì)于大容量?jī)?chǔ)存的需求,本身也在飛漲。上個(gè)月,閃迪率先宣布漲價(jià),全系上調(diào)10%;這個(gè)月,三星和SK海力士更是提價(jià)高達(dá)30%。

市場(chǎng)普遍預(yù)計(jì),這場(chǎng)由AI驅(qū)動(dòng)的供應(yīng)短缺,不只是供需錯(cuò)配的結(jié)果,將比以往任何一次“傳統(tǒng)”的繁榮周期都更長(zhǎng)、更強(qiáng)。

以內(nèi)存為中心視角的AI基礎(chǔ)設(shè)施


這張來(lái)自Seagate(希捷)的圖示,清晰地展示了,在AI基礎(chǔ)設(shè)施的整體架構(gòu)中,各類存儲(chǔ)(Storage )與內(nèi)存(Memory)產(chǎn)品在不同環(huán)節(jié)中的分工與作用。

GPU或XPU等處理器,與HBM/DRAM緊密耦合,從而構(gòu)建出強(qiáng)大的計(jì)算集群(Compute Cluster)。越靠近GPU,數(shù)據(jù)就越“熱”,也就越需要更高的帶寬與更低的延遲。最終,這些數(shù)據(jù)會(huì)流入一個(gè)基于HDD(機(jī)械硬盤)或SSD(固態(tài)硬盤)構(gòu)建的網(wǎng)絡(luò)化存儲(chǔ)集群(Storage Cluster),“冷卻”下來(lái),用于長(zhǎng)期保存。它們?nèi)萘扛?,成本更低,速度則會(huì)更慢。

在過(guò)去,大模型預(yù)訓(xùn)練是AI基礎(chǔ)設(shè)施的主要需求。這是一個(gè)數(shù)據(jù)如何被存儲(chǔ)、預(yù)處理、分發(fā),以及模型權(quán)重如何更新的流程。龐大的訓(xùn)練數(shù)據(jù)集通常存放在存儲(chǔ)集群,前端配備了一層SSD緩存,以提高讀取效率。訓(xùn)練開始前,數(shù)據(jù)會(huì)被token化,以二進(jìn)制格式寫入SSD。在訓(xùn)練中,這些token會(huì)被分批(batch)加載到GPU,使得HBM得以充分利用;模型的權(quán)重與狀態(tài)會(huì)周期性地保存為檢查點(diǎn)(checkpoints),存放在NVMe(基于PCIe總線的高性能存儲(chǔ)協(xié)議)SSD上,以便中斷后快速恢復(fù)。

如今,推理已成為新的主角。它意味著模型權(quán)重、鍵值緩存(KV cache)以及RAG(檢索增強(qiáng)生成)的不同數(shù)據(jù)訪問(wèn)模式。在這個(gè)過(guò)程中,模型參數(shù)不再頻繁重寫,也讓不擅長(zhǎng)此道的NAND獲得新的機(jī)會(huì)。當(dāng)查詢觸發(fā)時(shí),模型權(quán)重必須加載到HBM。隨后生成的鍵值矩陣(KV matrices),也會(huì)暫存在HBM中,用于后續(xù)注意力計(jì)算。如果KV緩存過(guò)大,就要先后分層卸載(offload)至DRAM與SSD中。RAG的向量數(shù)據(jù)庫(kù)通常也存放在SSD上,在推理時(shí)快速檢索并載入HBM。

容量、帶寬與成本,構(gòu)成了AI基礎(chǔ)設(shè)施中內(nèi)存技術(shù)的“不可能三角”。但市場(chǎng)仍試圖突破邊界,或同時(shí)提升三者上限,或在特定應(yīng)用中強(qiáng)化某一項(xiàng)性能。這為即將到來(lái)的“超級(jí)周期” 注入了新的結(jié)構(gòu)性增量與想象力。

定制HBM

不斷擴(kuò)展的大模型,對(duì)帶寬的追求也沒(méi)有盡頭。越靠近計(jì)算核心的內(nèi)存,就越成為性能提升的關(guān)鍵。被稱為“HBM之父”的,已經(jīng)將HBM的路線圖,規(guī)劃至 2038年。從HBM4到HBM8,每一代都在推高帶寬、速度與容量上限,其中帶寬的提升尤為顯著。


如今,SK海力士、美光與三星已經(jīng)進(jìn)入HBM4的首輪競(jìng)速。三家公司已經(jīng)先后向英偉達(dá)送樣,HBM4將成為2026 年下一代AI基礎(chǔ)設(shè)施與AI加速芯片的標(biāo)準(zhǔn)配置。

但正如AI芯片,HBM也開始講訴同樣的敘事。為了壓縮能耗、減少延遲與信號(hào)損失,AI芯片廠商開始與存儲(chǔ)廠深度共設(shè)計(jì)(co-design),推出定制化基底裸片(custom base die)。這意味著HBM堆疊底部的邏輯層不再通用,而是針對(duì)特定AI架構(gòu)優(yōu)化信號(hào)路徑、電源分配與接口協(xié)議,從而實(shí)現(xiàn)更高的能效和帶寬密度。這是一次革新架構(gòu)層面的重大飛躍,徹底改變了HBM與AI加速器的集成方式。

今年6月,SK海力士同時(shí)鎖定了英偉達(dá)、微軟、博通,達(dá)成HBM4E定制合作;三星也在與博通、AMD談判。英偉達(dá)已經(jīng)拿出了自己的基礎(chǔ)裸片的設(shè)計(jì),預(yù)計(jì)2027年小規(guī)模量產(chǎn)。它現(xiàn)在不僅要自己掌握GPU、CPU與網(wǎng)絡(luò),還要掌握HBM,未來(lái)無(wú)論HBM由哪家制造,都必須兼容它的底層架構(gòu)。亞馬遜AWS高管直言,HBM定制化“可能會(huì)關(guān)閉其他玩家的大門”。

存算一體

如果HBM代表著“更大的帶寬”,那么“更近的距離”也是業(yè)界開始思考大幅降低數(shù)據(jù)延遲的另一條路徑。初創(chuàng)企業(yè)d-Matrix就認(rèn)為,與其堆疊更多帶寬,不如直接。

在今年夏天的 Hot Chips 2025 上,這家成立于2019年的企業(yè),展示了這種理念的最新形態(tài)。它就是Pavehawk 架構(gòu),其核心是3D堆疊數(shù)字內(nèi)存計(jì)算(3DIMC)技術(shù),使用改進(jìn)型SRAM單元,在內(nèi)存內(nèi)部直接執(zhí)行計(jì)算。通過(guò)在垂直方向上將計(jì)算層與存儲(chǔ)層堆疊,數(shù)據(jù)移動(dòng)距離被壓縮到極限。它還發(fā)布了存算一體的Corsair芯片,宣稱帶寬性能比HBM4高出10倍,能耗則降低90%。


到了OCP全球峰會(huì)2025上,d-Matrix更進(jìn)一步,展示了機(jī)架級(jí)解決方案 SquadRack。它在性價(jià)比、能效、token生成速度上,分別提升了3倍、3倍、10倍。單機(jī)架可以運(yùn)行千億參數(shù)大模型;想要部署更大的模型,還可以通過(guò)以太網(wǎng)橫向擴(kuò)展。明年,這家公司還會(huì)拿出迭代后的Raptor架構(gòu)。

推理工作負(fù)載正遷移至邊緣與端側(cè)。隨著小模型性能逐步提升,存算一體能在延遲高度敏感的應(yīng)用場(chǎng)景下找到自己的機(jī)會(huì)。側(cè)重SRAM層面的創(chuàng)新,也是Groq等芯片初創(chuàng)企業(yè)努力突破的方向。

熱數(shù)據(jù)擴(kuò)展

隨著推理負(fù)載不斷擴(kuò)大,壓力也在從DARM向NAND傳導(dǎo)。當(dāng)上下文窗口與并發(fā)請(qǐng)求同時(shí)增長(zhǎng)時(shí),推理系統(tǒng)開始需要一種更廉價(jià)、更大容量的“緩沖層”。這讓SSD成為了創(chuàng)新焦點(diǎn)。

當(dāng)初,為了減輕HBM的壓力,無(wú)論是英偉達(dá)的Dynamo Distributed KVCache Manager框架,還是華為的UCM技術(shù),都在通過(guò)多級(jí)緩存算法,將訪問(wèn)壓力逐層下沉到存儲(chǔ)層。但HDD帶寬實(shí)在太低,帶寬性能(BW/TB)反而隨著單盤容量持續(xù)提升而逐年下降。而主流TLC(三層單元)SSD容量稍顯不足;一個(gè)單位SLC(單層單元)能儲(chǔ)存1個(gè)比特(2種狀態(tài)),到了量產(chǎn)級(jí)的最新主流技術(shù)QLC(四層單元)則能儲(chǔ)存4個(gè)比特,相當(dāng)于閃存容量翻了16倍。


今年年中,Meta宣布與PureStorage合作,將QLC SSD引入數(shù)據(jù)中心架構(gòu),以取代部分HDD和TLC SSD。Meta認(rèn)為,盡管TLC在寫入密集型環(huán)境中仍具優(yōu)勢(shì),但QLC擁有更高密度、更好能效和更低的每TB成本,足以承擔(dān)“熱數(shù)據(jù)”的一部分任務(wù)。

HBF終局

如果說(shuō)HBM代表著DRAM的堆疊形態(tài),那么HBF則是NAND的堆疊形態(tài)。前者在內(nèi)存層級(jí)持續(xù)追求更高帶寬,后者則在存儲(chǔ)層級(jí)探索更高帶寬與更大容量。這種架構(gòu)尤其適合向量數(shù)據(jù)庫(kù)與AI智能體等場(chǎng)景,它們渴求內(nèi)存容量的高速增長(zhǎng)。

金教授相信,未來(lái),HBF將左右整個(gè)業(yè)界的性能表現(xiàn)。力積電(Powerchip)也是這么想的,在上周的財(cái)報(bào)發(fā)布會(huì)上表示,HBF將成為未來(lái)的重要技術(shù),能夠滿足文本、圖像甚至視頻模型帶來(lái)的超大規(guī)模存儲(chǔ)需求。Rubin CPX的出現(xiàn)已經(jīng)證明,并非所有階段都必須超高的內(nèi)存帶寬;是時(shí)候追求更高的內(nèi)存容量了。

當(dāng)前,HBM最大的短板正是容量。由于DRAM采用“1T1C”結(jié)構(gòu),即每個(gè)單元包含一個(gè)晶體管(Transistor)和一個(gè)電容(Capacitor),其擴(kuò)展空間已經(jīng)逼近物理極限,內(nèi)存密度難以繼續(xù)提升。相比之下,NAND采用單晶體管浮柵(floating gate)結(jié)構(gòu),單元間距更緊湊,便于擴(kuò)展?;贜AND的架構(gòu)可實(shí)現(xiàn)比HBM高8至16倍的存儲(chǔ)密度,并在相近成本下提供可比的讀取帶寬。

今年8月,閃迪(SanDisk)與SK海力士簽署了諒解備忘錄(MoU),宣布共同開發(fā)HBF產(chǎn)品,首批樣品預(yù)計(jì)將于2026年下半年面市。在本月的OCP大會(huì)上,SK海力士官宣了“AI-NAND B”系列,正是一款通過(guò)堆疊NAND閃存以擴(kuò)大帶寬的HBF。

AI時(shí)代,AI基礎(chǔ)設(shè)施中的內(nèi)存棧正在被逐步重構(gòu)。大模型的未來(lái),取決于它能裝下多少數(shù)據(jù),又能以多快的速度讀寫這些數(shù)據(jù)。市場(chǎng)在擴(kuò)產(chǎn)HBM,滿足周期性上行的需求,也在發(fā)明新的內(nèi)存形態(tài),創(chuàng)造新的增量市場(chǎng)。于是,內(nèi)存或許真的迎來(lái)了屬于自己的“超級(jí)周期”。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
U23國(guó)足20分鐘丟2球!小倉(cāng)幸成遠(yuǎn)射世界波,王鈺棟低級(jí)失誤

U23國(guó)足20分鐘丟2球!小倉(cāng)幸成遠(yuǎn)射世界波,王鈺棟低級(jí)失誤

奧拜爾
2026-01-24 23:27:54
民進(jìn)黨準(zhǔn)備下死手,黃國(guó)昌攜美密令向大陸遞投名狀,統(tǒng)一已成定局

民進(jìn)黨準(zhǔn)備下死手,黃國(guó)昌攜美密令向大陸遞投名狀,統(tǒng)一已成定局

小俎娛樂(lè)
2026-01-25 14:34:15
布呂尼:從妻子變兒媳,同時(shí)和父子談戀愛(ài),最終成為法國(guó)第一夫人

布呂尼:從妻子變兒媳,同時(shí)和父子談戀愛(ài),最終成為法國(guó)第一夫人

青途歷史
2026-01-23 20:12:55
明確規(guī)定來(lái)了!機(jī)關(guān)事業(yè)單位職工下班后打牌打麻將,算違紀(jì)嗎?

明確規(guī)定來(lái)了!機(jī)關(guān)事業(yè)單位職工下班后打牌打麻將,算違紀(jì)嗎?

阿纂看事
2026-01-24 09:56:48
78年王近山病逝,鄧小平看過(guò)訃告上的軍級(jí)之后,坦言:確實(shí)不合適

78年王近山病逝,鄧小平看過(guò)訃告上的軍級(jí)之后,坦言:確實(shí)不合適

元哥說(shuō)歷史
2026-01-25 14:45:03
打臉黑子,湖人逆轉(zhuǎn)獨(dú)行俠,賽后還有5個(gè)好消息,東契奇喜笑顏開

打臉黑子,湖人逆轉(zhuǎn)獨(dú)行俠,賽后還有5個(gè)好消息,東契奇喜笑顏開

鄒維體育
2026-01-25 12:17:55
此人叛變新四軍,1949年李先念主動(dòng)宴請(qǐng)他,他舉報(bào):有人要叛變

此人叛變新四軍,1949年李先念主動(dòng)宴請(qǐng)他,他舉報(bào):有人要叛變

大運(yùn)河時(shí)空
2026-01-25 17:05:03
越共中央政治局,“新面孔”接近一半

越共中央政治局,“新面孔”接近一半

中國(guó)新聞周刊
2026-01-24 19:46:04
2026年養(yǎng)老金繼續(xù)漲?人社部部長(zhǎng)表態(tài)了!取消掛鉤調(diào)整可行嗎?

2026年養(yǎng)老金繼續(xù)漲?人社部部長(zhǎng)表態(tài)了!取消掛鉤調(diào)整可行嗎?

李健政觀察
2026-01-25 13:08:19
49年,裝滿50箱大洋的飛機(jī)墜毀,當(dāng)?shù)厝四寐榇鼡專瑓s付出慘痛代價(jià)

49年,裝滿50箱大洋的飛機(jī)墜毀,當(dāng)?shù)厝四寐榇鼡專瑓s付出慘痛代價(jià)

雍親王府
2026-01-25 08:20:03
白宮發(fā)布“特朗普和企鵝漫步格陵蘭島”圖,遭群嘲

白宮發(fā)布“特朗普和企鵝漫步格陵蘭島”圖,遭群嘲

新華社
2026-01-25 16:55:04
井柏然曬北京千萬(wàn)豪宅!水泥地?fù)Q成木板土氣,陽(yáng)臺(tái)和劉雯合照搶鏡

井柏然曬北京千萬(wàn)豪宅!水泥地?fù)Q成木板土氣,陽(yáng)臺(tái)和劉雯合照搶鏡

曉徙娛樂(lè)
2026-01-25 04:21:24
肯德基,被迫改名PFK

肯德基,被迫改名PFK

設(shè)計(jì)癖
2026-01-24 12:13:41
丈夫項(xiàng)英犧牲后,李又蘭改嫁張愛(ài)萍,生下三個(gè)兒子都是牛人

丈夫項(xiàng)英犧牲后,李又蘭改嫁張愛(ài)萍,生下三個(gè)兒子都是牛人

史韻流轉(zhuǎn)
2026-01-25 06:25:03
“臘八3不吃,福氣進(jìn)家門”,指哪3不吃?臘八節(jié)來(lái)臨,莫忘老傳統(tǒng)

“臘八3不吃,福氣進(jìn)家門”,指哪3不吃?臘八節(jié)來(lái)臨,莫忘老傳統(tǒng)

神牛
2026-01-24 15:00:25
陪睡陪玩只是冰山一角!萬(wàn)達(dá)蒸發(fā)800億后,王思聰再次傳出大丑聞

陪睡陪玩只是冰山一角!萬(wàn)達(dá)蒸發(fā)800億后,王思聰再次傳出大丑聞

阿器談史
2025-12-26 15:26:05
快報(bào)調(diào)查|嫣然醫(yī)院與嫣然基金的賬本迷局

快報(bào)調(diào)查|嫣然醫(yī)院與嫣然基金的賬本迷局

現(xiàn)代快報(bào)
2026-01-24 18:53:06
14年后,再看“京城四少”的現(xiàn)狀,才明白娶一個(gè)好老婆有多重要

14年后,再看“京城四少”的現(xiàn)狀,才明白娶一個(gè)好老婆有多重要

豐譚筆錄
2026-01-13 07:20:11
“秦嵐”也太凡爾賽了吧!穿一身瑜伽服凹凸有致,巴掌腰太搶鏡

“秦嵐”也太凡爾賽了吧!穿一身瑜伽服凹凸有致,巴掌腰太搶鏡

巧手曉廚娘
2025-12-30 18:59:18
從草根到頂流,趙麗穎能“輸?shù)闷稹钡牡着疲旱艿懿攀钦嬲氖刈o(hù)者

從草根到頂流,趙麗穎能“輸?shù)闷稹钡牡着疲旱艿懿攀钦嬲氖刈o(hù)者

夢(mèng)在深巷qw
2026-01-25 10:22:47
2026-01-25 17:27:00
未盡研究 incentive-icons
未盡研究
新能源、人工智能、合成生物、地緣X
292文章數(shù) 61關(guān)注度
往期回顧 全部

財(cái)經(jīng)要聞

隋廣義等80人被公訴 千億騙局進(jìn)入末路

頭條要聞

獲黃仁勛簽名紅包商戶:我開始不認(rèn)識(shí)他 紅包里有600元

頭條要聞

獲黃仁勛簽名紅包商戶:我開始不認(rèn)識(shí)他 紅包里有600元

體育要聞

中國(guó)足球不會(huì)一夜變強(qiáng),但他們已經(jīng)創(chuàng)造歷史

娛樂(lè)要聞

王玉雯方嚴(yán)正聲明 劇方回應(yīng):涉事人員已被開除

科技要聞

黃仁勛在上海逛菜市場(chǎng),可能惦記著三件事

汽車要聞

別克至境E7內(nèi)飾圖曝光 新車將于一季度正式發(fā)布

態(tài)度原創(chuàng)

健康
手機(jī)
游戲
教育
軍事航空

耳石脫落為何讓人天旋地轉(zhuǎn)+惡心?

手機(jī)要聞

榮耀泡泡瑪特聯(lián)名手機(jī)今日開售:首銷即引爆,線下再現(xiàn)排隊(duì)熱潮

R星又藏了!玩家發(fā)現(xiàn)《大鏢客2》暗含GTA6伏筆

教育要聞

北京中考數(shù)學(xué),0的倒數(shù)是多少?

軍事要聞

俄美烏三方首輪會(huì)談細(xì)節(jié)披露

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版