專訪云天勵飛董事長陳寧：AI推理時代已至，推理芯片崛起將是中國科技復興巨大機遇

2025-12-24 16:44:11　來源: 每日經(jīng)濟新聞

四川舉報

分享至

每經(jīng)記者：涂穎浩每經(jīng)編輯：陳旭

當ChatGPT點燃的全球AI訓練競賽逐漸開始白熱化，一個更深層次的產(chǎn)業(yè)變革正在悄然發(fā)生。2025年，被業(yè)界普遍視為“AI應(yīng)用大爆發(fā)的元年”，智能體（Agent）正從概念走向現(xiàn)實。而在應(yīng)用爆發(fā)的背后，是百倍增長的推理算力需求與高昂成本之間的尖銳矛盾。在這場由“訓練”轉(zhuǎn)向“推理”的算力范式革命中，中國AI芯片產(chǎn)業(yè)能否抓住歷史性機遇？

在日前舉辦的雪球嘉年華會議期間，云天勵飛（SH688343）董事長兼CEO陳寧在接受《每日經(jīng)濟新聞》記者專訪時表示，人工智能就像當年第一臺蒸汽機、第一個燈泡、第一臺計算機，可以說人工智能是未來五年科技突破的關(guān)鍵。他認為，中國在算法上已能夠?qū)⒏澜缦冗M水平之間的差距縮短至數(shù)月，甚至在應(yīng)用、數(shù)據(jù)、能源、系統(tǒng)集成方面更有優(yōu)勢。

在陳寧看來，推理芯片賽道是中國實現(xiàn)“超車”的關(guān)鍵。這場關(guān)于重新定義算力的競賽才剛剛吹響號角，中國第一次與全球站在相近的起跑線。“我們有機會，也必須抓住這個機會?！?/p>

陳寧在雪球嘉年華上發(fā)表演講圖片來源：受訪者

從訓練到推理——AI產(chǎn)業(yè)的分水嶺與中國的“愛迪生”機會

在陳寧看來，人工智能產(chǎn)業(yè)的發(fā)展可以清晰地劃分為三個階段。

第一階段是2012年至2020年的“智能感知”時代，以小模型驅(qū)動特定場景的解決方案為主，市場的特點就是碎片化，難以規(guī)模化復制。

第二階段是2020年至2025年的“AIGC”時代，大模型展現(xiàn)出驚人的內(nèi)容生成能力，但除了英偉達這家“賣鏟人”，整個行業(yè)仍在巨額投入中尋找盈利閉環(huán)。

“但2025年，我們進入了第三個階段——‘Agentic AI’時代。”陳寧強調(diào)。無論是豆包手機、AI眼鏡還是人形機器人，其本質(zhì)都是將大模型、操作系統(tǒng)與硬件載體深度融合的智能體。它們能獨立完成復雜任務(wù)，替代部分工作崗位，這才是AI引發(fā)產(chǎn)業(yè)革命的真正形態(tài)。這個時代的核心特征是應(yīng)用爆發(fā)，而應(yīng)用背后所需的算力，從以訓練為主正轉(zhuǎn)向以推理為主。

“這是一個根本性的轉(zhuǎn)折?！标悓幈硎?，訓練追求極致性能和迭代速度，而推理要大規(guī)模商業(yè)化，必須講求市場經(jīng)濟，追求極高的性價比。

他以19世紀初英國化學家戴維發(fā)明了世界上第一個實驗性電燈為例，直到70多年后，愛迪生通過商業(yè)化改良、降低成本并建設(shè)了電網(wǎng)，才真正將電力革命推向千家萬戶。

陳寧笑言，黃仁勛可能成為AI領(lǐng)域的戴維，因為他定義了訓練時代；而推理時代的‘愛迪生們’正在涌現(xiàn)，這也從另一個角度決定了誰才能真正主導一場產(chǎn)業(yè)革命。

正是這一轉(zhuǎn)變，打破了英偉達憑借CUDA（英偉達給自家GPU量身打造的專屬工具）生態(tài)和GPGPU（通用圖形處理器）在訓練時代建立的壟斷格局。

陳寧表示，此前黃仁勛長期堅持“通用計算”理念，認為算法迭代極快，專用推理芯片容易過時，主張通過GPU的通用性來覆蓋推理需求。但市場規(guī)律證明了推理賽道的不可替代性。谷歌在最新的TPU（張量處理器）戰(zhàn)略中明確了“訓推分離”的趨勢，加碼推理專用的算力權(quán)重，博通為Meta、OpenAI定制推理芯片，都證明了獨立推理賽道的崛起，并展現(xiàn)出巨大潛力。

對于中國而言，這意味著一場難得的“超車”機遇。陳寧坦言，在訓練賽道上，由于先進制程受限、CUDA生態(tài)壁壘高筑，中國追趕英偉達差距較大，風險也越來越大。但在推理賽道上，全球都剛剛起步，游戲規(guī)則不同。“推理更接近應(yīng)用場景，要為用戶提供更高性價比的產(chǎn)品，這正是中國產(chǎn)業(yè)所擅長的。”他判斷，推理芯片的崛起將是中國科技復興的巨大機遇。

需把“百萬 token”推理綜合成本降到“一分錢”級別

面對推理時代的全新需求與挑戰(zhàn)，陳寧認為，一味簡單模仿英偉達的GPGPU架構(gòu)并非出路。推理任務(wù)的計算范式發(fā)生了根本變化，尤其是“Prefill”（預填充）和“Decode”（解碼）兩個階段對算力和帶寬的需求截然不同，傳統(tǒng)架構(gòu)必然面臨瓶頸。

為此，云天勵飛提出了新的“GPNPU”架構(gòu)，旨在融合三大核心能力：首先是頂層結(jié)合GPGPU的SIMT編程范式，具有通用靈活的調(diào)度架構(gòu)，這樣可以更便利兼容CUDA的生態(tài)；其次是結(jié)合指令集微架構(gòu)設(shè)計能力，去優(yōu)化GPGPU里面的矩陣類計算的硬件；與此同時，基于國產(chǎn)工藝和全國產(chǎn)產(chǎn)業(yè)鏈融合一系列先進封裝技術(shù)，打破內(nèi)存瓶頸，降低內(nèi)存成本。

GPNPU的目標是在計算算力、存儲帶寬、存儲容量三者間實現(xiàn)更優(yōu)配比，滿足面向未來推理時代多元化異構(gòu)推理算力的需求。無論是單位硅芯片面積的計算性能上，還是模型迭代的遷移成本上，包括算子優(yōu)化提升的硬件利用率，尤其是通過高能效、低功耗等一系列的芯片技術(shù)降低運營過程中能源成本，能真正實現(xiàn)全方位降低用戶的TCO(總體擁有成本)。

展望未來，陳寧描繪了推理算力需求的爆炸性場景。他以豆包大模型為例，其日均Token（文本處理的最小單元）處理量已達50萬億且增速驚人。

他給出“粗算”的假設(shè)，即便以50萬億為基準不再增長，面向大規(guī)模在線推理的資本開支與運營開支也會非?？捎^。

與此同時，有媒體亦報道稱字節(jié)跳動2026年AI 基建相關(guān)資本開支預算約1600億元，反映出頭部廠商對推理基礎(chǔ)設(shè)施的投入強度正在顯著抬升。

陳寧進一步判斷，若token規(guī)模短期繼續(xù)上行，明年上半年可能觸及100萬億，而在單位能效不發(fā)生顯著改善的情況下，電力與散熱等基礎(chǔ)設(shè)施壓力可能出現(xiàn)“千倍級”的數(shù)量級躍遷。

為支撐AI的規(guī)模化產(chǎn)業(yè)化，他提出需要在較短周期內(nèi)把“百萬 token”的推理綜合成本降低到“一分錢”級別。而這需要通過架構(gòu)革命（如存算一體）和工藝創(chuàng)新才能實現(xiàn)，這也正是中國企業(yè)的機會所在。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.