国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

2026,國產(chǎn)AI芯片,跨越天塹:從“推理”走向“訓(xùn)練”

0
分享至

文 | 半導(dǎo)體產(chǎn)業(yè)縱橫

過去幾年,國產(chǎn)AI芯片始終活躍在一個相對安全、也相對邊緣的位置——推理側(cè)

在政務(wù)、金融、安防、工業(yè)質(zhì)檢等場景中,國產(chǎn)芯片憑借成本可控、供應(yīng)穩(wěn)定等優(yōu)勢,逐步完成了從“可用”到“好用”的過程。但在AI訓(xùn)練這一算力金字塔頂端,國產(chǎn)芯片長期缺席,或者只能參與邊緣性任務(wù)。

這一格局,正在發(fā)生改變。2026年,將成為“國產(chǎn)AI芯片訓(xùn)練落地元年”但這一步,絕非簡單升級,而是一場系統(tǒng)工程級別的跨越。

01 訓(xùn)練與推理有何區(qū)別?

在大眾語境中,“AI算力”往往被視作一個整體,但在工程實踐中,訓(xùn)練與推理幾乎是兩種完全不同的工作負(fù)載。

訓(xùn)練的核心是讓AI模型“學(xué)會知識”,具體而言,是通過海量帶標(biāo)簽樣本,經(jīng)過特定算法迭代,求解出機(jī)器學(xué)習(xí)模型最優(yōu)參數(shù)的過程。這一階段需要海量數(shù)據(jù)的持續(xù)投喂、數(shù)十億至萬億級參數(shù)的動態(tài)更新,以及數(shù)周乃至數(shù)月的不間斷運(yùn)行,追求的是吞吐量與規(guī)?;\(yùn)算效率。

這意味著訓(xùn)練芯片不僅要具備強(qiáng)悍的算力,還需配備極高的顯存帶寬、高效的分布式通信能力,以及萬卡級集群規(guī)模下的穩(wěn)定性。訓(xùn)練過程可進(jìn)一步細(xì)分為預(yù)訓(xùn)練與后訓(xùn)練兩個階段:預(yù)訓(xùn)練依托海量無標(biāo)注或弱標(biāo)注數(shù)據(jù),通過大規(guī)模反復(fù)迭代計算優(yōu)化模型參數(shù),最小化預(yù)測誤差,最終形成具備通用生成能力的基礎(chǔ)大模型,對芯片的計算性能、互連通信能力及通用性提出極高要求;后訓(xùn)練又稱微調(diào)、優(yōu)化階段,基于通用大模型,借助標(biāo)注專業(yè)數(shù)據(jù)集對輸出層參數(shù)進(jìn)行量化、剪枝等優(yōu)化,通過強(qiáng)化學(xué)習(xí)強(qiáng)化特定領(lǐng)域適配能力,雖計算量不及預(yù)訓(xùn)練,但隨著行業(yè)化需求提升,其在全流程中的權(quán)重正持續(xù)增加。

與訓(xùn)練形成鮮明對比,推理是模型“運(yùn)用知識”的階段,需要依托已訓(xùn)練完成的模型參數(shù),對新輸入數(shù)據(jù)進(jìn)行預(yù)測、生成響應(yīng),是AI技術(shù)落地解決實際問題的核心環(huán)節(jié)。相較于訓(xùn)練,推理更側(cè)重速度、能效比、響應(yīng)延遲與成本控制,其部署場景覆蓋云服務(wù)、邊緣節(jié)點(diǎn)乃至終端設(shè)備,對穩(wěn)定性與能效比的訴求遠(yuǎn)高于峰值算力。這種特性使得推理過程無需經(jīng)歷漫長的迭代訓(xùn)練,可直接調(diào)用成熟模型完成分析預(yù)測,在海量數(shù)據(jù)處理與實時響應(yīng)場景中具備顯著高效性。

大模型的發(fā)展遵循Scaling Law的經(jīng)驗公式,即模型參數(shù)量、數(shù)據(jù)量以及計算資源的增長能得到更好的模型智能。在通用基礎(chǔ)大模型發(fā)展階段,大模型向更大參數(shù)方向不斷演化,預(yù)訓(xùn)練階段的數(shù)據(jù)量呈指數(shù)級增長,GPU作為算力硬件的核心在預(yù)訓(xùn)練市場經(jīng)歷了爆發(fā)增長。根據(jù)中國信通院《中國算力發(fā)展白皮書(2023)》,GPT-3的模型參數(shù)約為1,746億個,而GPT-4的模型參數(shù)約達(dá)到了約1.8萬億個,訓(xùn)練算力需求上升了68倍。此外,xAI發(fā)布的Grok-3使用20萬卡訓(xùn)練芯片集群帶來模型性能提升亦證明了預(yù)訓(xùn)練Scaling Law將長期成為人工智能發(fā)展的基石。

更值得關(guān)注的是,訓(xùn)練算力存在“邊際效益遞減”的天花板。對于稠密架構(gòu)大模型,當(dāng)參數(shù)從千億級向萬億級跨越時,算力需求呈超線性增長,指數(shù)級攀升的成本壓力,讓從頭訓(xùn)練大模型成為少數(shù)科技巨頭的“專屬游戲”。

憑借高算力門檻,國際領(lǐng)先廠商英偉達(dá)的產(chǎn)品一直以來都是人工智能訓(xùn)練端的首選,占據(jù)了AI訓(xùn)練市場90%以上份額,其Blackwell架構(gòu)支持1.8萬億參數(shù)模型訓(xùn)練,且NVLink 6技術(shù)實現(xiàn)72卡集群無縫互聯(lián)。而推理端(尤其是邊緣端、終端推理)對芯片性能要求較訓(xùn)練端低,因此推理芯片市場百花齊放,各類芯片均占有一席之地。

由于中國AI芯片市場起步較晚,國產(chǎn)廠商通常從門檻相對較低的推理端切入市場,目前已取得階段性成果;而訓(xùn)練端的國產(chǎn)化率仍相對較低。在海外高性能芯片出口管制不斷升級的背景下,擁有高性能計算能力、產(chǎn)品可有效應(yīng)用于訓(xùn)練端的國產(chǎn)廠商將充分受益。

02 國產(chǎn)算力走向訓(xùn)練,難在那里?

從“能推理”到“能訓(xùn)練”,表面看是性能維度的小幅提升,實則是跨越全技術(shù)棧的深度重構(gòu),核心面臨技術(shù)突破與商業(yè)閉環(huán)兩大挑戰(zhàn),考驗的是企業(yè)的綜合攻堅能力。

技術(shù)層面,核心矛盾已從單一芯片的紙面參數(shù)競爭,轉(zhuǎn)向萬卡級集群的互聯(lián)瓶頸突破,最終目標(biāo)是提升模型算力利用率(MFU)。硬件端,單卡性能的提升已無法滿足大規(guī)模訓(xùn)練需求,分布式并行成為必由之路——Scale Up通過增加單服務(wù)器GPU數(shù)量構(gòu)建超節(jié)點(diǎn),Scale Out通過擴(kuò)容服務(wù)器規(guī)模搭建分布式集群,谷歌、Meta、微軟等海外大廠已率先布局,如谷歌A3虛擬機(jī)搭載2.6萬塊英偉達(dá)H100 GPU,同時基于自研芯片搭建8960卡TPUv5p集群,通過規(guī)模化集群優(yōu)勢優(yōu)化服務(wù)架構(gòu)。而國產(chǎn)廠商雖在單卡性能上實現(xiàn)突破,但在集群協(xié)同能力上仍與海外存在差距。

軟件端,單純兼容CUDA生態(tài)的路徑在高強(qiáng)度訓(xùn)練場景中已暴露瓶頸,構(gòu)建原生、高效的自主軟件生態(tài)成為必然選擇。隨著大模型參數(shù)量與算法復(fù)雜度提升,訓(xùn)練任務(wù)對計算系統(tǒng)的通信能力要求持續(xù)升級,千卡、萬卡級智算集群成為標(biāo)配,而國內(nèi)具備完整訓(xùn)練芯片部署能力的廠商寥寥無幾。其中,華為海思憑借長期技術(shù)積淀、全棧協(xié)同優(yōu)勢及豐富的人才與客戶儲備,在國產(chǎn)訓(xùn)練芯片領(lǐng)域建立了顯著領(lǐng)先地位。

技術(shù)之外,市場用最樸素的邏輯投票:穩(wěn)定性與總擁有成本(TCO),這兩大維度構(gòu)成了對國產(chǎn)訓(xùn)練芯片的核心拷問:

其一為應(yīng)用穩(wěn)定性,長達(dá)數(shù)月的訓(xùn)練任務(wù)對芯片平均無故障時間(MTBF)提出極致要求,一次意外中斷就可能造成數(shù)百萬沉沒成本。這也是當(dāng)前智算中心普遍采用“異構(gòu)部署”策略的核心原因——通過英偉達(dá)芯片保障核心基座模型的穩(wěn)定運(yùn)行,同時用國產(chǎn)芯片在垂類模型微調(diào)、推理等場景中迭代優(yōu)化、積累信任,推動國產(chǎn)算力從“敢用”向“愿用”跨越,而實戰(zhàn)落地是唯一的破局路徑。

其二為產(chǎn)業(yè)體系升維。客戶最終采購的并非PetaFLOPS這類冰冷的性能參數(shù),而是穩(wěn)定高效的AI生產(chǎn)力。這要求國產(chǎn)廠商完成從“單一芯片供應(yīng)商”到“全棧算力解決方案服務(wù)商”的轉(zhuǎn)型,具備從供電、液冷等基礎(chǔ)設(shè)施到軟件調(diào)優(yōu)、運(yùn)維支持的全鏈條服務(wù)能力,交付一套高性能、高可靠的“算力動力總成”。

03 國產(chǎn)AI芯片從推理走向訓(xùn)練

國產(chǎn)芯片在訓(xùn)練場景的落地,并非一蹴而就的爆發(fā),而是政策驅(qū)動與技術(shù)迭代共同作用的結(jié)果,早在去年就已顯現(xiàn)端倪。2025年8月21日,DeepSeek曾表示,新版本采用了一項針對國產(chǎn)芯片而設(shè)計的技術(shù),能夠?qū)崿F(xiàn)性能優(yōu)化,并加快處理速度。

政策層面的支撐更為明確:2025年5月,美國BIS發(fā)布《關(guān)于可能適用于先進(jìn)計算芯片及其他用于訓(xùn)練AI模型商品的管制的政策聲明》《關(guān)于通用禁令10(GP10)對中華人民共和國(PRC)先進(jìn)計算芯片適用的指南》《關(guān)于防止先進(jìn)計算芯片轉(zhuǎn)移的行業(yè)指南》,從AI芯片的使用范圍、供應(yīng)鏈制裁等角度進(jìn)一步加強(qiáng)了對先進(jìn)AI芯片和相關(guān)技術(shù)的出口管制,將出口管制風(fēng)險進(jìn)一步延伸至產(chǎn)業(yè)鏈的各個參與方。地緣政治倒逼相關(guān)國內(nèi)客戶使用國產(chǎn)GPU產(chǎn)品,在一定程度上幫助國產(chǎn)GPU廠商與國內(nèi)客戶和供應(yīng)商建立密切聯(lián)系,進(jìn)而快速實現(xiàn)技術(shù)和產(chǎn)品迭代升級。

而且近期,工信部聯(lián)合7部門出臺《“人工智能+制造”專項行動實施意見》明確提出,支持突破高端訓(xùn)練芯片、端側(cè)推理芯片、人工智能服務(wù)器、高速互聯(lián)、智算云操作系統(tǒng)等關(guān)鍵技術(shù)。

多重因素疊加下,2026年成為國產(chǎn)AI芯片訓(xùn)練落地的關(guān)鍵元年。


今年以來,一批基于國產(chǎn)芯片訓(xùn)練的AI大模型密集落地,標(biāo)志著國產(chǎn)算力在訓(xùn)練場景的實戰(zhàn)能力得到驗證。

2026年1月14日,智譜聯(lián)合華為開源新一代圖像生成模型GLM-Image,開源后24小時內(nèi)登頂全球AI開源社區(qū)Hugging Face Trending榜單榜首。該模型基于華為昇騰Atlas 800T A2設(shè)備與昇思MindSpore AI框架,完成從數(shù)據(jù)處理到模型訓(xùn)練的全流程閉環(huán),是首個依托國產(chǎn)芯片實現(xiàn)全程訓(xùn)練的SOTA(當(dāng)前最高水平)多模態(tài)模型,首次讓國產(chǎn)芯片訓(xùn)練的模型站上國際頂端舞臺,印證了我國AI模型端到端自主研發(fā)能力的突破,引發(fā)全球AI圈、產(chǎn)業(yè)界與資本市場的廣泛關(guān)注。

1月13日,摩爾線程與北京智源人工智能研究院達(dá)成突破,依托MTT S5000千卡智算集群與FlagOS-Robo框架,成功完成智源自研具身大腦模型RoboBrain 2.5的全流程訓(xùn)練。這一成果首次驗證了國產(chǎn)算力集群在具身智能大模型訓(xùn)練中的可用性與高效性,標(biāo)志著國產(chǎn)AI基礎(chǔ)設(shè)施已具備應(yīng)對復(fù)雜多模態(tài)任務(wù)的能力。此外,摩爾線程還與小馬智行正式宣布達(dá)成戰(zhàn)略合作。雙方將聚焦L4級自動駕駛技術(shù)落地與規(guī)?;瘧?yīng)用,圍繞小馬智行技術(shù)核心——世界模型及虛擬司機(jī)系統(tǒng)的訓(xùn)練與優(yōu)化展開深度協(xié)同,共同探索“AI算法+AI算力”深度融合的合作新范式,以安全可靠的AI算力,賦能自動駕駛技術(shù)迭代和商業(yè)落地。雙方將基于摩爾線程MTT S5000訓(xùn)推一體智算卡及夸娥智算集群,共同推進(jìn)小馬智行世界模型及車端模型訓(xùn)練的適配與驗證。

中國電信近期開源的千億級星辰大模型,實現(xiàn)了國產(chǎn)AI全棧生態(tài)的關(guān)鍵突破。此次發(fā)布的TeleChat3系列包含兩大核心模型——混合專家架構(gòu)的
TeleChat3-105B-A4.7B-Thinking與稠密架構(gòu)的TeleChat3-36B-Thinking,其訓(xùn)練全程依托上海臨港國產(chǎn)萬卡算力池完成,累計消耗15萬億tokens訓(xùn)練數(shù)據(jù),成為國產(chǎn)AI發(fā)展史上的里程碑事件。技術(shù)層面,該系列模型實現(xiàn)從硬件到軟件的全鏈路國產(chǎn)化適配,深度整合華為昇騰生態(tài),包括Atlas800T A2訓(xùn)練服務(wù)器的硬件支持、昇思MindSpore框架的開發(fā)環(huán)境,以及完整的國產(chǎn)AI算力基礎(chǔ)設(shè)施支撐。

客觀來看,英偉達(dá)A100/H100/H800系列GPU仍是全球超大規(guī)模前沿模型(如DeepSeek-V3)訓(xùn)練的首選,但國產(chǎn)算力平臺已逐步實現(xiàn)突破,可穩(wěn)定支撐數(shù)十億至千億參數(shù)級模型的全流程訓(xùn)練任務(wù)。此前主流大模型高度依賴海外GPU的格局正在改變,供應(yīng)鏈安全風(fēng)險得到有效緩解,國產(chǎn)AI芯片正從推理側(cè)的“單點(diǎn)突破”,邁向訓(xùn)練側(cè)的“體系化崛起”。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
深度揭秘|她斂財6千萬,在法庭叫囂:死也不退贓,這些錢都是我睡來的

深度揭秘|她斂財6千萬,在法庭叫囂:死也不退贓,這些錢都是我睡來的

一分為三看人生
2026-02-28 00:07:11
中方兩大鄰國發(fā)生激烈沖突!巴鐵戰(zhàn)機(jī)被擊落!已正式對阿富汗宣戰(zhàn)

中方兩大鄰國發(fā)生激烈沖突!巴鐵戰(zhàn)機(jī)被擊落!已正式對阿富汗宣戰(zhàn)

霽寒飄雪
2026-02-27 22:54:45
中國游客不去日本消費(fèi),中國經(jīng)濟(jì)反而比日本虧?這筆賬給你掰到底

中國游客不去日本消費(fèi),中國經(jīng)濟(jì)反而比日本虧?這筆賬給你掰到底

何氽簡史
2026-02-27 19:20:59
陳垣宇力排眾議,3-1擊敗世界第二強(qiáng)勢晉級

陳垣宇力排眾議,3-1擊敗世界第二強(qiáng)勢晉級

每一次點(diǎn)擊
2026-02-28 02:18:44
為何郭士強(qiáng)挑戰(zhàn)違體卻吃T?日本媒體曬出證據(jù),被吹T真的不冤

為何郭士強(qiáng)挑戰(zhàn)違體卻吃T?日本媒體曬出證據(jù),被吹T真的不冤

南海浪花
2026-02-27 08:14:39
上海是個垃圾桶,全國的垃圾都來上海

上海是個垃圾桶,全國的垃圾都來上海

上海云河
2026-02-26 22:23:23
頂尖歷史學(xué)家齊聚北京,說出殘酷真相,我們讀的歷史漏掉99%的人

頂尖歷史學(xué)家齊聚北京,說出殘酷真相,我們讀的歷史漏掉99%的人

墨印齋
2026-02-26 12:58:12
卡里克談連續(xù)使用相同首發(fā);卡里克:我非常喜歡烏加特,他是球隊重要的一環(huán)

卡里克談連續(xù)使用相同首發(fā);卡里克:我非常喜歡烏加特,他是球隊重要的一環(huán)

MUREDS
2026-02-27 23:33:13
事發(fā)上海!房門和防盜門之間竟夾了個人,3小時動彈不得……怎么發(fā)生的?

事發(fā)上海!房門和防盜門之間竟夾了個人,3小時動彈不得……怎么發(fā)生的?

環(huán)球網(wǎng)資訊
2026-02-27 19:39:22
別被熱身賽給騙了!山東泰山2-9慘敗上海申花,只是試錯不是崩盤

別被熱身賽給騙了!山東泰山2-9慘敗上海申花,只是試錯不是崩盤

獅王亂彈
2026-02-28 06:04:53
沮喪,熱火隊主教練就諾曼·鮑威爾的腹股溝傷勢發(fā)表了更多看法

沮喪,熱火隊主教練就諾曼·鮑威爾的腹股溝傷勢發(fā)表了更多看法

好火子
2026-02-28 04:29:22
“閨女,回婆家坐月子,你哥要結(jié)婚”“阿姨,房是我這個外人的”

“閨女,回婆家坐月子,你哥要結(jié)婚”“阿姨,房是我這個外人的”

秀秀情感課堂
2026-02-27 19:30:03
李小璐的新瓜,信息量有點(diǎn)大啊…

李小璐的新瓜,信息量有點(diǎn)大啊…

二胡的歲月如歌
2026-02-26 14:06:05
斯基拉:巴薩準(zhǔn)備3000萬歐買斷拉什福德,雙方已談妥個人條款

斯基拉:巴薩準(zhǔn)備3000萬歐買斷拉什福德,雙方已談妥個人條款

懂球帝
2026-02-28 05:32:11
“性蕭條”才是這個時代真正的危機(jī)

“性蕭條”才是這個時代真正的危機(jī)

深藍(lán)夜讀
2025-09-24 16:00:09
南通支云鋒霸社媒官宣離開俱樂部,曾是上港絕對主力,將重返中超

南通支云鋒霸社媒官宣離開俱樂部,曾是上港絕對主力,將重返中超

懂個球
2026-02-27 16:52:16
韓寒的這場“豪賭”,贏得很徹底,他能分賬多少錢?

韓寒的這場“豪賭”,贏得很徹底,他能分賬多少錢?

八卦南風(fēng)
2026-02-25 13:37:35
死了一個女人,埋葬半個王朝

死了一個女人,埋葬半個王朝

我是歷史其實挺有趣
2026-02-27 15:23:11
春咖:一種與時光對飲的儀式

春咖:一種與時光對飲的儀式

疾跑的小蝸牛
2026-02-27 21:44:18
分手,太陽隊最終與科爾·安東尼分道揚(yáng)鑣

分手,太陽隊最終與科爾·安東尼分道揚(yáng)鑣

好火子
2026-02-28 06:11:42
2026-02-28 07:12:49
鈦媒體APP incentive-icons
鈦媒體APP
獨(dú)立財經(jīng)科技媒體
129966文章數(shù) 861825關(guān)注度
往期回顧 全部

科技要聞

狂攬1100億美元!OpenAI再創(chuàng)融資神話

頭條要聞

特朗普警告伊朗:“有時候不得不打”

頭條要聞

特朗普警告伊朗:“有時候不得不打”

體育要聞

一場必須要贏的比賽,男籃何止擊敗了裁判

娛樂要聞

郭晶晶霍啟剛現(xiàn)身香港藝術(shù)節(jié)盡顯恩愛

財經(jīng)要聞

沈明高提共富建議 百姓持科技股國家兜底

汽車要聞

嵐圖泰山黑武士版3月上市 搭載華為四激光智駕方案

態(tài)度原創(chuàng)

親子
游戲
教育
數(shù)碼
公開課

親子要聞

今年過年和父母鬧別扭了嗎?希望小女孩能找到和父母相處最舒服的方式

《寶可夢:冠軍》4月登陸NS 夏季登陸手機(jī)端

教育要聞

圓與旋轉(zhuǎn)第1講,一個視頻學(xué)明白

數(shù)碼要聞

Omdia:時隔5年,小米去年再度回歸可穿戴設(shè)備出貨榜首

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版