国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

中國計算產(chǎn)業(yè),終于邁過了生態(tài)這道坎

0
分享至



一位從事算法開發(fā)的朋友,向我們講述了他親身經(jīng)歷的故事:

他所在的團隊,被領導安排了一個任務——將已有的圖像識別模型從CUDA遷移到昇騰平臺上。

最開始,他以為會是個“大工程”,時常在論壇里看到缺少算子、工具鏈不夠完善的討論,想要在昇騰平臺上開發(fā)AI應用,等于是在啃一塊硬骨頭,連基礎的算子都要自己寫。

結果竟然比想象中順利許多。

大部分主流算子已能在CANN的算子庫中找到,只有少數(shù)需要通過算子開發(fā)套件自定義實現(xiàn)。官方提供的工具鏈談不上成熟,整體來看已經(jīng)比較完善。最終只做少量修改,就跑通了模型。

一位開發(fā)者的際遇,其實是整個生態(tài)的縮影。

很長一段時間里,國內(nèi)計算生態(tài)的“貧瘠”可謂深入人心,“缺算子、缺文檔、缺工具”等問題被頻頻詬病。

現(xiàn)在,情況正在悄然改變。昇騰CANN的算子庫、工具鏈的不斷豐富,讓開發(fā)者的遷移體驗越來越順暢,論壇里的因為“跑不通”產(chǎn)生的“吐槽帖”,漸漸變成了“怎么跑得更快”的“經(jīng)驗貼”。

中國的計算產(chǎn)業(yè),終于走出了至暗時刻。

01 計算的終局是生態(tài)

回顧計算產(chǎn)業(yè)的發(fā)展史,從不缺少“性能耀眼”的產(chǎn)品,有的被寫進了“技術史”,卻沒能在產(chǎn)業(yè)中占據(jù)一席之地。

典型的例子就是Intel的Itanium。

時間回到上世紀90年代末,在x86上一家獨大的Intel清楚地意識到:x86架構的指令集復雜度高,遺留兼容性拖累了架構演進。

于是Intel選擇和HP聯(lián)手押注EPIC架構,把并行性、指令調(diào)度等由“硬件猜”的事交給編譯器靜態(tài)完成,CPU本身可以更簡單、更高效地執(zhí)行,相當于“把硬件未來幾十年的負擔一次性解決”。

遺憾的是,Intel和HP都低估了構建軟件生態(tài)的成本。

當時Linux和Windows均已綁定了x86,企業(yè)沒有動力投入到新架構,開發(fā)者想要在Itanium上運行應用,必須重寫或移植,導致積極性嚴重不足。被寄予厚望的Itanium,無奈淪為了“昂貴的試驗品”。

和Intel形成鮮明對比的,是英偉達CUDA的崛起。



2006年的GPU市場,還是英偉達和ATI分庭抗禮的局面,就在AMD斥巨資并購ATI時,英偉達默默做了別人不愿做的事:提供類似C語言的編程接口,允許開發(fā)者直接把GPU當并行處理器使用,即使在市場不看好的情況下,仍然十幾年如一日地投資開發(fā)者生態(tài),完善工具鏈、文檔和社區(qū)。

當深度學習浪潮到來時,CUDA已然成為事實上的標準,成了任何想做AI的團隊都難以跳過的選項。

這些成功或失敗的案例背后,藏著計算產(chǎn)業(yè)的現(xiàn)實:一些產(chǎn)品之所以輸?shù)袅宋磥?,不是因為性能不夠強,而是沒能跨過生態(tài)這道坎,沒能打動千萬計的開發(fā)者。技術決定起點,而生態(tài)決定了終局。

02 一道殘酷的生死題

既然生態(tài)這么難,連Intel這樣的巨頭,當年也沒能另起爐灶,為什么還要“冒險”孵化自己的計算生態(tài)呢?

答案很殘酷,這不是選擇題,而是生死題。

以AI應用為例,國內(nèi)外有不少計算企業(yè)想要在生態(tài)上走捷徑,即兼容CUDA。簡單來說就是在CUDA的API和芯片的底層驅動間加一個“翻譯器”,幫助開發(fā)者快速跑通已有的CUDA應用,最大程度降低開發(fā)者的門檻。

諸如此類的做法無可厚非。

早期靠“兼容”解決“能用”的問題,接下來圍繞卷積、矩陣乘法、KV Cache等重點算子做深度優(yōu)化,一步步實現(xiàn)“好用”,長期則試圖培育基于自身軟硬件的原生生態(tài),逐漸擺脫對CUDA的綁定。

只是CUDA并非開源,而且更新非常頻繁,第三方產(chǎn)品很難通過指令翻譯的方式實現(xiàn)完美兼容。在大多數(shù)通用AI訓練和推理場景下,兼容路徑難以匹敵英偉達的性能和能效。

況且英偉達一旦感受到了競爭壓力,還可以通過“扎緊生態(tài)藩籬”的形式,倒逼開發(fā)者“用腳投票”。就像2024年初的一幕,英偉達宣布禁止在其他GPU上通過轉譯層運行CUDA軟件,給不少廠商敲響了警鐘。



計算生態(tài)的“有”與“無”,決定著一整個產(chǎn)業(yè)鏈的生死存亡。

如果是“無”,始終存在被卡脖子的風險,意味著關鍵軟件無法運行、關鍵應用無法落地,被鎖死在別人搭好的舞臺上。

哪怕只是“有”,即使暫時不夠好用、工具鏈不夠完善,也意味著可以逐步打磨、可以不斷迭代,避免徹底出局的風險。

業(yè)界不少芯片廠商選擇兼容CUDA生態(tài)時,華為副董事長、輪值董事長徐直軍卻坦言:“如果我們投如此多的錢兼容CUDA生態(tài),而且還是CUDA過去的版本,哪天CUDA生態(tài)兼容不了了怎么辦?”

所以在計算生態(tài)的抉擇上,華為做了一個很多人不理解的決定——做屬于自己的CANN生態(tài)。

03 CANN開源開放的“陽謀”

2025年8月初的昇騰計算產(chǎn)業(yè)發(fā)展峰會上,華為宣布“CANN全面開源開放,Mind系列應用使能套件及工具鏈全面開源,支持用戶自主的深度挖潛和自定義開發(fā),加速廣大開發(fā)者的創(chuàng)新步伐,讓昇騰更好用、更易用?!?/p>

在英偉達的封閉生態(tài)遭遇“信任危機”時,華為站在了歷史正確的一邊——加速開源開放。

CANN的全面開源開放,意味著開發(fā)者可以深入到圖優(yōu)化、算子融合、內(nèi)存調(diào)度等底層機制,不僅可以調(diào)用,還能看到底層實現(xiàn)邏輯,甚至在必要時改造、優(yōu)化,進行二次創(chuàng)新。

Mind系列工具鏈的開源,讓模型移植、調(diào)試、Profiling的全過程“白盒化”,開發(fā)者不再局限于現(xiàn)成的工具和框架,可以根據(jù)自身需求進行深度定制和優(yōu)化,實現(xiàn)更高的性能和效率。

CANN還進一步兼容了vLLM、SGLang、PyTorch、Tensorflow等主流框架,開發(fā)者將應用遷移到昇騰平臺時,無需對原有代碼進行大規(guī)模修改,只需做少量適配乃至“零改動”。

故事并未就此結束。

9月18日的華為HC 2025上,華為的硬件和超節(jié)點架構占據(jù)了多家媒體的頭條,其實還有另一個影響可能更深遠的動作——華為宣布將開放靈衢2.0技術規(guī)范,全面開放超節(jié)點技術,包括開放超節(jié)點參考架構、開放超節(jié)點基礎硬件、開源操作系統(tǒng)靈衢組件等等。



無論是昇騰384超節(jié)點,還是支持8192張卡的Atlas 950超節(jié)點,都是基于靈衢互聯(lián)協(xié)議開創(chuàng)的。底層技術協(xié)議和整套超節(jié)點技術的開放,意味著產(chǎn)業(yè)界可以基于技術規(guī)范自研相關產(chǎn)品或部件,自主設計基于靈衢的各種產(chǎn)品,實現(xiàn)真正意義上的AI算力自由。

個中邏輯并不難解釋。

只有走開源路線,降低產(chǎn)業(yè)參與門檻,才有更多的企業(yè)從中受益,才會讓更多的開發(fā)者敢于All in。華為通過硬件開放、軟件開源主動拆掉了最核心的“護城河“,用“技術讓利”換取“生態(tài)復利”,吸引全球的開發(fā)者參與進來,促進產(chǎn)業(yè)鏈上下游協(xié)同,形成良性的正反饋循環(huán)。

一組不應該被忽略的數(shù)據(jù)是:CANN全面開源開放48小時內(nèi),昇騰開發(fā)者社區(qū)新增注冊用戶就超過了10萬,Gitee平臺上的CANN代碼庫收獲了5.7萬星標,向外界宣示了中國計算生態(tài)的號召力和凝聚力。

04 前路漫漫亦燦燦

客觀評價CANN代表的國產(chǎn)計算生態(tài),必須承認仍處于“追趕”階段,在成熟度、應用廣度、生態(tài)完善度上和CUDA仍有差距。畢竟CUDA已經(jīng)打磨了近20年,CANN在2018年才推出。

有差距不代表沒機會,大模型技術正在重構千行萬業(yè),也在加劇底層計算生態(tài)的重新洗牌。

比如華為一直積極與高校合作,通過編寫教材、開設實驗課、聯(lián)合研發(fā)等方式,將昇騰、鯤鵬生態(tài)納入到了人才培養(yǎng)體系,同時幫助高校和科研機構在國產(chǎn)平臺上進行前沿研究。

典型例子就是北京大學的楊智老師,基于Ascend C自主開發(fā)了AI編程語言TileLang,提供Tile-level的類Python編程方式,大幅降低了AI編程門檻。目前昇騰CANN與TileLang已對接,并完成了FlashAttention算子的開發(fā)實現(xiàn),性能持平官方版本,核心代碼從500+行減少到了80行。

某種程度上,昇騰已經(jīng)初步形成了“教育—應用—生態(tài)”的閉環(huán):學生們在求學階段就能接觸到國產(chǎn)計算生態(tài),在實驗室里嘗試開發(fā)應用,畢業(yè)后應用到廣闊的產(chǎn)業(yè)場景中,為生態(tài)的繁榮持續(xù)注入 “新鮮血液”。



再比如在大模型領域,MoE架構逐漸成為提升參數(shù)規(guī)模和推理效率的主流路徑,卻也遇到了跨卡通信的高帶寬壓力、專家路由的動態(tài)調(diào)度等新挑戰(zhàn)。除了超節(jié)點的架構創(chuàng)新,CANN也進行了針對性優(yōu)化。

在算子開發(fā)方面,CANN將在下個版本中同時支持SIMD+SIMT的編程方式,滿足不同場景的開發(fā)需求:其中SIMD新增支持的Cube和Vector融合編程,無需寫數(shù)據(jù)搬運指令,實現(xiàn)融合算子開發(fā)效率提升30%。

在通信效率方面,昇騰將開源共享內(nèi)存能力Share Memory,在超節(jié)點范圍內(nèi)的所有片上內(nèi)存可實現(xiàn)資源池化共享,并通過Load and Store方式通信,較傳統(tǒng)通信時間大幅降低。

截止到目前,越來越多的第三方企業(yè)和開發(fā)者與華為站在一起,加入到了開源共建的陣營中。

比如無問芯穹基于CATLASS模板庫開發(fā)的Group GEMM算子,相比aclNN算子,性能再提升50%;科大訊飛、華南理工等企業(yè)和高校,在不斷豐富算子開發(fā)的專家知識庫,幾分鐘內(nèi)便可輸出最優(yōu)Tiling策略......

一邊在人才培養(yǎng)上“補短板”,一邊在工程創(chuàng)新上“立長板”,只要沿著正確的道路走下去,一個繁榮的計算生態(tài)只是時間問題。

05 寫在最后

計算生態(tài)的范疇不只是AI算力,CPU、操作系統(tǒng)等都需要從0到1構建自主生態(tài),每一個都深刻影響著整個產(chǎn)業(yè)格局。

樂觀的是,CANN的崛起已經(jīng)論證了自主生態(tài)的可行性,跑出了開源開放的生態(tài)新范式:有人在計算架構上不斷試探極限,有人在工具鏈和框架中默默補齊短板,有人在高校課堂和開源社區(qū)里播下種子……這不是一家企業(yè)的獨角戲,而是中國計算產(chǎn)業(yè)的集體答卷。

生態(tài)不是三年五載就能完成的工程,需要千千萬萬的開發(fā)者參與進來,考驗的不是速度,而是中國計算產(chǎn)業(yè)的集體耐力。

聲明:個人原創(chuàng),僅供參考

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
日子過久了才明白:有5種“家務”壓根就不用做,可惜很多人不懂

日子過久了才明白:有5種“家務”壓根就不用做,可惜很多人不懂

家居設計師蘇哥
2026-02-25 11:51:36
又有兩名伊朗外交官叛逃 短短數(shù)月已出現(xiàn)第四人

又有兩名伊朗外交官叛逃 短短數(shù)月已出現(xiàn)第四人

桂系007
2026-03-13 05:22:41
37歲把公司賣給馬云,套現(xiàn)300億全部用來造車,何小鵬究竟有多牛

37歲把公司賣給馬云,套現(xiàn)300億全部用來造車,何小鵬究竟有多牛

云舟史策
2026-03-10 11:58:03
高速服務區(qū)靠什么盈利?保潔大姐說出真相,顛覆了我的三觀!

高速服務區(qū)靠什么盈利?保潔大姐說出真相,顛覆了我的三觀!

愛下廚的阿釃
2026-03-08 16:21:08
博主曝花上萬買的二手手機缺斤少兩!網(wǎng)友:偷換零部件一魚兩吃

博主曝花上萬買的二手手機缺斤少兩!網(wǎng)友:偷換零部件一魚兩吃

柴狗夫斯基
2026-03-13 11:30:39
20+11不是張子宇極限!梅斯曼送女籃2句忠告,王思雨楊舒予尷尬了

20+11不是張子宇極限!梅斯曼送女籃2句忠告,王思雨楊舒予尷尬了

后仰大風車
2026-03-13 07:10:09
黃金投資渠道收窄,銀行“掀桌子”:誰都不想成為下一個國投瑞銀

黃金投資渠道收窄,銀行“掀桌子”:誰都不想成為下一個國投瑞銀

互金科普君
2026-03-13 18:17:25
五糧液首款光瓶酒上市,100%純糧定價399,樹立市場“新標桿”

五糧液首款光瓶酒上市,100%純糧定價399,樹立市場“新標桿”

影像渭南
2026-03-13 12:05:06
中國對臺海統(tǒng)一的壓力測試基本已經(jīng)完成,美國幾乎已經(jīng)打出所有牌

中國對臺海統(tǒng)一的壓力測試基本已經(jīng)完成,美國幾乎已經(jīng)打出所有牌

安安說
2026-03-13 12:25:12
“不好看,有點嚇人!”藝考生曬堪比小燕子的大眼睛,引人不適

“不好看,有點嚇人!”藝考生曬堪比小燕子的大眼睛,引人不適

蝴蝶花雨話教育
2026-02-08 12:47:42
古埃及法老亂倫,為何不覺得違背倫理?甚至覺得:一般人是沒機會

古埃及法老亂倫,為何不覺得違背倫理?甚至覺得:一般人是沒機會

扶蘇史記
2026-03-07 15:16:48
既然抓不到“內(nèi)鬼”,那就不抓了,伊朗非常聰明,選擇權力下沉。

既然抓不到“內(nèi)鬼”,那就不抓了,伊朗非常聰明,選擇權力下沉。

阿七說史
2026-03-11 16:03:44
犀利,熱火隊阿德巴約就未來單場80分以上的比賽發(fā)表見解

犀利,熱火隊阿德巴約就未來單場80分以上的比賽發(fā)表見解

好火子
2026-03-14 05:18:28
嫁黎明4年敗光7億家產(chǎn),離婚后再嫁美國富豪,如今胖成大媽不敢認

嫁黎明4年敗光7億家產(chǎn),離婚后再嫁美國富豪,如今胖成大媽不敢認

往史過眼云煙
2026-02-13 19:43:23
字母哥再度釋放離隊信號?多次稱贊熱火文化 力挺阿德巴約83分

字母哥再度釋放離隊信號?多次稱贊熱火文化 力挺阿德巴約83分

羅說NBA
2026-03-14 05:53:06
第40波打擊!伊朗強援參戰(zhàn),以色列惱羞成怒,特朗普發(fā)現(xiàn)不對勁

第40波打擊!伊朗強援參戰(zhàn),以色列惱羞成怒,特朗普發(fā)現(xiàn)不對勁

井普椿的獨白
2026-03-12 15:10:09
剛剛,又反轉!霍爾木茲海峽,大消息!

剛剛,又反轉!霍爾木茲海峽,大消息!

中國基金報
2026-03-13 22:00:30
上海這晚,57歲周濤秒了30歲李雪琴,不愧是央視嚴選的國泰民安臉

上海這晚,57歲周濤秒了30歲李雪琴,不愧是央視嚴選的國泰民安臉

大鐵貓娛樂
2026-02-08 00:10:03
胡歌婚變真相大白后,央視密集點名,薛佳凝預言成真

胡歌婚變真相大白后,央視密集點名,薛佳凝預言成真

李侽在北漂
2026-03-12 16:34:56
游戲全服第一,生活邋遢不洗臉,一看身高153的高挑美女七森莉莉

游戲全服第一,生活邋遢不洗臉,一看身高153的高挑美女七森莉莉

碧波萬覽
2026-03-14 03:25:08
2026-03-14 07:59:00
Alter聊科技 incentive-icons
Alter聊科技
探究產(chǎn)業(yè)興衰,專注商業(yè)解讀。
1489文章數(shù) 168115關注度
往期回顧 全部

科技要聞

龍蝦熱卷到AI硬件 “無腦”硬件或被淘汰

頭條要聞

特朗普:對伊朗石油出口樞紐哈爾克島發(fā)動"猛烈空襲"

頭條要聞

特朗普:對伊朗石油出口樞紐哈爾克島發(fā)動"猛烈空襲"

體育要聞

叕戰(zhàn)奧運,張雨霏要做回“小將”

娛樂要聞

廣電總局公布演員將用姓氏筆畫定番位

財經(jīng)要聞

“十五五”規(guī)劃綱要,全文來了!

汽車要聞

置換補貼價8.68萬 五菱繽果S 525km旗艦款上市

態(tài)度原創(chuàng)

數(shù)碼
教育
旅游
家居
親子

數(shù)碼要聞

iFixit 拆解證實MacBook Neo 成為近十年來最易維修的蘋果筆記本

教育要聞

南京一中2026年招生工作正式啟動!

旅游要聞

別再說沒機會當主角!這108彎的方向盤交給你!

家居要聞

藝術之家 法式優(yōu)雅

親子要聞

育兒思路:思考快與慢

無障礙瀏覽 進入關懷版