国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

拆解CANN:當(dāng)華為決定打開算力的「黑盒」

0
分享至



編輯|Panda、澤南

大模型的競(jìng)爭(zhēng)如火如荼,也有一群人正在研究如何降低門檻,讓 AI 工具變得親民。

最近,在 AI 基礎(chǔ)算力上重磅頻出的華為,又亮出了一張王牌:昇騰的底層基礎(chǔ)軟件,CANN 全面開源開放

昇騰宣布將通過一系列新舉措,持續(xù)支持開發(fā)者在 AI 模型、算子、內(nèi)核、底層資源等多個(gè)層級(jí)進(jìn)行自主優(yōu)化與自定義開發(fā)。通過開放共建,一個(gè)新興的 AI 算力生態(tài)正在快速崛起,改變計(jì)算架構(gòu)領(lǐng)域本已固化的格局。

CANN 全稱為「神經(jīng)網(wǎng)絡(luò)異構(gòu)計(jì)算架構(gòu)」(Compute Architecture for Neural Networks),其作為連接上層 AI 訓(xùn)練框架(如 PyTorch、TensorFlow、MindSpore 等)和底層 AI 芯片的橋梁,讓開發(fā)者不用關(guān)心芯片細(xì)節(jié)就能調(diào)用底層算力。

最近一段時(shí)間,業(yè)內(nèi)對(duì)于國產(chǎn) AI 算力的需求大幅增長,讓人們更加重視起硬件的計(jì)算架構(gòu)。CANN 的開源開放引發(fā)了業(yè)界的廣泛關(guān)注,當(dāng) CANN 這個(gè)在整個(gè) AI 技術(shù)棧中「承上啟下」的關(guān)鍵角色被開源了之后,開發(fā)者們獲得了定義算力的權(quán)力。

以前在 AI 芯片上的算子開發(fā)門檻高到不敢用,現(xiàn)在昇騰 CANN 把這層窗戶紙捅破了。

這一次,我們不談宏大的生態(tài)格局,只談對(duì)于坐在屏幕前的開發(fā)者來說,CANN 的開源開放到底帶來了什么?

拒絕「黑盒」

三種路徑實(shí)現(xiàn)「AI 算子開發(fā)自由」

在 AI 開發(fā)的深水區(qū),算子開發(fā)效率與性能的平衡始終是個(gè)難題。但「AI 算子開發(fā)自由」首先建立在廣泛的生態(tài)兼容之上。

CANN 目前已經(jīng)支持與 PyTorch、TensorFlow、MindSpore、PaddlePaddle 等主流 AI 框架無縫對(duì)接,并開放了 GE 圖開發(fā)接口,允許開發(fā)者自定義圖結(jié)構(gòu),滿足了多樣化的開發(fā)需求。



大模型方面,CANN 覆蓋了國內(nèi)外目前的主流,支持包括 Llama、Mistral、Phi 等海外模型,以及 Qwen、DeepSeek、GLM 等國產(chǎn)大模型家族,共計(jì)超過 50 種。昇騰已經(jīng)參與了超過 10 個(gè)大模型開源社區(qū)的上下游生態(tài)構(gòu)建。

在此基礎(chǔ)上,針對(duì)更深層的算子開發(fā)挑戰(zhàn),開源開放后的 CANN 為不同技術(shù)背景的開發(fā)者提供了三條路徑。



路徑一:習(xí)慣 Python?Triton 生態(tài)無縫接入

對(duì)于習(xí)慣了 GPU 編程范式的開發(fā)者,最大的顧慮往往是遷移成本。CANN 對(duì)此給出的答案是:不用改變習(xí)慣

CANN 實(shí)現(xiàn)了與業(yè)界主流開發(fā)范式 Triton 的深度對(duì)接。通過 Linalg IR 與 AscendNPU IR(中間表示)的轉(zhuǎn)換,開發(fā)者可以直接使用熟悉的 Python 語法編寫高性能算子,原有的 Triton 代碼能夠以極低的成本遷移到昇騰 NPU 上。

此外,CANN 還引入了TileLang這一新興編程選擇。它提供了比 Triton 更細(xì)粒度的性能控制能力,允許開發(fā)者顯式管理數(shù)據(jù)分塊和內(nèi)存層級(jí)映射。通過 TileLang-Ascend 的深度適配,開發(fā)者可以利用類 Python 語法,精準(zhǔn)操控 NPU 的 Cube 核與 Vector 核,有效解決現(xiàn)代 AI 芯片面臨的「內(nèi)存墻」挑戰(zhàn)。

路徑二:追求極致?Ascend C 讓性能「狂飆」

對(duì)于追求 SOTA 性能的系統(tǒng)級(jí)程序員,Ascend C是昇騰原生提供的終極武器。

這是一種采用 C/C++ 語法風(fēng)格的編程語言,它開放了算子底層資源管理接口。這意味著開發(fā)者不再受限于封裝好的 API,而是可以直接調(diào)用 NPU 的原子級(jí)能力,精確控制每一個(gè)時(shí)鐘周期的行為和片上緩存管理。無論是 FlashAttention 還是復(fù)雜的 MoE 融合算子,Ascend C 都能讓開發(fā)者榨干硬件的每一滴性能。

路徑三:想要省力?搭積木式的模板庫

并非所有場(chǎng)景都需要從零手寫算子。針對(duì)深度學(xué)習(xí)中無處不在的矩陣運(yùn)算(GEMM),CANN 推出了CATLASS 算子模板庫



這是一個(gè)基于 Ascend C 構(gòu)建的高性能算子模版庫,它將復(fù)雜的矩陣乘法及其融合算子抽象為可配置的模板。開發(fā)者無需重新編寫復(fù)雜的切分(Tiling)和流水線(Pipeline)邏輯,只需簡(jiǎn)單的參數(shù)配置,即可快速生成適配不同形狀和精度的矩陣乘算子。

在當(dāng)前主流的 MoE(混合專家)模型支持上,CANN 還推出了創(chuàng)新的 MLAPO 融合算子。這種設(shè)計(jì)將原本需要多個(gè)算子完成的 MoE 計(jì)算,融合為單個(gè)高效算子。測(cè)試數(shù)據(jù)顯示,MLAPO 融合算子能夠顯著降低計(jì)算開銷,相比傳統(tǒng)實(shí)現(xiàn)方式,在相同硬件上獲得明顯的性能提升。



在大參數(shù) DeepSeekV3 模型的量化場(chǎng)景下,MLAPO 算子的實(shí)現(xiàn)能將計(jì)算耗時(shí)從 109us 縮減為 45us,帶來整網(wǎng)性能提升 20%。

這不是畫餅,而是已經(jīng)有開源代碼、有倉庫的實(shí)質(zhì)性進(jìn)展。

為了方便開發(fā)者快速上手,CANN 已在 AtomGit 上開放了包括 CATLASS(算子模板庫)、ops-math(基礎(chǔ)數(shù)學(xué))、ops-nn(神經(jīng)網(wǎng)絡(luò))、ops-transformer(transformer 類大模型)、ops-cv(圖像處理、目標(biāo)檢測(cè))、HCCL(通信庫)在內(nèi)的多個(gè)核心倉庫,并發(fā)布了集成主流大模型環(huán)境的官方容器鏡像,開發(fā)者可以通過容器指令直接獲取開箱即用的開發(fā)環(huán)境。(https://gitcode.com/cann)

目前,CANN 已預(yù)置了超過 1400 個(gè)基礎(chǔ)算子、100 多個(gè)融合算子以及 15 個(gè)通信算法,為大模型開發(fā)提供了「開箱即用」的能力。這些算子經(jīng)過深度優(yōu)化和實(shí)際生產(chǎn)過程的驗(yàn)證,能夠充分發(fā)揮昇騰硬件的性能潛力,是吸引開發(fā)者和企業(yè)客戶從「試一試」轉(zhuǎn)向「深度用」的硬通貨。

這種對(duì)底層細(xì)節(jié)的「可控性」,使 CANN 能夠成為追求 SOTA 性能的系統(tǒng)程序員的有力武器。

架構(gòu)變革:分層解耦

為什么現(xiàn)在的 CANN 能做到如此靈活?核心在于架構(gòu)上的分層解耦



CANN 的多層架構(gòu)示意圖,其中不同的層級(jí)有不同的開源策略。

何為分層解耦?其實(shí)并不難理解。在過去的 AI 軟件棧中,工具鏈、運(yùn)行時(shí)、驅(qū)動(dòng)、編程體系、加速庫等往往被打造成一個(gè)整體。這種模式雖也有優(yōu)勢(shì),但對(duì)于追求極致性能的頭部模型廠商和底層系統(tǒng)工程師來說,卻顯得笨重。

而 CANN 卻做到了在宏觀架構(gòu)上的功能解耦與組件獨(dú)立演進(jìn)。

具體來說,CANN 不再是一個(gè)巨大的單體軟件,而是被拆解為多個(gè)功能正交的組件。分層解耦的思路貫穿了全棧:從底層的硬件驅(qū)動(dòng)到中間的運(yùn)行時(shí),再到上層的編譯器和加速庫,每一層都實(shí)現(xiàn)了物理上的松耦合。

這意味著開發(fā)者無需像過去那樣「牽一發(fā)而動(dòng)全身」,而是可以根據(jù)業(yè)務(wù)需求,按需引入或升級(jí)特定的組件功能,大幅降低了系統(tǒng)集成和定制開發(fā)的門檻。

這種解耦可為 CANN 各個(gè)層級(jí)帶來重要的變化:

加速庫的「組件化」

CANN 改變了過去「全量算子一個(gè)包」的發(fā)布方式。算子庫被精細(xì)拆分為 ops-math、ops-nn、ops-cv 和 ops-transformer 等獨(dú)立組件。



通信庫和圖引擎(GE)也作為獨(dú)立組件逐步開放。其中 HCCL 開放了通信算子和框架層,支持開發(fā)者自定義通信算法以適應(yīng)大規(guī)模集群;GE 則開放了圖編譯和執(zhí)行接口,支持自定義圖融合策略。

運(yùn)行時(shí)的「極簡(jiǎn)化」

Runtime 層剝離了冗余模塊,實(shí)現(xiàn)了核心功能的最小化。更為關(guān)鍵的是,Runtime 開放了 aclGraph 接口,支持圖模式下沉。

這一機(jī)制允許開發(fā)者將由多個(gè)算子組成的計(jì)算圖一次性下沉到 Device 側(cè),極大地減少了 Host 與 Device 之間的交互開銷。

在架構(gòu)分層解耦之后,CANN 實(shí)現(xiàn)了組件功能的最小化,共有 20 余個(gè)安裝包,支持各功能的獨(dú)立演進(jìn)和編譯升級(jí)。

這樣一來,開發(fā)者可以在模型、算子、內(nèi)核、底層資源等多個(gè)層級(jí)分別進(jìn)行優(yōu)化與開發(fā)??梢哉f開源后的 CANN,在追求極致性能的同時(shí),兼顧了開發(fā)的易用性。

全面開源開放

正在陸續(xù)進(jìn)行中

對(duì)于開源世界來說,真正的技術(shù)價(jià)值會(huì)在自由流動(dòng)中無限放大。CANN 的開源正是遵循同一邏輯:它不僅僅是為了「替代」,更是發(fā)出了一份共同構(gòu)建「算力多元世界」的邀請(qǐng)函。開發(fā)者的每一次使用,問題的反饋和代碼的提交,都會(huì)為這個(gè)新的生態(tài)做出貢獻(xiàn)。

當(dāng) CANN 開源社區(qū)的代碼倉庫逐漸被開發(fā)者 fork 和 star,大學(xué)實(shí)驗(yàn)室的研究者們開始用 Ascend C 完成 AI 項(xiàng)目,當(dāng)硅基流動(dòng)、無問芯穹等創(chuàng)業(yè)公司基于 CANN 優(yōu)化自己的模型訓(xùn)練流程,一個(gè)不同于 CUDA 路徑的 AI 算力生態(tài)正在快速成長。

基于昇騰 CANN,無論你是想驗(yàn)證一個(gè)想法,還是遷移一個(gè)模型,現(xiàn)在都可以快速開始。

目前,CANN 的全面開源開放正在加速推進(jìn),其在 AtomGit 的代碼庫也非?;钴S,幾乎每天都有新的動(dòng)態(tài)。



截至目前,CANN 項(xiàng)目下已有 27 個(gè)子項(xiàng)目,總 star 數(shù)已經(jīng)超過 3700,總下載量更是已經(jīng)突破 35 萬。

更值得期待的是,開源的版圖還在持續(xù)擴(kuò)大。比如用于負(fù)責(zé) AI 計(jì)算圖的解析、優(yōu)化和執(zhí)行的 GE (Graph Engine,也是 CANN 的核心組件之一)以及一種旨在簡(jiǎn)化高性能算子的開發(fā)流程的新型編程范式 PyPTO(Python Parallel Tensor Operation)框架。



想體驗(yàn)最新的 CANN 開源開放能力?

  • 主頁地址:https://www.hiascend.com/cann
  • 開源項(xiàng)目:https://gitcode.com/cann

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
王心凌武漢演唱會(huì)翻車?小腹贅肉出圈,網(wǎng)友反而集體破防,真實(shí)感

王心凌武漢演唱會(huì)翻車?小腹贅肉出圈,網(wǎng)友反而集體破防,真實(shí)感

阿廢冷眼觀察所
2025-12-23 09:09:52
廣東93-85廣州!球員評(píng)分:2人滿分,3人良好,2人不合格

廣東93-85廣州!球員評(píng)分:2人滿分,3人良好,2人不合格

多特體育說
2025-12-23 21:39:18
2026要嚴(yán)查個(gè)人收入?如果賬戶收入超過這個(gè)數(shù),就要注意了?

2026要嚴(yán)查個(gè)人收入?如果賬戶收入超過這個(gè)數(shù),就要注意了?

今朝牛馬
2025-12-23 16:29:57
中東王子全身癱瘓赴華求醫(yī),中醫(yī)摸下手腕,1句話讓醫(yī)療團(tuán)隊(duì)傻眼

中東王子全身癱瘓赴華求醫(yī),中醫(yī)摸下手腕,1句話讓醫(yī)療團(tuán)隊(duì)傻眼

小哥很OK
2025-12-07 15:35:44
閆妮在華強(qiáng)北送外賣!有深圳人看哭......

閆妮在華強(qiáng)北送外賣!有深圳人看哭......

深圳晚報(bào)
2025-12-23 12:33:55
天冷了要養(yǎng)骨!少吃白菜蘿卜,多吃這8樣,腿腳有勁,精氣十足!

天冷了要養(yǎng)骨!少吃白菜蘿卜,多吃這8樣,腿腳有勁,精氣十足!

美食店主
2025-12-22 00:27:55
遼寧省住房和城鄉(xiāng)建設(shè)廳原副廳長祁向國被“雙開”:未經(jīng)批準(zhǔn)出入國境

遼寧省住房和城鄉(xiāng)建設(shè)廳原副廳長祁向國被“雙開”:未經(jīng)批準(zhǔn)出入國境

界面新聞
2025-12-23 18:54:53
中國10大美食之都,西安第4,廣州第2,第1實(shí)至名歸,有空逛一逛

中國10大美食之都,西安第4,廣州第2,第1實(shí)至名歸,有空逛一逛

簡(jiǎn)食記工作號(hào)
2025-12-23 00:13:58
關(guān)曉彤曬餃子火了,網(wǎng)友吵翻了,這碗家常飯藏著多少門道

關(guān)曉彤曬餃子火了,網(wǎng)友吵翻了,這碗家常飯藏著多少門道

觀察鑒娛
2025-12-23 08:51:43
生育率的回旋鏢終于來了。

生育率的回旋鏢終于來了。

愛吃糖的貓cat
2025-12-23 13:55:34
目前來看,洋浦港想取代新加坡是不可能的

目前來看,洋浦港想取代新加坡是不可能的

扶蘇聊歷史
2025-12-23 15:14:13
風(fēng)波升級(jí)?羅永浩不忍了,發(fā)文炮轟項(xiàng)立剛,網(wǎng)友:別成下一個(gè)西貝

風(fēng)波升級(jí)?羅永浩不忍了,發(fā)文炮轟項(xiàng)立剛,網(wǎng)友:別成下一個(gè)西貝

千言娛樂記
2025-12-22 20:55:14
今夜誰被打臉?徐昕手刃舊主or杜鋒納大禮?郭艾倫單挑徐杰迎救贖

今夜誰被打臉?徐昕手刃舊主or杜鋒納大禮?郭艾倫單挑徐杰迎救贖

中山印象體育攝影師
2025-12-23 14:01:42
何穗曬2個(gè)月寶寶會(huì)抬頭,頭發(fā)稀耳朵大有福,對(duì)陳偉霆稱呼顯親昵

何穗曬2個(gè)月寶寶會(huì)抬頭,頭發(fā)稀耳朵大有福,對(duì)陳偉霆稱呼顯親昵

阿纂看事
2025-12-23 17:45:34
發(fā)現(xiàn)一個(gè)奇怪現(xiàn)象:喜歡把家里打掃得很干凈的人,往往會(huì)有這3種命運(yùn),并非迷信

發(fā)現(xiàn)一個(gè)奇怪現(xiàn)象:喜歡把家里打掃得很干凈的人,往往會(huì)有這3種命運(yùn),并非迷信

LULU生活家
2025-12-23 18:33:20
趙露思不尷尬嗎?寶格麗900萬珠寶給她戴了,卻一身廉價(jià)味顯難堪

趙露思不尷尬嗎?寶格麗900萬珠寶給她戴了,卻一身廉價(jià)味顯難堪

嫹筆牂牂
2025-12-23 07:09:08
廣東豪取五連勝!薩林杰狂砍32+11,徐杰20+4,杜鋒軍訓(xùn)徐昕

廣東豪取五連勝!薩林杰狂砍32+11,徐杰20+4,杜鋒軍訓(xùn)徐昕

多特體育說
2025-12-23 21:34:57
周琦一家近照,大6歲妻子身材好,兒子也愛籃球,29歲身家過億

周琦一家近照,大6歲妻子身材好,兒子也愛籃球,29歲身家過億

大西體育
2025-12-23 16:37:16
軍隊(duì)再強(qiáng)大,經(jīng)濟(jì)再富足,武器再尖端,沒有偉大領(lǐng)袖,全都白瞎

軍隊(duì)再強(qiáng)大,經(jīng)濟(jì)再富足,武器再尖端,沒有偉大領(lǐng)袖,全都白瞎

南權(quán)先生
2025-12-23 16:58:45
容易和異性發(fā)生“曖昧關(guān)系”的,大多是以下三種女人

容易和異性發(fā)生“曖昧關(guān)系”的,大多是以下三種女人

葉飛飛情感屋
2024-12-06 18:22:45
2025-12-23 22:20:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
11980文章數(shù) 142518關(guān)注度
往期回顧 全部

科技要聞

慘烈90分鐘!快手驚魂:遭遇最強(qiáng)黑產(chǎn)攻擊

頭條要聞

媒體稱系寧波人朱光送拍8800萬的《江南春》 身份披露

頭條要聞

媒體稱系寧波人朱光送拍8800萬的《江南春》 身份披露

體育要聞

楊瀚森連續(xù)5場(chǎng)DNP!開拓者遭活塞雙殺

娛樂要聞

朱孝天回應(yīng)阿信感謝,自曝沒再收到邀約

財(cái)經(jīng)要聞

祥源系百億產(chǎn)品爆雷 浙金中心18人被拘

汽車要聞

四款新車集中發(fā)布 星途正式走進(jìn)3.0時(shí)代

態(tài)度原創(chuàng)

游戲
藝術(shù)
健康
房產(chǎn)
軍事航空

德瑪西亞杯:驚天逆轉(zhuǎn),不敢相信!OMG零封WBG

藝術(shù)要聞

朱總理的詩句驚艷眾人,張家界竟藏有這樣的美景!

這些新療法,讓化療不再那么痛苦

房產(chǎn)要聞

獨(dú)家猛料!16.1億,浙江老板搶下雅居樂清水灣261畝重磅宅地!

軍事要聞

俄烏沖突關(guān)鍵人物在莫斯科被炸死 烏方尚未公開認(rèn)領(lǐng)

無障礙瀏覽 進(jìn)入關(guān)懷版