国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

KernelCAT 發(fā)布,Agent 自動化實現(xiàn)國產(chǎn)芯片適配與計算加速

0
分享至

國產(chǎn)算力基建進入下半場,重心正從芯片的「數(shù)量增長」轉(zhuǎn)向「效率提升」。國產(chǎn)芯片數(shù)量持續(xù)增長,但生態(tài)建設(shè)依舊落后,這正是當下 AI 落地最真實的一幕。

模型不斷刷新參數(shù),底層卻在艱難轉(zhuǎn)場。

比起輪番刷新的參數(shù)規(guī)模記錄,更難轉(zhuǎn)變的是開發(fā)者所使用的那套固化的流程。算力只是門檻,而真正的較量在于算法與硬件的協(xié)同效率。



KernelCAT:計算加速專家級別的 Agent

幾乎每個人都能感受到 AI 領(lǐng)域的加速感,模型密集發(fā)布,應用數(shù)據(jù)持續(xù)走高。但在真實的工程現(xiàn)場,感受卻更復雜:真正制約落地效率的不是模型能力本身,而是底層軟件生態(tài)的成熟度。

硬件選擇變多,問題反而集中暴露出來:遷移成本高,適配周期長,性能釋放不穩(wěn)定。很多模型即便具備條件切換算力平臺,最終也會被算子支持和工具鏈完整度擋在門外。

這讓一個事實變得越來越清晰。突破口不是堆更多算力,而是打通算法到硬件之間那段最容易被忽視的工程鏈路,把芯片的理論性能真正轉(zhuǎn)化為可用性能。

其中最關(guān)鍵的一環(huán)正是高性能算子的開發(fā)。

算子(Kernel)的作用是連接 AI 算法與計算芯片,它將算法轉(zhuǎn)化為硬件可執(zhí)行的指令,決定了 AI 模型的推理速度、能耗與兼容性。

算子開發(fā)屬于內(nèi)核級的編程工程,但行業(yè)現(xiàn)狀卻仍高度依賴個人經(jīng)驗。它極度依賴頂尖專家的直覺與肌肉記憶,性能調(diào)優(yōu)往往像是在迷霧里盲測,周期漫長。

但如果,讓 AI 來開發(fā)算子呢?

傳統(tǒng)大模型或知識增強型 Agent 在此類任務面前往往力不從心。因為它們擅長模式匹配,卻難以理解復雜計算任務中的物理約束、內(nèi)存布局與并行調(diào)度邏輯。唯有超越經(jīng)驗式推理,深入建模問題本質(zhì),才能實現(xiàn)真正的「智能級」優(yōu)化。

正是在這種嚴峻的技術(shù)挑戰(zhàn)下,KernelCAT 應運而生。


KernelCAT 終端版 Agent

KernelCAT 是一款本地運行的 AI Agent。它不僅是深耕算子開發(fā)和模型遷移的「計算加速專家」,也能夠勝任日常通用的全棧開發(fā)任務,提供了 CLI 終端命令行版與簡潔桌面版兩種形態(tài)供開發(fā)者使用。

不同于僅聚焦特定任務的工具型 Agent,KernelCAT 具備扎實的通用編程能力。

它不僅能理解、生成和優(yōu)化內(nèi)核級別代碼,也能處理常規(guī)軟件工程任務,如環(huán)境配置、依賴管理、錯誤診斷與腳本編寫,從而在復雜場景中實現(xiàn)端到端自主閉環(huán)。


KernelCAT 桌面版 Agent


為國產(chǎn)芯片生態(tài)寫高性能算子

在算子開發(fā)中,有一類問題很像「調(diào)參」。面對幾十上百種參數(shù)或策略組合,工程師需要找出讓算子跑得最快的那一組配置。

傳統(tǒng)做法靠經(jīng)驗試錯費時費力且容易踩坑。KernelCAT 的思路是:引入運籌優(yōu)化,把「找最優(yōu)參數(shù)」這件事交給算法,讓算法去探索調(diào)優(yōu)空間并收斂到最佳方案。

以昇騰芯片上的 FlashAttentionScore 算子為例,KernelCAT 可以依據(jù)昇騰官方的示例代碼自動對該算子的分塊參數(shù)調(diào)優(yōu)問題進行運籌學建模,并使用數(shù)學優(yōu)化算法求解。十幾輪迭代后就能鎖定最優(yōu)配置,在多種輸入尺寸下延遲降低最高可達 22%,吞吐量提升最高近 30%,整個過程無需人工干預。

這正是 KernelCAT 的獨特之處。它不僅具備大模型的智能,能夠理解代碼、生成方案,還擁有運籌優(yōu)化算法的嚴謹,能夠系統(tǒng)搜索并收斂到最優(yōu)解。

智能與算法的結(jié)合讓算子調(diào)優(yōu)既靈活,又有交付保障。

在對 KernelCAT 的另一場測試中,該團隊選取了 7 個不同規(guī)模的向量加法任務,測試目標明確,即在華為昇騰平臺上,直接對比華為開源算子、「黑盒」封裝的商業(yè)化算子與 KernelCAT 自研算子實現(xiàn)的執(zhí)行效率。

結(jié)果同樣令人振奮。在這個案例的 7 個測試規(guī)模中,KernelCAT 給出的算子版本性能均取得領(lǐng)先優(yōu)勢,且任務完成僅用時 10 分鐘。這意味著,即便面對經(jīng)過商業(yè)級調(diào)優(yōu)的閉源實現(xiàn),KernelCAT 所采用的優(yōu)化方式仍具備一定競爭力。

這不僅是數(shù)值層面的勝利,更是國產(chǎn) AI Agent 在算子領(lǐng)域完成的一次自證。



沒有堅不可破的生態(tài),包括 CUDA

全球范圍內(nèi),目前超過 90% 的重要 AI 訓練任務運行于英偉達 GPU 之上,推理占比亦達 80% 以上;其開發(fā)者生態(tài)覆蓋超 590 萬用戶,算子庫規(guī)模逾 400 個,深度嵌入 90% 頂級 AI 學術(shù)論文的實現(xiàn)流程。

黃仁勛曾言:「我們創(chuàng)立英偉達,是為了加速軟件,芯片設(shè)計反而是次要的?!?/strong>

在現(xiàn)代計算體系中,軟件才是真正的護城河。英偉達的持續(xù)領(lǐng)先,源于其從底層算法出發(fā)、貫通架構(gòu)與編程模型的全棧掌控能力。

參考 AMD 的歷史經(jīng)驗,即使在架構(gòu)與制程上具備充足的競爭力,缺乏成熟的生態(tài)系統(tǒng)也仍然難以撼動英偉達的地位。

這類案例清晰地表明,模型性能并不簡單等價于算力規(guī)模的堆疊,而是取決于算法設(shè)計、算子實現(xiàn)與硬件特性的協(xié)同程度。當算子足夠成熟,硬件潛力才能被真正釋放。

沿著這條思路,KernelCAT 團隊圍繞模型在本土算力平臺上的高效遷移,進行了系統(tǒng)性的工程探索。以 DeepSeek-OCR-2 模型在華為昇騰 910B2 NPU 上的部署為例,KernelCAT 展示了一種全新的工作范式:

  • 對抗「版本地獄」:KernelCAT 對任務目標和限制條件有著深度理解,基于 DeepSeek-OCR-2 官方的 CUDA 實現(xiàn),通過精準的依賴識別和補丁注入,解決了 vLLM、torch 和 torch_npu 的各個依賴庫間版本互鎖的三角矛盾,硬生生從零搭建起了一套穩(wěn)定的生產(chǎn)環(huán)境,結(jié)合基礎(chǔ) Docker 鏡像即可實現(xiàn)模型的開箱即用。


  • 準確修補:它敏銳地識別出原版 vLLM 的 MOE 層依賴 CUDA 專有的操作,和 vllm-ascend 提供的 Ascend 原生 MOE 實現(xiàn),并果斷通過插件包進行調(diào)用替換,讓模型在國產(chǎn)芯片上「說上了母語」。

  • 實現(xiàn) 35 倍加速:在引入 vllm-ascend 原生 MOE 實現(xiàn)補丁后,vLLM 在高并發(fā)下的吞吐量飆升至 550.45toks/s,相比 Transformers 方案實現(xiàn)了 35 倍加速,且在繼續(xù)優(yōu)化中。

  • 無需人工大量介入:在這種復雜任務目標下,KernelCAT 可以自己規(guī)劃和完成任務,無需研發(fā)提供大量提示詞指導模型工作。


有了 KernelCAT,原本需要頂尖工程師團隊花費數(shù)周才能完成進行的適配工作,現(xiàn)在可以縮短至小時級(包含模型下載、環(huán)境構(gòu)建的時間)。

與此同時,它讓國產(chǎn)芯片實現(xiàn)了 35 倍的加速。也就是說,KernelCAT 讓國產(chǎn)芯片可以通過深度工程優(yōu)化,承載頂級多模態(tài)模型推理任務的性能引擎。

KernelCAT 所代表的不只是一個 AI Agent 新范式的出現(xiàn),更是一種底層能力建設(shè)方式的轉(zhuǎn)向:從依賴既有生態(tài),到構(gòu)建能夠自我演進的計算基礎(chǔ)。

KernelCAT 正限時免費內(nèi)測中,歡迎體驗。

點擊原文鏈接即可跳轉(zhuǎn)產(chǎn)品主頁。




特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
13日至14日為本輪雨雪最強時段!青甘寧等地留意對交通、設(shè)施農(nóng)業(yè)影響

13日至14日為本輪雨雪最強時段!青甘寧等地留意對交通、設(shè)施農(nóng)業(yè)影響

環(huán)球網(wǎng)資訊
2026-03-12 10:21:09
哈佛女博士被打假!偽造學歷到處借錢,疑有精神病,私生活太離譜

哈佛女博士被打假!偽造學歷到處借錢,疑有精神病,私生活太離譜

阿纂看事
2026-03-11 16:04:22
剛從伊朗回來,這位紹興教授觀察到了什么?

剛從伊朗回來,這位紹興教授觀察到了什么?

上觀新聞
2026-03-12 11:20:09
現(xiàn)場畫面!特朗普宣稱:我們贏了,在第一個小時一切就結(jié)束了,但需要“完成最后的工作”

現(xiàn)場畫面!特朗普宣稱:我們贏了,在第一個小時一切就結(jié)束了,但需要“完成最后的工作”

極目新聞
2026-03-12 10:33:45
伊朗新領(lǐng)袖被曝受重傷正在搶救

伊朗新領(lǐng)袖被曝受重傷正在搶救

鳳眼論
2026-03-11 09:37:56
悲催!兩位80后朋友心梗離世,一網(wǎng)友哭訴平時無煙無酒,踢球跑步

悲催!兩位80后朋友心梗離世,一網(wǎng)友哭訴平時無煙無酒,踢球跑步

火山詩話
2026-03-11 16:21:10
突發(fā)!知名地產(chǎn)董事長出境時被攔截,法院回應“案件辦理中”,知情人士稱可能涉及兩個方面原因

突發(fā)!知名地產(chǎn)董事長出境時被攔截,法院回應“案件辦理中”,知情人士稱可能涉及兩個方面原因

都市快報橙柿互動
2026-03-11 23:23:29
美媒:FBI稱伊朗或?qū)又莅l(fā)動無人機襲擊

美媒:FBI稱伊朗或?qū)又莅l(fā)動無人機襲擊

界面新聞
2026-03-12 07:11:30
家長拒交550班費續(xù):孩子被調(diào)最后一排,老師聽到自己女兒名怕了

家長拒交550班費續(xù):孩子被調(diào)最后一排,老師聽到自己女兒名怕了

奇思妙想草葉君
2026-03-11 13:29:37
魯山舅舅偽造亡母結(jié)婚證侵吞遺產(chǎn)案最新進展:五大噩耗接踵而至

魯山舅舅偽造亡母結(jié)婚證侵吞遺產(chǎn)案最新進展:五大噩耗接踵而至

老貓觀點
2026-03-12 08:11:36
西貝生死劫,一場史詩級別的公關(guān)災難

西貝生死劫,一場史詩級別的公關(guān)災難

二湘空間
2026-03-12 10:14:27
終于平賬了!一深圳業(yè)主2017年花210萬買70平米房子,如今賣210萬

終于平賬了!一深圳業(yè)主2017年花210萬買70平米房子,如今賣210萬

火山詩話
2026-03-11 13:29:00
美國將對中歐等16個貿(mào)易伙伴發(fā)起301調(diào)查

美國將對中歐等16個貿(mào)易伙伴發(fā)起301調(diào)查

界面新聞
2026-03-12 10:47:14
為什么說宇宙中最神秘的整數(shù)是137?

為什么說宇宙中最神秘的整數(shù)是137?

中科院物理所
2026-03-11 12:46:46
蹲了40年的地主出獄,給王震寫信:記得送給359旅的12萬斤糧食嗎

蹲了40年的地主出獄,給王震寫信:記得送給359旅的12萬斤糧食嗎

墨說古今
2026-01-07 23:02:58
狂攬133億!一瓶黃色液體,全是科技狠活,憑什么拿捏中國打工人

狂攬133億!一瓶黃色液體,全是科技狠活,憑什么拿捏中國打工人

八斗小先生
2026-03-11 15:09:10
被炸1401次遠超以色列!伊朗為何猛攻阿聯(lián)酋?

被炸1401次遠超以色列!伊朗為何猛攻阿聯(lián)酋?

網(wǎng)易新聞出品
2026-03-11 17:00:21
中國船員實拍伊朗導彈轟炸阿聯(lián)酋儲油設(shè)施,6枚愛國者皆攔截失敗

中國船員實拍伊朗導彈轟炸阿聯(lián)酋儲油設(shè)施,6枚愛國者皆攔截失敗

不掉線電波
2026-03-12 09:27:43
美軍內(nèi)部調(diào)查初步確認美軍誤炸伊朗小學,造成175名師生遇難

美軍內(nèi)部調(diào)查初步確認美軍誤炸伊朗小學,造成175名師生遇難

劉耘博士
2026-03-12 08:07:54
七十多個臺灣同胞從戰(zhàn)區(qū)被接回來,落地就翻臉!這操作真讓人開眼

七十多個臺灣同胞從戰(zhàn)區(qū)被接回來,落地就翻臉!這操作真讓人開眼

眼界縱橫
2026-03-12 10:11:53
2026-03-12 13:08:49
真格基金 incentive-icons
真格基金
創(chuàng)業(yè),來真格的。
1517文章數(shù) 3635關(guān)注度
往期回顧 全部

科技要聞

騰訊"養(yǎng)蝦"暴漲后,百度急得在門口"裝蝦"

頭條要聞

牛彈琴:伊朗開出停戰(zhàn)三大條件 這是讓美國"投降"啊

頭條要聞

牛彈琴:伊朗開出停戰(zhàn)三大條件 這是讓美國"投降"啊

體育要聞

要臉,還是要83分紀錄?

娛樂要聞

李湘瘦身驚艷亮相肖邦之夜 攜女兒出席

財經(jīng)要聞

盧鋒:從特朗普團隊群演看時代變局

汽車要聞

大眾2025財報:轉(zhuǎn)型雖有陣痛 "大象"已然起跑

態(tài)度原創(chuàng)

教育
家居
藝術(shù)
數(shù)碼
軍事航空

教育要聞

六年級附加題:填分數(shù),方法不好想到

家居要聞

觸感本真 家的跡象

藝術(shù)要聞

朱屺瞻『凌波仙子』

數(shù)碼要聞

七彩虹主板更新適配英特爾酷睿Ultra新U,背插3.0新品主板發(fā)布!

軍事要聞

朝鮮"崔賢"號驅(qū)逐艦進行戰(zhàn)略巡航導彈試射

無障礙瀏覽 進入關(guān)懷版