国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

GPU編程新機(jī)遇!TritonNext 2026大會(huì)來襲,首批嘉賓與議題重磅揭曉

0
分享至


過去二十年,CUDA幾乎定義了GPU編程的主流路徑,開發(fā)者可以在其框架內(nèi)充分挖掘GPU性能。隨著國(guó)產(chǎn)AI芯片進(jìn)入訓(xùn)練與推理主戰(zhàn)場(chǎng),這套長(zhǎng)期依賴CUDA的開發(fā)模式也面臨新的工程挑戰(zhàn):算子如何高效編寫、性能如何精細(xì)調(diào)優(yōu)、同一套代碼能否在不同硬件上長(zhǎng)期迭代,成為核心課題。在這種背景下,Triton作為新興高性能算子編程模型,正受到越來越多團(tuán)隊(duì)關(guān)注。它在提供底層性能調(diào)優(yōu)能力的同時(shí),通過合理抽象,也為跨硬件部署和長(zhǎng)期維護(hù)提供了可行方案。

圍繞這一正在發(fā)生的工程轉(zhuǎn)變,由眾智FlagOS社區(qū)、北京智源人工智能研究院、CSDN聯(lián)合主辦的「TritonNext 技術(shù)大會(huì)(TritonNext 2026)」,將于2026年1月9日北京海淀區(qū)中關(guān)村國(guó)家自主創(chuàng)新示范區(qū)展示中心拉開帷幕。作為國(guó)內(nèi)首個(gè)聚焦Triton的技術(shù)盛會(huì),本次大會(huì)將聚焦于國(guó)產(chǎn)芯片與算子實(shí)踐這一核心戰(zhàn)場(chǎng)。

來自智源、摩爾線程、華為、中國(guó)科學(xué)院計(jì)算技術(shù)研究所、百度、先進(jìn)編譯實(shí)驗(yàn)室、螞蟻集團(tuán)、上海苦芽科技有限公司、湖南卡姆派樂信息科技有限公司等深耕GPU編譯、算子優(yōu)化與芯片軟件棧的一線資深專家,將圍繞Triton在真實(shí)業(yè)務(wù)中的落地成效,以及在國(guó)產(chǎn)AI芯片上的適配經(jīng)驗(yàn),展開一場(chǎng)場(chǎng)緊扣工程實(shí)戰(zhàn)的深度分享。

話不多,大會(huì)報(bào)名通道現(xiàn)已開啟。掃描下方二維碼,搶先注冊(cè)參會(huì):


https://www.bagevent.com/event/9117276?bag_track=csdngzh

同時(shí),首波嘉賓已經(jīng)就位,精彩議題同步揭曉,快來看看有哪些行業(yè)大咖——


首批嘉賓陣容和議題


林詠華

北京智源人工智能研究院副院長(zhǎng)兼總工程師

簡(jiǎn)介:現(xiàn)任北京智源人工智能研究院副院長(zhǎng)兼總工程師,主管大模型研究中心、人工智能系統(tǒng)及基礎(chǔ)軟件研究、產(chǎn)業(yè)生態(tài)合作等重要方向。IEEE女工程師亞太區(qū)領(lǐng)導(dǎo)組成員,IEEE女工程師協(xié)會(huì)北京分會(huì)的創(chuàng)始人。曾任IBM中國(guó)研究院院長(zhǎng),同時(shí)也是IBM全球杰出工程師,在IBM內(nèi)部引領(lǐng)全球人工智能系統(tǒng)的創(chuàng)新。從事近20年的系統(tǒng)架構(gòu)、云計(jì)算、AI系統(tǒng), 計(jì)算機(jī)視覺等領(lǐng)域的研究。本人有超過50個(gè)全球?qū)@?,并多次獲得ACM/IEEE最佳論文獎(jiǎng)。獲評(píng)2019年福布斯中國(guó)50位科技領(lǐng)導(dǎo)女性。

演講議題:開源統(tǒng)一AI系統(tǒng)軟件棧FlagOS新技術(shù)特性


崔慧敏

中國(guó)科學(xué)院計(jì)算技術(shù)研究所研究員、博士生導(dǎo)師,中科加禾創(chuàng)始人兼CEO

簡(jiǎn)介:崔慧敏,中國(guó)科學(xué)院計(jì)算技術(shù)研究所研究員,博士生導(dǎo)師,中科加禾創(chuàng)始人,任中科院計(jì)算所編譯與編程實(shí)驗(yàn)室主任。曾主持過多項(xiàng)自然科學(xué)基金、973項(xiàng)目、科技部重點(diǎn)研發(fā)計(jì)劃等國(guó)家級(jí)科研項(xiàng)目與課題,是2030新一代人工智能某編程項(xiàng)目的首席科學(xué)家。發(fā)表包括ASLPOS、MICRO、PLDI、PPoPP、OSDI、SC、TOCS、TPDS、TACO等編譯和系統(tǒng)領(lǐng)域的頂級(jí)國(guó)際會(huì)議和期刊論文60余篇。

演講議題:AI編譯器學(xué)術(shù)報(bào)告:面向快速演進(jìn)計(jì)算架構(gòu)的自適應(yīng)編譯器構(gòu)建與優(yōu)化技術(shù)

議題介紹:隨著計(jì)算架構(gòu)向異構(gòu)化與定制化方向演進(jìn),人工智能正在驅(qū)動(dòng)編譯技術(shù)新范式的發(fā)展。本報(bào)告旨在系統(tǒng)探討大模型在編譯領(lǐng)域的潛力,重點(diǎn)研究如何基于長(zhǎng)期積累的編譯技術(shù)演進(jìn),實(shí)現(xiàn)編譯流程的自動(dòng)化與智能化,從而使編譯器能夠高效適配新興硬件平臺(tái),進(jìn)行深度資源優(yōu)化,并最終構(gòu)建面向領(lǐng)域特定計(jì)算的高效編譯與架構(gòu)協(xié)同生態(tài)體系。


門春雷

北京智源人工智能研究院AI系統(tǒng)研究團(tuán)隊(duì)負(fù)責(zé)人

簡(jiǎn)介:高級(jí)工程師,主要負(fù)責(zé)智能算力調(diào)度平臺(tái)、AI編譯器和AI芯片研究。先后在多家互聯(lián)網(wǎng)公司擔(dān)任技術(shù)主管/專家,從事人工智能研發(fā)工作,包括基礎(chǔ)技術(shù)研發(fā)和應(yīng)用落地。代表成果:京東物流無人機(jī)/無人車規(guī)模化落地,快手大模型在短視頻場(chǎng)景應(yīng)用落地。已授權(quán)發(fā)明專利13篇。

演講議題:Triton多芯片統(tǒng)一編譯器FlagTree新特性介紹


鄭思澤

字節(jié)跳動(dòng)工程師

簡(jiǎn)介:鄭思澤博士現(xiàn)任字節(jié)跳動(dòng)機(jī)器學(xué)習(xí)系統(tǒng)研究員,主要負(fù)責(zé)Triton-distributed 項(xiàng)目。他在北京大學(xué)獲得計(jì)算機(jī)博士學(xué)位;此前,他曾于華盛頓大學(xué)訪學(xué)。他的研究聚焦于編譯器設(shè)計(jì)與代碼優(yōu)化、CPU/GPU高效訓(xùn)練與推理的算法及框架設(shè)計(jì),相關(guān)成果發(fā)表于MICRO、ASPLOS、ISCA等頂級(jí)會(huì)議。同時(shí),他活躍于學(xué)術(shù)社區(qū),擔(dān)任ChinaSys PC成員及ICLR、TPDS等多個(gè)國(guó)際會(huì)議與期刊的審稿人。

演講議題基于Triton-Distributed的推理與訓(xùn)練實(shí)踐

議題介紹:在單芯片摩爾定律失效,多芯片系統(tǒng)成為主流的今天,如何在分布式系統(tǒng)中面向多芯片編程成為當(dāng)前機(jī)器學(xué)習(xí)系統(tǒng)發(fā)展的一個(gè)重要問題。為了解決這個(gè)問題,本報(bào)告介紹Triton-distributed。通過拓展Tile編程語義,Triton-distributed提供了大量分布式編程語義,支持單機(jī)、跨機(jī)多種場(chǎng)景的多種訓(xùn)練推理算子。實(shí)驗(yàn)證明,Triton-distributed可以取得和底層編程一致的性能,同時(shí)極大降低開發(fā)門檻。


甄羿

螞蟻集團(tuán)技術(shù)專家

簡(jiǎn)介:螞蟻集團(tuán)技術(shù)專家,在基礎(chǔ)技術(shù)、編譯、編程語言等方面有多年經(jīng)驗(yàn)。

演講議題:DeepSeek V3.2 DSA算子Triton開發(fā)實(shí)踐

議題介紹:概述DSA算子基于Triton適配和優(yōu)化的實(shí)踐。 同時(shí)聊一聊FlagOS、FlagGems生態(tài)軟件在螞蟻應(yīng)用的情況。


馬永強(qiáng)

百度資深工程師

簡(jiǎn)介:負(fù)責(zé)飛槳框架多硬件適配技術(shù)體系構(gòu)建,研發(fā)面向大模型的高性能計(jì)算和融合優(yōu)化技術(shù),強(qiáng)化大模型在多硬件下的訓(xùn)練效率與推理性能。

演講議題:飛槳原生Triton支持方案詳解——大模型軟硬件適配技術(shù)分享

議題介紹:本次分享將圍繞以下三部分展開:

1、triton/flagtree的支持方案

2、triton算子在訓(xùn)推中的使用

3、paddle適配方案相關(guān)內(nèi)容


海納

摩爾線程編譯器負(fù)責(zé)人

簡(jiǎn)介:摩爾線程編譯器負(fù)責(zé)人,編譯器資深專家,長(zhǎng)期從事系統(tǒng)性能優(yōu)化等工作。著有圖書《從零開始寫Linux內(nèi)核》,《自己動(dòng)手寫Python虛擬機(jī)》,以及極客專欄《高手必學(xué)的內(nèi)存知識(shí)》等。

演講議題:摩爾線程在FlagTree中的優(yōu)化實(shí)踐

議題介紹:摩爾線程編譯團(tuán)隊(duì)在Triton中適配Tensor Core,同時(shí)開啟了pipeline、warp specialize、split k等優(yōu)化方案。本次演講會(huì)重點(diǎn)介紹這些優(yōu)化工作。


劉廣

北京智源人工智能研究院系統(tǒng)智能研究組負(fù)責(zé)人

簡(jiǎn)介:劉廣,智源人工智能研究院系統(tǒng)智能研究組的負(fù)責(zé)人,領(lǐng)導(dǎo)OpenSeek等開源項(xiàng)目,主導(dǎo)開發(fā)了悟道天鷹(Aquila)系列語言大模型,構(gòu)建并開源Infinity-Instruct/-MM 以及CCI4.0等系列等數(shù)據(jù)集,目前正專注于KernelGen項(xiàng)目來提升算子開發(fā)的效率,致力于推動(dòng)系統(tǒng)領(lǐng)域的的AI技術(shù)應(yīng)用和創(chuàng)新。

演講議題:Triton算子自動(dòng)生成探索和實(shí)踐

議題介紹:圍繞大模型訓(xùn)練與推理的高性能需求,我們基于KernelGen開展了Triton算子自動(dòng)生成的探索與實(shí)踐。通過構(gòu)建覆蓋算子描述、自動(dòng)代碼生成、性能搜索與驗(yàn)證的一體化流程,KernelGen顯著降低了算子開發(fā)門檻與工程成本,并在多種核心算子上實(shí)現(xiàn)接近甚至優(yōu)于手寫Triton/CUDA的性能表現(xiàn),同時(shí)具備良好的跨芯片適配能力,為算子自動(dòng)化生成與AI for System的工程化落地提供了可行路徑。


邵恩

中國(guó)科學(xué)院計(jì)算技術(shù)研究所高級(jí)工程師

簡(jiǎn)介:邵恩,中國(guó)科學(xué)院計(jì)算技術(shù)研究所,高級(jí)工程師,主要研究方向?yàn)楦咝阅苡?jì)算與系統(tǒng)軟件。入選北京市科技新星計(jì)劃和中國(guó)科學(xué)院青年創(chuàng)新促進(jìn)會(huì),主持國(guó)家重點(diǎn)研發(fā)計(jì)劃(青年科學(xué)家項(xiàng)目)、國(guó)家自然科學(xué)基金(青年基金)、CCF-百度松果基金、CCF-螞蟻軟硬件協(xié)同專項(xiàng)基金等。帶領(lǐng)科研團(tuán)隊(duì)完成百度飛槳、Apache TVM、oneAPI、光合開發(fā)者在內(nèi)多個(gè)開源社區(qū)對(duì)SYCL的編譯支持。

演講議題:面向異構(gòu)硬件的系統(tǒng)軟件共性優(yōu)化

議題介紹:伴隨著計(jì)算機(jī)產(chǎn)業(yè)的不斷發(fā)展,種類多樣化的處理器和加速器芯片的微體系結(jié)構(gòu),正朝著異構(gòu)、領(lǐng)域?qū)S谢姆较虬l(fā)展。與此同時(shí),面向跨異構(gòu)硬件的并行編程模型(SYCL),也逐漸在高性能計(jì)算的系統(tǒng)軟件中發(fā)揮重要作用。系統(tǒng)軟件是否能夠同時(shí)適用于來自不同芯片廠商的處理器和加速器,將直接限制集成異構(gòu)處理器的高性能計(jì)算機(jī)的應(yīng)用研制與生態(tài)發(fā)展。本次報(bào)告將結(jié)合面向跨異構(gòu)硬件的現(xiàn)狀展開,結(jié)合對(duì)國(guó)產(chǎn)高性能計(jì)算機(jī)的適配現(xiàn)狀,討論系統(tǒng)軟件的共性優(yōu)化問題與機(jī)遇。


朱天陽(yáng)

北京中科加禾智能科技有限公司研發(fā)總監(jiān)

簡(jiǎn)介:中科加禾研發(fā)總監(jiān),主要負(fù)責(zé)Triton編譯器和大模型端側(cè)推理引擎的研發(fā)工作,曾先后就職于Intel、華為和阿里的編譯器和模型部署團(tuán)隊(duì),負(fù)責(zé)相關(guān)研發(fā)和管理工作。

演講議題:Triton語言擴(kuò)展TLE的架構(gòu)感知層的設(shè)計(jì)和實(shí)現(xiàn)

議題介紹:TLE是針對(duì)Triton的語言的擴(kuò)展,它需要充分暴露硬件特性供算子開發(fā)者編寫針對(duì)某種硬件架構(gòu)的高性能算子,本議題針對(duì)DSA和GPU硬件架構(gòu)特性進(jìn)行語言層面的抽象和實(shí)現(xiàn)。


郭依蓬

華為昇騰CANN生態(tài)技術(shù)專家

簡(jiǎn)介:昇騰CANN生態(tài)技術(shù)專家,對(duì)昇騰開發(fā)工具鏈有較為深刻的理解。深耕編譯器與編程語言領(lǐng)域,積累了豐富的MLIR/LLVM編譯優(yōu)化相關(guān)經(jīng)驗(yàn),深度參與畢昇編譯器開發(fā)。

演講議題AscendNPU IR完備表達(dá)昇騰,開源開放支持多語言接入

議題介紹:昇騰CANN畢昇編譯器組件AscendNPU IR已達(dá)成全面開源。AscendNPU IR作為面向三方框架的MLIR接入層,提供靈活對(duì)接、完備表達(dá)與昇騰親和編譯優(yōu)化能力,可支撐多前端DSL實(shí)現(xiàn)算子性能提升。


柴赟達(dá)

先進(jìn)編譯實(shí)驗(yàn)室基礎(chǔ)編譯部部長(zhǎng)

簡(jiǎn)介:柴赟達(dá),主研方向?yàn)?AI 編譯器、基礎(chǔ)編譯器以及編譯優(yōu)化技術(shù)。精通LLVM編譯器前端設(shè)計(jì)、中間代碼級(jí)編譯優(yōu)化及后端代碼生成等,精通MLIR 語法, triton - shared 編譯器、以及 Linalg IR 中間表示設(shè)計(jì)等編譯系統(tǒng)的研發(fā)工作。

演講議題:面向 Triton 編譯器的編譯優(yōu)化實(shí)踐

議題介紹:本次分享將剖析 Triton 的生態(tài)與發(fā)展,分析 triton - shared 編譯器, linalg IR 中間表示設(shè)計(jì)。結(jié)合 FlagTree 編譯器生態(tài),講解Triton算子生成,以及面向不同架構(gòu)的triton編譯器優(yōu)化實(shí)踐。


郭暉

北京智源人工智能研究院AI編譯器研究員

簡(jiǎn)介:郭暉,7 年端/云 AI 推理芯片軟硬件協(xié)同設(shè)計(jì)經(jīng)驗(yàn),曾于嘉楠科技擔(dān)任 AI 編譯部經(jīng)理,負(fù)責(zé)全自研開源 AI 編譯器 nncase 的研發(fā)。目前于智源人工智能研究院擔(dān)任 AI 編譯器研究員,主要研究方向?yàn)?AI 編程語言和編譯器。

演講議題:TLE: 一種為各層次用戶設(shè)計(jì)的Triton語言擴(kuò)展

議題介紹:Triton是一種Python DSL形式的算子編程語言,它基于Block的編程理念屏蔽了存儲(chǔ)層級(jí)、Layout、流水線、同步等硬件細(xì)節(jié),通過編譯器優(yōu)化實(shí)現(xiàn)較高性能的算子。Triton的這些優(yōu)點(diǎn)吸引了大量的開發(fā)者,形成了龐大的社區(qū)和生態(tài)。

但近年來Triton的進(jìn)一步發(fā)展遇到一些困難,一方面在DSA和新GPU架構(gòu)上的適配進(jìn)展比較緩慢,另一方面相比一些新興語言如TileLang因?yàn)樵诩?xì)粒度控制存儲(chǔ)層級(jí)和并行粒度上缺少抽象,在性能上表現(xiàn)出一些劣勢(shì)。

針對(duì)Triton發(fā)展的困境,我們提出了TLE(Triton Language Extentions),它從三個(gè)層級(jí)擴(kuò)展了Triton,從而滿足不同層次用戶對(duì)算子編程語言的迫切需求。


張先軼

澎峰科技創(chuàng)始人&CEO

簡(jiǎn)介:北理工本碩,中科院博士, UT Austin和MIT博后,CCF高性能計(jì)算專委常委,OpenBLAS開源項(xiàng)目發(fā)起人,曾榮獲中國(guó)計(jì)算機(jī)學(xué)會(huì)科技進(jìn)步二等獎(jiǎng)、中國(guó)科學(xué)院杰出科技成就獎(jiǎng)、北京市自然科學(xué)二等獎(jiǎng)。

演講議題:基于FlagGems Triton的運(yùn)行時(shí)調(diào)優(yōu)與算子優(yōu)化

議題介紹:本報(bào)告將介紹針對(duì)FlagGems算子庫(kù)的性能優(yōu)化工作,包括Triton運(yùn)行時(shí)多后端對(duì)接和調(diào)優(yōu),以及Triton算子優(yōu)化等。


吳偉

上??嘌靠萍加邢薰韭?lián)合創(chuàng)始人

簡(jiǎn)介:吳偉是苦芽科技聯(lián)合創(chuàng)始人,在開源編譯器和RISC-V社區(qū)有著多年的經(jīng)驗(yàn)。目前擔(dān)任LLVM基金會(huì)理事、RISC-V國(guó)際基金會(huì)技術(shù)委員會(huì)委員、CCF系統(tǒng)軟件專委RISC-V基礎(chǔ)軟件工作組組長(zhǎng)等職務(wù)。在加入苦芽科技之前,吳偉于2019年創(chuàng)建并領(lǐng)導(dǎo)著PLCT實(shí)驗(yàn)室,推動(dòng)了全球RISC-V的軟件生態(tài)的發(fā)展。2024年出席,吳偉聯(lián)合多家機(jī)構(gòu)聯(lián)合發(fā)起“甲辰計(jì)劃”,致力于在2036年之前,實(shí)現(xiàn)RISC-V軟件生態(tài)的全面繁榮。

演講議題:FlagOS on RISC-V:現(xiàn)狀及規(guī)劃

議題介紹:RISC-V已經(jīng)成為世界三大主流ISA架構(gòu)之一,并且有希望在十年內(nèi)成為國(guó)際ISA開放標(biāo)準(zhǔn)。RISC-V在中國(guó)受到了廣泛的重視,在多個(gè)領(lǐng)域落地應(yīng)用;同時(shí)中國(guó)也已經(jīng)成為RISC-V開源軟硬件生態(tài)的重要推動(dòng)力量,取得了一系列重要的成果。智算場(chǎng)景RISC-V生態(tài)蓬勃發(fā)展的領(lǐng)域,而FlagOS致力于為國(guó)產(chǎn)智算芯片提供統(tǒng)一、全面的AI軟件棧。

在本次演講中,吳偉將會(huì)介紹FlagOS在RISC-V架構(gòu)的最新適配進(jìn)展,并展示2026年的工作規(guī)劃。歡迎廣大開發(fā)者參與進(jìn)來,共同為FlagOS社區(qū)添磚加瓦。


王鋒

湖南卡姆派樂信息科技有限公司總經(jīng)理

簡(jiǎn)介:湖南卡姆派樂信息科技有限公司總經(jīng)理,湖南大學(xué)特聘研究員,博士生導(dǎo)師,湖南大學(xué)編譯技術(shù)研究中心主任。長(zhǎng)期從事高性能計(jì)算、編程語言與編譯優(yōu)化、并行編程模型及AI編譯框架研究,面向多種體系結(jié)構(gòu)開展數(shù)據(jù)預(yù)取、Cache優(yōu)化、自動(dòng)向量化等關(guān)鍵技術(shù)研究,熟悉PGAS等并行模型以及TVM等機(jī)器學(xué)習(xí)編譯器。率先在千萬億次異構(gòu)超算系統(tǒng)中引入MPI/OpenMP/Streaming混合編程模型并實(shí)現(xiàn)全系統(tǒng)擴(kuò)展,成果應(yīng)用于天河系列超級(jí)計(jì)算機(jī),為其取得世界領(lǐng)先性能做出重要貢獻(xiàn)。

演講議題:基于Triton的高性能分布式算子實(shí)現(xiàn)及編譯優(yōu)化

議題介紹:Transformer Engine、Triton Distributed等高性能分布式算子實(shí)現(xiàn)及性能對(duì)比;基于Triton編譯器,對(duì)矩陣乘(MM)算子進(jìn)行系統(tǒng)性優(yōu)化,通過引入shared memory hint機(jī)制,顯式控制張量在寄存器、共享內(nèi)存與全局內(nèi)存之間的分配策略;采用TMA(Tensor Memory Accelerator)異步拷貝優(yōu)化重寫矩陣乘算子;擴(kuò)展Autotune配置空間,優(yōu)化矩陣乘算子的block形狀與執(zhí)行參數(shù)選擇;支持在K維度上進(jìn)行更細(xì)粒度的切分(split-K),實(shí)現(xiàn)粗粒度數(shù)據(jù)搬移,細(xì)粒度矩陣計(jì)算等優(yōu)化手段減少內(nèi)存訪問次數(shù)、隱藏訪問延遲、提升計(jì)算密度與整體性能。


李先鐸

北京智源人工智能研究院AI框架研發(fā)工程師

簡(jiǎn)介:李先鐸,北京智源人工智能研究院研發(fā)工程師,曾就職于百度PaddlePaddle,南開大學(xué)碩士。目前負(fù)責(zé)大模型分布式訓(xùn)練、性能優(yōu)化等方向。

演講議題:基于FlagOS軟件棧的多芯片統(tǒng)一后端插件設(shè)計(jì)與實(shí)踐

議題介紹:隨著AI芯片架構(gòu)日益多樣化,如何在異構(gòu)硬件上實(shí)現(xiàn)高效、統(tǒng)一的模型訓(xùn)練與推理,已成為大模型落地的關(guān)鍵挑戰(zhàn)。FlagOS是由北京智源人工智能研究院牽頭推出的開源智算系統(tǒng)軟件棧,致力于通過統(tǒng)一軟件層解耦A(yù)I模型與異構(gòu)硬件,打破不同架構(gòu)芯片之間的軟件生態(tài)壁壘,實(shí)現(xiàn)“一次開發(fā),處處運(yùn)行”。

本議題將圍繞FlagOS軟件棧下的多芯片統(tǒng)一后端插件設(shè)計(jì)與實(shí)踐展開,重點(diǎn)介紹如何通過插件化架構(gòu),實(shí)現(xiàn)對(duì)多種AI芯片的統(tǒng)一支持。議題內(nèi)容涵蓋:

1)統(tǒng)一后端插件架構(gòu)設(shè)計(jì):基于FlagTree編譯器與FlagGems算子庫(kù),構(gòu)建可擴(kuò)展的插件機(jī)制,實(shí)現(xiàn)多芯片后端的快速接入與適配;

2)插件生命周期管理:從插件注冊(cè)、加載、調(diào)度到卸載,構(gòu)建完整的插件管理機(jī)制,保障系統(tǒng)的穩(wěn)定性與可維護(hù)性;

3)典型芯片適配案例:分享國(guó)產(chǎn)芯片在FlagOS中的適配經(jīng)驗(yàn),展示插件化設(shè)計(jì)在實(shí)際工程中的落地效果;

4)未來演進(jìn)方向:探討統(tǒng)一后端插件在支持新芯片架構(gòu)、自動(dòng)化適配工具鏈等方面的拓展?jié)摿Α?/p>

更多重磅嘉賓以及熱門議題正在陸續(xù)確認(rèn)中!敬請(qǐng)期待。


不止于「聽」,三大工作坊同步開啟!

除了精彩紛呈的主題演講,本次大會(huì)還精心安排了三場(chǎng)深度技術(shù)工作坊,讓參會(huì)開發(fā)者可以近距離接觸最前沿的工具與技術(shù)實(shí)踐:

  • “人機(jī)協(xié)作”的Triton算子開發(fā)培訓(xùn)班

本工作坊將圍繞KernelGen v1.0展開,聚焦真實(shí)算子開發(fā)流程與工程實(shí)踐。

值得注意的是,KernelGen v1.0這款工具面向多元芯片場(chǎng)景,通過“自然語言提示+AI 生成+驗(yàn)證+循環(huán)修正”的人機(jī)協(xié)同工作流,降低算子開發(fā)中大量低層細(xì)節(jié)的編寫成本,并在過程中持續(xù)對(duì)比與優(yōu)化性能。

屆時(shí),智源研究團(tuán)隊(duì)將于大會(huì)現(xiàn)場(chǎng)結(jié)合不同類型算子進(jìn)行示例講解,從需求分析到高性能實(shí)現(xiàn),全流程演示算子開發(fā)過程,帶領(lǐng)開發(fā)者完整走一遍算子從設(shè)計(jì)到落地的實(shí)踐路徑,幫助參會(huì)者掌握KernelGen v1.0在實(shí)際項(xiàng)目中的應(yīng)用方法。

當(dāng)然,為確?,F(xiàn)場(chǎng)實(shí)操效果,大會(huì)組委會(huì)也特別建議參會(huì)者提前準(zhǔn)備一臺(tái)性能充足的筆記本電腦(推薦不少于 16GB 內(nèi)存,具備 GPU 的設(shè)備可用于實(shí)際調(diào)試),并預(yù)先配置好開發(fā)環(huán)境,包括 Python、Triton 相關(guān)依賴以及 PyTorch、FlagGems 等常用庫(kù),同時(shí)安裝好常用代碼編輯器(如 VS Code 或 PyCharm)以及正常的網(wǎng)絡(luò)訪問權(quán)限,以便獲取教程資源和示例代碼。

  • FlagOS-AI編譯器培訓(xùn)班

針對(duì)AI模型編譯與優(yōu)化,F(xiàn)lagOS-AI編譯器培訓(xùn)班將帶領(lǐng)參會(huì)者深入理解AI編譯器在實(shí)際算子和系統(tǒng)開發(fā)中的應(yīng)用與潛力。

這一工作坊內(nèi)容覆蓋FlagOS/Triton基本原理、從前端到硬件的完整技術(shù)棧、個(gè)性化手寫算子,以及傳統(tǒng)編譯技術(shù)與AI編譯技術(shù)的對(duì)比和典型優(yōu)化方法。通過實(shí)際動(dòng)手示例,開發(fā)者將從“會(huì)用框架”逐步進(jìn)階到“能造引擎”,掌握從算子設(shè)計(jì)到硬件執(zhí)行的全鏈路編譯流程,打通框架與底層硬件的認(rèn)知斷層。

如果你也想在現(xiàn)場(chǎng)直接動(dòng)手操作?同樣建議提前準(zhǔn)備好性能充足的筆記本電腦(x86_64架構(gòu),16GB內(nèi)存起,32GB更佳)。操作系統(tǒng)則推薦Ubuntu 20.04/22.04或Windows WSL,并預(yù)裝PyTorch、Triton、FlagTree,以及 CUDA(如有NVIDIA GPU更佳)。

  • 基于FlagOS的具身一站式平臺(tái)/FlagOS-Robot培訓(xùn)班

面向具身智能研發(fā)與工程落地場(chǎng)景,本工作坊系統(tǒng)講解了從多本體真機(jī)任務(wù)設(shè)計(jì)、真實(shí)機(jī)器人數(shù)據(jù)采集與標(biāo)注,到基于FlagOS-Robo與RoboBrainX0的具身模型訓(xùn)練全流程。

大會(huì)現(xiàn)場(chǎng),將會(huì)有資深技術(shù)專家精彩演示如何在國(guó)產(chǎn)算力環(huán)境下,利用智源具身一站式平臺(tái)和FlagOS-Robo完成具身模型訓(xùn)練,讓與會(huì)者掌握“真機(jī)數(shù)據(jù) → 國(guó)產(chǎn)算力→具身模型”的完整工程閉環(huán),緊貼科研、產(chǎn)業(yè)與工程團(tuán)隊(duì)的實(shí)際需求,幫助開發(fā)者快速落地具身智能系統(tǒng)。


報(bào)名參會(huì)

如果說主題演講和技術(shù)工作坊解決的是“怎么看、怎么學(xué)”,那么這次TritonNext 2026更希望開發(fā)者真正“動(dòng)手參與”。圍繞大型算子庫(kù)、統(tǒng)一AI編譯器、并行訓(xùn)推框架、統(tǒng)一通信庫(kù)等核心開源項(xiàng)目,大會(huì)現(xiàn)場(chǎng)還將正式啟動(dòng)FlagOS全球大賽。

無論你是想了解Triton的最新實(shí)踐,還是希望在國(guó)產(chǎn)芯片、AI生態(tài)中找到展示和落地的機(jī)會(huì),這里都是一個(gè)不可多得的起點(diǎn)。

  • 大會(huì)時(shí)間:2026年1月9日

  • 大會(huì)地點(diǎn):北京海淀區(qū)中關(guān)村國(guó)家自主創(chuàng)新示范區(qū)展示中心

「TritonNext 技術(shù)大會(huì)(TritonNext 2026)」現(xiàn)已經(jīng)開放報(bào)名!

與一線工程師面對(duì)面,聽真實(shí)案例、看真實(shí)代碼、聊真實(shí)問題

立即加入這場(chǎng)面向未來 GPU 編程的技術(shù)現(xiàn)場(chǎng)


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
韓國(guó)國(guó)民演員安圣基去世,曾出演《實(shí)尾島》《華麗的休假》,是韓國(guó)獲獎(jiǎng)最多的演員之一

韓國(guó)國(guó)民演員安圣基去世,曾出演《實(shí)尾島》《華麗的休假》,是韓國(guó)獲獎(jiǎng)最多的演員之一

極目新聞
2026-01-05 09:34:31
醫(yī)生調(diào)查發(fā)現(xiàn):老人過了71歲后,基本都有這6個(gè)現(xiàn)狀,要坦然接受

醫(yī)生調(diào)查發(fā)現(xiàn):老人過了71歲后,基本都有這6個(gè)現(xiàn)狀,要坦然接受

荷蘭豆愛健康
2026-01-05 04:50:04
入粵始祖,后裔2700萬,客家八大姓氏之一,認(rèn)祖歸宗憑一首詩(shī)

入粵始祖,后裔2700萬,客家八大姓氏之一,認(rèn)祖歸宗憑一首詩(shī)

銘記歷史呀
2026-01-05 03:24:58
陪玩陪睡不夠!集體開嫖、舔手指、目無王法,陰暗面徹底藏不住了

陪玩陪睡不夠!集體開嫖、舔手指、目無王法,陰暗面徹底藏不住了

好賢觀史記
2025-11-09 21:58:39
日本簽字了,高市選定中日主戰(zhàn)場(chǎng),對(duì)華開第二槍,解放軍開始巡海

日本簽字了,高市選定中日主戰(zhàn)場(chǎng),對(duì)華開第二槍,解放軍開始巡海

李橑在北漂
2026-01-05 13:13:56
馮鞏被問:一年在北京生活,到底要花多少錢?

馮鞏被問:一年在北京生活,到底要花多少錢?

民間平哥
2026-01-05 13:20:39
曝阿莫林最早本周下課,重演馬雷斯卡劇情!曼聯(lián)難覓新帥恐成阻礙

曝阿莫林最早本周下課,重演馬雷斯卡劇情!曼聯(lián)難覓新帥恐成阻礙

羅米的曼聯(lián)博客
2026-01-05 11:33:17
或?qū)⒋钶dV8引擎 奧迪Q9將于2026年發(fā)布

或?qū)⒋钶dV8引擎 奧迪Q9將于2026年發(fā)布

車質(zhì)網(wǎng)
2026-01-05 09:27:15
2026年首位落馬銀行董事長(zhǎng)出現(xiàn)了

2026年首位落馬銀行董事長(zhǎng)出現(xiàn)了

科技金融在線
2026-01-05 12:16:25
6國(guó)宣布出兵!中方不低頭也得低?揚(yáng)言和中方斗到底!咱媽動(dòng)真格

6國(guó)宣布出兵!中方不低頭也得低?揚(yáng)言和中方斗到底!咱媽動(dòng)真格

瞳哥視界
2025-12-31 21:05:39
東風(fēng)導(dǎo)彈泄密案:間諜郭萬鈞一家三口,全部被處以死刑

東風(fēng)導(dǎo)彈泄密案:間諜郭萬鈞一家三口,全部被處以死刑

冰點(diǎn)歷史
2025-07-15 09:33:13
鋼鐵賤賣屢遭反傾銷,如今限供全球慌了!中國(guó)這次不再妥協(xié)

鋼鐵賤賣屢遭反傾銷,如今限供全球慌了!中國(guó)這次不再妥協(xié)

百科密碼
2026-01-04 15:14:37
1955年賀晉年授銜,賀龍與彭德懷皆有不滿,毛主席驚問:怎么會(huì)是這般結(jié)果?

1955年賀晉年授銜,賀龍與彭德懷皆有不滿,毛主席驚問:怎么會(huì)是這般結(jié)果?

源溯歷史
2026-01-03 14:34:14
詹姆斯26+7+10超保羅只仰望一大神!東契奇準(zhǔn)三雙,湖人逆轉(zhuǎn)灰熊

詹姆斯26+7+10超保羅只仰望一大神!東契奇準(zhǔn)三雙,湖人逆轉(zhuǎn)灰熊

釘釘陌上花開
2026-01-05 13:11:20
張靈甫身亡,蔣介石當(dāng)眾將湯恩伯打得滿頭血,死后蔣仍冷言相待

張靈甫身亡,蔣介石當(dāng)眾將湯恩伯打得滿頭血,死后蔣仍冷言相待

浩渺青史
2026-01-04 00:58:05
恩里克:這是登貝萊本賽季踢得最好的比賽;要管理其出場(chǎng)時(shí)間

恩里克:這是登貝萊本賽季踢得最好的比賽;要管理其出場(chǎng)時(shí)間

懂球帝
2026-01-05 09:20:18
中國(guó)花3億打撈800年的南海沉船,18萬件文物重現(xiàn),海盜都傻眼了

中國(guó)花3億打撈800年的南海沉船,18萬件文物重現(xiàn),海盜都傻眼了

歷史回憶室
2026-01-05 11:26:10
皇馬5-1,缺誰誰尷尬!姆巴佩看臺(tái)鼓掌,球迷:沒他進(jìn)攻更流暢

皇馬5-1,缺誰誰尷尬!姆巴佩看臺(tái)鼓掌,球迷:沒他進(jìn)攻更流暢

阿泰希特
2026-01-05 12:11:40
美國(guó)73年來第一次這么做!李在明還沒到中國(guó),特朗普先對(duì)韓國(guó)下手

美國(guó)73年來第一次這么做!李在明還沒到中國(guó),特朗普先對(duì)韓國(guó)下手

霽寒飄雪
2026-01-05 11:50:17
離譜?英超5豪門又集體翻車+2連平!阿森納狂喜:5連勝后6分領(lǐng)跑

離譜?英超5豪門又集體翻車+2連平!阿森納狂喜:5連勝后6分領(lǐng)跑

我愛英超
2026-01-05 06:51:42
2026-01-05 14:48:49
CSDN incentive-icons
CSDN
成就一億技術(shù)人
26230文章數(shù) 242208關(guān)注度
往期回顧 全部

科技要聞

雷軍新年首播:確認(rèn)汽車業(yè)務(wù)降速

頭條要聞

媒體:美國(guó)捉拿馬杜羅后 多位專家示警賴清德

頭條要聞

媒體:美國(guó)捉拿馬杜羅后 多位專家示警賴清德

體育要聞

女子世界第一,9年前在咖啡店洗碗

娛樂要聞

黃宗澤奪雙料視帝,淚灑頒獎(jiǎng)臺(tái)憶往昔

財(cái)經(jīng)要聞

李迅雷:擴(kuò)內(nèi)需要把重心從"投"轉(zhuǎn)向"消"

汽車要聞

不是9S是8X!極氪全新高性能旗艦SUV命名官宣

態(tài)度原創(chuàng)

游戲
家居
親子
教育
公開課

《碧藍(lán)航線》2025冬日快閃點(diǎn)燃玩家熱情 三城線下嘉年華圓滿落幕

家居要聞

白色大理石 奢華現(xiàn)代

親子要聞

2026年度育兒補(bǔ)貼今起開放申領(lǐng),流程新增一鍵續(xù)領(lǐng)功能

教育要聞

收藏:山東2026高中綜評(píng)操作教程(教師端)

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版