国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

混合專家模型驅(qū)動前沿 AI 模型在 NVIDIA Blackwell 系統(tǒng)上提速 10 倍

0
分享至



  • Top 10 智能開源模型均使用混合專家模型架構(gòu)。
  • Kimi K2 Thinking、DeepSeek-R1、Mistral Large 3 等模型在 NVIDIA Grace Blackwell 機(jī)架級擴(kuò)展系統(tǒng)上運(yùn)行速度提升 10 倍。

如今,幾乎任一前沿模型的內(nèi)部結(jié)構(gòu)都采用混合專家(MoE)模型架構(gòu),這種架構(gòu)旨在模擬人腦的高效運(yùn)作機(jī)制。

正如大腦會根據(jù)任務(wù)激活特定區(qū)域,MoE 模型將工作分配給各個專門的專家,并在每個 AI token 的生成過程中只激活與之相關(guān)的專家。這樣一來,無需成比例增加計(jì)算量,就能夠?qū)崿F(xiàn)更快速、更高效的 token 生成。

業(yè)界已認(rèn)識到這一優(yōu)勢。在獨(dú)立 AI 基準(zhǔn)測試機(jī)構(gòu) Artificial Analysis(AA)的榜單上,Top 10 智能開源模型均采用 MoE 架構(gòu),包括深度求索的 DeepSeek-R1、月之暗面的 Kimi K2 Thinking、OpenAI 的 gpt-oss-120B 以及 Mistral AI 的 Mistral Large 3。

然而,大規(guī)模部署 MoE 模型并同時(shí)保持高性能向來極具挑戰(zhàn)。NVIDIA Grace Blackwell 機(jī)架級擴(kuò)展系統(tǒng)通過軟硬件的極致協(xié)同設(shè)計(jì),將硬件與軟件優(yōu)化相結(jié)合,以實(shí)現(xiàn)性能和效率最大化,從而使規(guī)?;渴?MoE 模型變得切實(shí)可行且簡便直接。

Kimi K2 Thinking MoE 模型在 AA 榜單被評為當(dāng)前最智能的開源模型。它在 NVIDIA Grace Blackwell 機(jī)架級擴(kuò)展系統(tǒng)上的性能較在 NVIDIA HGX Hopper 上實(shí)現(xiàn)了 10 倍的飛躍?;?DeepSeek-R1 和 Mistral Large 3 MoE 模型展現(xiàn)的卓越性能,這一突破性進(jìn)展表明 MoE 架構(gòu)正在成為前沿模型的首選架構(gòu),同時(shí)也印證了 NVIDIA 全棧推理平臺是釋放其全部潛力的關(guān)鍵所在。

什么是 MoE,為何它已成為前沿模型的標(biāo)準(zhǔn):通過有選擇性地僅調(diào)用最重要的專家模型,MoE 模型在不增加計(jì)算成本的前提下實(shí)現(xiàn)了更高的智能水平和適應(yīng)性。這使其成為高效 AI 系統(tǒng)的基石,這類系統(tǒng)專為“每美元性能”與“每瓦特性能”而優(yōu)化,能夠在單位資金和單位能耗下產(chǎn)出顯著更高的智能價(jià)值。鑒于這些優(yōu)勢,MoE 迅速成為前沿模型的首選架構(gòu)也就不足為奇。今年以來,已有超過 60% 的開源 AI 模型采用這一架構(gòu)。自 2023 年初至今,該架構(gòu)更推動模型智能水平實(shí)現(xiàn)近 70 倍的飛躍式增長,不斷推動 AI 突破能力疆界。

通過極致協(xié)同設(shè)計(jì)突破 MoE 擴(kuò)展瓶頸:前沿的 MoE 模型體量龐大且結(jié)構(gòu)復(fù)雜,無法部署在單塊 GPU 上。要運(yùn)行這些模型,必須將專家分布在多塊 GPU 上,這種技術(shù)稱為“專家并行”。即使在 NVIDIA Hopper 這樣的高性能平臺上,部署 MoE 模型仍會遇到一些挑戰(zhàn)。NVIDIA Grace Blackwell 是一款機(jī)架級擴(kuò)展系統(tǒng),搭載的 72 塊 NVIDIA Blackwell GPU 協(xié)同工作,可以如同單一系統(tǒng)般運(yùn)行。MoE 模型能夠利用這種設(shè)計(jì)將專家并行擴(kuò)展到遠(yuǎn)超以往的極限——將專家分布在多達(dá) 72 塊 GPU 的更大規(guī)模集群中,這種架構(gòu)方法直接解決了 MoE 的擴(kuò)展瓶頸。

性能體現(xiàn)在每瓦特性能上:NVIDIA Grace Blackwell 機(jī)架級擴(kuò)展系統(tǒng)能夠高效擴(kuò)展復(fù)雜的元學(xué)習(xí)模型,實(shí)現(xiàn)每瓦性能 10 倍的提升。這一性能飛躍不僅是標(biāo)準(zhǔn)上的突破,它使 token 收入可以實(shí)現(xiàn) 10 倍增長,徹底改變了 AI 在能效受限、成本敏感型數(shù)據(jù)中心中的規(guī)模化經(jīng)濟(jì)模型。

大規(guī)模驅(qū)動智能:NVIDIA Grace Blackwell 機(jī)架級擴(kuò)展系統(tǒng)意在為除 MoE 模型之外的工作負(fù)載也提供強(qiáng)大的性能。將這一原理擴(kuò)展至大規(guī)模部署——即多個應(yīng)用程序和智能體為眾多用戶提供服務(wù)的情境——將釋放出全新的效率水平。這種方法無需為每個智能體或應(yīng)用程序重復(fù)構(gòu)建龐大的 AI 模型,而是建立一個共享的專家池供所有系統(tǒng)調(diào)用,確保每個請求都能精準(zhǔn)路由至對應(yīng)的專家。

以上為摘要內(nèi)容,點(diǎn)擊鏈接閱讀完整內(nèi)容:

混合專家模型驅(qū)動最智能的前沿 AI 模型,在 NVIDIA Blackwell 系統(tǒng)上運(yùn)行速度提升 10 倍 | NVIDIA 英偉達(dá)博客

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
中方是否計(jì)劃采取行動幫助馬杜羅夫婦獲釋?外交部回應(yīng)

中方是否計(jì)劃采取行動幫助馬杜羅夫婦獲釋?外交部回應(yīng)

新京報(bào)政事兒
2026-01-07 15:41:25
黃金、白銀直線拉升!發(fā)生了什么?

黃金、白銀直線拉升!發(fā)生了什么?

證券時(shí)報(bào)e公司
2026-01-12 08:00:13
二戰(zhàn)日本最離譜的計(jì)劃:海軍把船開過去溜了一圈就跑,50萬陸軍被扔在島上活活餓死,這就是所謂的必勝?

二戰(zhàn)日本最離譜的計(jì)劃:海軍把船開過去溜了一圈就跑,50萬陸軍被扔在島上活活餓死,這就是所謂的必勝?

老杉說歷史
2026-01-11 22:22:11
被內(nèi)蒙古某些部門的官僚習(xí)氣驚到了

被內(nèi)蒙古某些部門的官僚習(xí)氣驚到了

魚眼觀察
2026-01-12 10:51:38
一群外國人曾到中國避難,于2003年正式加入中國國籍,他們直言:我是中國人,我為此感到自豪

一群外國人曾到中國避難,于2003年正式加入中國國籍,他們直言:我是中國人,我為此感到自豪

寄史言志
2026-01-09 17:55:10
輕斷食再次封神!研究證實(shí):能讓肝臟脂肪在3個月內(nèi)少25.5%!

輕斷食再次封神!研究證實(shí):能讓肝臟脂肪在3個月內(nèi)少25.5%!

健康之光
2026-01-09 06:20:03
我被母親冷暴力的30年 | 人間

我被母親冷暴力的30年 | 人間

網(wǎng)易人間
2026-01-12 14:07:15
無休整!明日開賽,多哈挑戰(zhàn)資格賽開啟,林詩棟蒯曼等繼續(xù)參賽!

無休整!明日開賽,多哈挑戰(zhàn)資格賽開啟,林詩棟蒯曼等繼續(xù)參賽!

生活新鮮市
2026-01-12 15:10:18
85%的血管淤堵,根本不用過度治療!醫(yī)生:做好3件事,比吃藥管用

85%的血管淤堵,根本不用過度治療!醫(yī)生:做好3件事,比吃藥管用

孟大夫之家1
2026-01-09 15:47:05
秦可卿到底得了什么病?其實(shí)從她一日換四五遍衣裳,就看得出來!

秦可卿到底得了什么病?其實(shí)從她一日換四五遍衣裳,就看得出來!

飛云如水
2025-04-19 18:33:37
為什么人骨在黑市上最受歡迎?人骨產(chǎn)業(yè)有多可怕?

為什么人骨在黑市上最受歡迎?人骨產(chǎn)業(yè)有多可怕?

心中的麥田
2026-01-09 19:09:13
6天賠光90萬?蜜雪冰城也不掙錢?中年人的“老板夢”竟是騙局

6天賠光90萬?蜜雪冰城也不掙錢?中年人的“老板夢”竟是騙局

現(xiàn)代小青青慕慕
2026-01-12 16:42:00
給2025年最好的10部動作片排個名:《匿殺》第7,《捕風(fēng)追影》第2

給2025年最好的10部動作片排個名:《匿殺》第7,《捕風(fēng)追影》第2

皮皮電影
2026-01-04 09:50:59
張鎮(zhèn)麟:在美國高中打球時(shí)被歧視只能睡凳子,只有自己強(qiáng)大才能讓他們折服

張鎮(zhèn)麟:在美國高中打球時(shí)被歧視只能睡凳子,只有自己強(qiáng)大才能讓他們折服

懂球帝
2026-01-11 21:27:46
哈國突然斷氣,中國稀土受挫,美國 9 億拿下七成礦權(quán),地緣棋局再變

哈國突然斷氣,中國稀土受挫,美國 9 億拿下七成礦權(quán),地緣棋局再變

花小貓的美食日常
2026-01-12 05:45:02
合川千人殺豬宴后續(xù):父母格局大,文旅連夜指導(dǎo)送豬,網(wǎng)友大格局

合川千人殺豬宴后續(xù):父母格局大,文旅連夜指導(dǎo)送豬,網(wǎng)友大格局

娛說瑜悅
2026-01-12 16:51:26
馬斯克173分鐘訪談:當(dāng)智力成本歸零,普通人唯一的護(hù)城河在哪?

馬斯克173分鐘訪談:當(dāng)智力成本歸零,普通人唯一的護(hù)城河在哪?

小8說科技
2026-01-12 15:05:57
“征求意見”淪為形式主義,涼了人心傷了公信 | 新京報(bào)快評

“征求意見”淪為形式主義,涼了人心傷了公信 | 新京報(bào)快評

新京報(bào)
2026-01-11 14:34:21
日本急了,喊話中國,“無法容許”加強(qiáng)對日本出口兩用物項(xiàng)的管控

日本急了,喊話中國,“無法容許”加強(qiáng)對日本出口兩用物項(xiàng)的管控

扶蘇聊歷史
2026-01-12 17:35:14
德國總理:向?yàn)蹩颂m部署多國部隊(duì)需獲俄羅斯同意

德國總理:向?yàn)蹩颂m部署多國部隊(duì)需獲俄羅斯同意

俄羅斯衛(wèi)星通訊社
2026-01-11 16:08:09
2026-01-12 18:16:49
NVIDIA英偉達(dá)中國 incentive-icons
NVIDIA英偉達(dá)中國
英偉達(dá)(中國)官方賬號
3361文章數(shù) 1437關(guān)注度
往期回顧 全部

科技要聞

面對SpaceX瘋狂“下餃子” 中國正面接招

頭條要聞

女子不會殺豬上千網(wǎng)友去幫忙 村干部:宰5頭豬吃流水席

頭條要聞

女子不會殺豬上千網(wǎng)友去幫忙 村干部:宰5頭豬吃流水席

體育要聞

聰明的球員,不是教練教出來的

娛樂要聞

閆學(xué)晶:脫離群眾太久 忘了自己的根

財(cái)經(jīng)要聞

倍輕松信披迷霧 實(shí)控人占用資金金額存疑

汽車要聞

增配不加價(jià) 北京現(xiàn)代 第五代 勝達(dá)2026款上市

態(tài)度原創(chuàng)

藝術(shù)
健康
手機(jī)
家居
教育

藝術(shù)要聞

畫完這組畫,他抑郁了,后來自殺了

血常規(guī)3項(xiàng)異常,是身體警報(bào)!

手機(jī)要聞

紅魔11 Air來了 姜超:重新定義Air 同檔最強(qiáng)

家居要聞

包絡(luò)石木為生 野性舒適

教育要聞

新浪招實(shí)習(xí)生啦!100-150/天!免費(fèi)班車、節(jié)日福利!

無障礙瀏覽 進(jìn)入關(guān)懷版