国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AI推理時代全面到來,大EP推理讓行業(yè)智能化走深向?qū)?/h1>
0
分享至

技術(shù)的突破僅僅是序章,大規(guī)模應(yīng)用而引發(fā)的連鎖反應(yīng)才是真正的變革。

今年初,DeepSeek掀起的AI浪潮席卷全球,一周之內(nèi)即實現(xiàn)億級用戶的爆發(fā)式增長和數(shù)百家企業(yè)踴躍接入,標志著中國AI企業(yè)開始掌握將技術(shù)突破轉(zhuǎn)化為AI普惠應(yīng)用的底層邏輯。

回望最近十年AI發(fā)展歷史,算力始終是橫亙在理想與現(xiàn)實之間的一道鴻溝。尤其是在我國,算力的稀缺,猶如懸掛在整個AI產(chǎn)業(yè)上的達摩克利斯之劍。而DeepSeek的技術(shù)突圍,恰恰始于對這場"算力封鎖"的顛覆,并激發(fā)起整個AI產(chǎn)業(yè)的全面創(chuàng)新。

DeepSeek的火爆,讓大規(guī)??绻?jié)點專家并行(Expert Parallelism ,簡稱: EP)成為當下AI最重要的趨勢之一,同時使得大EP推理解決方案迅速映入用戶們的眼簾。隨著DeepSeek開始全面進入各行各業(yè)的頭部用戶之中,大EP推理解決方案也成為行業(yè)智能化走深向?qū)嵉哪敲缎ㄗ樱瑹o比低調(diào)卻又至關(guān)重要。

大EP推理為何成大勢所趨

從2012年,AlexNet點燃深度學習革命開始,算力一直是左右AI發(fā)展的核心力量。

尤其是在Scaling Law規(guī)則的驅(qū)動下,AI大模型的訓練與推理對于算力需求也迅速水漲船高。AI頭部巨頭們更是紛紛加碼基礎(chǔ)設(shè)施的布局,從微軟、Meta、AWS等重金投建新數(shù)據(jù)中心,到xAI短時間構(gòu)建起20萬張GPU卡的AI集群,再到OpenAI推出“星際之門”項目,“得算力者得天下”深入人心,AI頭部巨頭們無不在追求“少量大專家模式”的“性能摸高”。

但這種“技術(shù)摸高”的模式會是AI發(fā)展創(chuàng)新的唯一路徑么?

DeepSeek-R1的橫空出現(xiàn),帶來不一樣的答案。DeepSeek在工程層面大膽創(chuàng)新,采用大規(guī)??绻?jié)點專家并行的模式,在算力規(guī)模和先進性受限的情況下,依然能打造出性能強大和先進的AI大模型。所謂“大規(guī)??绻?jié)點專家并行”,即將專家分布到更多的算力卡上,減少每張卡權(quán)重加載的時延,同時減少權(quán)重的顯存占用,顯著提升單卡并行的路數(shù),從而推動AI大模型的創(chuàng)新。

事實上,在DeepSeek出現(xiàn)之前,AI大模型在行業(yè)之中部署與應(yīng)用依然面臨著數(shù)據(jù)、算法和算力等一系列巨大挑戰(zhàn)。很多行業(yè)用戶既需要面臨高質(zhì)量數(shù)據(jù)缺乏的挑戰(zhàn),又面臨著動輒千卡或者萬卡的AI集群帶來極高的成本,更受制于AI大模型閉源帶來的部署與使用門檻。

而DeepSeek采用大規(guī)??绻?jié)點專家并行的模式,利用強化學習來減少人工依賴和數(shù)據(jù)缺失的問題;通過全面開源的方式,大幅降低AI大模型的獲取和部署成本,將AI推理資源池成本降到百卡/千卡范圍;并且支持更加輕量、靈活的部署方式,真正降低AI大模型在行業(yè)用戶環(huán)境中的部署與使用成本。

本質(zhì)上,DeepSeek在工程創(chuàng)新層面做了大量優(yōu)化工作,真正為中國AI產(chǎn)業(yè)走出一條新路,給予整個產(chǎn)業(yè)界巨大的信心,并激發(fā)起千行百業(yè)的AI應(yīng)用創(chuàng)新。業(yè)界也認為,未來AI發(fā)展‘性能摸高’和‘工程創(chuàng)新’兩條技術(shù)路徑未來會繼續(xù)并存。

大EP推理挑戰(zhàn)在哪里

就像醫(yī)院問診一樣,過去屬于“少量大專家”的模式,通過少量的全科大夫坐診,每個大夫均處于繁忙狀態(tài);而現(xiàn)在,大規(guī)模跨節(jié)點專家則屬于“大量小專家”模式,每個門診(每張算力卡)均有自己的大夫,不僅可以處理更多用戶的需求,還能夠帶來更好地用戶體驗。

當然,除了具備具備多種優(yōu)勢之外,大規(guī)??绻?jié)點專家并行模式也并非完美無瑕,隨著專家數(shù)量的增加,一系列新挑戰(zhàn)也接踵而至。

事實上,大規(guī)??绻?jié)點專家并行模式并不是專家越多越好;相反,專家數(shù)量存在一個“甜點”區(qū)域,當超過這個區(qū)域,性能提升并不明顯甚至會出現(xiàn)下降。在大規(guī)??绻?jié)點專家并行模式中,多專家的負載均衡和通信優(yōu)化是最為突出的挑戰(zhàn)。

例如,AI大模型的推理屬于自回歸過程,包括Prefill和Decode兩個階段。Prefill屬于預(yù)填充,將用戶請求的prompt傳入大模型并進行計算,屬于典型的計算密集型,需要耗費大量算力;而Decode則是增量推理階段,從顯存讀取前文產(chǎn)生的KVCache再進行計算,屬于訪存密集型。這兩個階段對于算力資源需求存在著明顯差異,需要算力效率和通信開銷進行均衡優(yōu)化。

所謂多專家負載均衡,即在業(yè)務(wù)處理中,肯能會出現(xiàn)某一位專家特別忙,而其他專家處于閑置狀態(tài),需要盡可能讓所有專家“人盡其用”,從而讓算力資源高效化。而通信優(yōu)化則是需要覺接ALL2ALL通信占比時間過高的問題,即當需要多個專家處理某個問題時候,專家互相之間交換意見的時間需要不短優(yōu)化,以實現(xiàn)更高效地處理好業(yè)務(wù)。

因此,在大EP推理解決方案中,算力等硬件能力只是基礎(chǔ),系統(tǒng)層面的整體優(yōu)化才是推理加速的關(guān)鍵因素,這也要求解決方案商必須具備從架構(gòu)到算法的端到端全棧優(yōu)化能力。

事實上,環(huán)顧當下整個市場,針對DeepSeek AI大模型的推理解決方案并不少,而華為依然占據(jù)著整個市場的大部分份額,其成功的關(guān)鍵就在于全棧能力。華為昇騰的大EP推理解決方案涵蓋從推理系列硬件,到CANN硬件使能層,再到推理引擎,以及全面的開發(fā)工具鏈和套件,從而實現(xiàn)性能更高、并發(fā)更高和體驗更優(yōu)。

據(jù)悉,華為昇騰大EP推理解決方案能夠?qū)崿F(xiàn)單卡并發(fā)3倍的提升,Decode時延能夠降低50%以上,大幅降低用戶的部署和使用成本,使用體驗也得以大幅提升。此外,用戶之前一體機方案,通過交換機進行參數(shù)面互聯(lián),基于現(xiàn)有組網(wǎng)架構(gòu)軟件升級,即可升級到華為昇騰大EP推理方案。

讓行業(yè)智能化走深向?qū)?/strong>

如今,AI全面走向推理時代。有人甚至認為,應(yīng)用的未來在于推理,推理將成為所有應(yīng)用未來的核心組件之一。

毫無疑問,在當前的行業(yè)智能化建設(shè)中,降低AI推理的部署、使用和成本門檻具有極為意義重大。降低門檻,意味著有更多行業(yè)用戶能夠把AI推理用起來和使用好,進而推動AI在行業(yè)場景中創(chuàng)新的充分釋放,再進一步帶動AI應(yīng)用在To B領(lǐng)域的繁榮,最終形成良性循環(huán)。

華為昇騰大EP推理解決方案的推出,無疑為AI推理的普及帶來一份重要答卷,也為行業(yè)智能化走深向?qū)嵦峁﹫詫嵒A(chǔ)。

首先,憑借對AI技術(shù)趨勢的前瞻洞察以及戰(zhàn)略定力,華為昇騰大EP推理解決方案擁有大量關(guān)鍵創(chuàng)新,包括MoE負載均衡、autoPD分離部署、雙流/多維混合并行、MLAPO融合算力等五大關(guān)鍵技術(shù),能夠?qū)崿F(xiàn)整體方案層面的性能吞吐和時延最優(yōu),真正幫助行業(yè)用戶應(yīng)對AI推理時代的到來。

例如,華為的autoPD分離部署是自適應(yīng)PD分離部署,自動感知負載變化,且無需人工介入,實現(xiàn)多級緩存內(nèi)存資源池化,冷熱KV分層加載,不僅能夠大幅提升系統(tǒng)的資源利用率,而且可以動態(tài)適應(yīng)場景的變化需求。

其次,除了全棧自研能力之外,華為在計算、網(wǎng)絡(luò)和AI大模型等多個領(lǐng)域擁有豐富的經(jīng)驗積累,使得昇騰大EP推理解決方案不僅實現(xiàn)性能最優(yōu),更貼近當前用戶的使用需求。

相反,目前國際廠商針對中國市場的“閹割版”方案,其性能落差巨大、短板明顯,F(xiàn)P16算力只有148TFLOPS。面對大規(guī)模分布式任務(wù)時,在類似DeepSeek大規(guī)模專家并行模式的推理場景下,“閹割版”方案無法有效支撐提升并發(fā)數(shù)和單卡吞吐,尤其是輸入樣本數(shù)量和序列長度提升的情況下,算力瓶頸暴露無疑。

此外,DeepSeek等AI大模型采用“潮汐導讀”實現(xiàn)92%的日均算力利用率,即利用“白天推理、晚上訓練”的模式來充分釋放硬件性能,而“閹割版”方案對于特定架構(gòu)過度依賴,算力受限使得其在AI沒到校預(yù)訓練場景中幾乎難有作為,無法滿足訓推一體的使用需求。加上AI大模型加速向MoE模式演進,“閹割版”方案不僅成本高昂,還面臨著潛在的戰(zhàn)略隱患,使得其很難滿足當下行業(yè)用戶的需求。

以MoE負載均衡為例,華為自身是通信起家,對于大容量、大并發(fā)的通信場景擁有大量時間,并且積累起豐富的經(jīng)驗,針對大規(guī)??绻?jié)點專家并行,不僅能夠根據(jù)業(yè)務(wù)情況、集群規(guī)模、專家情況來自動尋優(yōu),還能自動預(yù)測和自動降解,讓專家與資源配比最優(yōu),實現(xiàn)整個MoE負載均衡在業(yè)界最優(yōu)。

最后,華為昇騰大EP推理解決方案始終秉持開放共贏的戰(zhàn)略,聚焦底層根技術(shù)的基礎(chǔ)創(chuàng)新,不僅與DeepSeek等AI大模型企業(yè)保持著緊密聯(lián)系,共同攻堅與聯(lián)合創(chuàng)新來應(yīng)對AI日新月異的發(fā)展蘇,更攜手產(chǎn)業(yè)鏈伙伴形成AI應(yīng)用普惠化的產(chǎn)業(yè)協(xié)同效應(yīng),推動中國AI產(chǎn)業(yè)良性發(fā)展軌道。

綜合觀察,歷史告訴我們:偉大的基礎(chǔ)設(shè)施從來不只是工具,更是產(chǎn)業(yè)變革和社會經(jīng)濟發(fā)展的引擎。當AI應(yīng)用開始走進田間地頭、政務(wù)大廳、工廠廠房、醫(yī)療機構(gòu)、港口碼頭、金融柜臺……中國正引領(lǐng)AI推理時代最大的技術(shù)平權(quán)運動。而以DeepSeek、華為等為代表的中國企業(yè),在AI基礎(chǔ)設(shè)施領(lǐng)域的持續(xù)探索與創(chuàng)新,無疑中國AI普惠開辟出一條屬于自己的康莊大道。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
界面調(diào)查|一位“90后”網(wǎng)約車司機之死:被騙網(wǎng)貸、被催債和致命的絕望

界面調(diào)查|一位“90后”網(wǎng)約車司機之死:被騙網(wǎng)貸、被催債和致命的絕望

界面新聞
2026-03-29 10:33:24
改寫歷史,真主黨打進了以色列本土

改寫歷史,真主黨打進了以色列本土

星火聊天下
2026-03-30 16:09:46
41歲美女老板朱明月去世,生前常熬夜,喜歡吃燒烤,身價幾千萬

41歲美女老板朱明月去世,生前常熬夜,喜歡吃燒烤,身價幾千萬

180視角
2026-03-30 08:54:24
越打越出驚喜!以色列傳來好消息,美軍徹底歇菜:8年無法再開戰(zhàn)

越打越出驚喜!以色列傳來好消息,美軍徹底歇菜:8年無法再開戰(zhàn)

知法而形
2026-03-26 17:28:20
打出戰(zhàn)爭回旋鏢:烏克蘭如何把戰(zhàn)爭和痛苦,一起打包寄回莫斯科?

打出戰(zhàn)爭回旋鏢:烏克蘭如何把戰(zhàn)爭和痛苦,一起打包寄回莫斯科?

無月可歸辛
2026-03-29 22:12:43
李湘終于露面了!短短兩個多月,簡直是暴瘦,王詩齡個子又長高了

李湘終于露面了!短短兩個多月,簡直是暴瘦,王詩齡個子又長高了

阿纂看事
2026-03-30 18:52:14
沒裝ETC也能秒過站 江蘇高速推出“手機+”無卡通行

沒裝ETC也能秒過站 江蘇高速推出“手機+”無卡通行

極目新聞
2026-03-30 21:41:47
得知毛岸英犧牲后,蔣介石晚上支開宋美齡,對蔣經(jīng)國說了一番話

得知毛岸英犧牲后,蔣介石晚上支開宋美齡,對蔣經(jīng)國說了一番話

瑩瑩的歷史說
2026-03-31 01:18:25
母親做膽結(jié)石手術(shù)月余后身亡,女子發(fā)帖討公道被拘賠款5萬,涉事醫(yī)生曾涉一級甲等醫(yī)療事故,廈門市衛(wèi)健委已對該案立案核查

母親做膽結(jié)石手術(shù)月余后身亡,女子發(fā)帖討公道被拘賠款5萬,涉事醫(yī)生曾涉一級甲等醫(yī)療事故,廈門市衛(wèi)健委已對該案立案核查

大風新聞
2026-03-30 11:56:07
你們都是什么時候?qū)δ信麻_竅的?網(wǎng)友:果然還是攔不住有心人

你們都是什么時候?qū)δ信麻_竅的?網(wǎng)友:果然還是攔不住有心人

夜深愛雜談
2026-02-21 21:37:02
真正好消息!中國大陸將有2家企業(yè),能制造7nm芯片了?

真正好消息!中國大陸將有2家企業(yè),能制造7nm芯片了?

互聯(lián)網(wǎng).亂侃秀
2026-03-28 14:19:21
俄羅斯不賣油了!普京禁令一下,最慘的不是歐洲,而是兩個鄰國

俄羅斯不賣油了!普京禁令一下,最慘的不是歐洲,而是兩個鄰國

聽風喃
2026-03-30 10:42:29
官方:CCTV5直播中國隊與喀麥隆隊的比賽

官方:CCTV5直播中國隊與喀麥隆隊的比賽

懂球帝
2026-03-30 12:30:20
庫明加老鷹首秀27分驚艷全場!但10場數(shù)據(jù)暴跌70%,他真被高估了

庫明加老鷹首秀27分驚艷全場!但10場數(shù)據(jù)暴跌70%,他真被高估了

籃球小布丁
2026-03-31 03:18:38
三河壩失利后,這兩人離隊,一個由大將變上將,一個由上將變中將

三河壩失利后,這兩人離隊,一個由大將變上將,一個由上將變中將

顧史
2026-03-30 22:16:13
善惡有報!逼人民日報怒批、暗諷張雪峰,1300萬網(wǎng)紅終為荒唐買單

善惡有報!逼人民日報怒批、暗諷張雪峰,1300萬網(wǎng)紅終為荒唐買單

標體
2026-03-31 01:05:29
比披絲巾更可怕的是“瑜伽褲外穿”,廉價又卡襠,三角區(qū)更尷尬

比披絲巾更可怕的是“瑜伽褲外穿”,廉價又卡襠,三角區(qū)更尷尬

生命之泉的奧秘
2026-03-20 03:56:49
陪玩陪睡僅是冰山一角,李榮浩手撕單依純后,更大的黑幕被曝出

陪玩陪睡僅是冰山一角,李榮浩手撕單依純后,更大的黑幕被曝出

夢想的旅途照進現(xiàn)實
2026-03-31 00:57:23
我靠“抄襲”年入80萬,你可能對努力一無所知

我靠“抄襲”年入80萬,你可能對努力一無所知

流蘇晚晴
2026-03-29 16:30:54
決不輕饒!軍工反腐揪出大老虎,不是技不如人,而是“蛀蟲”太多

決不輕饒!軍工反腐揪出大老虎,不是技不如人,而是“蛀蟲”太多

無悔的燦爛人生
2026-03-28 20:46:25
2026-03-31 03:52:49

dobigdata incentive-icons
dobigdata
科技推動商業(yè)
770文章數(shù) 304關(guān)注度
往期回顧 全部

科技要聞

一句謊言引發(fā)的硅谷血案

頭條要聞

特朗普:對伊朗襲擊以煉油廠的回應(yīng)“很快到來”

頭條要聞

特朗普:對伊朗襲擊以煉油廠的回應(yīng)“很快到來”

體育要聞

想進世界杯,意大利還要過他這一關(guān)

娛樂要聞

全紅嬋聊到體重哭了,每天只吃一頓飯

財經(jīng)要聞

本輪地緣沖突,A股憑什么走出獨立行情

汽車要聞

限時12.58萬起 銀河星耀8遠航家系列上市

態(tài)度原創(chuàng)

家居
房產(chǎn)
旅游
本地
公開課

家居要聞

東方法式美學 現(xiàn)代簡約

房產(chǎn)要聞

重磅!番禺20宗涉宅地亮相,萬博CBD宅地將上新!

旅游要聞

走!去蘇州河畔新開的書香文化“大船”看看

本地新聞

用Color Walk的方式解鎖城市春日

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版