国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

千萬(wàn)級(jí)大模型項(xiàng)目,驚現(xiàn)“奇怪”采購(gòu)

0
分享至

最近,我們刷到一個(gè)千萬(wàn)級(jí)大模型大單↓

一套AI計(jì)算集群,中標(biāo)價(jià)2000多萬(wàn)。

猛一看,采購(gòu)的是AI服務(wù)器,這不奇怪,當(dāng)下AI服務(wù)器就是很搶手,大單頻出。



可細(xì)一看,很多吃瓜人士就開始好奇——

“除了服務(wù)器,這里面的KunLun AI Space,是個(gè)啥玩意?”

此時(shí),懂行的老司機(jī)發(fā)話了:嘿嘿,這其實(shí)是MaaS!



什么是MaaS,為啥MaaS能賣這么貴?

先講個(gè)真實(shí)現(xiàn)狀吧:

上半年,你不搞大模型,客戶會(huì)覺得你Out了,項(xiàng)目都懶得跟你談。

下半年,你搞大模型沒MaaS,客戶就會(huì)覺得你不是真正搞大模型的,還是懶得跟你談。





為啥呢?

因?yàn)楝F(xiàn)在開源大模型那么多,你想獲得一個(gè)大模型其實(shí)沒啥難度,甚至客戶自己都能搞定。



可是,你想真的把大模型優(yōu)化好、部署好、用好,得到更高的推理效率,更好地適配業(yè)務(wù),就沒那么簡(jiǎn)單了。

所以,你就會(huì)發(fā)現(xiàn),很多客戶雖然有了大模型,卻只能“供著”。



要想把大模型真正用起來,就離不開MaaS。

MaaS,就是大模型服務(wù)平臺(tái)(Model as a Service),向下對(duì)接算、存、網(wǎng)等AI硬件基礎(chǔ)設(shè)施,向上對(duì)接AI應(yīng)用開發(fā)。

MaaS就像AI時(shí)代的奶牛,吃的是草(算力),擠出來的是奶(tokens)。



企業(yè)要想用好大模型,對(duì)這頭奶牛要求可不低↓

第一,客戶買了這頭“奶牛”,希望它在吃相同草料的情況下(算力),能更快更多的產(chǎn)奶(tokens)。



此時(shí),就需要考量TPOT、TTFT、并發(fā)、極限吞吐這些推理性能指標(biāo)。

但實(shí)際上,市面上“奶?!绷驾积R,能力差別很大,很多“產(chǎn)奶”指標(biāo)都是測(cè)試?yán)硐胫怠?/p>



第二,客戶還希望這頭奶牛好飼養(yǎng),國(guó)產(chǎn)草料、進(jìn)口草料都能吃,還有配套的飼養(yǎng)員、獸醫(yī)。

比如,有的牛特別挑食,只偏愛某一兩種草料(算力),換了草料就不干活。



再比如,牛有頭疼腦熱或者水土不服(故障、bug或者部署、適配優(yōu)化問題),客戶就希望廠家能提供獸醫(yī)或者飼養(yǎng)員團(tuán)隊(duì)幫忙(原廠優(yōu)化適配專家)。



第三,客戶需要的不止是鮮奶(Tokens),他們的最終目標(biāo)是把奶變成各種可口的食物(AI應(yīng)用)。

光有牛還不夠,還要有配套的奶制品生產(chǎn)線,也就是AI應(yīng)用開發(fā)和智能體開發(fā)平臺(tái)。



產(chǎn)奶效率高、不挑草料、有資深飼養(yǎng)員和獸醫(yī)提供服務(wù),還提供配套的奶產(chǎn)品加工生產(chǎn)需求。

一番盤點(diǎn)下來,這樣的“超能牛”可不太好找。



嘿嘿,眾里尋“?!鼻О俣?,踏破鐵鞋無覓處。

驀然回首,你會(huì)發(fā)現(xiàn),中標(biāo)公告里的KunLun AI Space,原來就是那頭“超能牛”。



KunLun AI Space這頭“牛”到底有多牛?

第一牛,吃更少的“草料”,卻能更快更多“產(chǎn)奶”。

不僅省飼料,產(chǎn)奶效率還奇高,這樣的牛誰(shuí)不愛呢?



憑啥有這種效率?一句話,軟硬協(xié)同!

KunLun AI Space實(shí)現(xiàn)了從“算力卡”到“Token輸出”端到端軟硬協(xié)同優(yōu)化。

也就是說,從飼料投喂(算力池化調(diào)度)、進(jìn)食階段(算子加速)、消化階段(模型適配)、產(chǎn)奶階段(推理加速),每個(gè)環(huán)節(jié),都進(jìn)行了優(yōu)化。



KunLun為什么要這么干?

只因要想達(dá)到最優(yōu)的“產(chǎn)奶”效率,必須解決四大難題:計(jì)算效率、訪存效率、存儲(chǔ)效率和通信效率。

這四大難題,如同四道“嘆息之墻”,很多牛人第一道墻都過不了。



而KunLun AI Space正是通過端到端的軟硬協(xié)同優(yōu)化,成功突破了這四道墻,把性能拉滿,最終實(shí)現(xiàn)最佳推理效率。



具體怎么破,我來給大家講講↓

①算子優(yōu)化:通過算子融合、算子定制開發(fā)、軟FP4/FP8等手段,提升計(jì)算、訪存和通信效率。

算子,是深度學(xué)習(xí)里的“動(dòng)作單元”,正是依靠一個(gè)個(gè)算子的高效“動(dòng)作”,才組合成流暢高效的推理流程,算子級(jí)的優(yōu)化是性能提升的關(guān)鍵。



KunLun AI Space通過算子融合,將多個(gè)獨(dú)立“小算子”融合一個(gè)“大算子”,功能等價(jià)但性能更優(yōu)。

好比將多個(gè)步驟的動(dòng)作,合成一個(gè)大動(dòng)作,達(dá)到同樣目的,但是更省勁。



同時(shí),針對(duì)當(dāng)下大量模型采用FP8甚至FP4的推理精度,而市面上很多算力卡卻不支持該精度的問題,KunLun AI Space提供軟FP8/FP4方案。

采用該方案,資源門檻下降50%,性能可提升10%(比如跑滿血大模型,原來需要32張卡,現(xiàn)在只需要16張)。



②KV Cache優(yōu)化:通過KV Cache壓縮、分級(jí)卸載等手段,節(jié)省存儲(chǔ)和計(jì)算開銷,并提升長(zhǎng)下文處理能力和并發(fā)性能。

KV Cache相當(dāng)于大模型推理里的記憶緩存機(jī)制,用于存放之前算過的「注意力特征」。

參考理解一下牛的「反芻」,你就秒懂了,都是已經(jīng)嚼過(算過)的東西。



具體怎么優(yōu)化呢?學(xué)問很大!

首先,采用KV Cache多級(jí)緩存池,相似或重復(fù)問題直接從緩存讀取,減少重復(fù)計(jì)算,降低GPU和顯存消耗。

同時(shí),通過內(nèi)存和SSD分級(jí)存儲(chǔ),降低緩存成本。



接下來,采用高性能壓縮算法和硬件,對(duì)KV Cache進(jìn)行壓縮,并提供智能冷熱數(shù)據(jù)分級(jí),把存儲(chǔ)成本打下來。

通過這一系列操作,以存促算,多輪對(duì)話TTFT降低80%,KV Cache存儲(chǔ)空間(顯存+內(nèi)存+SSD)降低一半以上。



③推理調(diào)度優(yōu)化:采用異構(gòu)PD分離、智能路由等技術(shù)提升計(jì)算效率,并使用統(tǒng)一存儲(chǔ)來平衡PD階段的資源利用率、延遲,提升吞吐。

現(xiàn)在大家都知道通過PD分離部署來避免資源爭(zhēng)搶、提升推理效率,但是面對(duì)不同的推理場(chǎng)景、不同算力卡資源,如何優(yōu)化PD配比,其實(shí)很有學(xué)問。



KunLun AI Space有自己一套邏輯↓

采用混合/半分離設(shè)計(jì),PD計(jì)算過程分開,但統(tǒng)一存儲(chǔ),與KV Cache分級(jí)緩存相結(jié)合,實(shí)現(xiàn)跨節(jié)點(diǎn)共享數(shù)據(jù)。

同時(shí)利用智能路由策略,靈活分配負(fù)載,且P實(shí)例可以彈性伸縮,滿足突發(fā)請(qǐng)求。



通過這番操作,又可以讓首Token時(shí)延降低45%,吞吐量提升25%。

從算子優(yōu)化到KV Cache優(yōu)化再到推理調(diào)度優(yōu)化,KunLun AI Space實(shí)現(xiàn)了通信效率、存儲(chǔ)效率、訪存效率、計(jì)算效率的集體提升。

最終這一系列的乘積也把推理效率徹底拉滿!



第二牛,這牛胃口好、不挑食,而且配備優(yōu)秀的“養(yǎng)牛專家”提供服務(wù)。

大模型落地到企業(yè)場(chǎng)景,遇到五花八門的“草料”(算力)是不可避免的。

此時(shí)選KunLun AI Space就太省心了,國(guó)產(chǎn)草料、進(jìn)口草料來者不拒。



不止如此,KunLun還配備了資深“養(yǎng)牛專家”提供服務(wù),他們專治各種水土不服的“牛脾氣”。

算、存、網(wǎng)、集群、整體優(yōu)化,哪里不服治哪里,針對(duì)客戶特殊場(chǎng)景,還可以做定制化的算子開發(fā),這沒點(diǎn)軟硬協(xié)同的本領(lǐng)可做不到。





第三牛,AI Space不止是MaaS,還包含了應(yīng)用使能模塊。

KunLun AI Space其實(shí)包含兩大部分↓

第一部分叫做「AI Space Wings」,這個(gè)是MaaS(也就是牛),另一部分叫做「AI Space Prime」,屬于應(yīng)用使能模塊(相當(dāng)于奶制品加工廠)。



道理很簡(jiǎn)單,用大模型做推理,生產(chǎn)再多Tokens也沒用,核心是要把他們變成AI應(yīng)用,就像把鮮奶變成美味奶制品,形成落地閉環(huán)。

AI Space Prime提供了MCP、Agent編排/提示詞工程/插件管理、RAG等一系列“生產(chǎn)線”,幫助客戶把Tokens快速變成生產(chǎn)力工具。



KunLun AI Space的成績(jī)單,和它背后的“養(yǎng)牛人”

目前,KunLun AI Space早已不是實(shí)驗(yàn)室里的產(chǎn)品,而是大模型實(shí)戰(zhàn)中牛氣沖天的“小戰(zhàn)神”。

1、落地200+項(xiàng)目,覆蓋互聯(lián)網(wǎng)、運(yùn)營(yíng)商、金融、政企等頭部客戶;
2、解決500+大模型生態(tài)適配問題;
3、模型推理性能提升50%,token成本大幅下降。

這些成績(jī)意味著:客戶花出去的每一分錢,都能換回更高的算力價(jià)值。

所以KunLun能拿下篇頭那個(gè)2000萬(wàn)+的大單,就不足為奇了。



有人問,牛歸牛,但KunLun這名字看著挺生的,怕不是個(gè)新公司吧?

嘿嘿,這個(gè)成立3年的新公司,卻有著20年的老道行。

昆侖技術(shù),2022年10月正式成立,核心團(tuán)隊(duì)來自原鯤鵬+昇騰體系,是最懂國(guó)產(chǎn)算力生態(tài)的那撥人…

如今,這些最強(qiáng)“養(yǎng)牛人”,依托通用和AI計(jì)算領(lǐng)域的技術(shù)積累、實(shí)戰(zhàn)經(jīng)驗(yàn)、服務(wù)體系,正在刮起一波大模型時(shí)代的“牛旋風(fēng)”!



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
美國(guó)發(fā)起的所謂“和平委員會(huì)”首次會(huì)議在瑞士達(dá)沃斯舉行

美國(guó)發(fā)起的所謂“和平委員會(huì)”首次會(huì)議在瑞士達(dá)沃斯舉行

財(cái)聯(lián)社
2026-01-22 18:27:07
終于理解為啥呂布從沒斬殺有名大將,卻被稱為第一猛將!評(píng)論太精辟

終于理解為啥呂布從沒斬殺有名大將,卻被稱為第一猛將!評(píng)論太精辟

熱鬧的河馬
2024-10-08 16:25:19
全市預(yù)警!北京將迎大范圍降雪!

全市預(yù)警!北京將迎大范圍降雪!

美麗大北京
2026-01-22 20:55:31
何慶魁喊話趙本山:你總說有困難吱聲,但我真沒臉跟你再要50萬(wàn)!

何慶魁喊話趙本山:你總說有困難吱聲,但我真沒臉跟你再要50萬(wàn)!

天天熱點(diǎn)見聞
2026-01-22 08:08:43
主帥被驅(qū)逐+2分鐘7T!山西遭深圳終結(jié)3連勝 賀希寧23分

主帥被驅(qū)逐+2分鐘7T!山西遭深圳終結(jié)3連勝 賀希寧23分

醉臥浮生
2026-01-22 21:38:06
沒有陽(yáng)剛之氣就別演“大俠”,《鏢人》中謝霆鋒,給內(nèi)娛上了一課

沒有陽(yáng)剛之氣就別演“大俠”,《鏢人》中謝霆鋒,給內(nèi)娛上了一課

糊咖娛樂
2026-01-22 11:48:48
眼神給出去刷屏,“性商教母”撈金超2400萬(wàn)元,誰(shuí)在為“性商”課程買單?

眼神給出去刷屏,“性商教母”撈金超2400萬(wàn)元,誰(shuí)在為“性商”課程買單?

新民周刊
2026-01-22 18:24:18
馬克龍受了奇恥大辱,轉(zhuǎn)頭對(duì)中國(guó)提出兩個(gè)請(qǐng)求,特朗普緊急攤牌

馬克龍受了奇恥大辱,轉(zhuǎn)頭對(duì)中國(guó)提出兩個(gè)請(qǐng)求,特朗普緊急攤牌

策略述
2026-01-22 12:48:55
特朗普啟動(dòng)“和平委員會(huì)”,巴、以代表沒簽字

特朗普啟動(dòng)“和平委員會(huì)”,巴、以代表沒簽字

極目新聞
2026-01-22 20:22:33
震驚!網(wǎng)傳有學(xué)校老師冬天坐在教學(xué)樓走廊,批改作業(yè)并為學(xué)生解答

震驚!網(wǎng)傳有學(xué)校老師冬天坐在教學(xué)樓走廊,批改作業(yè)并為學(xué)生解答

火山詩(shī)話
2026-01-22 14:44:08
靈堂里一個(gè)從安徽趕來的女人哭到幾乎昏厥,她曾是聶衛(wèi)平家的保姆

靈堂里一個(gè)從安徽趕來的女人哭到幾乎昏厥,她曾是聶衛(wèi)平家的保姆

南權(quán)先生
2026-01-22 15:51:35
歐洲打死也不會(huì)想到,這場(chǎng)戰(zhàn)爭(zhēng)徹底打掉了歐洲五十年的國(guó)運(yùn)

歐洲打死也不會(huì)想到,這場(chǎng)戰(zhàn)爭(zhēng)徹底打掉了歐洲五十年的國(guó)運(yùn)

揭秘歷史的真相
2026-01-19 21:05:12
反轉(zhuǎn)!越南隊(duì)主帥回應(yīng)0-3輸中國(guó)隊(duì)真相,主力后衛(wèi)或遭亞足聯(lián)重罰

反轉(zhuǎn)!越南隊(duì)主帥回應(yīng)0-3輸中國(guó)隊(duì)真相,主力后衛(wèi)或遭亞足聯(lián)重罰

何老師呀
2026-01-22 16:23:50
金正恩視察溫泉療養(yǎng)設(shè)施,并在女賓浴場(chǎng)與女性們交談

金正恩視察溫泉療養(yǎng)設(shè)施,并在女賓浴場(chǎng)與女性們交談

隨波蕩漾的漂流瓶
2026-01-22 18:30:40
呂特發(fā)給特朗普的私密信息,讓歐洲人吵翻了!

呂特發(fā)給特朗普的私密信息,讓歐洲人吵翻了!

環(huán)球時(shí)報(bào)國(guó)際
2026-01-22 00:13:27
中國(guó)第一個(gè)2萬(wàn)億經(jīng)濟(jì)大區(qū),要來了

中國(guó)第一個(gè)2萬(wàn)億經(jīng)濟(jì)大區(qū),要來了

國(guó)民經(jīng)略
2026-01-22 12:16:37
炸裂!50歲網(wǎng)紅自稱"性商教母",教狐系媚術(shù)浴室玩法,狂斂2400萬(wàn)

炸裂!50歲網(wǎng)紅自稱"性商教母",教狐系媚術(shù)浴室玩法,狂斂2400萬(wàn)

派大星紀(jì)錄片
2026-01-22 14:56:51
君樂寶上市直擊 龍頭成長(zhǎng)邏輯你看懂了么

君樂寶上市直擊 龍頭成長(zhǎng)邏輯你看懂了么

銠財(cái)
2026-01-22 10:34:38
男子連續(xù)15年為妻女購(gòu)買黃金,一共買了28件金條、金飾,預(yù)估收益超過100萬(wàn)元!

男子連續(xù)15年為妻女購(gòu)買黃金,一共買了28件金條、金飾,預(yù)估收益超過100萬(wàn)元!

深圳晚報(bào)
2026-01-22 14:55:27
央行:為保持銀行體系流動(dòng)性充裕,2026年1月23日,中國(guó)人民銀行將以固定數(shù)量、利率招標(biāo)、多重價(jià)位中標(biāo)方式開展9000億元MLF操作,期限為1年期

央行:為保持銀行體系流動(dòng)性充裕,2026年1月23日,中國(guó)人民銀行將以固定數(shù)量、利率招標(biāo)、多重價(jià)位中標(biāo)方式開展9000億元MLF操作,期限為1年期

每日經(jīng)濟(jì)新聞
2026-01-22 17:26:07
2026-01-22 22:35:00
AI全球總部
AI全球總部
全球最新、最酷AI解決方案
1113文章數(shù) 715關(guān)注度
往期回顧 全部

科技要聞

幾千億只是開胃菜,AI基建還得再砸?guī)兹f(wàn)億

頭條要聞

北約稱將確保中俄不在格陵蘭島有軍事立足點(diǎn) 中方回應(yīng)

頭條要聞

北約稱將確保中俄不在格陵蘭島有軍事立足點(diǎn) 中方回應(yīng)

體育要聞

跑個(gè)步而已,他們?cè)谌际裁矗?/h3>

娛樂要聞

車銀優(yōu)賺800億 涉嫌逃稅200億!

財(cái)經(jīng)要聞

西貝拿到“救命錢”,然后呢

汽車要聞

配備多塊娛樂屏 極氪8X內(nèi)飾曝光

態(tài)度原創(chuàng)

藝術(shù)
游戲
數(shù)碼
房產(chǎn)
軍事航空

藝術(shù)要聞

一場(chǎng)雪,飄進(jìn)了唐詩(shī)

《波斯王子時(shí)之砂RE》推特被噴爆!育碧你搞什么鬼?

數(shù)碼要聞

分形工藝上架Pop 2 Air系列機(jī)箱,649元起

房產(chǎn)要聞

開年王炸!四重政策紅利加碼,廣州置業(yè)窗口期邁入倒計(jì)時(shí)!

軍事要聞

普京:愿意向"和平委員會(huì)"提供10億美元

無障礙瀏覽 進(jìn)入關(guān)懷版