国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

微軟把3年前埋的暗線全翻出來了,K8s圈集體失眠

0
分享至


2024年GPU調(diào)度還是各家自研的野路子,2025年英偉達(dá)DGX Cloud和OpenShift開始互掐接口標(biāo)準(zhǔn),到2026年3月的KubeCon歐洲站,微軟突然攤牌——他們手里握著7個已進(jìn)入CNCF孵化期的開源項目,全部指向同一個目標(biāo):讓AI負(fù)載在Kubernetes里變成"一等公民"。

這不是技術(shù)升級,是游戲規(guī)則重寫。

Azure Kubernetes Service(AKS)產(chǎn)品負(fù)責(zé)人Sean McKenna在阿姆斯特丹的演講里打了個比方:早期云原生解決的是"怎么讓容器跑起來",現(xiàn)在AI基建卡在"怎么讓好答案和壞答案可區(qū)分、可回滾、可審計"。從"能用"到"可信",中間隔著整個運維哲學(xué)的斷層。

微軟的解法很產(chǎn)品經(jīng)理:不造新輪子,把K8s成熟的那套"變更安全"機(jī)制,原樣搬進(jìn)AIinfra。

調(diào)度層:GPU終于不用"搶車位"了

McKenna團(tuán)隊過去18個月干了一件很"反微軟"的事——把Azure內(nèi)部的GPU調(diào)度邏輯全拆成開源標(biāo)準(zhǔn),推給CNCF。

核心叫Dynamic Resource Allocation(動態(tài)資源分配,DRA)。傳統(tǒng)K8s調(diào)度像食堂打飯:GPU是整份套餐,你要1/10算力也得端著整盤走。DRA改成"自選稱重":顯存、計算單元、甚至Tensor Core時段,都能切片申請。

更狠的是Topology Aware Scheduling(拓?fù)涓兄{(diào)度)。多卡訓(xùn)練時,NVLink和PCIe的物理距離直接決定通信延遲。以前調(diào)度器看不見這些,現(xiàn)在微軟把硬件拓?fù)鋱D喂進(jìn)調(diào)度決策,讓K8s像老網(wǎng)管一樣知道"哪幾張卡挨著,哪幾張隔著半個機(jī)房"。

這兩個項目2024年還是提案階段,2025年Q4進(jìn)入Kubernetes 1.32 Beta,2026年3月微軟宣布:AKS已默認(rèn)開啟,且向后兼容到1.28版本。

「我們不是在做Azure的功能,是在補K8s的拼圖?!筂cKenna的原話。

觀測層:黑盒模型的"飛行記錄儀"

AI運維最折磨人的場景:模型輸出突然跑偏,你不知道是數(shù)據(jù)漂移、權(quán)重?fù)p壞,還是某張GPU的顯存靜默報錯。

微軟推了Kaito(Kubernetes AI Toolchain Operator)的2.0版本,新增Model Observatory模塊。它把推理請求的輸入輸出、延遲分布、token級熱力圖,全部接進(jìn)Prometheus標(biāo)準(zhǔn)指標(biāo)。

換句話說,以前調(diào)優(yōu)LLM像修老式收音機(jī)——拍兩下看反應(yīng);現(xiàn)在像看飛機(jī)黑匣子,每次"顛簸"都有時序數(shù)據(jù)可回溯。

更隱蔽的改動在Retina——微軟開源的CNI(容器網(wǎng)絡(luò)接口)插件。它給每個Pod加了eBPF級別的網(wǎng)絡(luò)遙測,能抓到RDMA(遠(yuǎn)程直接內(nèi)存訪問)鏈路的微秒級抖動。這對多節(jié)點分布式訓(xùn)練是剛需:一次NCCL(NVIDIA集合通信庫)超時,可能讓價值50萬美元的GPU小時直接打水漂。

多集群:從"聯(lián)邦制"到"單一控制面"


AKS Fleet Manager的更新被嚴(yán)重低估了。它現(xiàn)在支持跨云、跨區(qū)域的GPU資源池統(tǒng)一調(diào)度,延遲敏感任務(wù)自動下沉到邊緣節(jié)點,批處理任務(wù)上浮到廉價 Spot 實例。

McKenna舉了個客戶案例:某自動駕駛公司用Fleet Manager把模型訓(xùn)練拆成三段——數(shù)據(jù)清洗在Azure德國(合規(guī))、預(yù)訓(xùn)練在Azure美國中部(H100充足)、微調(diào)在本地邊緣集群(低延遲驗證)。三段用同一套K8s API,同一套RBAC(基于角色的訪問控制)策略。

這直接挑戰(zhàn)了Anthropic和Google的私有方案。后者通常要求你在每個環(huán)境跑不同的控制平面,再用專有工具做任務(wù)遷移。

安全:當(dāng)模型權(quán)重變成"數(shù)據(jù)"

微軟在AKS里塞了一個叫"Confidential Containers on GPU"的功能,基于AMD SEV-SNP和Intel TDX的機(jī)密計算擴(kuò)展。簡單說,模型權(quán)重在顯存里也是加密的,宿主機(jī)root權(quán)限也讀不到。

這對金融和醫(yī)療客戶是硬需求——模型即知識產(chǎn)權(quán),比代碼更值錢。但技術(shù)實現(xiàn)很刁鉆:GPU的TEE(可信執(zhí)行環(huán)境)和CPU的TEE要跨廠商握手,微軟聯(lián)合AMD、NVIDIA干了兩年才把延遲壓到可接受范圍。

「我們不想讓客戶在"安全"和"性能"之間二選一?!筂cKenna說這話時,現(xiàn)場有工程師喊了聲"終于"。

存儲:檢查點(Checkpoint)的"秒級復(fù)活"

大模型訓(xùn)練最怕什么?不是慢,是斷。一次 checkpoint 寫入慢10秒,可能讓整輪迭代從頭來。

AKS新集成了Azure Container Storage的"流式檢查點"功能,把GPU顯存狀態(tài)直接刷進(jìn)NVMe-oF(NVMe over Fabrics)后端,繞過內(nèi)核頁緩存。微軟給出的數(shù)字:175B參數(shù)的模型,checkpoint 時間從4分鐘壓到23秒。

這個數(shù)字被現(xiàn)場一位Google工程師質(zhì)疑過——他懷疑是特定場景優(yōu)化。McKenna的回應(yīng)很直接:「歡迎拿你的 workload 來測,數(shù)據(jù)開源在GitHub?!?/b>

這種"用代碼說話"的姿態(tài),在微軟過去十年的K8s社區(qū)史里并不常見。2014年他們還在推Azure Service Fabric,和K8s正面競爭;2018年被迫"擁抱";2023年開始大規(guī)模 upstream 貢獻(xiàn);到2026年,微軟已經(jīng)是CNCF AI Working Group的聯(lián)合主席。

轉(zhuǎn)變的底層邏輯,McKenna在采訪里點破了:「AI基建的贏家不是擁有最好芯片的人,是讓芯片利用率最高的人。而利用率的上限,由運維成熟度決定?!?/p>

這解釋了為什么微軟愿意把Azure的內(nèi)部工具全開源——標(biāo)準(zhǔn)越統(tǒng)一,他們作為最大云廠商的規(guī)模優(yōu)勢越明顯。就像當(dāng)年AWS推S3 API成為事實標(biāo)準(zhǔn),最后所有對象存儲都得兼容它。

現(xiàn)場一個細(xì)節(jié):微軟展臺隔壁是英偉達(dá),兩家工程師在聯(lián)合演示一個場景——用DRA調(diào)度Grace Hopper超級芯片,同時用Kaito做模型熱更新。這種"競合"在2024年不可想象,當(dāng)時英偉達(dá)還在力推自己的Base Command Manager,和K8s生態(tài)若即若離。

現(xiàn)在英偉達(dá)的態(tài)度變了。他們的GTC 2026演講里,Kubernetes被提及47次,比前一年多一倍。

所以問題拋給讀者:當(dāng)GPU調(diào)度、模型觀測、機(jī)密計算這些高門檻能力,全部被K8s開源社區(qū)" flatten "成標(biāo)準(zhǔn)接口,那些靠私有方案賣高溢價的AIinfra創(chuàng)業(yè)公司,還剩多少窗口期?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
博主被陌生網(wǎng)友辱罵3個月,默默觀察其2年半,終于找到機(jī)會碰面了

博主被陌生網(wǎng)友辱罵3個月,默默觀察其2年半,終于找到機(jī)會碰面了

離離言幾許
2026-03-26 15:01:41
連續(xù)兩個月從中國進(jìn)口鎵鍺為零后,日本宣布無人機(jī)要做世界第一

連續(xù)兩個月從中國進(jìn)口鎵鍺為零后,日本宣布無人機(jī)要做世界第一

小小科普員
2026-03-26 19:07:58
華山醫(yī)院候診屏現(xiàn)“照顧號”引熱議,院方:為75歲以上老人等優(yōu)待群體提供便利

華山醫(yī)院候診屏現(xiàn)“照顧號”引熱議,院方:為75歲以上老人等優(yōu)待群體提供便利

上游新聞
2026-03-26 15:33:08
人類史上最高級零元購,榨干印度200年,留下45萬億天價賬單

人類史上最高級零元購,榨干印度200年,留下45萬億天價賬單

掠影后有感
2026-03-26 10:39:36
喪夫僅5個月,49歲翁帆突傳“喜訊”高調(diào)露面,狀態(tài)好到出人意料

喪夫僅5個月,49歲翁帆突傳“喜訊”高調(diào)露面,狀態(tài)好到出人意料

冷紫葉
2026-03-24 19:12:36
受權(quán)發(fā)布|中華人民共和國國務(wù)院令  第833號

受權(quán)發(fā)布|中華人民共和國國務(wù)院令  第833號

新華社
2026-03-26 17:03:04
4月1日醫(yī)保7號令落地!1965-1985年出生的,這6件事務(wù)必抓緊辦

4月1日醫(yī)保7號令落地!1965-1985年出生的,這6件事務(wù)必抓緊辦

混沌錄
2026-03-25 15:50:11
中方拒收道歉,日本自衛(wèi)官被轉(zhuǎn)移,小泉進(jìn)次郎沉默24小時后發(fā)聲

中方拒收道歉,日本自衛(wèi)官被轉(zhuǎn)移,小泉進(jìn)次郎沉默24小時后發(fā)聲

何氽簡史
2026-03-26 15:40:58
想拿中國尿素救春耕?先把欠中企的百億欠款還了!否則一粒不售

想拿中國尿素救春耕?先把欠中企的百億欠款還了!否則一粒不售

過期少女致幻錄
2026-03-26 11:44:43
引而不發(fā)才是王道,封鎖霍爾木茲海峽,伊朗打完了最后一張牌……

引而不發(fā)才是王道,封鎖霍爾木茲海峽,伊朗打完了最后一張牌……

家傳編輯部
2026-03-26 10:34:27
伊朗稱正在搜捕逃亡美軍

伊朗稱正在搜捕逃亡美軍

界面新聞
2026-03-25 23:21:14
家長違停孩子開門殺撞人后逃逸?交警回應(yīng)

家長違停孩子開門殺撞人后逃逸?交警回應(yīng)

中國新聞周刊
2026-03-26 14:46:51
突發(fā)傳聞:封鎖霍爾木茲的伊朗關(guān)鍵人物被擊斃

突發(fā)傳聞:封鎖霍爾木茲的伊朗關(guān)鍵人物被擊斃

桂系007
2026-03-26 16:19:32
伊朗戰(zhàn)爭還將持續(xù)多久?據(jù)傳特朗普希望4-6周內(nèi)終結(jié)戰(zhàn)事

伊朗戰(zhàn)爭還將持續(xù)多久?據(jù)傳特朗普希望4-6周內(nèi)終結(jié)戰(zhàn)事

財聯(lián)社
2026-03-26 18:29:05
張雪峰奶奶近況令人擔(dān)憂,4年內(nèi)子孫相繼離世,不設(shè)追思會瞞著她

張雪峰奶奶近況令人擔(dān)憂,4年內(nèi)子孫相繼離世,不設(shè)追思會瞞著她

古希臘掌管松餅的神
2026-03-26 11:29:25
堅決反對中國任何城市申辦奧運會,國際奧委會這次怕是真失算了

堅決反對中國任何城市申辦奧運會,國際奧委會這次怕是真失算了

南權(quán)先生
2026-03-25 15:25:11
張雪峰猝然離世,辦公室內(nèi)景曝光,擺設(shè)奇怪,寫真照被指像遺照,生前的話字字催淚

張雪峰猝然離世,辦公室內(nèi)景曝光,擺設(shè)奇怪,寫真照被指像遺照,生前的話字字催淚

筆墨V
2026-03-26 14:53:51
41歲張雪峰去世后續(xù),其婚姻被扒,已離婚6年,前妻很低調(diào)

41歲張雪峰去世后續(xù),其婚姻被扒,已離婚6年,前妻很低調(diào)

180視角
2026-03-26 13:01:03
斯柯達(dá)退出中國?大眾中國回應(yīng):銷售持續(xù)至年中,客戶將持續(xù)獲得全面售后支持

斯柯達(dá)退出中國?大眾中國回應(yīng):銷售持續(xù)至年中,客戶將持續(xù)獲得全面售后支持

澎湃新聞
2026-03-26 17:02:26
一覺醒來,愛吃活魚的人天塌了,央視曝光的內(nèi)幕真可怕!

一覺醒來,愛吃活魚的人天塌了,央視曝光的內(nèi)幕真可怕!

濤哥銳評
2026-03-26 17:57:04
2026-03-26 20:35:00
硬核玩家2哈
硬核玩家2哈
沉淀中,勿擾
170文章數(shù) 0關(guān)注度
往期回顧 全部

科技要聞

Meta高管狂分百億期權(quán),700名員工卻下崗

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財經(jīng)要聞

油價"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

教育
家居
手機(jī)
藝術(shù)
數(shù)碼

教育要聞

2026人工智能時代下的教育課堂變革

家居要聞

傍海而居 靜觀蝴蝶海

手機(jī)要聞

狂攬307萬!紅米殺瘋了:K90破150萬、Turbo 5破百萬,性價比贏麻

藝術(shù)要聞

哪一座橋不是風(fēng)景?

數(shù)碼要聞

1+4核,英特爾酷睿3 304處理器現(xiàn)身基準(zhǔn)測試

無障礙瀏覽 進(jìn)入關(guān)懷版