国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Kimi K2.6 開源直逼 GPT-5.4:漲 58% 的 API 定價,暴露了月之暗面的真實(shí)意圖

0
分享至


4月20日晚間,月之暗面(Moonshot AI)正式發(fā)布并開源最新旗艦?zāi)P?Kimi K2.6。該模型在長程編碼、Agent 集群調(diào)度及自主執(zhí)行能力上實(shí)現(xiàn)顯著躍升,多項(xiàng)基準(zhǔn)測試成績持平或超越 GPT-5.4、Claude Opus 4.6 等國際頂尖閉源模型。

一周之內(nèi),Anthropic 發(fā)布 Claude Opus 4.7、阿里推出 Qwen3.6-Max-Preview,DeepSeek V4 亦將于下旬發(fā)布。Kimi K2.6 在這個密集窗口期登場,是月之暗面在 AI 競爭從"算法創(chuàng)新"轉(zhuǎn)向"工程化落地"關(guān)鍵節(jié)點(diǎn)的一次戰(zhàn)略展示。

長程編碼:從單輪補(bǔ)全到系統(tǒng)級優(yōu)化


與此前大模型在代碼任務(wù)中多局限于"單輪補(bǔ)全"或"簡單腳本編寫"不同,Kimi K2.6 的核心進(jìn)步在于處理復(fù)雜系統(tǒng)工程的能力。據(jù)官方技術(shù)博客披露,K2.6 可自主完成從需求分析、代碼實(shí)現(xiàn)、測試驗(yàn)證到性能優(yōu)化的全流程閉環(huán),單次任務(wù)可修改超過 4000 行代碼。

兩項(xiàng)實(shí)測案例展現(xiàn)了這一能力。

案例一:Zig 語言重寫推理引擎

在 Mac 本地部署 Qwen3.5-0.8B 模型時,K2.6 跨語言使用小眾的 Zig 語言進(jìn)行推理優(yōu)化,歷經(jīng) 12 小時連續(xù)運(yùn)行、4000 余次工具調(diào)用及 14 輪迭代,將推理吞吐量從 15 tokens/s 提升至 193 tokens/s,最終速度超越主流推理框架 LM Studio 約 20%。


案例二:8 年引擎的性能重構(gòu)

在對擁有 8 年歷史的開源金融撮合引擎 exchange-core 的優(yōu)化中,K2.6 在 13 小時的執(zhí)行過程中迭代了 12 種優(yōu)化策略,發(fā)起 1000 余次工具調(diào)用,通過分析 CPU 與內(nèi)存火焰圖定位隱藏瓶頸,將核心線程拓?fù)鋸?4ME+2RE 重構(gòu)為 2ME+1RE。即便引擎已接近性能極限,K2.6 仍將中位吞吐量從 0.43 提升至 1.24 MT/s(提升 185%),峰值吞吐量從 1.23 提升至 2.86 MT/s(提升 133%)。


"這不再是簡單的'做題',而是在解決真實(shí)的工程問題。"多位開發(fā)者在體驗(yàn)后反饋,K2.6 已具備從編碼到前端設(shè)計(jì)再到全棧交付的專業(yè)級 Web 應(yīng)用構(gòu)建能力。在官方的 Code-Driven Design 內(nèi)部評測中,K2.6 在落地頁構(gòu)建、全棧應(yīng)用開發(fā)等四類任務(wù)上表現(xiàn)接近 Google AI Studio。

基準(zhǔn)測試:編碼領(lǐng)先,推理仍有差距

官方公布的基準(zhǔn)測試數(shù)據(jù)顯示,K2.6 在工程類任務(wù)中全面領(lǐng)先,但純推理能力與國際頂尖閉源模型仍有距離。


編碼與 Agent 任務(wù)方面,K2.6 在 SWE-Bench Pro 中取得 58.6%,領(lǐng)先所有參與對比的模型;在 Terminal-Bench 2.0 中以 66.7% 超越 GPT-5.4 和 Claude Opus 4.6 的 65.4%;在博士級難度的 Humanity's Last Exam(工具增強(qiáng)版)中以 54.0% 位居第一;DeepSearchQA 的 F1 分?jǐn)?shù)達(dá) 92.5%,大幅領(lǐng)先 GPT-5.4 的 78.6%。

然而,在不使用工具的純推理測試中,K2.6 的短板同樣明顯。HLE-Full 僅得 34.7%,低于 GPT-5.4 的 39.8% 和 Gemini 3.1 Pro 的 44.4%;在視覺推理類基準(zhǔn)如 MathVision(87.4% vs GPT-5.4 的 92.0%)上,差距同樣存在。這套基準(zhǔn)測試描繪了一個清晰的輪廓:K2.6 的工程化與工具調(diào)度能力已躋身全球第一梯隊(duì),但在純粹的知識推理和視覺理解層面,仍需持續(xù)追趕。

Agent 集群:300 子 Agent 并行,協(xié)作步驟三倍擴(kuò)展

K2.6 的 Agent 集群架構(gòu)相比 K2.5 實(shí)現(xiàn)了三倍量級的擴(kuò)展——子 Agent 從 100 個提升至 300 個,協(xié)作步驟從 1500 步擴(kuò)展至 4000 步。這種橫向擴(kuò)展的"群體智能"架構(gòu)使 K2.6 能夠在一次自主運(yùn)行中并行完成深度搜索、文檔分析、網(wǎng)頁生成、PPT 制作和表格輸出的端到端交付。

案例:天體論文一鍵轉(zhuǎn)化為學(xué)術(shù)技能

K2.6 驅(qū)動的 Agent 集群將一篇天體物理論文轉(zhuǎn)化為可復(fù)用的學(xué)術(shù)技能,最終產(chǎn)出一份 7000 字的研究論文、一個包含 2 萬多條數(shù)據(jù)記錄的結(jié)構(gòu)化數(shù)據(jù)集及 14 張?zhí)煳募増D表。上傳的文檔格式不受限——PDF、表格、PPT、Word 均可轉(zhuǎn)化為技能資產(chǎn)。


官方案例視頻截圖

在招聘場景中,Agent 集群可基于上傳的簡歷自動生成 100 個子 Agent,分別為用戶匹配 100 個加州崗位并定制化簡歷。官方博客還展示了 30 家零售門店的本地化頁面生成案例,300 個子 Agent 各自完成從文案撰寫到落地頁構(gòu)建的全流程。

更值得關(guān)注的是 Claw Groups 的研究預(yù)覽。這是一個異構(gòu) Agent 生態(tài),允許來自不同設(shè)備、運(yùn)行不同模型、攜帶各自工具鏈的 Agent 與人類作為真正的協(xié)作者共同運(yùn)行。K2.6 在其中擔(dān)任自適應(yīng)協(xié)調(diào)者,根據(jù)技能畫像動態(tài)匹配任務(wù),并在 Agent 故障或卡頓時自動重新分配。

月之暗面透露,內(nèi)部團(tuán)隊(duì)已使用 Claw Groups 運(yùn)行端到端的內(nèi)容生產(chǎn)和營銷活動。這一布局顯示出月之暗面正試圖從單一模型提供商向 Agent 生態(tài)基礎(chǔ)設(shè)施服務(wù)商轉(zhuǎn)型。

商業(yè)化:輸入成本上漲 58%

在商業(yè)層面,以美元計(jì)價,Kimi API K2.6 每百萬 Token 的輸入價格(緩存未命中)為 $0.95,較 K2.5 的 $0.60 上漲約 58%;輸出價格為 $4.00,較 K2.5 的 $3.00 上漲約 33%;緩存命中價格則為 $0.16/MTok。上下文窗口為 262,144 tokens(約 256K)。


價格調(diào)整背后,是長程編碼與 Agent 自主運(yùn)行帶來的 Token 消耗遠(yuǎn)超傳統(tǒng)對話模型。K2.6 支持最長 5 天的持續(xù)自主運(yùn)行,官方內(nèi)部團(tuán)隊(duì)已使用 K2.6 驅(qū)動的 Agent 獨(dú)立運(yùn)行 5 天,完成監(jiān)控、事件響應(yīng)和系統(tǒng)運(yùn)維任務(wù)。這意味著單位任務(wù)中的 Token 消耗量遠(yuǎn)非普通 API 調(diào)用可比。

與此同時,Kimi Agent 模式已內(nèi)置上百個官方推薦技能,并支持將任意高質(zhì)量文件——PDF、表格、PPT、Word 文檔——轉(zhuǎn)化為可復(fù)用技能,捕獲并保存文檔的結(jié)構(gòu)與風(fēng)格特征。這種將非結(jié)構(gòu)化數(shù)據(jù)標(biāo)準(zhǔn)化為"技能資產(chǎn)"的能力,是月之暗面在企業(yè)服務(wù)市場構(gòu)建壁壘的關(guān)鍵布局。

在 Meta 發(fā)布閉源旗艦 Muse Spark 的行業(yè)背景下,月之暗面堅(jiān)持將 K2.6 全面開源。

月之暗面創(chuàng)始人楊植麟在 3 月 26 日的中關(guān)村論壇年會上明確表態(tài):"如果模型能力能做到一樣的水平,開源會是絕對的勝利。"在他看來,開源的核心價值在于構(gòu)建生態(tài)共贏的合作模式,通過催生海量應(yīng)用場景,形成遠(yuǎn)超閉源模式的市場總量。

Kimi K2.6 的開源,正是這一邏輯的延續(xù)。但開源并不等于免費(fèi)——API 定價的上漲表明,月之暗面正通過分級計(jì)費(fèi)策略,在保障高端企業(yè)用戶服務(wù)質(zhì)量的同時探索可持續(xù)的 B 端盈利模式。

隨著 DeepSeek V4、阿里 Qwen3.6 等重磅模型的集體登場,2026 年大模型行業(yè)的洗牌已然加速。K2.6 的基準(zhǔn)測試成績證明,國產(chǎn)開源模型已在工程化場景中站穩(wěn)第一梯隊(duì),但在純推理和視覺理解能力上仍有追趕空間。開源社區(qū)的繁榮與商業(yè)化變現(xiàn)之間的平衡,仍是月之暗面乃至整個行業(yè)接下來必須面對的長期考題。(本文首發(fā)鈦媒體APP,作者 | AGI Signal,編輯 | 秦聰慧)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
研究發(fā)現(xiàn):宇宙并不是無限大的,它的邊界就在140億光年外

研究發(fā)現(xiàn):宇宙并不是無限大的,它的邊界就在140億光年外

觀察宇宙
2026-04-21 21:58:45
14歲女孩KTV醉酒后,被前臺帶到酒店開房:女孩醒來意識到遭侵犯

14歲女孩KTV醉酒后,被前臺帶到酒店開房:女孩醒來意識到遭侵犯

江山揮筆
2026-04-22 11:13:58
上海樓市開啟深度重構(gòu)大洗牌!莘莊房價賣9萬平,相鄰的梅隴竟暗藏大招?

上海樓市開啟深度重構(gòu)大洗牌!莘莊房價賣9萬平,相鄰的梅隴竟暗藏大招?

墜入二次元的海洋
2026-04-21 16:54:13
美媒稱,伊朗戰(zhàn)爭證明,造價3000萬美元的死神無人機(jī),已經(jīng)落伍了

美媒稱,伊朗戰(zhàn)爭證明,造價3000萬美元的死神無人機(jī),已經(jīng)落伍了

南宗歷史
2026-04-22 09:05:07
052D穿過日本橫當(dāng)水道!這步棋有多狠?

052D穿過日本橫當(dāng)水道!這步棋有多狠?

牲產(chǎn)隊(duì)
2026-04-20 22:21:15
李善長被押刑場沒求情,只問朱元璋:我死不冤,陛下還要?dú)讉€?

李善長被押刑場沒求情,只問朱元璋:我死不冤,陛下還要?dú)讉€?

歷史甄有趣
2026-04-21 09:30:19
快訊!伊朗傳來新消息!

快訊!伊朗傳來新消息!

達(dá)文西看世界
2026-04-22 08:12:57
LGD裁員!65個月薪補(bǔ)償!

LGD裁員!65個月薪補(bǔ)償!

中國半導(dǎo)體論壇
2026-04-21 21:16:41
49歲翁帆高調(diào)露面!換造型驚艷全場,一句話讓英國定居傳聞破滅

49歲翁帆高調(diào)露面!換造型驚艷全場,一句話讓英國定居傳聞破滅

一盅情懷
2026-03-16 16:58:07
爆冷!1-1!亨德森31分,賽后克林根沖進(jìn)場內(nèi) 亨德森接受記者采訪

爆冷!1-1!亨德森31分,賽后克林根沖進(jìn)場內(nèi) 亨德森接受記者采訪

擔(dān)酒
2026-04-22 10:49:02
李夢楊力維馳援?世界杯分組,中國女籃下下簽,和美國意大利同組

李夢楊力維馳援?世界杯分組,中國女籃下下簽,和美國意大利同組

東球貓貓
2026-04-22 08:59:04
大命局:東方大國此次是終極崛起,西方再無超越的可能

大命局:東方大國此次是終極崛起,西方再無超越的可能

趣味萌寵的日常
2026-04-22 10:09:08
牛肉頂多注個水豬肉頂多催個肥,唯有三文魚全程cosplay

牛肉頂多注個水豬肉頂多催個肥,唯有三文魚全程cosplay

富貴說
2026-04-14 23:15:09
2026年一季度消費(fèi):汽車、彩電、空調(diào)全線下跌

2026年一季度消費(fèi):汽車、彩電、空調(diào)全線下跌

風(fēng)向觀察
2026-04-21 09:27:07
皮尤民調(diào):美國民眾對中國好感度連續(xù)三年回升

皮尤民調(diào):美國民眾對中國好感度連續(xù)三年回升

留學(xué)咖啡館
2026-04-21 08:33:00
召回李夢楊力維?中國女籃下下簽,與美意同組,宮魯鳴需作出改變

召回李夢楊力維?中國女籃下下簽,與美意同組,宮魯鳴需作出改變

萌蘭聊個球
2026-04-22 09:27:53
“普通家庭,咋敢吃這么貴的早餐?”一碗12元的抄手,讓母親崩潰

“普通家庭,咋敢吃這么貴的早餐?”一碗12元的抄手,讓母親崩潰

妍妍教育日記
2026-04-22 07:50:03
江蘇省北部曾有多個湖泊,有的面積堪比太湖,為何今天均已消失

江蘇省北部曾有多個湖泊,有的面積堪比太湖,為何今天均已消失

潯陽咸魚
2026-04-21 15:10:09
你們都是什么時候?qū)δ信麻_竅的?網(wǎng)友:果然還是攔不住有心人

你們都是什么時候?qū)δ信麻_竅的?網(wǎng)友:果然還是攔不住有心人

夜深愛雜談
2026-02-21 21:37:02
孕晚期女子征婚:接受腹中胎兒,不要彩禮,評論區(qū)一點(diǎn)面子都不給

孕晚期女子征婚:接受腹中胎兒,不要彩禮,評論區(qū)一點(diǎn)面子都不給

譚談社會
2026-04-21 00:12:25
2026-04-22 12:12:49
鈦媒體APP incentive-icons
鈦媒體APP
獨(dú)立財(cái)經(jīng)科技媒體
132572文章數(shù) 862112關(guān)注度
往期回顧 全部

科技要聞

凌晨突發(fā)!ChatGPT Images 2.0發(fā)布

頭條要聞

柬埔寨國王在京手術(shù) 洪森攜子看望:感謝中方

頭條要聞

柬埔寨國王在京手術(shù) 洪森攜子看望:感謝中方

體育要聞

一到NBA季后賽,四屆DPOY就成了主角

娛樂要聞

復(fù)婚無望!baby黃曉明陪小海綿零交流

財(cái)經(jīng)要聞

伊朗拒絕出席 特朗普宣布延長?;鹌谙?/h3>

汽車要聞

四款全球首秀+AI落地 大眾汽車集團(tuán)在華轉(zhuǎn)型全面提速

態(tài)度原創(chuàng)

數(shù)碼
教育
房產(chǎn)
家居
軍事航空

數(shù)碼要聞

來酷AI MINI PRO迷你主機(jī)上架:"Lunar Lake"平臺,3799元起

教育要聞

博主分享數(shù)學(xué)速算技巧,三位數(shù)的平方輕松算出來,網(wǎng)友:干嘛不用計(jì)算器

房產(chǎn)要聞

年薪40-50萬!海南地產(chǎn)圈還在猛招人

家居要聞

極簡繪夢 克制和諧

軍事要聞

特朗普宣布延長?;?伊朗表態(tài)

無障礙瀏覽 進(jìn)入關(guān)懷版