国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Kimi K2.5來(lái)了:楊植麟親自站臺(tái),還能分身出100個(gè)Agent!

0
分享至


作者 | 王兆洋
郵箱 | wangzhaoyang@pingwest.com

沒(méi)坐在實(shí)木茶幾前,沒(méi)坐在沙發(fā)里,背景也沒(méi)有高雅的綠植映襯,月之暗面的CEO楊植麟在視頻里站著就發(fā)布了Kimi最新的模型K2.5。

而且還是中英文雙語(yǔ)的。

“Hi 大家好,我是植麟。”楊植麟說(shuō)?!癒2.5是我們目前最強(qiáng)大的模型,它是一個(gè)全能模型,不管是視覺(jué)還是文本,對(duì)話還是agent,思考還是非思考——所有這些能力,都集中在這一個(gè)模型里。重要的是,K2.5是一個(gè)開(kāi)源模型?!?/p>

顯然,一個(gè)瘋狂的模型集體更新季到來(lái)了。

而即便如此,在諸多新發(fā)布的模型之間,月之暗面剛剛最新發(fā)布的Kimi K2.5依然區(qū)分度明顯。

根據(jù)Kimi的數(shù)據(jù),K2.5在包括HLE、BrowseComp 和 DeepSearchQA等極具挑戰(zhàn)性的 agent 評(píng)測(cè)中取得了當(dāng)前最佳表現(xiàn)。在編程能力測(cè)試上,它在 SWE-bench Verified 上拿到了 76.8 分,縮小了與頂尖閉源模型之間的差距。多項(xiàng)視覺(jué)理解評(píng)測(cè)上也實(shí)現(xiàn)了當(dāng)前最佳效果。


在這些能力指標(biāo)之外,更重要的是,K2.5是至今為止最能充分展現(xiàn)月之暗面特質(zhì)的一代模型:

這家公司一直被寄予厚望的是它的算法研究和產(chǎn)品創(chuàng)新能力,而這代更全面的模型充分展示了這家公司在研究和產(chǎn)品設(shè)計(jì)上很強(qiáng)的少年氣。

1

先看看K2.5的幾個(gè)核心特點(diǎn):

在模型具體單點(diǎn)的能力上,它終于有了視覺(jué)能力,可以基于視覺(jué),包括圖片和視頻,進(jìn)行理解和推理。同時(shí)它是一個(gè)all in one架構(gòu)的模型,多模態(tài)和文本、思考和快速回答、代碼和agent能力都統(tǒng)一于一個(gè)模型一身。

在月之暗面一直堅(jiān)信的“模型即產(chǎn)品”思路之下,K2.5這次做了多個(gè)很有新意的功能封裝。

它把視覺(jué)和編碼能力結(jié)合,把模型追求的few shots甚至zero shot能力直接體現(xiàn)在Kimi的產(chǎn)品上,你可以用更簡(jiǎn)單的自然語(yǔ)言和更直觀的視覺(jué)編輯的方式,比如直接給他一個(gè)你要的產(chǎn)品的視頻,讓它拆解后還原復(fù)刻,比如直接在生成的UI上圈圈改改,就能完成創(chuàng)作和開(kāi)發(fā)以及修改。

官方給出的一個(gè)用視覺(jué)能力復(fù)刻項(xiàng)目的例子

除了前端設(shè)計(jì),伴隨K2.5,Kimi還推出了Kimi Code,可以在終端里直接運(yùn)行,也能集成到 VSCode、Cursor 等主流編輯器中。你可以直接輸入圖片和視頻進(jìn)行編程輔助,而且它還可以自動(dòng)發(fā)現(xiàn)并將你現(xiàn)有的Skills遷移到新的工作流中。

更亮眼的則是此次發(fā)布的但依然在beta階段的多agent能力。Kimi直接通過(guò)產(chǎn)品把模型訓(xùn)練出來(lái)的“多agent平行與串行調(diào)度能力”封裝提供了出來(lái):

當(dāng)你選擇Agent集群模式,模型開(kāi)始給你打造一個(gè)專業(yè)團(tuán)隊(duì),100個(gè)agent集群可以同時(shí)并發(fā),串行+并行來(lái)完成復(fù)雜任務(wù)。根據(jù)Kimi介紹,這些專項(xiàng) agents 本質(zhì)上都是 K2.5 的“分身”但各自承擔(dān)不同的角色和子任務(wù)。

“沒(méi)有任何預(yù)設(shè)的規(guī)則,所有的角色分配和任務(wù)拆解,都由 K2.5 現(xiàn)場(chǎng)即時(shí)決定。”依然是模型通用能力最終大過(guò)垂直打造工作流的產(chǎn)品思路。

目前Agent 集群功能正在進(jìn)行 Beta 測(cè)試,部分 Kimi 會(huì)員可提前試用,接下來(lái)會(huì)逐漸推廣。

而在這一切的底座上,在模型訓(xùn)練方法以及AI技術(shù)演進(jìn)的方向上楊植麟繼續(xù)完善著他scale to AGI的路線。

在訓(xùn)練上,Agent集群對(duì)模型提出新的要求,Kimi為此重構(gòu)了強(qiáng)化學(xué)習(xí)的基建,專門(mén)優(yōu)化了訓(xùn)練算法,以確保它能達(dá)到極致的效率和性能。

而從K1.5開(kāi)始,每一代的模型其實(shí)都在Scale一個(gè)不同的方向,K1.5 是在 token上繼續(xù)Scale,到了agent能力增強(qiáng)的K2,重點(diǎn)scale 思考的步驟,而K2.5 則是對(duì)agent的規(guī)模,也就是多agent的共同協(xié)作能力做Scale,進(jìn)而保持scale的可延續(xù)。

“Scaling Out, Not Just Up.”

2

這次K2.5讓Kimi變成一個(gè)全面的模型,更難得的,是這些背后都有它自己思路清晰的創(chuàng)新思考。

都說(shuō)scaling law不持續(xù),我就要給你延續(xù)下去,而且是一個(gè)又一個(gè)“新花樣”的延續(xù)。

而且這些Scale的方向后來(lái)也都成為了模型研究界在那一階段的主流。此次的多agent其實(shí)再次把a(bǔ)gent swarm擺到了大家面前,這個(gè)“agent蜂巢”的概念提了很久,這次Kimi用一個(gè)模型來(lái)把它展示出來(lái),接下來(lái)如何提高高并發(fā)、大批量、多樣性以及智能“分身”的能力,會(huì)成為又一個(gè)各大廠商比拼的重點(diǎn)。

在此次的技術(shù)報(bào)告里,Kimi也著重分享了Agent swarm背后的創(chuàng)新。

K2.5使用了一種并行智能體強(qiáng)化學(xué)習(xí)(PARL)的方法進(jìn)行訓(xùn)練,讓模型學(xué)會(huì)自我指導(dǎo)一個(gè)多達(dá)100個(gè)子智能體的蜂群,在最多1500個(gè)協(xié)調(diào)步驟內(nèi)執(zhí)行并行工作流。而這個(gè)過(guò)程里無(wú)需預(yù)定義角色或手工設(shè)計(jì)的工作流。

PARL其實(shí)包括三個(gè)部分,一個(gè)可訓(xùn)練的編排智能體,負(fù)責(zé)拆解任務(wù),“分身”出可并行化的子任務(wù),這些子任務(wù)由動(dòng)態(tài)實(shí)例化的凍結(jié)子智能體執(zhí)行。

這個(gè)訓(xùn)練過(guò)程困難重重,比如當(dāng)你讓它們并行后再串聯(lián)起來(lái)時(shí),很可能會(huì)發(fā)現(xiàn)編排器默認(rèn)退化為了單智能體執(zhí)行,于是一切都崩了。Kimi為解決此問(wèn)題,給PARL采用了分階段獎(jiǎng)勵(lì)塑形,在訓(xùn)練早期鼓勵(lì)并行,并逐步將重心轉(zhuǎn)向任務(wù)成功。


這一套創(chuàng)新帶來(lái)很好的效果。在Kimi的內(nèi)部評(píng)估中,Agent Swarm使端到端運(yùn)行時(shí)間縮短80%,并支持更復(fù)雜的長(zhǎng)周期任務(wù)負(fù)載。


在廣泛搜索場(chǎng)景下,相比單智能體執(zhí)行,它將達(dá)成目標(biāo)性能所需的最小關(guān)鍵步驟減少3至4.5倍,且節(jié)省效果隨目標(biāo)提升而擴(kuò)展——通過(guò)并行化實(shí)現(xiàn)高達(dá)4.5倍的實(shí)際耗時(shí)縮減。

同時(shí),在多模態(tài)上,它不只是給一個(gè)文本模型補(bǔ)上這個(gè)能力就完事了,它同樣展現(xiàn)了自己對(duì)這個(gè)能力究竟能給人們帶來(lái)什么價(jià)值的思考。

眼看人們的創(chuàng)造都已離不開(kāi)AI卻又逐漸淪陷在AI味兒的模版化里無(wú)暇逃離,它就花大力氣去訓(xùn)模型的“美學(xué)品味”。

眼看提示詞工程正變得越來(lái)越懸乎,本該簡(jiǎn)潔的AI交互里,它(很多時(shí)候瞎熱鬧)的復(fù)雜性正被反過(guò)來(lái)用作一種新的FOMO來(lái)源,于是Kimi強(qiáng)化了K2.5的意圖理解能力,并且在交互上做文章——

都知道多模態(tài)是必備能力,但Kimi覺(jué)得它不該是“目的”本身,而應(yīng)該是一把利刃,加持到Coding的能力上去,這樣能讓更多人平等的享受AI帶來(lái)的編程“普惠”紅利,不用陷入提示詞陷阱里去。

有用戶使用K2.5生成的網(wǎng)頁(yè) Prompt: Code me a landing page for a gym super good UI/UX single file html css javascript no limit.

Kimi從成立到今天,有一個(gè)地方一直沒(méi)變,就是它是一個(gè)最有自己想法的,甚至有時(shí)候讓人感到充滿一股中二氣質(zhì)和熱血感的模型公司。

一個(gè)很有意思的地方是,當(dāng)這個(gè)多agent調(diào)用時(shí),它會(huì)給不同agent起名字,在一個(gè)案例里,這些agent的名字中二氣十足:


比起在榜單上對(duì)閉源模型的逼近,其實(shí)今天我們更需要的沒(méi)有被困在某個(gè)階段或是困在原地的模型和公司們,它們能讓人看到繼續(xù)打破一些桎梏往前走的希望,讓人看到一些少年氣,這真的很重要。


點(diǎn)個(gè)愛(ài)心,再走 吧

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
53歲李冰冰在巴黎殺瘋了!白到發(fā)光隱現(xiàn)腹肌,這狀態(tài)真不是人類?

53歲李冰冰在巴黎殺瘋了!白到發(fā)光隱現(xiàn)腹肌,這狀態(tài)真不是人類?

草莓解說(shuō)體育
2026-02-06 05:59:56
比特幣反彈7.64%,市場(chǎng)恐懼指數(shù)仍然為10

比特幣反彈7.64%,市場(chǎng)恐懼指數(shù)仍然為10

財(cái)聞
2026-03-01 10:23:12
新華社快訊:伊朗媒體稱伊朗最高領(lǐng)袖哈梅內(nèi)伊遇害

新華社快訊:伊朗媒體稱伊朗最高領(lǐng)袖哈梅內(nèi)伊遇害

新華社
2026-03-01 09:33:15
河南籍在伊華人逃離德黑蘭:接到大使館通知當(dāng)日乘飛機(jī)離開(kāi),合伙人準(zhǔn)備撤離時(shí)購(gòu)票網(wǎng)站已無(wú)法登錄

河南籍在伊華人逃離德黑蘭:接到大使館通知當(dāng)日乘飛機(jī)離開(kāi),合伙人準(zhǔn)備撤離時(shí)購(gòu)票網(wǎng)站已無(wú)法登錄

大象新聞
2026-02-28 21:46:49
美國(guó)指責(zé)中國(guó)開(kāi)展核爆炸試驗(yàn),外交部:美國(guó)為逃避國(guó)際軍控義務(wù),不惜栽贓抹黑別國(guó)

美國(guó)指責(zé)中國(guó)開(kāi)展核爆炸試驗(yàn),外交部:美國(guó)為逃避國(guó)際軍控義務(wù),不惜栽贓抹黑別國(guó)

每日經(jīng)濟(jì)新聞
2026-02-25 16:40:30
小區(qū)樓上天天晚上都有女的大聲叫。。。

小區(qū)樓上天天晚上都有女的大聲叫。。。

微微熱評(píng)
2025-12-24 00:26:04
美政府“第三國(guó)遣返”政策被裁定違法

美政府“第三國(guó)遣返”政策被裁定違法

參考消息
2026-03-01 14:57:04
下午4點(diǎn),中國(guó)男籃vs中國(guó)臺(tái)北!傳來(lái)1壞消息,爆冷輸球=淪為墊底

下午4點(diǎn),中國(guó)男籃vs中國(guó)臺(tái)北!傳來(lái)1壞消息,爆冷輸球=淪為墊底

侃球熊弟
2026-03-01 00:07:19
中東局勢(shì)對(duì)A股有何影響?短期回調(diào)也是上車機(jī)會(huì),關(guān)注這些板塊

中東局勢(shì)對(duì)A股有何影響?短期回調(diào)也是上車機(jī)會(huì),關(guān)注這些板塊

徐sir財(cái)經(jīng)
2026-03-01 12:55:35
普拉蒂尼:現(xiàn)在沒(méi)有特別突出的球員,上一個(gè)真正杰出的是梅西

普拉蒂尼:現(xiàn)在沒(méi)有特別突出的球員,上一個(gè)真正杰出的是梅西

懂球帝
2026-03-01 01:18:21
又一衛(wèi)健委主任被抓!

又一衛(wèi)健委主任被抓!

梅斯醫(yī)學(xué)
2026-02-28 07:53:41
林彪主持會(huì)議時(shí),輪到陳賡發(fā)言,他卻笑著說(shuō)道:我摸過(guò)林彪的腦殼

林彪主持會(huì)議時(shí),輪到陳賡發(fā)言,他卻笑著說(shuō)道:我摸過(guò)林彪的腦殼

文史明鑒
2026-01-17 23:55:16
OPPO誕生新卷王,7200mAh+100W+IP69防水,國(guó)補(bǔ)后有“真香價(jià)”

OPPO誕生新卷王,7200mAh+100W+IP69防水,國(guó)補(bǔ)后有“真香價(jià)”

小愚測(cè)評(píng)
2026-03-01 15:04:11
伊朗失守的一個(gè)側(cè)面:匯率雙軌,特權(quán)分蛋糕,普通人買單

伊朗失守的一個(gè)側(cè)面:匯率雙軌,特權(quán)分蛋糕,普通人買單

蛙蛙和洼
2026-01-18 09:25:01
山西婚鬧致死案:新郎被4個(gè)伴郎暴打致死,婚禮結(jié)束直接辦喪事

山西婚鬧致死案:新郎被4個(gè)伴郎暴打致死,婚禮結(jié)束直接辦喪事

明智家庭教育
2025-12-02 11:20:34
49歲的特朗普95年來(lái)香港,懷中抱著一位神秘中國(guó)女孩,她是誰(shuí)?

49歲的特朗普95年來(lái)香港,懷中抱著一位神秘中國(guó)女孩,她是誰(shuí)?

板栗說(shuō)事
2025-02-17 07:54:14
伊朗終于發(fā)狠了,打擊力度升級(jí),關(guān)鍵時(shí)刻,掏出中國(guó)一王牌武器

伊朗終于發(fā)狠了,打擊力度升級(jí),關(guān)鍵時(shí)刻,掏出中國(guó)一王牌武器

史智文道
2026-02-28 16:27:37
阿爾茨海默病者逐漸增多,醫(yī)生提醒:50歲后,盡量改掉5個(gè)壞習(xí)慣

阿爾茨海默病者逐漸增多,醫(yī)生提醒:50歲后,盡量改掉5個(gè)壞習(xí)慣

奇妙的本草
2026-03-01 12:01:16
我們瞧不起漂亮國(guó)也不是一天兩天了

我們瞧不起漂亮國(guó)也不是一天兩天了

霹靂炮
2026-02-08 22:17:59
隨著41歲C羅離譜失點(diǎn)+率隊(duì)3-1,沙特聯(lián)榜首易主:利雅得勝利登頂

隨著41歲C羅離譜失點(diǎn)+率隊(duì)3-1,沙特聯(lián)榜首易主:利雅得勝利登頂

側(cè)身凌空斬
2026-03-01 05:16:08
2026-03-01 15:43:00
硅星人 incentive-icons
硅星人
硅(Si)是創(chuàng)造未來(lái)的基礎(chǔ),歡迎來(lái)到這個(gè)星球。
2896文章數(shù) 10458關(guān)注度
往期回顧 全部

科技要聞

小米超跑概念車全球首秀!殺入頂豪俱樂(lè)部

頭條要聞

專家:伊朗局勢(shì)可參考委內(nèi)瑞拉 反美力量將進(jìn)一步削弱

頭條要聞

專家:伊朗局勢(shì)可參考委內(nèi)瑞拉 反美力量將進(jìn)一步削弱

體育要聞

火箭輸給熱火:烏度卡又輸斯波教練

娛樂(lè)要聞

《江山為聘》:吳謹(jǐn)言陳哲遠(yuǎn)燃炸朝堂

財(cái)經(jīng)要聞

中東局勢(shì)升級(jí) 如何影響A股、黃金和原油

汽車要聞

小米汽車2月交付超20000臺(tái) 雷軍:為新SU7量產(chǎn)作準(zhǔn)備

態(tài)度原創(chuàng)

家居
房產(chǎn)
健康
教育
時(shí)尚

家居要聞

素色肌理 品意式格調(diào)

房產(chǎn)要聞

濱江九小也來(lái)了!集齊海僑北+哈羅、寰島...江東教育要炸了!

轉(zhuǎn)頭就暈的耳石癥,能開(kāi)車上班嗎?

教育要聞

五年級(jí)求面積,會(huì)者不難

普通人穿衣不需要太復(fù)雜!顏色恰當(dāng)、搭配和諧,高級(jí)又耐看

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版