国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Kimi Agent產(chǎn)品很厲害,然后呢?

0
分享至



眨眼間,2026年2月了,

AI界的春節(jié),

真的是模型下餃子。

當下,有三件事值得看,

1. ClaudeOpus4.6(閉源)

+Claude Sonnet 4.6(閉源)



2. GPT-5.3-Codex(閉源)

+ Germini 3.1 Pro(閉源)

3. KimiAgent產(chǎn)品

+Kimi K2.5模型(開源)



畢竟,閉源模型能知道的不多,

也就開源的有技術(shù)報告可以挖挖。

這一次,我和以下專家進行討論:

武漢人工智能研究院研究員朱貴波博士,

華為盤古大模型核心算法工程師,

阿里云無影AgentBay工程師,

波士頓動力(Boston Dynamics)強化學(xué)習(xí)算法工程師,

一位Kimi的產(chǎn)品同學(xué)。

我尊重專家的匿名意愿。



幾個核心觀察,

1.Agentic模型已是當下主流,打法是啥?

有別于此前(約12個月前)的推理模型,

大模型公司沒有拿得出手的這類Agentic模型,

面子砸在地板上。那打法是啥?



第一,如果模型與產(chǎn)品的協(xié)同得不好,

模型就會替代產(chǎn)品,

甚至“蠶食”產(chǎn)品功能。

Cursor被ClaudeCode賦予了更強的產(chǎn)品能力,

但是ClaudeCode出來也快干掉Cursor了。

包括Claude Cowork問世,

也干掉了一些創(chuàng)業(yè)公司。

模型能力增長干掉產(chǎn)品,干掉創(chuàng)業(yè)公司,

在AI圈不是新聞。

當然,Agentic模型還有更大的甜點,

在于和MaaS平臺協(xié)同,這個此處按下不表,

另篇他論。

第二,模型和產(chǎn)品協(xié)同得好,

模型讓產(chǎn)品贏在起跑線。

Agentic模型為提高了產(chǎn)品贏的概率,

產(chǎn)品經(jīng)理有機會做出更強的產(chǎn)品,

因為,內(nèi)建的“執(zhí)行能力”在處理復(fù)雜任務(wù)上,

比從產(chǎn)品層面處理,高了一個維度。

Agentic模型的這種訓(xùn)練,

不僅有目的,而且有針對性,

這個思路的效果,在KimiAgent產(chǎn)品上能看到。

整體上,是存在模型往上螺旋上升,

蠶食產(chǎn)品的現(xiàn)象,

所以,產(chǎn)品只能被逼著繼續(xù)往上去卷新的場景。

但是到底哪個速度更快?

哪個影響力更大?尚未定論。

2.很多老金礦的價值,誰都不能低估。

第一,強化學(xué)習(xí)是口老金礦,

單輪反饋強化學(xué)習(xí)卷完,卷Agentic RL,

Kimi和Anthropic在卷群體智能強化學(xué)習(xí),

Opus 4.6模型和Kimi K2.5模型都用到了。

群體智能強化學(xué)習(xí)思路很簡潔,

但是怎么實現(xiàn)成為關(guān)鍵,

理論牛不牛似乎不在是決定性,

誰能用極致工程能力做出來,

在更大的規(guī)模上做出來,效果好,誰才牛。



第二,與視覺模態(tài)融合也是老金礦,

視覺給模型加持能力,

本質(zhì)是模態(tài)融合得好,

理解能力進一步提高,

場景價值也能突顯,

比如,Agent這個場景,

它會因為視覺的存在更加智能。

篇幅有限,挑重點講,后面再寫。



Agentic模型到底在卷什么?

先談Agentic模型,

也就是專注Agent的這種,

不是光吐字那種,

比如,KimiAgent在辦公場景

(牛馬大戰(zhàn)PDF/Excel等),

直接6到飛起。

不用Ctrl+C按到手抽筋了,

這里的干活是指動手干辦公室臟活累活(任務(wù)),

不是吐字寫稿那種。

我有一個word列表,每年都整理,

文章標題,發(fā)稿時間,閱讀量,點贊數(shù)……

全年的量也不少,

再讓我手動粘成excel表,

想得美,

我的耐心,

已經(jīng)在做Word文件的時候用完了。

這事必須AI來。

好處享受了,看看原理。

Kimi K2.5模型開源了,還配有技術(shù)報告:

《Kimi K2.5: Visual Agentic Intelligence》?!?/p>



Kimi的節(jié)奏一向很快,

早在2025年11月中旬,

Kimi Agent的底層模型,

還是Kimi K2 Thinking模型,

到2025年12月的時候,

Kimi的Agent模式的底層模型是

Kimi K2.5。

可以看到,K2.5是典型的Agentic模型。

這模型有啥好?

當然,我可以捏著鼻子,

學(xué)ChatGPT說話:

“這類大模型性能的提升,

標志著人工智能向自主,

深度思考,工具協(xié)作的方向邁出了重要一步?!?/p>

Agentic模型為啥強?

在我眼里,大模型的本質(zhì)就是,

你喂給它啥,它就會啥。

你想讓它會使用工具,

那就給它喂調(diào)用工具的數(shù)據(jù)。

當下是這類模型的時間窗口期,

廠商為了搶奪排位,又不少花錢,

沒有萬卡,很難加入戰(zhàn)斗。

而譚老師我買Claude Code會員的錢,

都快要辦分期了。

造的人和用的人都狠狠花錢,

AI再繼續(xù)漲價,人類可能要從昂貴的AI手里,

把失去的工作搶回來了。

聊完錢,再聊能力。

Agentic能力變強到底指啥能力變強?

指的是模型在干活的時候,

如何自己拿主意干活,

如何分步驟思考

如何把活干完,

數(shù)據(jù)就需要是:

工具怎么調(diào)用來的?調(diào)用的結(jié)果是啥?

你想讓它按步驟干活,

那干的活需要分哪幾個步驟等等。

總結(jié)下來就是:

第一,干活前,分解規(guī)劃:拆任務(wù),拆步驟;

第二,多個工具一起干活,

該用哪個工具,還用得好。

第三,在相對長的時間內(nèi),執(zhí)行多輪交互的任務(wù)。

第四,任務(wù)中,能來回調(diào)整,干出好結(jié)果。

這四個能力怎么訓(xùn)練得到,就得廠商各自摸索。

常見的技術(shù):

多任務(wù)管理、跨模態(tài)處理、長時推理。

目標都是提高模型干活時的能力。



過程就是把干活的那個結(jié)果寫訓(xùn)練到模型里面。

Kimi產(chǎn)品同學(xué)說得很中肯,

“Kimi的Agent模式有了智能體的這種智能感”,

他也謙虛地說:

“但是,絕大多數(shù)有生產(chǎn)力價值的這種場景,

其實AI還是沒有服務(wù)得很好。

最核心的是,把模型能力做好,

排在對產(chǎn)品差異化的考慮之前?!?/p>

聽他這么說,相信Kimi內(nèi)部,

對于模型和產(chǎn)品的博弈哲學(xué)有很深的思考。



強化學(xué)習(xí)這口老金礦,Kimi怎么挖的?

智能體從串行到并行了?

不能這么說。為此,

我請教了波士頓動力公司強化學(xué)習(xí)算法工程師,

他這樣告訴我:

群體智能(Swam)不是新概念。

本質(zhì)上,智能體可以是一個比較強的中央式系統(tǒng)。

而這種多智能體系統(tǒng)是什么樣的呢?

首先,有一個比較強的中央系統(tǒng),

再加上一堆執(zhí)行器,

你可以理解為,它大腦很強。

但是,實際去執(zhí)行工作的那些末端,

是飛機也好,是機器人也好,

甚至是一些小東西,

比如這些個程序也好,

所執(zhí)行的東西并不復(fù)雜。

像Anthropic公司的Opus 4.6那樣,

它主要的工作其實是調(diào)度各種模型的過程。

這個調(diào)度本身并不復(fù)雜,

關(guān)鍵在于每個模型本身的執(zhí)行能力,

這些模型每個都非常強大。

以前的智能體,每個智能體的算力可能沒那么強,

更多是依靠“大腦”來給它們詳細具體指令,

甚至包括一些細微的操作。

指導(dǎo)不細,干不好。

現(xiàn)在的這種智能體,你可以理解為,

它們之間的交流,

更像更接近于人與人之間的交流方式了。

這是因為本體智能的能力的上限不斷提升,

同時,能夠完成的任務(wù)周期時間也會越來越長。

所以說,智能體通過這樣的協(xié)作的模式的轉(zhuǎn)變,

辦事方式有變化。

過去的智能體怎么辦事呢?

一個智能體在那吭哧吭哧搞很久很久。

但是,這么玩是有上限的,

任務(wù)的復(fù)雜度不可能是非常高。

而現(xiàn)在挑戰(zhàn)不同了,

寫一個編譯器(Compiler)。

那么復(fù)雜的工作,僅僅通過一條提示詞,

或者說現(xiàn)在單個智能體能干的活,

以前的智能體做不到,因為上難度了。

編譯器現(xiàn)在被Anthropic做到了,

雖然這是一個昂貴實驗(2萬美元)。



在這個背景下的話,

你如何把多個智能體的智力按什么方式融合。

我覺得,在這個時間點上的話,

大家都已經(jīng)在往這個群體智能的方向去想了。

另外,本質(zhì)上,

這也是一種Scaling(規(guī)模擴展)技術(shù).

過去,我們在擴展能力時,

主要是通過增加模型的上下文長度

(Context length),

和擴展模型的參數(shù)量來實現(xiàn)。

現(xiàn)在,擴展的重點變成了增加智能體的數(shù)量。

以前有過討論:如果我投入相同的算力,

是應(yīng)該擴展智能體的數(shù)量,

還是應(yīng)該擴大每個子智能體的規(guī)模,

讓它們具備更強的記憶能力?

這兩種方式大家都探索過很多,

很值得繼續(xù)討論,

如果你有好觀點,也歡迎探討交流。

再細看Kimi K2.5,

會發(fā)現(xiàn)一個有意思的點:

K2.5的Agent Swarm,

有一個Orchestrator(可訓(xùn)練編排器)

每個智能體都被分配了具體的任務(wù)。

比如,AI研究員、物理研究員、

生命科學(xué)研究員等,

這是中心化的思路。



每個智能體的訓(xùn)練目標是幫助整體群體完成任務(wù),

而不是單獨優(yōu)化自身行為。

這個獎勵函數(shù)用來衡量群體任務(wù)完成的質(zhì)量,

由三個方面組成。

首先是并行度,任務(wù)越多、

智能體能同時完成的子任務(wù)越多,獎勵就越高。

其次是每個子任務(wù)完成的情況,

任務(wù)完成得越好,獎勵越高。

最后是整體任務(wù)的完成情況,

如果整體任務(wù)成功了,獎勵就越大。

獎勵也不是簡單的累計。

并行度和子任務(wù)完成度兩個方面的獎勵

有兩個權(quán)重,一個叫λ1,一個叫λ2。

接下來調(diào)整權(quán)重,

最后,還是以總體任務(wù)的成功率為準,給獎勵。

另外,資源限制方面,就是任務(wù)也不能無限多。

而Kimi K2.5訓(xùn)練數(shù)據(jù)的獲取方式,

主要是通過合成的方式,

即拿到“提示詞訓(xùn)練集”(Prompt Construction)。

Kimi K2.5展現(xiàn)了群體智能的潛力,

好巧不巧,這點和Opus 4.6,

“英雄所干略同”。





視覺是一等公民了嗎?

我們接著聊,

譚老師我歷來把視覺作為重點,

從未敢輕視。

有文章為證《2023年終盤點:圖文大模型編年簡史》

Kimi K2.5也把視覺視為重點,

你在知乎上好好看看Kimi的VLM算法小哥哥寫的感想,

發(fā)自內(nèi)心的成就感,噴薄而出。

反觀有的大廠,GitHub口碑真是不忍直視。

其實,Kimi K2.5技術(shù)報告有幾個重點:

一個是視覺,一個是群體智能;

你說是什么超級革新的方法嗎?

表面上看都不是,

專家笑談:“這個方法雖然大家都知道,

但是真正訓(xùn)出來的,也沒幾家?!?/p>

我始終認為,視覺是一個要死磕的技術(shù)路線,

最堅定的追隨者,非谷歌Gemini莫屬,

人家從頭到尾,一路死磕融合。

Nano、Banana這些小模型做PPT,

畫圖、文生圖效果賊穩(wěn),

現(xiàn)在連學(xué)生寫論文都用Gemini畫流程圖了

那些字、那些示意框,比以前準太多。

提示詞遵循得特別好,

畫流程圖時字在哪、

箭頭怎么指都明明白白。

這也是同一棵果樹上摘的果子(重視視覺融合)。

Kimi這次也是摘到果子了。

他們的算法工程師,

不認為K2.5是一個傳統(tǒng)意義上的VLM。

MoonViT這個架構(gòu),

對前序工作借鑒的基礎(chǔ)上,

數(shù)據(jù)上下的功夫也不少,

扛住了預(yù)訓(xùn)練視覺數(shù)據(jù)15T總訓(xùn)練量的規(guī)模,

圖片是2維,視頻3維,

給視覺提供了多一維度的信息量,

只要能處理的好額外學(xué)習(xí)時序和動態(tài)這部分獨特的能力,

性能可按預(yù)期提升。

K2.5所用的方法,

總是深思熟慮且實用,

比如,用一個極小的輸入來激活視覺能力,

這樣不僅有效,

且避免了傳統(tǒng)方法中,

對大量視覺數(shù)據(jù)的依賴。

通過冷啟動,讓模型能夠迅速啟動視覺能力,

使得視覺信息直接融入到文本推理過程當中。

用有限的數(shù)據(jù)量,

激活視覺能力。



這樣,有了K2 Thinking的能力,

(也就是上一版發(fā)純文本模型的能力),

視覺能力強,

Tool use能力也很強。

力圖多訓(xùn)練出一個維度,

性能就上一個大臺階。

雖然阿里Qwen模型先發(fā)優(yōu)勢極大,

而Kimi呈現(xiàn)出強勢的追趕勢頭。

有好看的了。



One More thing

思考得科幻一些,

AI寫代碼的產(chǎn)品從第一天起,

就是Agent形態(tài)的,

未來,代碼模型和Agent模型,

是否可能會匯合成一套,

反正模型也是把API視為工具的一種,

如果匯合成為一個大類,

而這一類大大有別于大語言模型,

也就是說,這兩類可能會走出模型差異化的道路。

AI的世界,卷卷更精彩。

(放一些PPT成果)



聲明:個人原創(chuàng),僅供參考

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
張本美和賽前總是三鞠躬!外界都以為是在感謝球迷!其實另有隱情

張本美和賽前總是三鞠躬!外界都以為是在感謝球迷!其實另有隱情

浪子阿邴聊體育
2026-04-04 12:34:39
經(jīng)常有學(xué)生喊ching chang chong咋辦?網(wǎng)友:不反擊,他們更猖狂

經(jīng)常有學(xué)生喊ching chang chong咋辦?網(wǎng)友:不反擊,他們更猖狂

帶你感受人間冷暖
2026-04-02 00:20:03
王藝迪被橫掃引質(zhì)疑!三四局領(lǐng)先同等方式輸球,教練暫停也有問題

王藝迪被橫掃引質(zhì)疑!三四局領(lǐng)先同等方式輸球,教練暫停也有問題

籃球資訊達人
2026-04-04 11:50:56
吉林琿烏高速因暴雪致多車相撞,現(xiàn)場一片狼藉!

吉林琿烏高速因暴雪致多車相撞,現(xiàn)場一片狼藉!

吉林烏拉侯
2026-04-04 11:55:58
18歲女棋手與卡爾森自拍后手機被沒收 世界第一向裁判告發(fā)引發(fā)爭議

18歲女棋手與卡爾森自拍后手機被沒收 世界第一向裁判告發(fā)引發(fā)爭議

勁爆體壇
2026-04-04 07:34:09
NASA宇航員飛抵月球背面,Outlook崩了2次

NASA宇航員飛抵月球背面,Outlook崩了2次

硬核玩家2哈
2026-04-03 08:37:26
深夜利空,4股被立案,5股發(fā)退市風(fēng)險提示,18股發(fā)減持公告

深夜利空,4股被立案,5股發(fā)退市風(fēng)險提示,18股發(fā)減持公告

風(fēng)風(fēng)順
2026-04-04 06:59:26
你敢地面入侵,我就派志愿軍!伊朗迎來新幫手,海灣7國沉默不語

你敢地面入侵,我就派志愿軍!伊朗迎來新幫手,海灣7國沉默不語

顧史
2026-04-03 23:27:25
突然變天!中澳航班大面積取消、票價暴漲!真正的危機才剛剛開始…

突然變天!中澳航班大面積取消、票價暴漲!真正的危機才剛剛開始…

澳洲紅領(lǐng)巾
2026-04-04 12:33:04
宅基地審批全面放開?農(nóng)村自建房更方便,但需同時滿足4個條件

宅基地審批全面放開?農(nóng)村自建房更方便,但需同時滿足4個條件

小談食刻美食
2026-04-03 10:02:44
魯山舅舅案還沒完!外甥女再曝新證據(jù),事前人已被拘,果然有貓膩

魯山舅舅案還沒完!外甥女再曝新證據(jù),事前人已被拘,果然有貓膩

青橘罐頭
2026-04-03 07:24:17
烏克蘭首次實現(xiàn)領(lǐng)土凈增長,俄發(fā)動復(fù)活節(jié)空襲大白天狂轟濫炸

烏克蘭首次實現(xiàn)領(lǐng)土凈增長,俄發(fā)動復(fù)活節(jié)空襲大白天狂轟濫炸

史政先鋒
2026-04-04 13:15:03
多地已開啟職稱倒查!已有多人高級職稱被撤銷!

多地已開啟職稱倒查!已有多人高級職稱被撤銷!

黯泉
2026-04-03 20:11:06
太陽報:姆巴佩女友社媒有兩千多萬粉絲,曾與維尼修斯約會過

太陽報:姆巴佩女友社媒有兩千多萬粉絲,曾與維尼修斯約會過

懂球帝
2026-04-04 09:23:13
胡錫進:全國經(jīng)濟形勢向好,國企營收增長只有0.2%,是最差的一年

胡錫進:全國經(jīng)濟形勢向好,國企營收增長只有0.2%,是最差的一年

南權(quán)先生
2026-04-04 05:20:03
調(diào)查!存儲價格“急漲急跌”背后:國內(nèi)現(xiàn)貨一周跌去25%,海外合約價為何暴漲70%

調(diào)查!存儲價格“急漲急跌”背后:國內(nèi)現(xiàn)貨一周跌去25%,海外合約價為何暴漲70%

華夏時報
2026-04-03 17:31:03
伊朗政權(quán)絞死兩名人民圣戰(zhàn)支持者

伊朗政權(quán)絞死兩名人民圣戰(zhàn)支持者

一種觀點
2026-03-30 15:51:17
德國工程師:中國人難道不知南水北調(diào)的弊端,環(huán)保大國稱號何來?

德國工程師:中國人難道不知南水北調(diào)的弊端,環(huán)保大國稱號何來?

心靈得以滋養(yǎng)
2026-03-13 22:44:44
《紐約時報》為美國登月挽尊,NASA局長承認:中國可能更快登月

《紐約時報》為美國登月挽尊,NASA局長承認:中國可能更快登月

共工之錨
2026-04-03 18:46:27
伊朗伊斯蘭革命衛(wèi)隊最新任命

伊朗伊斯蘭革命衛(wèi)隊最新任命

第一財經(jīng)資訊
2026-04-04 13:38:58
2026-04-04 14:11:00
親愛的數(shù)據(jù) incentive-icons
親愛的數(shù)據(jù)
《我看見了風(fēng)暴:人工智能基建革命》一書作者
693文章數(shù) 219913關(guān)注度
往期回顧 全部

科技要聞

內(nèi)存一年漲四倍!國產(chǎn)手機廠商集體漲價

頭條要聞

男子建了18個"5G基站"被政府叫停 發(fā)現(xiàn)紅頭文件為偽造

頭條要聞

男子建了18個"5G基站"被政府叫停 發(fā)現(xiàn)紅頭文件為偽造

體育要聞

剎不住的泰格·伍茲,口袋里的兩粒藥丸

娛樂要聞

闞清子口碑贏了!全開麥跑調(diào)拒絕重唱

財經(jīng)要聞

劉紀鵬:只盼長慢牛,鞏固4000點是關(guān)鍵

汽車要聞

17萬級海豹07EV 不僅續(xù)航長還有9分鐘滿電的快樂

態(tài)度原創(chuàng)

本地
手機
藝術(shù)
時尚
公開課

本地新聞

跟著歌聲游安徽,聽古村回響

手機要聞

三星Galaxy S26 FE手機跑分曝光:Exynos 2500、8GB內(nèi)存

藝術(shù)要聞

王羲之《孝經(jīng)》真跡現(xiàn)身日本!美得難以言表

襯衫+半裙,今年春夏最時髦CP!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版