国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

實測Kimi首個Agent:智能體與模型之間的區(qū)隔消失了?

0
分享至

這兩天,月之暗面上線了名為 Kimi-Researcher 的產(chǎn)品,以“模型即Agent”的思路切入,標志著其在 Agent 路線上的一次明顯發(fā)力。

如果大家還記得的話,就在 Kimi 發(fā)布的前一天,MiniMax 在 MiniMax Week 的第三天也啟動了通用 Agent 的灰度測試。這兩家此前一度低調(diào)的公司幾乎在同一時段重新進入公眾視野,也讓原本趨于平靜的 AI 四小強格局再次活躍起來。

Kimi、MiniMax、智譜、階躍星辰,這幾位曾經(jīng)在大模型初期階段高頻出現(xiàn)的名字,如今正借助 Agent 的新賽道尋找新的突破口。不管是技術(shù)報告的更新、產(chǎn)品形態(tài)的演進,還是實際功能的迭代,幾家廠商都在以各自的節(jié)奏向外界釋放信號。

這一輪產(chǎn)品集中露面的時間節(jié)點并非巧合。從時機上看,這一波集中亮相并非偶然。當(dāng)前,大模型正從純粹的問答工具演進為具備自主規(guī)劃、任務(wù)執(zhí)行與上下文記憶能力的智能體系統(tǒng)。Agent 正在從“增強生產(chǎn)力”轉(zhuǎn)向“替代部分人類任務(wù)角色”。對于具備模型研發(fā)和產(chǎn)品整合能力的廠商來說,這是一次相對公平的新起點。

01

報告,不只是寫完,還得像

在這樣的背景下,Kimi 推出的 Kimi-Researcher 選擇了一個很明確的切入口:深度研究。

這個定位本身就帶著濃厚的判斷意味。它不打資訊助手、也不打日常問答,而是瞄準了原本需要專業(yè)助理團隊完成的任務(wù),例如梳理產(chǎn)業(yè)政策、比對跨國法規(guī)、生成調(diào)研報告等。

這類任務(wù)對模型的檢索、思考、組織、判斷能力要求極高,幾乎是對 Agent 體系的全方位考驗。

話不多說,我們直接開測。

比如說我想讓它分析下2025年上半年黃金價格波動與美聯(lián)儲政策走向的關(guān)聯(lián)性。

它沒有立刻開始寫,而是反問了我一些問題,從研究邏輯本身出發(fā),主動確認這個任務(wù)到底該怎么做才不空轉(zhuǎn)。

這種主動澄清機制,是過去在 Deep Research(左圖展示為:ChatGPT的 research 模式)里很熟悉的,也不像 MiniMax (右圖展示為MiniMax Agent)那種一口氣跑完所有流程后才看結(jié)果的虛擬機結(jié)構(gòu),更接近一個“你提一個話題,它開始一步步推”的助研模型。

Kimi比GPT更貼心增添了“Include everything”按鈕,不是單純放開信息源,而是直接把它切換到一種更傾向生成完整結(jié)構(gòu)報告的工作狀態(tài)。

經(jīng)過大概十幾分鐘的等待,它一共生成了兩種版本。

一種是我們熟悉的文字版研究報告,段落結(jié)構(gòu)清晰,語氣沉穩(wěn),整體邏輯偏向內(nèi)容層次 + 政策推導(dǎo);另一種則是自動渲染的 HTML 格式報告,已經(jīng)配好封面、標題、摘要、分節(jié)說明,標注出“核心發(fā)現(xiàn)”“關(guān)鍵風(fēng)險”“歷史規(guī)律”這些結(jié)構(gòu)化小標簽。

網(wǎng)頁稿鏈接在這,有興趣的朋友們可以打開看一看:

https://www.kimi.com/preview/d1bpb4criic9fe1hgdk0?blockId=108

內(nèi)容還是很豐富的。

對經(jīng)常要做對內(nèi)材料和對外匯報的人來說,這種“寫+排+渲”一體的體驗,確實提高了交付效率。

你可以把它當(dāng)成是Word+Notion+研究助理的混合體,不僅能輸出內(nèi)容,還知道怎么讓內(nèi)容看起來像一份真的報告。

然后我們也測了測生成PPT的能力。給它的任務(wù)是這樣的:

梳理一下 Stable Diffusion 從最初發(fā)布到最新版本的演進路線,列出各階段關(guān)鍵改進與社區(qū)貢獻節(jié)點,并作出PPT

看起來是一個非常結(jié)構(gòu)化的問題,理論上應(yīng)該正對 Researcher 的下懷。但實際操作過程中,我們也發(fā)現(xiàn)了一些限制。

1. 當(dāng)前版本仍未支持多任務(wù)并行(當(dāng)然,這可能只是內(nèi)測階段的限制,正式版是否優(yōu)化還有待觀察。)

2. 并不能生成傳統(tǒng)PPT,只能是 HTML 格式報告。

我們還是把report鏈接放在這里:

https://www.kimi.com/preview/d1bmvgb1cvf506sb6okg?blockId=108

不過也不能說它表現(xiàn)不好。作為一個學(xué)術(shù)型Agent,它在報告里自動加上了參考文獻鏈接,并用下劃線標注出處??梢酝瓿梢徽卓山桓秲?nèi)容。

而這,恰恰就是很多 AI 工具還停留在段落生成時無法做到的部分。

但當(dāng)我們把這個任務(wù)交給 MiniMax Agent 時,體驗就完全不同了:

它不僅生成了 PPT,還一并打包了 PDF 報告、Markdown 研究文檔、圖表文件、項目任務(wù)表(todo.md)和用于可視化的 Python 腳本。

你可以下載 .pptx 源文件,二次修改內(nèi)容和格式。也能查看 .md 的版本記錄、調(diào)圖的 .py 腳本,每一階段的中間產(chǎn)物全都可查。

從產(chǎn)出形式來看,它給你的是一整個PPT 制作系統(tǒng),而不是一份靜態(tài)報告。

02

Kimi-Researcher和

MiniMax Agent,哪個更適合你

從執(zhí)行力上來說,兩者都已經(jīng)遠超傳統(tǒng)意義上的聊天機器人——你不用再一句一句提示,它們可以自己補全問題、拆解任務(wù),甚至按你沒說出口的邏輯推下去。但使用下來,兩者的Agent 感其實來自不同的方向。

Kimi-Researcher 是任務(wù)導(dǎo)向的,它的邏輯很清楚:你給我一個研究型問題,我就像一個訓(xùn)練過的助理那樣,問你三件事、查五份資料、最后給你一份成稿。

但 MiniMax 不太一樣。

它更像一個運行在虛擬機里的多工系統(tǒng)——你可以把它理解成你裝了一個干活的人,但這個人是你組裝出來的。他自己并不主張“要做研究”還是“要做運營”,而是你怎么設(shè)計,他就按你的指令一步步走。有時候你會覺得,它像是個開著調(diào)試模式的智能體,你能看到它每一步調(diào)用了什么插件、在哪個頁面抓了數(shù)據(jù)、用了哪個文檔里的知識。這種透明度很高的體驗,本質(zhì)上更像是你操控一個流程機器人,而不是和一個人打交道。

如果說 Kimi 是把一個智能體藏在了模型背后,讓你感受到結(jié)果;那 MiniMax 更像是把智能體攤開在你眼前,讓你參與構(gòu)建過程。兩者誰更強,不一定,但它們帶來的使用心智是完全不一樣的。

還有一個重要差別,是默認角色設(shè)定。

Kimi 很明顯是自帶性格的——不夸張地說,它的Researcher標簽決定了它的行為方式,比如它更關(guān)注嚴謹表達、更傾向于做出規(guī)范排版、更容易使用資料比對視角進行總結(jié)。

而 MiniMax 給你的更多是空角色模板——你自己來寫 prompt,自己搭建鏈路,它才啟動真正的 Agent 能力。

我不是說哪個更好,我只是說它們在實現(xiàn)Agent這件事上,走的是完全不同的路徑。

在我們深度體驗兩者后,給出用戶一句話結(jié)論:如果你更在意“我提個需求就能直接拿到結(jié)果”,Kimi 會是更順手的選擇;但如果你希望掌控整個任務(wù)的執(zhí)行流程、甚至自己定義智能體的邏輯結(jié)構(gòu),那 MiniMax 可能更適合你。

03

Kimi 做結(jié)果,MiniMax 做過程

說到底,Kimi 和 MiniMax 的這次同步出招,看起來像是在做 Agent,其實是在做一次底層策略切換。

Kimi 把“模型即 Agent”這件事做得非常徹底。你看不到 Agent 配置、插件安裝、工作流設(shè)計這些 Developer 套路,它不是在鼓勵你搭建 Agent,而是干脆告訴你:“Agent 本身就是模型的一部分了”。你想研究政策,它就用研究員的方式回應(yīng)你。它把智能體的控制權(quán)從用戶界面撤回到了模型內(nèi)部,交給了系統(tǒng)自動調(diào)度。

這一點是很多人沒意識到的。

過去我們理解的智能體,是我來設(shè)計、我來組合,但 Kimi 的思路是,你不需要設(shè)計,你只要告訴我你要什么結(jié)果,我來決定應(yīng)該找誰干活、用什么方法、怎么安排流程。

它把整個 Agent 系統(tǒng)做成了一個黑箱,你丟任務(wù)進去,它自己完成任務(wù)拆解、插件調(diào)用、資料組織和內(nèi)容生成。就像你發(fā)了封工作郵件,過一陣就能收到一份干凈利落的文檔回復(fù)。

很多人還在找插件入口,Kimi 已經(jīng)在去插件化。

這兩種產(chǎn)品方向的不同,其實也能看出背后公司在策略上的側(cè)重點。Kimi 一直強調(diào)“長文本”能力和“系統(tǒng)性表達”,在 Researcher 這個產(chǎn)品上被推到極致,它更注重交付內(nèi)容的完整性和邏輯性。

Kimi不是做開發(fā)者平臺,它要做的是“懂結(jié)構(gòu)、能調(diào)度”的模型本體。這也解釋了為什么它一上來就定位在最復(fù)雜的研究類任務(wù),因為這種任務(wù)能最大程度激活它預(yù)設(shè)的 Agent 內(nèi)部機制:澄清問題、檢索并行、結(jié)構(gòu)統(tǒng)籌、表達生成。這不是讓你看到它能干什么,而是逼你意識到,你其實可以不再親自干。

這點對用戶心智的沖擊,其實比 MiniMax 更強。

MiniMax 反而是最像 Agent的那一個。你真的可以看到它調(diào)用了哪些函數(shù),爬了哪些網(wǎng)頁,引用了哪段語料,它給你一個完整的操作軌道,你像是在 Debug 一個機器人的思路流程。這讓它特別適合那些自己有一套流程、知道怎么干活的人。你可以把它當(dāng)成 Agent 的 IDE ——你是工程師,它是執(zhí)行層。

但這個過程中,大多數(shù)用戶其實是有門檻的。

你需要理解:插件怎么綁定、變量怎么配置、路徑怎么切換、長文本怎么緩存……你得像在搭一個流程工廠。而 Kimi 則直接告訴你:“你什么都不用管,只要告訴我要結(jié)果。”

這個差別說到底,是兩家公司對智能體未來形態(tài)的不同下注。

MiniMax 賭的是:AI 應(yīng)該成為一個流程平臺,你來決定它長成什么樣。

Kimi 賭的是:AI 應(yīng)該直接成為一個能干事的角色,讓你不再需要流程本身。

這兩條路背后的預(yù)設(shè)完全不同。一個相信每個用戶都該擁有自己的Agent,一個相信模型應(yīng)該成為能自動執(zhí)行復(fù)雜任務(wù)的交付體。

Kimi 是在重新定義什么是工具,MiniMax 是在放大工具能到多深。

這場Agent戰(zhàn)役其實不是從用戶開始的,而是從怎么分配任務(wù)這件事開始的。而這,恰恰是大模型能力真正能走入現(xiàn)實的起點。

你以為你在選一個Agent工具,其實你在決定的是:你愿不愿意把解決問題的方式,也一并交給它。

歡迎在評論區(qū)留言~
如需開白請加小編微信:dongfangmark

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
你聽過最勁爆的瓜是啥?網(wǎng)友:被大八歲的補習(xí)班老師表白了

你聽過最勁爆的瓜是啥?網(wǎng)友:被大八歲的補習(xí)班老師表白了

帶你感受人間冷暖
2025-11-26 00:10:06
爭議護學(xué)崗:當(dāng)家長被推到校門口

爭議護學(xué)崗:當(dāng)家長被推到校門口

新京報
2026-01-08 09:00:56
艾滋病新增130萬!很多人中招很冤枉!在外“5不碰”一定要記死

艾滋病新增130萬!很多人中招很冤枉!在外“5不碰”一定要記死

今朝牛馬
2025-12-31 19:31:04
笑不活!帶閨蜜下跪求復(fù)合爆火,評論區(qū)比卑微,一個比一個離譜

笑不活!帶閨蜜下跪求復(fù)合爆火,評論區(qū)比卑微,一個比一個離譜

單手搓核彈
2026-01-05 15:05:53
1980年,“大法官”伍修權(quán)去探視了江青,對她評價:有點窮講究

1980年,“大法官”伍修權(quán)去探視了江青,對她評價:有點窮講究

南書房
2026-01-08 10:05:03
觸目驚心!打了一場CBA比賽,整張臉都被“毀容”了 球迷:可怕

觸目驚心!打了一場CBA比賽,整張臉都被“毀容”了 球迷:可怕

體育哲人
2026-01-07 18:10:38
頂級后衛(wèi)視野?拉拉維亞救球后直接坐在多名女球迷身邊

頂級后衛(wèi)視野?拉拉維亞救球后直接坐在多名女球迷身邊

懂球帝
2026-01-07 12:00:09
41歲呂一疑似婚變!北京小家重裝依舊老土,老公生活痕跡全被抹掉

41歲呂一疑似婚變!北京小家重裝依舊老土,老公生活痕跡全被抹掉

娛圈小愚
2026-01-07 09:51:58
若中美開戰(zhàn),美摧毀北斗衛(wèi)星,中國將如何應(yīng)對?4大殺手锏已就位

若中美開戰(zhàn),美摧毀北斗衛(wèi)星,中國將如何應(yīng)對?4大殺手锏已就位

春風(fēng)秋雨
2025-10-29 19:55:04
女子產(chǎn)后被持刀家暴后續(xù):特殊原因曝光,丈夫拒絕離婚,婦聯(lián)介入

女子產(chǎn)后被持刀家暴后續(xù):特殊原因曝光,丈夫拒絕離婚,婦聯(lián)介入

奇思妙想草葉君
2026-01-06 19:05:08
哇塞!可能加盟北京隊!三屆NBA總冠軍中鋒

哇塞!可能加盟北京隊!三屆NBA總冠軍中鋒

籃球?qū)崙?zhàn)寶典
2026-01-07 23:56:02
連“綁架”都不讓說,BBC這次真的老實了

連“綁架”都不讓說,BBC這次真的老實了

陸棄
2026-01-07 10:19:01
靠譜?德媒:恩里克拒絕與巴黎圣日耳曼續(xù)約,尋求新挑戰(zhàn)

靠譜?德媒:恩里克拒絕與巴黎圣日耳曼續(xù)約,尋求新挑戰(zhàn)

星耀國際足壇
2026-01-08 00:11:10
24歲朝鮮女孩遠嫁四川,多年來首次回家,丈夫給了她5100塊錢

24歲朝鮮女孩遠嫁四川,多年來首次回家,丈夫給了她5100塊錢

好點點
2024-07-08 14:00:15
山東區(qū)劃調(diào)整:日照并入臨沂?官方回應(yīng)

山東區(qū)劃調(diào)整:日照并入臨沂?官方回應(yīng)

大象新聞
2026-01-07 11:57:03
高峰也沒想到,他當(dāng)年拋棄的兒子,如今開始給那英爭光了

高峰也沒想到,他當(dāng)年拋棄的兒子,如今開始給那英爭光了

趣文說娛
2026-01-04 16:34:24
意外!阿奇姆彭剛從河南隊離開,就轉(zhuǎn)身加盟津門虎?于根偉樂開花

意外!阿奇姆彭剛從河南隊離開,就轉(zhuǎn)身加盟津門虎?于根偉樂開花

羅掌柜體育
2026-01-08 06:10:03
實體店越來越難了!女子投資30萬開水果店,堅持一年多撐不住了

實體店越來越難了!女子投資30萬開水果店,堅持一年多撐不住了

唐小糖說情感
2026-01-07 16:30:11
四五次催診電話“窮追不舍”,瑞金醫(yī)生為啥非要喊他來手術(shù)?

四五次催診電話“窮追不舍”,瑞金醫(yī)生為啥非要喊他來手術(shù)?

上海交通大學(xué)醫(yī)學(xué)院附屬瑞金醫(yī)院
2026-01-07 17:23:12
首筆交易!老鷹送特雷-楊去奇才開啟新時代 換來CJ+基斯珀特

首筆交易!老鷹送特雷-楊去奇才開啟新時代 換來CJ+基斯珀特

醉臥浮生
2026-01-08 10:39:51
2026-01-08 11:16:49
直面派 incentive-icons
直面派
講述值得講述的真實故事
244文章數(shù) 236關(guān)注度
往期回顧 全部

科技要聞

雷軍:現(xiàn)在聽到營銷這兩個字都有點惡心

頭條要聞

博主發(fā)4條微博被控損害華為商譽 二審定罪免罰

頭條要聞

博主發(fā)4條微博被控損害華為商譽 二審定罪免罰

體育要聞

賣水果、搬磚的小伙,與哈蘭德爭英超金靴

娛樂要聞

《馬背搖籃》首播,革命的樂觀主義故事

財經(jīng)要聞

農(nóng)大教授科普:無需過度擔(dān)憂蔬菜農(nóng)殘

汽車要聞

不談顛覆與奇跡,智駕企業(yè)還能聊點什么?

態(tài)度原創(chuàng)

教育
時尚
家居
健康
公開課

教育要聞

電氣專業(yè)為什么非要去國家電網(wǎng)

藍色+灰色、紅色+棕色,這4組配色怎么搭都好看!

家居要聞

理性主義 冷調(diào)自由居所

這些新療法,讓化療不再那么痛苦

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版