国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

實(shí)測(cè)Kimi首個(gè)Agent:智能體與模型之間的區(qū)隔消失了?

0
分享至

這兩天,月之暗面上線了名為 Kimi-Researcher 的產(chǎn)品,以“模型即Agent”的思路切入,標(biāo)志著其在 Agent 路線上的一次明顯發(fā)力。

如果大家還記得的話,就在 Kimi 發(fā)布的前一天,MiniMax 在 MiniMax Week 的第三天也啟動(dòng)了通用 Agent 的灰度測(cè)試。這兩家此前一度低調(diào)的公司幾乎在同一時(shí)段重新進(jìn)入公眾視野,也讓原本趨于平靜的 AI 四小強(qiáng)格局再次活躍起來(lái)。

Kimi、MiniMax、智譜、階躍星辰,這幾位曾經(jīng)在大模型初期階段高頻出現(xiàn)的名字,如今正借助 Agent 的新賽道尋找新的突破口。不管是技術(shù)報(bào)告的更新、產(chǎn)品形態(tài)的演進(jìn),還是實(shí)際功能的迭代,幾家廠商都在以各自的節(jié)奏向外界釋放信號(hào)。

這一輪產(chǎn)品集中露面的時(shí)間節(jié)點(diǎn)并非巧合。從時(shí)機(jī)上看,這一波集中亮相并非偶然。當(dāng)前,大模型正從純粹的問(wèn)答工具演進(jìn)為具備自主規(guī)劃、任務(wù)執(zhí)行與上下文記憶能力的智能體系統(tǒng)。Agent 正在從“增強(qiáng)生產(chǎn)力”轉(zhuǎn)向“替代部分人類任務(wù)角色”。對(duì)于具備模型研發(fā)和產(chǎn)品整合能力的廠商來(lái)說(shuō),這是一次相對(duì)公平的新起點(diǎn)。

01

報(bào)告,不只是寫完,還得像

在這樣的背景下,Kimi 推出的 Kimi-Researcher 選擇了一個(gè)很明確的切入口:深度研究。

這個(gè)定位本身就帶著濃厚的判斷意味。它不打資訊助手、也不打日常問(wèn)答,而是瞄準(zhǔn)了原本需要專業(yè)助理團(tuán)隊(duì)完成的任務(wù),例如梳理產(chǎn)業(yè)政策、比對(duì)跨國(guó)法規(guī)、生成調(diào)研報(bào)告等。

這類任務(wù)對(duì)模型的檢索、思考、組織、判斷能力要求極高,幾乎是對(duì) Agent 體系的全方位考驗(yàn)。

話不多說(shuō),我們直接開測(cè)。

比如說(shuō)我想讓它分析下2025年上半年黃金價(jià)格波動(dòng)與美聯(lián)儲(chǔ)政策走向的關(guān)聯(lián)性。

它沒(méi)有立刻開始寫,而是反問(wèn)了我一些問(wèn)題,從研究邏輯本身出發(fā),主動(dòng)確認(rèn)這個(gè)任務(wù)到底該怎么做才不空轉(zhuǎn)。

這種主動(dòng)澄清機(jī)制,是過(guò)去在 Deep Research(左圖展示為:ChatGPT的 research 模式)里很熟悉的,也不像 MiniMax (右圖展示為MiniMax Agent)那種一口氣跑完所有流程后才看結(jié)果的虛擬機(jī)結(jié)構(gòu),更接近一個(gè)“你提一個(gè)話題,它開始一步步推”的助研模型。

Kimi比GPT更貼心增添了“Include everything”按鈕,不是單純放開信息源,而是直接把它切換到一種更傾向生成完整結(jié)構(gòu)報(bào)告的工作狀態(tài)。

經(jīng)過(guò)大概十幾分鐘的等待,它一共生成了兩種版本。

一種是我們熟悉的文字版研究報(bào)告,段落結(jié)構(gòu)清晰,語(yǔ)氣沉穩(wěn),整體邏輯偏向內(nèi)容層次 + 政策推導(dǎo);另一種則是自動(dòng)渲染的 HTML 格式報(bào)告,已經(jīng)配好封面、標(biāo)題、摘要、分節(jié)說(shuō)明,標(biāo)注出“核心發(fā)現(xiàn)”“關(guān)鍵風(fēng)險(xiǎn)”“歷史規(guī)律”這些結(jié)構(gòu)化小標(biāo)簽。

網(wǎng)頁(yè)稿鏈接在這,有興趣的朋友們可以打開看一看:

https://www.kimi.com/preview/d1bpb4criic9fe1hgdk0?blockId=108

內(nèi)容還是很豐富的。

對(duì)經(jīng)常要做對(duì)內(nèi)材料和對(duì)外匯報(bào)的人來(lái)說(shuō),這種“寫+排+渲”一體的體驗(yàn),確實(shí)提高了交付效率。

你可以把它當(dāng)成是Word+Notion+研究助理的混合體,不僅能輸出內(nèi)容,還知道怎么讓內(nèi)容看起來(lái)像一份真的報(bào)告。

然后我們也測(cè)了測(cè)生成PPT的能力。給它的任務(wù)是這樣的:

梳理一下 Stable Diffusion 從最初發(fā)布到最新版本的演進(jìn)路線,列出各階段關(guān)鍵改進(jìn)與社區(qū)貢獻(xiàn)節(jié)點(diǎn),并作出PPT

看起來(lái)是一個(gè)非常結(jié)構(gòu)化的問(wèn)題,理論上應(yīng)該正對(duì) Researcher 的下懷。但實(shí)際操作過(guò)程中,我們也發(fā)現(xiàn)了一些限制。

1. 當(dāng)前版本仍未支持多任務(wù)并行(當(dāng)然,這可能只是內(nèi)測(cè)階段的限制,正式版是否優(yōu)化還有待觀察。)

2. 并不能生成傳統(tǒng)PPT,只能是 HTML 格式報(bào)告。

我們還是把report鏈接放在這里:

https://www.kimi.com/preview/d1bmvgb1cvf506sb6okg?blockId=108

不過(guò)也不能說(shuō)它表現(xiàn)不好。作為一個(gè)學(xué)術(shù)型Agent,它在報(bào)告里自動(dòng)加上了參考文獻(xiàn)鏈接,并用下劃線標(biāo)注出處。可以完成一整套可交付內(nèi)容。

而這,恰恰就是很多 AI 工具還停留在段落生成時(shí)無(wú)法做到的部分。

但當(dāng)我們把這個(gè)任務(wù)交給 MiniMax Agent 時(shí),體驗(yàn)就完全不同了:

它不僅生成了 PPT,還一并打包了 PDF 報(bào)告、Markdown 研究文檔、圖表文件、項(xiàng)目任務(wù)表(todo.md)和用于可視化的 Python 腳本。

你可以下載 .pptx 源文件,二次修改內(nèi)容和格式。也能查看 .md 的版本記錄、調(diào)圖的 .py 腳本,每一階段的中間產(chǎn)物全都可查。

從產(chǎn)出形式來(lái)看,它給你的是一整個(gè)PPT 制作系統(tǒng),而不是一份靜態(tài)報(bào)告。

02

Kimi-Researcher和

MiniMax Agent,哪個(gè)更適合你

從執(zhí)行力上來(lái)說(shuō),兩者都已經(jīng)遠(yuǎn)超傳統(tǒng)意義上的聊天機(jī)器人——你不用再一句一句提示,它們可以自己補(bǔ)全問(wèn)題、拆解任務(wù),甚至按你沒(méi)說(shuō)出口的邏輯推下去。但使用下來(lái),兩者的Agent 感其實(shí)來(lái)自不同的方向。

Kimi-Researcher 是任務(wù)導(dǎo)向的,它的邏輯很清楚:你給我一個(gè)研究型問(wèn)題,我就像一個(gè)訓(xùn)練過(guò)的助理那樣,問(wèn)你三件事、查五份資料、最后給你一份成稿。

但 MiniMax 不太一樣。

它更像一個(gè)運(yùn)行在虛擬機(jī)里的多工系統(tǒng)——你可以把它理解成你裝了一個(gè)干活的人,但這個(gè)人是你組裝出來(lái)的。他自己并不主張“要做研究”還是“要做運(yùn)營(yíng)”,而是你怎么設(shè)計(jì),他就按你的指令一步步走。有時(shí)候你會(huì)覺(jué)得,它像是個(gè)開著調(diào)試模式的智能體,你能看到它每一步調(diào)用了什么插件、在哪個(gè)頁(yè)面抓了數(shù)據(jù)、用了哪個(gè)文檔里的知識(shí)。這種透明度很高的體驗(yàn),本質(zhì)上更像是你操控一個(gè)流程機(jī)器人,而不是和一個(gè)人打交道。

如果說(shuō) Kimi 是把一個(gè)智能體藏在了模型背后,讓你感受到結(jié)果;那 MiniMax 更像是把智能體攤開在你眼前,讓你參與構(gòu)建過(guò)程。兩者誰(shuí)更強(qiáng),不一定,但它們帶來(lái)的使用心智是完全不一樣的。

還有一個(gè)重要差別,是默認(rèn)角色設(shè)定。

Kimi 很明顯是自帶性格的——不夸張地說(shuō),它的Researcher標(biāo)簽決定了它的行為方式,比如它更關(guān)注嚴(yán)謹(jǐn)表達(dá)、更傾向于做出規(guī)范排版、更容易使用資料比對(duì)視角進(jìn)行總結(jié)。

而 MiniMax 給你的更多是空角色模板——你自己來(lái)寫 prompt,自己搭建鏈路,它才啟動(dòng)真正的 Agent 能力。

我不是說(shuō)哪個(gè)更好,我只是說(shuō)它們?cè)趯?shí)現(xiàn)Agent這件事上,走的是完全不同的路徑。

在我們深度體驗(yàn)兩者后,給出用戶一句話結(jié)論:如果你更在意“我提個(gè)需求就能直接拿到結(jié)果”,Kimi 會(huì)是更順手的選擇;但如果你希望掌控整個(gè)任務(wù)的執(zhí)行流程、甚至自己定義智能體的邏輯結(jié)構(gòu),那 MiniMax 可能更適合你。

03

Kimi 做結(jié)果,MiniMax 做過(guò)程

說(shuō)到底,Kimi 和 MiniMax 的這次同步出招,看起來(lái)像是在做 Agent,其實(shí)是在做一次底層策略切換。

Kimi 把“模型即 Agent”這件事做得非常徹底。你看不到 Agent 配置、插件安裝、工作流設(shè)計(jì)這些 Developer 套路,它不是在鼓勵(lì)你搭建 Agent,而是干脆告訴你:“Agent 本身就是模型的一部分了”。你想研究政策,它就用研究員的方式回應(yīng)你。它把智能體的控制權(quán)從用戶界面撤回到了模型內(nèi)部,交給了系統(tǒng)自動(dòng)調(diào)度。

這一點(diǎn)是很多人沒(méi)意識(shí)到的。

過(guò)去我們理解的智能體,是我來(lái)設(shè)計(jì)、我來(lái)組合,但 Kimi 的思路是,你不需要設(shè)計(jì),你只要告訴我你要什么結(jié)果,我來(lái)決定應(yīng)該找誰(shuí)干活、用什么方法、怎么安排流程。

它把整個(gè) Agent 系統(tǒng)做成了一個(gè)黑箱,你丟任務(wù)進(jìn)去,它自己完成任務(wù)拆解、插件調(diào)用、資料組織和內(nèi)容生成。就像你發(fā)了封工作郵件,過(guò)一陣就能收到一份干凈利落的文檔回復(fù)。

很多人還在找插件入口,Kimi 已經(jīng)在去插件化。

這兩種產(chǎn)品方向的不同,其實(shí)也能看出背后公司在策略上的側(cè)重點(diǎn)。Kimi 一直強(qiáng)調(diào)“長(zhǎng)文本”能力和“系統(tǒng)性表達(dá)”,在 Researcher 這個(gè)產(chǎn)品上被推到極致,它更注重交付內(nèi)容的完整性和邏輯性。

Kimi不是做開發(fā)者平臺(tái),它要做的是“懂結(jié)構(gòu)、能調(diào)度”的模型本體。這也解釋了為什么它一上來(lái)就定位在最復(fù)雜的研究類任務(wù),因?yàn)檫@種任務(wù)能最大程度激活它預(yù)設(shè)的 Agent 內(nèi)部機(jī)制:澄清問(wèn)題、檢索并行、結(jié)構(gòu)統(tǒng)籌、表達(dá)生成。這不是讓你看到它能干什么,而是逼你意識(shí)到,你其實(shí)可以不再親自干。

這點(diǎn)對(duì)用戶心智的沖擊,其實(shí)比 MiniMax 更強(qiáng)。

MiniMax 反而是最像 Agent的那一個(gè)。你真的可以看到它調(diào)用了哪些函數(shù),爬了哪些網(wǎng)頁(yè),引用了哪段語(yǔ)料,它給你一個(gè)完整的操作軌道,你像是在 Debug 一個(gè)機(jī)器人的思路流程。這讓它特別適合那些自己有一套流程、知道怎么干活的人。你可以把它當(dāng)成 Agent 的 IDE ——你是工程師,它是執(zhí)行層。

但這個(gè)過(guò)程中,大多數(shù)用戶其實(shí)是有門檻的。

你需要理解:插件怎么綁定、變量怎么配置、路徑怎么切換、長(zhǎng)文本怎么緩存……你得像在搭一個(gè)流程工廠。而 Kimi 則直接告訴你:“你什么都不用管,只要告訴我要結(jié)果。”

這個(gè)差別說(shuō)到底,是兩家公司對(duì)智能體未來(lái)形態(tài)的不同下注。

MiniMax 賭的是:AI 應(yīng)該成為一個(gè)流程平臺(tái),你來(lái)決定它長(zhǎng)成什么樣。

Kimi 賭的是:AI 應(yīng)該直接成為一個(gè)能干事的角色,讓你不再需要流程本身。

這兩條路背后的預(yù)設(shè)完全不同。一個(gè)相信每個(gè)用戶都該擁有自己的Agent,一個(gè)相信模型應(yīng)該成為能自動(dòng)執(zhí)行復(fù)雜任務(wù)的交付體。

Kimi 是在重新定義什么是工具,MiniMax 是在放大工具能到多深。

這場(chǎng)Agent戰(zhàn)役其實(shí)不是從用戶開始的,而是從怎么分配任務(wù)這件事開始的。而這,恰恰是大模型能力真正能走入現(xiàn)實(shí)的起點(diǎn)。

你以為你在選一個(gè)Agent工具,其實(shí)你在決定的是:你愿不愿意把解決問(wèn)題的方式,也一并交給它。

歡迎在評(píng)論區(qū)留言~
如需開白請(qǐng)加小編微信:dongfangmark

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
東風(fēng)導(dǎo)彈泄密案!間諜郭萬(wàn)鈞一家三口,全部被處以死刑

東風(fēng)導(dǎo)彈泄密案!間諜郭萬(wàn)鈞一家三口,全部被處以死刑

番外行
2026-03-31 08:28:28
一斤等于10斤牛肉,建議一周3次,健脾利濕、增強(qiáng)記憶力!

一斤等于10斤牛肉,建議一周3次,健脾利濕、增強(qiáng)記憶力!

寶哥精彩賽事
2026-04-02 18:37:40
普京顏面盡失,在克宮被昔日盟友公開羞辱,宣告不再討好俄羅斯

普京顏面盡失,在克宮被昔日盟友公開羞辱,宣告不再討好俄羅斯

阿萔影視評(píng)論
2026-04-04 06:51:01
愛德華茲賽季報(bào)銷,森林狼反手選對(duì)手:打湖人總比碰掘金強(qiáng)

愛德華茲賽季報(bào)銷,森林狼反手選對(duì)手:打湖人總比碰掘金強(qiáng)

寶哥精彩賽事
2026-04-03 18:54:30
外媒曝伍茲私人飛機(jī)降落在蘇黎世 48歲女友瓦妮莎主導(dǎo)境外秘密治療

外媒曝伍茲私人飛機(jī)降落在蘇黎世 48歲女友瓦妮莎主導(dǎo)境外秘密治療

勁爆體壇
2026-04-04 06:50:04
女生主動(dòng)起來(lái)有多黏人?網(wǎng)友:這些女的太開放了

女生主動(dòng)起來(lái)有多黏人?網(wǎng)友:這些女的太開放了

帶你感受人間冷暖
2026-01-27 00:20:06
中國(guó)拒接8500億美債,專家:救美救華時(shí)代已終結(jié)

中國(guó)拒接8500億美債,專家:救美救華時(shí)代已終結(jié)

孤酒老巷QA
2026-04-03 19:53:38
科學(xué)不夠,賭命來(lái)湊:美國(guó)今年,命犯馬桶?

科學(xué)不夠,賭命來(lái)湊:美國(guó)今年,命犯馬桶?

美第奇效應(yīng)
2026-04-03 07:07:27
3月合資銷量啞火 除了“兩田”,沒(méi)人吱聲

3月合資銷量啞火 除了“兩田”,沒(méi)人吱聲

車市紅點(diǎn)
2026-04-02 15:49:23
石破茂公開評(píng)價(jià)特朗普:他好面子,喜歡被奉承,要是說(shuō)他錯(cuò)了,立刻就發(fā)飆

石破茂公開評(píng)價(jià)特朗普:他好面子,喜歡被奉承,要是說(shuō)他錯(cuò)了,立刻就發(fā)飆

大象新聞
2026-04-03 20:49:04
逼中國(guó)跳陷阱?伊朗索要“安全擔(dān)!,中國(guó)一眼看穿,根本不上當(dāng)

逼中國(guó)跳陷阱?伊朗索要“安全擔(dān)保”,中國(guó)一眼看穿,根本不上當(dāng)

二大爺觀世界
2026-04-04 07:54:10
真敢說(shuō)!39歲張雪:創(chuàng)業(yè)13年重慶從沒(méi)有支持過(guò)我 一個(gè)子兒都沒(méi)有

真敢說(shuō)!39歲張雪:創(chuàng)業(yè)13年重慶從沒(méi)有支持過(guò)我 一個(gè)子兒都沒(méi)有

念洲
2026-04-01 09:39:30
韓國(guó)導(dǎo)演遭6人活活打死!目擊者:店內(nèi)遭勒脖暈厥,幼子見證全程

韓國(guó)導(dǎo)演遭6人活活打死!目擊者:店內(nèi)遭勒脖暈厥,幼子見證全程

法老不說(shuō)教
2026-04-03 19:35:03
51歲何潤(rùn)東直播《三角洲》火了!全程手柄操作引熱議

51歲何潤(rùn)東直播《三角洲》火了!全程手柄操作引熱議

游民星空
2026-04-03 17:18:55
上海夫妻給干妹妹轉(zhuǎn)賬4900萬(wàn),結(jié)果慘變“接盤俠”……

上海夫妻給干妹妹轉(zhuǎn)賬4900萬(wàn),結(jié)果慘變“接盤俠”……

環(huán)球網(wǎng)資訊
2026-04-02 21:22:30
浙大名嘴揭開殘酷真相:當(dāng)年恒大倒臺(tái),壓根不是因?yàn)?萬(wàn)億負(fù)債!

浙大名嘴揭開殘酷真相:當(dāng)年恒大倒臺(tái),壓根不是因?yàn)?萬(wàn)億負(fù)債!

阿器談史
2026-04-02 13:31:44
目標(biāo)以色列特拉維夫,伊朗、黎巴嫩真主黨、胡塞武裝聯(lián)合發(fā)動(dòng)襲擊!以軍:打擊伊朗革命衛(wèi)隊(duì)資金管理總部;美國(guó)最先進(jìn)的電子戰(zhàn)飛機(jī)飛抵希臘

目標(biāo)以色列特拉維夫,伊朗、黎巴嫩真主黨、胡塞武裝聯(lián)合發(fā)動(dòng)襲擊!以軍:打擊伊朗革命衛(wèi)隊(duì)資金管理總部;美國(guó)最先進(jìn)的電子戰(zhàn)飛機(jī)飛抵希臘

每日經(jīng)濟(jì)新聞
2026-04-03 07:34:06
庫(kù)存積壓嚴(yán)重!特斯拉最新銷量公布

庫(kù)存積壓嚴(yán)重!特斯拉最新銷量公布

新浪財(cái)經(jīng)
2026-04-04 00:57:30
不甜不咸不油,卻偷偷傷害全身!很多人每天都在超量吃

不甜不咸不油,卻偷偷傷害全身!很多人每天都在超量吃

蝌蚪五線譜
2026-04-03 17:03:28
男人的生理需求能有多難忍?網(wǎng)友:我對(duì)我老公只有動(dòng)物本能

男人的生理需求能有多難忍?網(wǎng)友:我對(duì)我老公只有動(dòng)物本能

帶你感受人間冷暖
2026-02-07 03:58:56
2026-04-04 08:35:00
直面派 incentive-icons
直面派
講述值得講述的真實(shí)故事
257文章數(shù) 236關(guān)注度
往期回顧 全部

科技要聞

5萬(wàn)輛庫(kù)存車,給了特斯拉一記重拳

頭條要聞

美國(guó)宣布:F-15E被擊落 1名飛行員被救還有1人下落不明

頭條要聞

美國(guó)宣布:F-15E被擊落 1名飛行員被救還有1人下落不明

體育要聞

被NBA選中20年后,他重新回到籃球場(chǎng)

娛樂(lè)要聞

夏克立官宣再婚當(dāng)爸?否認(rèn)婚內(nèi)出軌

財(cái)經(jīng)要聞

劉紀(jì)鵬:只盼長(zhǎng)慢牛,鞏固4000點(diǎn)是關(guān)鍵

汽車要聞

你介意和遠(yuǎn)房親戚長(zhǎng)得很像嗎?

態(tài)度原創(chuàng)

藝術(shù)
親子
教育
數(shù)碼
健康

藝術(shù)要聞

石濤『山水小景冊(cè)』

親子要聞

醫(yī)生說(shuō)這娃一場(chǎng)感冒就可能沒(méi)命!一針250萬(wàn)美元的藥打完,娃能跑能跳了...

教育要聞

以“鍛造”代“保護(hù)”:重塑青少年心理健康教育的底層邏輯

數(shù)碼要聞

酒店加速智慧化,電視成了核心

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版