国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Artificial Analysis評(píng)測(cè)新鮮出爐:Kimi K2 thinking位居世界第二,開(kāi)源第一

0
分享至


根據(jù)著名AI分析機(jī)構(gòu)Artificial Analysis的評(píng)估,Kimi K2 Thinking在智能體(agentic)相關(guān)任務(wù)中表現(xiàn)非常突出,但在完成評(píng)測(cè)時(shí)生成了所有模型中最多的token,表現(xiàn)出非?!霸挵A”的特性

以下是其核心要點(diǎn):

智能指數(shù)67分,登頂開(kāi)源榜首

Kimi K2 Thinking在Artificial Analysis智能指數(shù)中獲得67分。

這一成績(jī)使其明確領(lǐng)先于所有其他開(kāi)源權(quán)重模型,包括最近發(fā)布的MiniMax-M2(61分)和DeepSeek-V3.2-Exp(57分),在所有模型中僅次于GPT-5


Agent能力突出,推理表現(xiàn)強(qiáng)勁

Kimi K2 Thinking在智能體應(yīng)用場(chǎng)景中展現(xiàn)出強(qiáng)大實(shí)力,在Artificial Analysis智能體指數(shù)中排名第二,僅次于GPT-5

其優(yōu)異表現(xiàn)主要得益于在2-Bench Telecom基準(zhǔn)測(cè)試中取得了93%的成績(jī)。這是一個(gè)智能體工具使用評(píng)測(cè)。這是該機(jī)構(gòu)獨(dú)立測(cè)量到的最高分


此外,在Humanity’s Last Exam(人類終極考試)評(píng)測(cè)中,Kimi K2 Thinking在無(wú)工具情況下的得分為22.3%,創(chuàng)下開(kāi)源模型歷史新高,僅次于GPT-5和Grok 4


成為新晉開(kāi)源代碼模型冠軍

盡管Kimi K2 Thinking并未在任何一項(xiàng)代碼評(píng)測(cè)中奪得總冠軍,但相較于其他開(kāi)源模型,它在各項(xiàng)評(píng)測(cè)中均排名第一或并列第一

具體排名為:Terminal-Bench Hard第6名,SciCode第7名,LiveCodeBench第2名

因此,它在Artificial Analysis代碼指數(shù)中超越了先前的開(kāi)源領(lǐng)導(dǎo)者DeepSeek V3.2

更多排名:


模型細(xì)節(jié):1萬(wàn)億參數(shù),INT4原生精度

模型規(guī)格:總參數(shù)量1萬(wàn)億,激活參數(shù)320億(約594GB),僅支持文本輸入,擁有256K上下文窗口

模型定位:該模型是Kimi K2 Instruct的推理變體,擁有相同的架構(gòu)和參數(shù)數(shù)量

INT4精度:與此前Kimi K2 Instruct發(fā)布的FP8精度不同,該模型原生以INT4精度發(fā)布。月之暗面在后訓(xùn)練階段使用了量化感知訓(xùn)練來(lái)實(shí)現(xiàn)這一點(diǎn)。這使得模型大小僅為約594GB,相比K2 Instruct的1TB以上大幅縮小,從而提升了推理和訓(xùn)練效率

代價(jià):高冗余度、成本與延遲

Kimi K2 Thinking表現(xiàn)得非?!霸挵A”。在完成智能指數(shù)評(píng)測(cè)時(shí),它總共使用了1.4億個(gè)token,約為DeepSeek V3.2的2.5倍,GPT-5的2倍。


高冗余度直接影響了成本和延遲

基礎(chǔ)版API

定價(jià):輸入 百 萬(wàn) , 輸 出 2.5/百萬(wàn)token。

評(píng)測(cè)總成本:$356,比頂尖前沿模型便宜(比GPT-5(高)便宜2.5倍),但比DeepSeek V3.2貴9倍

速度:非常慢,約8個(gè)輸出token/秒

Turbo版API

定價(jià):輸入 百 萬(wàn) , 輸 出 8/百萬(wàn)token。
評(píng)測(cè)總成本:$1172,是第二昂貴的模型,僅次于Grok 4。
速度:相對(duì)較快,約50個(gè)輸出token/秒

報(bào)告指出,此次發(fā)布再次凸顯了一個(gè)持續(xù)的趨勢(shì):后訓(xùn)練,特別是強(qiáng)化學(xué)習(xí)(RL),正在推動(dòng)推理模型和涉及工具調(diào)用的長(zhǎng)程任務(wù)性能實(shí)現(xiàn)增長(zhǎng)

參考:

https://artificialanalysis.ai/models/kimi-k2-thinking

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
12歲男孩泡溫泉在泳池溺水后不幸身亡 警方:派出所正配合調(diào)解

12歲男孩泡溫泉在泳池溺水后不幸身亡 警方:派出所正配合調(diào)解

紅星新聞
2026-01-08 13:11:17
終于輪到日本“強(qiáng)烈抗議”:130年了,日本從未像今天這樣憋屈

終于輪到日本“強(qiáng)烈抗議”:130年了,日本從未像今天這樣憋屈

小陳講史
2026-01-08 11:57:03
湖南一男子在高速上開(kāi)車使用輔助駕駛,酣睡20公里后撞上護(hù)欄

湖南一男子在高速上開(kāi)車使用輔助駕駛,酣睡20公里后撞上護(hù)欄

環(huán)球網(wǎng)資訊
2026-01-07 19:35:13
媒體終于報(bào)道伊朗了,但評(píng)論卻是經(jīng)過(guò)精心篩選的

媒體終于報(bào)道伊朗了,但評(píng)論卻是經(jīng)過(guò)精心篩選的

清書(shū)先生
2026-01-08 16:55:15
女首相被嚇哭了!

女首相被嚇哭了!

鈞言堂
2026-01-07 12:36:38
一條新聞消失了

一條新聞消失了

深藍(lán)財(cái)經(jīng)
2026-01-07 14:22:05
中國(guó)養(yǎng)老負(fù)擔(dān)將越來(lái)越重:從4.7個(gè)勞動(dòng)力養(yǎng)一個(gè)老人到1.9個(gè)勞動(dòng)力供養(yǎng)1個(gè)老人

中國(guó)養(yǎng)老負(fù)擔(dān)將越來(lái)越重:從4.7個(gè)勞動(dòng)力養(yǎng)一個(gè)老人到1.9個(gè)勞動(dòng)力供養(yǎng)1個(gè)老人

西虹市閑話
2026-01-08 13:51:18
叛徒確定,取代馬杜羅后還能拿5000萬(wàn)?數(shù)月前就已通過(guò)美國(guó)面試

叛徒確定,取代馬杜羅后還能拿5000萬(wàn)?數(shù)月前就已通過(guò)美國(guó)面試

墜入二次元的海洋
2026-01-08 05:47:20
新一代機(jī)皇!新機(jī)官宣:2月25日,正式首發(fā)

新一代機(jī)皇!新機(jī)官宣:2月25日,正式首發(fā)

科技堡壘
2026-01-08 12:17:30
美媒曝光:美國(guó)出動(dòng)海豹突擊隊(duì)在北大西洋扣押“貝拉1”號(hào)油輪

美媒曝光:美國(guó)出動(dòng)海豹突擊隊(duì)在北大西洋扣押“貝拉1”號(hào)油輪

環(huán)球網(wǎng)資訊
2026-01-08 14:46:06
宜家的問(wèn)題已經(jīng)挺嚴(yán)重了

宜家的問(wèn)題已經(jīng)挺嚴(yán)重了

蔚然未來(lái)消費(fèi)
2026-01-08 08:34:50
網(wǎng)傳某國(guó)產(chǎn)操作系統(tǒng)大廠老董開(kāi)除核心工程師,理由竟是 “沒(méi)穿西裝”

網(wǎng)傳某國(guó)產(chǎn)操作系統(tǒng)大廠老董開(kāi)除核心工程師,理由竟是 “沒(méi)穿西裝”

可達(dá)鴨面面觀
2026-01-08 19:48:13
伊朗巨變前夜

伊朗巨變前夜

鳳眼論
2026-01-08 10:31:08
挨凍的河北農(nóng)村老人:每年好幾千燃?xì)赓M(fèi)舍不得燒,合作醫(yī)療也得好幾千

挨凍的河北農(nóng)村老人:每年好幾千燃?xì)赓M(fèi)舍不得燒,合作醫(yī)療也得好幾千

小蘿卜絲
2026-01-08 11:23:44
“哥都禮共和國(guó)”宣布成立,并宣布脫離緬甸獨(dú)立

“哥都禮共和國(guó)”宣布成立,并宣布脫離緬甸獨(dú)立

曼谷陳大叔
2026-01-07 15:57:35
特朗普稱委內(nèi)瑞拉已同意將其石油銷售所得收入僅用于購(gòu)買(mǎi)美國(guó)制造的商品

特朗普稱委內(nèi)瑞拉已同意將其石油銷售所得收入僅用于購(gòu)買(mǎi)美國(guó)制造的商品

極目新聞
2026-01-08 14:16:23
2026央視春晚彩排曝光,令人擔(dān)心的事還是發(fā)生了:不該來(lái)的都來(lái)了

2026央視春晚彩排曝光,令人擔(dān)心的事還是發(fā)生了:不該來(lái)的都來(lái)了

銀河史記
2026-01-06 17:22:24
俄羅斯赤道特遣隊(duì)撤回國(guó)內(nèi),美國(guó)捕馬撕去莫斯科最后一塊遮羞布

俄羅斯赤道特遣隊(duì)撤回國(guó)內(nèi),美國(guó)捕馬撕去莫斯科最后一塊遮羞布

史政先鋒
2026-01-07 19:38:07
亞運(yùn)冠軍舉報(bào)訓(xùn)練基地負(fù)責(zé)人“索要獎(jiǎng)金”續(xù):云南體育局稱“很快會(huì)有結(jié)論”

亞運(yùn)冠軍舉報(bào)訓(xùn)練基地負(fù)責(zé)人“索要獎(jiǎng)金”續(xù):云南體育局稱“很快會(huì)有結(jié)論”

澎湃新聞
2026-01-08 16:04:29
忍無(wú)可忍!籃球?qū)<彝磁褐辈グ岬讲耸袌?chǎng),CBA早晚要出事

忍無(wú)可忍!籃球?qū)<彝磁褐辈グ岬讲耸袌?chǎng),CBA早晚要出事

體育哲人
2026-01-08 12:46:07
2026-01-08 22:03:00
AI寒武紀(jì) incentive-icons
AI寒武紀(jì)
專注于人工智能,科技領(lǐng)域
1026文章數(shù) 393關(guān)注度
往期回顧 全部

科技要聞

智譜拿下“全球大模型第一股”,憑什么

頭條要聞

19歲小伙在柬疑被16萬(wàn)轉(zhuǎn)賣 與母親視頻時(shí)按"酒窩"求救

頭條要聞

19歲小伙在柬疑被16萬(wàn)轉(zhuǎn)賣 與母親視頻時(shí)按"酒窩"求救

體育要聞

世乒賽銀牌得主,說(shuō)自己夢(mèng)里都是孫穎莎

娛樂(lè)要聞

抗戰(zhàn)劇《馬背搖籃》首播,獲觀眾好評(píng)

財(cái)經(jīng)要聞

微軟CTO韋青:未來(lái)人類會(huì)花錢(qián)"戒手機(jī)"

汽車要聞

從量變到"智"變 吉利在CES打出了五張牌

態(tài)度原創(chuàng)

家居
數(shù)碼
旅游
教育
時(shí)尚

家居要聞

理性主義 冷調(diào)自由居所

數(shù)碼要聞

華碩推V400 AiO:全球首款高通驍龍X平臺(tái)Copilot+一體機(jī)電腦

旅游要聞

大道之行 | 滬蘇浙交界處的“共享客廳”:一院跨三地,一眼長(zhǎng)三角

教育要聞

經(jīng)常問(wèn)這七個(gè)問(wèn)題,足以改變孩子一生

190萬(wàn)贊的爆款女孩,等待代表作

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版