国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

ZPedia|Kimi K2 Thinking開(kāi)源反超頂尖閉源模型,訓(xùn)練成本僅460萬(wàn)美元

0
分享至


如果有關(guān)注近期資本市場(chǎng)的新聞,「月之暗面」的名字又開(kāi)始刷屏了。

多家媒體報(bào)道,這家公司正在敲定一筆數(shù)億美元的新一輪融資。

而就在最新一輪融資傳聞四起的時(shí)間點(diǎn)上,月之暗面把自己的新故事端了上來(lái):一款號(hào)稱是「迄今為止能力最強(qiáng)的開(kāi)源思考模型」——Kimi K2 Thinking。

這次他們沒(méi)有只做一個(gè)「更聰明一點(diǎn)」的聊天機(jī)器人,而是把 K2 Thinking 定位成一個(gè)原生的 Thinking Agent:可以一邊思考一邊調(diào)度搜索、瀏覽、寫代碼等工具,在復(fù)雜任務(wù)上,自己拆解步驟、自己查資料、自己寫腳本。

官方和第三方評(píng)測(cè)顯示,它在 Humanity’s Last Exam、BrowseComp、SEAL-0 等一批高難度基準(zhǔn)上,直接把不少閉源旗艦?zāi)P桶丛诹松砗蟆?/p>


在資金重新押注、估值重新抬升的當(dāng)口,月之暗面試圖用一個(gè)真正能「打贏閉源」的開(kāi)源模型,去換回技術(shù)敘事里的主動(dòng)權(quán)。

從「國(guó)產(chǎn) SOTA」到開(kāi)源正面超車閉源

把官方文案和外部評(píng)測(cè)拆開(kāi)看,會(huì)發(fā)現(xiàn) Kimi K2 Thinking 有一個(gè)非常鮮明的設(shè)計(jì)前提:它不是先做一個(gè)語(yǔ)言模型,再往外「外掛」Agent 能力,而是從第一天就被當(dāng)成一個(gè)「模型即 Agent」的內(nèi)核來(lái)訓(xùn)練。

K2 Thinking 基于此前的Kimi K2 架構(gòu):總參數(shù)量約 1 萬(wàn)億,是一個(gè)稀疏 MoE模型,但每次推理只激活約 320 億參數(shù),這一設(shè)計(jì)在GitHub 與 Hugging Face 的模型卡中都有披露。

預(yù)訓(xùn)練規(guī)模則來(lái)自月之暗面的技術(shù)報(bào)告:K2 在 15.5 萬(wàn)億 Token 上完成訓(xùn)練,采用 Muon 優(yōu)化器、QK-Clip 等一整套「為超大規(guī)模準(zhǔn)備的」訓(xùn)練技巧,解決了大 Token 量、長(zhǎng)時(shí)間訓(xùn)練下的穩(wěn)定性問(wèn)題。

在此基礎(chǔ)上,K2 Thinking 做了兩層關(guān)鍵強(qiáng)化。

第一層是推理深度。Kimi 自己在技術(shù)頁(yè)面上給出的數(shù)據(jù)是:K2 Thinking 能穩(wěn)定完成 200 到 300 輪工具調(diào)用,在整個(gè)過(guò)程中保持邏輯一致,不會(huì)因?yàn)椤杆伎继谩苟罎?。這其實(shí)就是Test-Time Scaling 的一個(gè)極端版本:不再只強(qiáng)調(diào)「模型大不大、訓(xùn)練多不多」,而是強(qiáng)調(diào)在測(cè)試時(shí)能否持續(xù)延長(zhǎng)思考鏈條,把工具調(diào)度也算進(jìn)「推理的一部分」。

第二層是工具使用的原生化。 在 K2 Thinking 的設(shè)定里,搜索網(wǎng)頁(yè)、打開(kāi) SEC 公告、寫 Python、小步調(diào)試腳本,都不是外掛能力,而是真正融入到策略里的一部分。在官方展示的示例中,K2 Thinking 會(huì)自動(dòng)先判斷問(wèn)題適不適合查資料,再?zèng)Q定是先搜一輪新聞,還是直接打開(kāi)官方文檔,然后根據(jù)每一步新獲得的信息,重寫自己的假設(shè)與下一步計(jì)劃。

正是這種「思考+工具」的打包設(shè)計(jì),讓它在一組專門為 Agent 設(shè)計(jì)的基準(zhǔn)上打出了極高的分?jǐn)?shù)。

在 Humanity’s Last Exam 上,K2 Thinking 在允許使用工具的條件下拿到了 44.9% 的成績(jī),官方和 VentureBeat 都把它標(biāo)成了新的 SOTA。這套題跨越一百多個(gè)專業(yè)領(lǐng)域,本意是測(cè)「如果你把 AI 當(dāng)成一個(gè)可以上場(chǎng)考試的研究員,它能考到幾分」。早前在同一任務(wù)上,領(lǐng)先的閉源模型大多集中在 40% 左右,這一次 K2 Thinking 不只把國(guó)產(chǎn)模型甩在身后,也把不少閉源旗艦平推了一截。


在 BrowseComp 這項(xiàng)網(wǎng)絡(luò)瀏覽基準(zhǔn)上,這種優(yōu)勢(shì)更加明顯。BrowseComp 原本是 OpenAI 為了考察 Agent「像研究員一樣刨根問(wèn)底」的能力設(shè)計(jì)的,題目要求模型在信息噪音極多的網(wǎng)頁(yè)環(huán)境中,自己規(guī)劃搜索路徑、篩選證據(jù),給出可驗(yàn)證的結(jié)論。這套任務(wù)上,人類研究員的平均分也只有二十多分,而 K2 Thinking 在最新公開(kāi)數(shù)據(jù)里交出的是 60.2% 的成績(jī),超過(guò)了最強(qiáng)的閉源模型GPT-5和Claude Sonnet 4.5。


對(duì)一個(gè)開(kāi)源模型而言,這里有一個(gè)非常微妙的「視角切換」。過(guò)去提到「國(guó)產(chǎn) SOTA」,大家默認(rèn)的補(bǔ)全句是:在 ChatGPT、Claude 這些閉源前沿模型之下,國(guó)產(chǎn)追到了它們身后、或者在部分維度趕上。而在 K2 Thinking 的多項(xiàng)評(píng)測(cè)中,敘事第一次變成了:在最考驗(yàn) Agentic 推理能力的幾項(xiàng)任務(wù)上,開(kāi)源模型開(kāi)始?jí)哼^(guò)閉源旗艦。

這不是媒體一家之言。

Hugging Face 有一篇博客在7 月專門寫過(guò)一篇《5 Things You Need to Know About Moonshot AI and Kimi K2》,點(diǎn)名 Kimi K2 在開(kāi)源社區(qū)上線24 小時(shí)內(nèi),沖到了平臺(tái) Trending 榜單第一,靠的是在編碼任務(wù)上的表現(xiàn)直接超過(guò)了 GPT-4,并且開(kāi)源了完整權(quán)重。


到了 K2 Thinking 發(fā)布這一次,HuggingFace CEO Clément Delangue 在 LinkedIn上的評(píng)論更直接,他說(shuō),看著 Moonshot/Kimi 團(tuán)隊(duì)「幾乎出現(xiàn)在每一次社區(qū)討論、每一個(gè) Pull Request 里」,是一件很美好的事。 這句話的潛臺(tái)詞是,在開(kāi)源基礎(chǔ)設(shè)施的建設(shè)上,月之暗面不再只是一個(gè)偶爾貢獻(xiàn)模型的「外來(lái)者」,而是一個(gè)真正深度參與、被全球工程社區(qū)認(rèn)可的一方。


HuggingFace 聯(lián)合創(chuàng)始人Thomas Wolf 甚至表示,我們正在見(jiàn)證又一次 DeepSeek 時(shí)刻:


有趣的是,個(gè)人開(kāi)發(fā)者手里的體驗(yàn)也在印證這些數(shù)字。LocalLLaMA 社區(qū)里有工程師復(fù)現(xiàn)了一部分評(píng)測(cè),發(fā)現(xiàn) K2 Thinking 在 Humanity’s Last Exam、BrowseComp 上確實(shí)跑出了類似成績(jī),甚至在 GPQA-Diamond 這類高難問(wèn)答上略微超過(guò) GPT-5。當(dāng)然,GPT-5 和Claude 在其他很多綜合測(cè)試、尤其是長(zhǎng)上下文穩(wěn)定性上依然有優(yōu)勢(shì),但至少在「讓一個(gè)模型像研究員和工程師一樣干活」這件事上,開(kāi)源陣營(yíng)終于不再只是追隨者。

綜合下來(lái),這更像是中國(guó)開(kāi)源陣營(yíng)端出的一塊「前沿 Agent 中樞」:在核心能力上不再刻意回避閉源,而是主動(dòng)站到最硬的那幾項(xiàng)任務(wù)之上。

在黃仁勛的「主權(quán) AI」敘事里,中國(guó)走出了另一條路

如果只看能力,很容易把 K2 Thinking 當(dāng)成「中國(guó)版的 GPT-5 開(kāi)源平替」:參數(shù)級(jí)別、推理水平、編碼能力都在快速接近。但真正意義上的差異,在于它背后的成本結(jié)構(gòu)與算力路徑。

南華早報(bào)等媒體曾經(jīng)援引 Moonshot 內(nèi)部人士說(shuō),K2 的整體研發(fā)成本「只花了西方巨頭一小部分的錢」,用的是 MoE+優(yōu)化器+工程打磨的組合拳,而不是把錢直接堆在 GPU 數(shù)量上。

在 K2 Thinking 這一代,月之暗面在推理效率上又做了一件挺有象征意義的事:把原生 INT4 量化做到大規(guī)模思考模型上。官方技術(shù)說(shuō)明寫得很直白,普通的低比特量化在「思考模型」上往往會(huì)造成性能雪崩,因?yàn)檫@類模型的輸出序列極長(zhǎng)、對(duì)數(shù)值精度極其敏感。月之暗面為此在后訓(xùn)練階段引入了量化感知訓(xùn)練(QAT),并對(duì) MoE 模塊做了專門的INT4 純權(quán)重量化,使得 K2 Thinking 能在保留復(fù)雜推理和 Agent 能力的前提下,把推理速度提升至原來(lái)的兩倍左右。 官方還特別加了一句:這種INT4 方案對(duì)國(guó)產(chǎn)加速芯片會(huì)更加友好。

據(jù) CNBC 的報(bào)道,K2 Thinking 的整體訓(xùn)練成本大約為 460 萬(wàn)美元——只有 OpenAI 或 xAI 訓(xùn)練GPT-5、Grok 等模型成本的 1% 左右。換句話說(shuō),這家被美國(guó)多方打壓、芯片采購(gòu)受限的中國(guó)公司,用幾百分之一的預(yù)算,做出了在多項(xiàng)關(guān)鍵基準(zhǔn)測(cè)試中擊敗 Sam Altman 和 Elon Musk 團(tuán)隊(duì)的模型。


如果把這條技術(shù)路線放在更大的「中美 AI 競(jìng)賽」背景下,意味就完全不同了。

一邊是以 OpenAI 為代表的美國(guó)陣營(yíng),公開(kāi)承諾在未來(lái)幾年投入高達(dá) 1.4 萬(wàn)億美元建設(shè) AI 基礎(chǔ)設(shè)施,配合微軟、亞馬遜、谷歌的巨量數(shù)據(jù)中心建設(shè),把賭注壓在「超大規(guī)模閉源系統(tǒng)」上。另一邊,則是像 Kimi 這樣的一批中國(guó)創(chuàng)業(yè)公司,用 MoE、量化、數(shù)據(jù)重寫等手段把成本擰到極致,在有限的算力預(yù)算下榨出更高的性價(jià)比,然后再把模型權(quán)重開(kāi)源出去,讓更多人站在這條「成本曲線」上往前走。

這個(gè)對(duì)照,和黃仁勛近期的發(fā)言,形成了某種呼應(yīng)。他在倫敦的一場(chǎng)峰會(huì)上把話說(shuō)得透徹:如果美國(guó)繼續(xù)用出口管制、芯片封鎖等方式來(lái)處理中國(guó),「中國(guó)很可能會(huì)贏下這場(chǎng) AI 競(jìng)賽」。隨后英偉達(dá)公關(guān)部門出了澄清,強(qiáng)調(diào)他的本意是美國(guó)應(yīng)該加速創(chuàng)新、贏得全球開(kāi)發(fā)者,但「中國(guó)只落后幾納秒」和「如果政策不改,中國(guó)會(huì)贏」這兩層意思,并沒(méi)有被否認(rèn)。

結(jié)合這一點(diǎn)再看 K2 Thinking,就會(huì)發(fā)現(xiàn),它實(shí)際上代表的是中國(guó)在這場(chǎng)競(jìng)賽里走出的一條「非對(duì)稱路線」。

一方面,在核心能力上,K2 Thinking 用開(kāi)源的方式,在 Humanity’s Last Exam、BrowseComp等多項(xiàng)高難 Agent 評(píng)測(cè)中壓過(guò)了不少閉源旗艦,證明中國(guó)團(tuán)隊(duì)完全有能力在最硬的技術(shù)戰(zhàn)場(chǎng)上正面碰撞。

另一方面,在成本和生態(tài)上,它又刻意拉開(kāi)了和閉源巨頭的距離: 訓(xùn)練階段用 MoE 和優(yōu)化器控制投入規(guī)模; 推理階段用 INT4 和工程優(yōu)化做好國(guó)產(chǎn)算力兼容; 分發(fā)階段用開(kāi)放權(quán)重的方式,把模型放上 Hugging Face 與國(guó)內(nèi)開(kāi)源平臺(tái),讓更多團(tuán)隊(duì)可以直接拿來(lái)做 Agent、做應(yīng)用。

如果說(shuō)黃仁勛口中的「主權(quán) AI」,是鼓勵(lì)各國(guó)砸錢建自己的數(shù)據(jù)中心、堆自己的 GPU 集群,那么 K2 Thinking 代表的,則是一種「輕一點(diǎn)但更聰明」的方案:在不擁有最多 GPU 的前提下,用更聰明的架構(gòu)和更開(kāi)放的生態(tài),讓自己的模型足夠強(qiáng)、足夠便宜、足夠容易被全球開(kāi)發(fā)者采用。

這也是為什么,最近幾年你會(huì)看到越來(lái)越多西方分析文章談「來(lái)自中國(guó)的開(kāi)源威脅」:從DeepSeek到通義,再到Kimi,很多模型的共同點(diǎn)是——性能逼近甚至超越閉源旗艦,但 API 價(jià)格只有后者的幾分之一,還附帶開(kāi)放權(quán)重。

對(duì)月之暗面自己而言,K2 Thinking 給它帶來(lái)的直接收益當(dāng)然是更高的商業(yè)想象力和融資空間:在投融資降溫的一年里,一家公司能在估值 30 多億美元的基礎(chǔ)上,緊接著拿到新一輪數(shù)億美元、本身就是一種投票。

參考文獻(xiàn):

[1] https://moonshotai.github.io/

歡迎掃碼加群參與討論

我們相信認(rèn)知能夠跨越階層,

致力于為年輕人提供高質(zhì)量的科技和財(cái)經(jīng)內(nèi)容。

稿件經(jīng)采用可獲邀進(jìn)入Z Finance內(nèi)部社群,優(yōu)秀者將成為簽約作者,00后更有機(jī)會(huì)成為Z Finance的早期共創(chuàng)成員。

我們正在招募新一期的實(shí)習(xí)生

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
一路走好!張雪峰遺體告別儀式舉行,靈堂布置用心,門外排起長(zhǎng)隊(duì)

一路走好!張雪峰遺體告別儀式舉行,靈堂布置用心,門外排起長(zhǎng)隊(duì)

離離言幾許
2026-03-28 09:10:41
唏噓!張雪峰去世真相+遺囑公布!巨額財(cái)產(chǎn)受益人竟然是她?

唏噓!張雪峰去世真相+遺囑公布!巨額財(cái)產(chǎn)受益人竟然是她?

華人星光
2026-03-27 11:12:47
貝克漢姆家大布:學(xué)歷顏值雙平平,卻娶到白富美嬌妻

貝克漢姆家大布:學(xué)歷顏值雙平平,卻娶到白富美嬌妻

述家?jiàn)视?/span>
2026-03-21 14:23:38
“為什么做成人游戲?” 開(kāi)發(fā)者:因?yàn)槔献邮莻€(gè)變態(tài)

“為什么做成人游戲?” 開(kāi)發(fā)者:因?yàn)槔献邮莻€(gè)變態(tài)

游民星空
2026-03-27 16:42:00
伊朗外長(zhǎng)同聯(lián)合國(guó)秘書(shū)長(zhǎng)通話,就美以對(duì)伊軍事行動(dòng)等交換意見(jiàn)

伊朗外長(zhǎng)同聯(lián)合國(guó)秘書(shū)長(zhǎng)通話,就美以對(duì)伊軍事行動(dòng)等交換意見(jiàn)

澎湃新聞
2026-03-27 11:23:04
放棄轟炸美航母?伊朗槍口大調(diào)轉(zhuǎn),這招反殺讓整個(gè)中東膽寒

放棄轟炸美航母?伊朗槍口大調(diào)轉(zhuǎn),這招反殺讓整個(gè)中東膽寒

孫镴北漂拍客
2026-03-28 08:40:30
伊朗已正式回應(yīng)美國(guó)提出的?;饏f(xié)議

伊朗已正式回應(yīng)美國(guó)提出的停火協(xié)議

新華社
2026-03-26 22:13:37
越扒越猛!釋永信在少林寺有多爽,你根本想不到!終于落到這下場(chǎng)

越扒越猛!釋永信在少林寺有多爽,你根本想不到!終于落到這下場(chǎng)

林輕吟
2026-03-26 07:34:21
馬筱梅產(chǎn)后開(kāi)播狀態(tài)好,生娃后對(duì)大S兒女視如己出,稱要陪他們玩

馬筱梅產(chǎn)后開(kāi)播狀態(tài)好,生娃后對(duì)大S兒女視如己出,稱要陪他們玩

甜檸檬吖
2026-03-28 10:48:47
張雪峰靈堂畫面首次曝出:大廳門口擺滿花圈,遺像安放在鮮花叢中

張雪峰靈堂畫面首次曝出:大廳門口擺滿花圈,遺像安放在鮮花叢中

博士觀察
2026-03-27 13:38:13
41票贊成49票反對(duì)!美國(guó)投票結(jié)果公布,特朗普深夜發(fā)表講話

41票贊成49票反對(duì)!美國(guó)投票結(jié)果公布,特朗普深夜發(fā)表講話

歐洲報(bào)姐
2026-03-27 17:23:21
明天起全國(guó)高速將大變動(dòng)!車主們都說(shuō):終于等到了!

明天起全國(guó)高速將大變動(dòng)!車主們都說(shuō):終于等到了!

苗苗情感說(shuō)
2026-03-28 00:14:58
里弗斯:庫(kù)里扮演著比賽改變者的角色 他比KD和詹姆斯更受歡迎

里弗斯:庫(kù)里扮演著比賽改變者的角色 他比KD和詹姆斯更受歡迎

仰臥撐FTUer
2026-03-28 10:42:07
高血壓的“天敵”被發(fā)現(xiàn)了!研究發(fā)現(xiàn):這2種水果可降低死亡風(fēng)險(xiǎn)

高血壓的“天敵”被發(fā)現(xiàn)了!研究發(fā)現(xiàn):這2種水果可降低死亡風(fēng)險(xiǎn)

DrX說(shuō)
2026-03-27 14:00:07
美國(guó)警告賴清德當(dāng)局:大陸決定動(dòng)手那一刻,“臺(tái)獨(dú)”只剩一個(gè)結(jié)局

美國(guó)警告賴清德當(dāng)局:大陸決定動(dòng)手那一刻,“臺(tái)獨(dú)”只剩一個(gè)結(jié)局

舟望停云
2026-03-28 01:03:37
美股全線大跌,芯片股普跌,微軟較高點(diǎn)跌34%,國(guó)際油價(jià)大漲7%,伊朗考慮退出不擴(kuò)散核武器條約

美股全線大跌,芯片股普跌,微軟較高點(diǎn)跌34%,國(guó)際油價(jià)大漲7%,伊朗考慮退出不擴(kuò)散核武器條約

21世紀(jì)經(jīng)濟(jì)報(bào)道
2026-03-28 07:13:32
曼聯(lián)貝爾恐無(wú)緣戰(zhàn)利茲聯(lián)!復(fù)出沒(méi)想象快,目標(biāo)已改為避免賽季報(bào)銷

曼聯(lián)貝爾恐無(wú)緣戰(zhàn)利茲聯(lián)!復(fù)出沒(méi)想象快,目標(biāo)已改為避免賽季報(bào)銷

羅米的曼聯(lián)博客
2026-03-28 10:53:37
富人圈子里選兒媳鐵律:美貌和文憑都是浮云,這3個(gè)品質(zhì)缺一不可

富人圈子里選兒媳鐵律:美貌和文憑都是浮云,這3個(gè)品質(zhì)缺一不可

千秋文化
2026-02-15 20:12:48
女子產(chǎn)檢15次都是雙胞胎,卻只生下1個(gè)孩子,她喂奶時(shí)發(fā)現(xiàn)一個(gè)問(wèn)題

女子產(chǎn)檢15次都是雙胞胎,卻只生下1個(gè)孩子,她喂奶時(shí)發(fā)現(xiàn)一個(gè)問(wèn)題

奶茶麥子
2026-03-03 16:29:08
小紅書(shū)種草,有線耳機(jī)成了最火“時(shí)尚單品”,銷量暴漲20%

小紅書(shū)種草,有線耳機(jī)成了最火“時(shí)尚單品”,銷量暴漲20%

雷科技
2026-03-25 11:30:26
2026-03-28 11:56:49
ZFinance
ZFinance
Z世代的一站式AI、科技和財(cái)經(jīng)資訊
155文章數(shù) 13關(guān)注度
往期回顧 全部

科技要聞

遭中國(guó)學(xué)界"拉黑"后,這家AI頂會(huì)低頭道歉

頭條要聞

媒體:"霍爾木茲決戰(zhàn)"攤牌了 美給伊朗開(kāi)出"投降"條件

頭條要聞

媒體:"霍爾木茲決戰(zhàn)"攤牌了 美給伊朗開(kāi)出"投降"條件

體育要聞

“我是全家最差勁的運(yùn)動(dòng)員”

娛樂(lè)要聞

王一博改名上熱搜!個(gè)人時(shí)代正式開(kāi)啟!

財(cái)經(jīng)要聞

我在小吃培訓(xùn)機(jī)構(gòu)學(xué)習(xí)“科技與狠活”

汽車要聞

置換補(bǔ)貼價(jià)4.28萬(wàn)起 第五代宏光MINIEV正式上市

態(tài)度原創(chuàng)

游戲
旅游
房產(chǎn)
手機(jī)
公開(kāi)課

主機(jī)越老越貴!外媒怒噴:PS5 Pro漲價(jià)后徹底不值得買

旅游要聞

賞花經(jīng)濟(jì)正旺,2月以來(lái)重慶景區(qū)收入同比增長(zhǎng)81.8%

房產(chǎn)要聞

6.8萬(wàn)方!天河員村再征地,金融城西區(qū)開(kāi)發(fā)全面提速

手機(jī)要聞

小米18 Ultra要配LOFIC長(zhǎng)焦和三個(gè)2億像素鏡頭?

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版