国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AI泡沫論調(diào)下,月之暗面用460萬美元訓(xùn)練了一款萬億參數(shù)模型

0
分享至



出品|搜狐科技

作者|梁昌均

編輯|楊 錦

“AI獨角獸又重回舞臺中心了。”談及最近國產(chǎn)大模型的表現(xiàn),有AI從業(yè)者感嘆。

最新例證是,月之暗面發(fā)布的萬億參數(shù)思考模型Kimi K2 Thinking,其基本趕超GPT-5等領(lǐng)先的閉源模型,并登頂全球開源模型榜首。

值得注意的是,這款模型還用了很低的成本。搜狐科技獲悉,Kimi K2 Thinking模型的訓(xùn)練成本約為460萬美元(約合人民幣3200萬元)。

這刷新了DeepSeek的紀錄。DeepSeek曾透露V3模型僅花了560萬美元,引發(fā)全球AI圈震動,如今Kimi K2 Thinking又降低了百萬美元。

“這是中國大模型最接近OpenAI的時刻”、“又一個DeepSeeek時刻”,不少評價稱。而除了月之暗面,智譜、MiniMax的模型最近也在海外出圈。

DeepSeek-R2遲遲不來,現(xiàn)在其也似乎已不再是話題中心,曾被搶去風(fēng)頭的國內(nèi)AI獨角獸則開始走向全球舞臺,這也是這些公司試圖重新?lián)尰丶夹g(shù)話語權(quán)的嘗試。


“又一個DeepSeeek時刻”

萬億參數(shù)、開源登頂、趕超GPT-5……這是月之暗面最新發(fā)布的思考模型Kimi K2 Thinking被外界討論的關(guān)注點。

官方評測顯示,該模型在推理、編程等多個能力超過或接近GPT-5和Claude Sonnet 4.5,并在人類最后的考試(Humanity's Last Exam)等多項基準(zhǔn)測試中達到SOTA(最優(yōu))水平。



“這是開源模型的歷史性突破。”在Artificial Analysis(下稱AA)最新發(fā)布的全球模型綜合評測中,Kimi K2 Thinking得分躍居全球第二,和GPT-5兩款模型僅有1分之差。


在該機構(gòu)發(fā)布的智能體評測基準(zhǔn)τ2-Bench的電信任務(wù)中,Kimi K2 Thinking更是直接躍升至第一名,吊打GPT-5、Claude Sonnet 4.5、Grok4等領(lǐng)先模型。

月之暗面在海外社交平臺對這款模型的介紹推文短短幾天閱讀就超過440萬,并再次刷新了海外對中國大模型的認知,有評論認為這又是一個“DeepSeek時刻”。

這款模型用了比DeepSeek更低的成本。搜狐科技從知情人士獲悉,Kimi K2 Thinking模型的訓(xùn)練成本約為460萬美元。這不僅遠低于OpenAI等模型投入,還打破了DeepSeek-V3約560萬美元的訓(xùn)練成本紀錄。

“相對美國那些頂尖模型來說,這個成本很低。中國多數(shù)模型都差不多這個預(yù)算水平,很多企業(yè)沒有那么多芯片可用,所以就是看誰訓(xùn)得好。”有AI從業(yè)者表示。

至于Kimi K2 Thinking為何能繼續(xù)降低成本,月之暗面并未透露相關(guān)技術(shù)論文,業(yè)內(nèi)認為還是得益于算法、架構(gòu)、后訓(xùn)練等方面的優(yōu)化,此次關(guān)鍵的一點是采用了原生INT4量化技術(shù)。

INT4是指在大語言模型中的一種量化技術(shù),其通過降低模型參數(shù)的數(shù)值精度來減少模型的存儲需求和計算資源消耗,同時盡可能地保持模型的性能。

月之暗面研究員劉少偉發(fā)文透露,在研發(fā)K2-Thinking時,發(fā)現(xiàn)隨著模型的生成長度變得越來越長,想要實現(xiàn)低延遲的推理,必須使用量化損失更小的INT4 QAT(訓(xùn)練感知量化)方案,這也使得后訓(xùn)練強化學(xué)習(xí)的訓(xùn)練效率顯著提升。

至于為何不選擇更“先進”的格式,劉少偉稱是為了更好地支持非Blackwell架構(gòu)硬件?!霸诖竽P蜁r代,量化是一個可以跟SOTA和Frontier(邊界)放在一起,甚至加快模型達到Frontier速度的概念?!?/p>

不過,不少實測顯示,Kimi K2 Thinking顯得非?!霸挵A”。在AA的智能指數(shù)評測時,它總共使用1.4億個token,是DeepSeek V3.2的2.5倍,是GPT-5的2倍,導(dǎo)致推理成本和速度受到一定影響。

“現(xiàn)在,世界上最智能的模型是開源的,而且來自中國。如果美國繼續(xù)閉門造車,中國開源模型將會完全取勝。”有評論說到。

全球華人首富黃仁勛上周提到,中國的AI技術(shù)非常出色,并開發(fā)出了非常優(yōu)秀的AI,目前世界上最流行的開源AI模型都來自中國,發(fā)展速度非常快。

這話說得沒錯,目前中國的開源模型無論是能力,還是數(shù)量都占據(jù)優(yōu)勢,今年的開源榜首也由中國模型輪流做。

在AA全球最新開源模型榜單中,全球前十模型中有六款來自中國,其中Kimi K2 Thinking居首,取代了半月前登頂榜首的MiniMax-M2,以及更早前的阿里、DeepSeek模型。


過去一段時間,以O(shè)penAI為核心的美國科技圈圍繞算力基礎(chǔ)設(shè)施進行捆綁,并揮出上萬億美元的投資,將自身優(yōu)勢發(fā)揮到了極致,但這種模式在中國難以復(fù)制。

對中國多數(shù)大模型廠商來說,需要在算法、架構(gòu)、工程等層面加大創(chuàng)新突破,正如DeepSeek和Kimi所做的這樣。一點一點的微創(chuàng)新累計起來,最終有可能產(chǎn)生驚人的成果。

一個明顯的信號是,中國AI獨角獸在重回技術(shù)競賽后,正在重回舞臺中心?,F(xiàn)在,DeepSeek在AA全球模型的排名已至十名之外,或許只有R2會再扳回一局。


國產(chǎn)模型的應(yīng)用之風(fēng)吹到了硅谷

在Kimi 模型出圈的背后,中國大模型日益受到海外青睞,硅谷正嘗試從昂貴的閉源往更便宜的中國開源模型上遷移。

硅谷知名投資人、Social Capital公司創(chuàng)始人Chamath Palihapitiya近日坦言,已把大量工作負載轉(zhuǎn)移到Kimi K2。

美國云計算公司Vercel則上線了該模型的API服務(wù),AI編程獨角獸Cursor和Windsurf,百度前高管景鯤在美創(chuàng)業(yè)公司Genspark,以及AI搜索獨角獸Perplexity等多家公司均有接入。

MiniMax早前發(fā)布的推理模型M2,推出幾天后就在海外模型路由器OpenRouter的全球調(diào)用量達到前三,一度成為HuggingFace下載量最大的模型,還有至少20家平臺提供了API服務(wù)。

此外,不少硅谷公司被爆出套殼中國大模型。Cursor在最新2.0版本更新中,推出首個自家的代碼模型Composer。但被開發(fā)者爆出,Composer套殼了中國的GLM-4.6模型。

GLM- 4.6是智譜在今年9月底發(fā)布的旗艦?zāi)P停a能力對齊Claude Sonnet 4,當(dāng)時號稱國內(nèi)最好的代碼模型,隨后在大模型競技場LMArena中排名開源模型第一。

另外兩大AI編程獨角獸Cognition和Windsurf也被爆出套殼GLM-4.6,Windsurf在被網(wǎng)友扒出后,直接不裝了,稱應(yīng)社區(qū)用戶的熱烈呼聲,上線了GLM-4.6模型,認為其“將帶來更出色的代碼生成能力和編程任務(wù)表現(xiàn)”。

這也讓不少AI從業(yè)者感到振奮?!霸瓉矶际侵袊竽P吞讱ずM忸I(lǐng)先模型,現(xiàn)在我們的模型成為被套殼的對象,國產(chǎn)模型真正開始揚眉吐氣了?!?/p>

可以說,中國大模型出海已進入新階段。從最初僅僅是關(guān)注討論,到部分產(chǎn)品應(yīng)用出圈,再到多個國產(chǎn)基座模型在海外企業(yè)落地,大模型領(lǐng)域的Made in China含金量,正在持續(xù)上升。

值得注意的是,這些模型均選擇了開源。這讓全球開發(fā)者和企業(yè)能夠無負擔(dān)地應(yīng)用起來,而中國大模型借助開源正在構(gòu)建起越來越大的技術(shù)影響。

當(dāng)然,開源也需要實力支撐,而讓硅谷選擇中國模型的關(guān)鍵就是極致的性價比。

美國云計算公司Vercel CEO吉列爾莫·勞赫(Guillermo Rauch)提到,在內(nèi)部智能體真實場景基準(zhǔn)測試中,Kimi K2在運行速度和準(zhǔn)確率上優(yōu)于GPT-5和Claude Sonnet 4.5,其中準(zhǔn)確率更是高出50%。

前述硅谷投資人Chamath則提到,Kimi-K2性能夠強,且比OpenAI和Anthropic便宜太多。

數(shù)據(jù)顯示,Kimi-K2、Kimi K2 Thinking以及智譜GLM-4.6的API輸出價格約為GPT-5的20%,不到Claude Sonnet 4.5的15%,MiniMax-M2的價格更是僅有Claude Sonnet 4.5的8%。

“這個一個重要時刻,中國的開源模型具備了足夠的能力來支持西方產(chǎn)品的開發(fā),全球AI正進入多極化競爭的新格局?!庇性u論稱,甚至有海外網(wǎng)友表示:是不是該學(xué)點中文了?


融資上市,AI獨角獸各謀出路

技術(shù)趕超、出海破圈,中國的AI獨角獸試圖繼續(xù)留在牌桌上。這也讓它們在邁向上市和新一輪融資的過程中,更有底氣了。

月之暗面最近被爆出開啟新一輪融資,甚至傳出海外知名的a16z考慮投資。有消息稱,月之暗面此次融資約6億美金,投前估值38億美金,領(lǐng)投方指向IDG,騰訊、五源資本、今日資本等老股東計劃跟投。

如融資完成,月之暗面有望成為繼智譜、MiniMax后又一家估值超300億元的AI獨角獸。

搜狐科技就此向月之暗面以及有關(guān)投資方求證,對方未做回應(yīng)。有關(guān)注AI的投資人認為,這么高額的融資,一般需要比較長的時間決策確認,而美國基金在當(dāng)前環(huán)境下不太可能投。

對月之暗面前述估值,該投資人表示,在國內(nèi)大模型融資熱潮已經(jīng)過去的情況下,這個估值不算低,但相較美國大模型獨角獸來說差距很大。

有觀點認為,國內(nèi)AI獨角獸相較美國AI創(chuàng)企,技術(shù)和估值嚴重不匹配。比如,月之暗面估值不到OpenAI和Anthropic的1%,“國內(nèi)大模型賺錢還是太難了”。

此前兩年,月之暗面是大模型市場炙手可熱的明星,去年超13億美元的兩輪融資更是讓其成為估值達33億美元的AI獨角獸,Kimi也一度成為國內(nèi)流量最高的AI原生應(yīng)用。

然而,隨著聯(lián)創(chuàng)張予彤和朱嘯虎的糾紛,以及DeepSeek沖擊,月之暗面遭遇質(zhì)疑,公司發(fā)展也出現(xiàn)擺動,停止產(chǎn)品投流,重心轉(zhuǎn)向技術(shù),并從閉源走向開源等。

今年以來,Kimi用戶規(guī)模增長停滯甚至下降。據(jù)QuestMobile,今年9月,Kimi月活規(guī)模已不足千萬,相較去年12月下降超過1100萬,在國內(nèi)AI原生APP排名從第二降至第五。


在商業(yè)化方面,月之暗面繼續(xù)押注C端,此前在海內(nèi)外上線OK Computer,并首次開啟訂閱付費。在國內(nèi)同類型產(chǎn)品均免費,且面臨頭部競爭情況下,這可能是一場持久的惡戰(zhàn)。

在這種情況下,此次融資對月之暗面頗為重要,尤其是在商業(yè)化相對較好的智譜開啟上市和MiniMax計劃上市的情況下,其需要積累更多資金應(yīng)對未來的變局。

今年中期,MiniMax完成近3億美元新一輪融資,投后估值超40億美元,上海國資等出手。隨后,該公司被爆計劃赴港上市,當(dāng)時內(nèi)部人士稱確有上市想法。

目前,該公司海外推出的陪伴類應(yīng)用Talkie和視頻生成應(yīng)用海螺AI構(gòu)成其主要收入來源,最近還在編程和智能體產(chǎn)品上推出收費模式,進一步押注C端。

深耕G端和B端的智譜則在今年上半年完成多地國資融資,并開啟上市,有望在年內(nèi)提交科創(chuàng)板招股書,成為大模型第一股。此前該公司爆出裁員,亦反應(yīng)出商業(yè)化和上市的不易。

肉眼可見的是,AI四小虎中的階躍星辰,似乎有些掉隊。AI獨角獸們在技術(shù)理想和現(xiàn)實交織當(dāng)中仍面臨生存壓力,但目前還遠未到格局已定的局面。



運營編輯 |曹倩審核|孟莎莎




特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
無錫著名大商城 要沒了?

無錫著名大商城 要沒了?

無錫eTV全媒體
2025-12-24 10:09:26
老公駐派中東3年,我深夜給5歲女兒掖被角,她說:爸爸每天半夜來

老公駐派中東3年,我深夜給5歲女兒掖被角,她說:爸爸每天半夜來

朝暮書屋
2025-12-17 18:26:03
-5℃!冰凍、大風(fēng)影響江蘇!

-5℃!冰凍、大風(fēng)影響江蘇!

江南晚報
2025-12-25 04:04:36
別被“某音”前凸后翹的網(wǎng)紅美女騙了....

別被“某音”前凸后翹的網(wǎng)紅美女騙了....

健身廚屋
2025-11-22 15:41:18
北京豐臺一小區(qū)住進一位“特殊業(yè)主”!這家安得太會挑地方了!

北京豐臺一小區(qū)住進一位“特殊業(yè)主”!這家安得太會挑地方了!

BRTV新聞
2025-12-24 11:35:26
徐湖平大劇已終?《亞洲周刊》這條發(fā)文傳遞什么信息?

徐湖平大劇已終?《亞洲周刊》這條發(fā)文傳遞什么信息?

達文西看世界
2025-12-24 14:45:08
巴菲特的兒子赴烏克蘭前線協(xié)助平民撤離

巴菲特的兒子赴烏克蘭前線協(xié)助平民撤離

桂系007
2025-12-24 23:47:09
離譜!阿森納向皇馬推薦阿爾特塔心中愛將

離譜!阿森納向皇馬推薦阿爾特塔心中愛將

奶蓋熊本熊
2025-12-25 02:32:37
獨生女不愿接班,天津老板套現(xiàn)7.2億,把家族產(chǎn)業(yè)賣給了安徽國資

獨生女不愿接班,天津老板套現(xiàn)7.2億,把家族產(chǎn)業(yè)賣給了安徽國資

素衣讀史
2025-12-23 17:03:03
賴昌星發(fā)妻曾明娜現(xiàn)狀:逃亡10年后回國,守著3000平老宅安靜養(yǎng)老

賴昌星發(fā)妻曾明娜現(xiàn)狀:逃亡10年后回國,守著3000平老宅安靜養(yǎng)老

古書記史
2025-12-12 11:21:38
女人陪你去下面三個地方,就是想要和你越界了,藏不住

女人陪你去下面三個地方,就是想要和你越界了,藏不住

落雪聽梅a
2025-12-23 12:10:06
勇士內(nèi)訌原因曝光!追夢不想干累活,被罰100萬,名嘴建議他替補

勇士內(nèi)訌原因曝光!追夢不想干累活,被罰100萬,名嘴建議他替補

你的籃球頻道
2025-12-24 09:21:29
闞清子讓微博炸鍋了!被傳孩子沒留住?路透看樣子夫婦倆心情很差

闞清子讓微博炸鍋了!被傳孩子沒留住?路透看樣子夫婦倆心情很差

好賢觀史記
2025-12-23 23:44:58
中國購買委內(nèi)瑞拉石油的超大型油輪已經(jīng)上路,美國還敢攔劫嗎?

中國購買委內(nèi)瑞拉石油的超大型油輪已經(jīng)上路,美國還敢攔劫嗎?

我心縱橫天地間
2025-12-21 18:38:22
造孽,挖了個大大坑

造孽,挖了個大大坑

越女事務(wù)所
2025-12-23 22:45:01
1.04835億元!廣州天河路體育東路交界一戶外廣告使用權(quán)“破億”成交

1.04835億元!廣州天河路體育東路交界一戶外廣告使用權(quán)“破億”成交

阿離家居
2025-12-25 01:41:55
阿里、拼多多、抖音集體“解綁”快遞!背后傳遞出哪些信號?

阿里、拼多多、抖音集體“解綁”快遞!背后傳遞出哪些信號?

新浪財經(jīng)
2025-12-24 09:52:30
龐家后人對《新華社》報道的聲明:不公正、不理解、不接受

龐家后人對《新華社》報道的聲明:不公正、不理解、不接受

每日一見
2025-12-21 14:31:46
楊丞琳退出娛樂圈!白皮女星懷金主的孩子!

楊丞琳退出娛樂圈!白皮女星懷金主的孩子!

八卦瘋叔
2025-12-23 12:46:15
今年的雞蛋,為啥這么便宜?終于有商販說實話了

今年的雞蛋,為啥這么便宜?終于有商販說實話了

簡食記工作號
2025-12-24 00:11:43
2025-12-25 06:40:49
搜狐科技 incentive-icons
搜狐科技
搜狐科技官方賬號
4615文章數(shù) 9175關(guān)注度
往期回顧 全部

科技要聞

智譜和MiniMax拿出了“血淋淋”的賬本

頭條要聞

幼兒園8人遇難兒童母親:女兒4歲 今年9月入讀

頭條要聞

幼兒園8人遇難兒童母親:女兒4歲 今年9月入讀

體育要聞

26歲廣西球王,在質(zhì)疑聲中成為本土得分王

娛樂要聞

懷孕增重30斤!闞清子驚傳誕一女夭折?

財經(jīng)要聞

北京進一步放松限購 滬深是否會跟進?

汽車要聞

“運動版庫里南”一月份亮相???或命名極氪9S

態(tài)度原創(chuàng)

旅游
教育
時尚
親子
手機

旅游要聞

上海藏2800株水上紅杉!免費開放,夕陽下美成油畫

教育要聞

調(diào)皮搗蛋的孩子,能給他安排一個班干部職位嗎?

對不起周柯宇,是陳靖可先來的

親子要聞

闞清子被曝早產(chǎn)女嬰,多重畸形搶救無效去世,細節(jié)曝光嘆真不應(yīng)該

手機要聞

榮耀Magic8 Ultra:雙3D生物識別+LOFIC主攝,還有24GB大內(nèi)存!

無障礙瀏覽 進入關(guān)懷版