国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

國產(chǎn)大模型年前集中爆發(fā),Kimi新模型k1.5對(duì)標(biāo)OpenAI o1滿血版(附帶技術(shù)報(bào)告解讀)

0
分享至

大洋彼岸的 OpenAI 遲遲沒有發(fā)布 GPT-5,一度讓業(yè)界懷疑 Scaling Law 是否已經(jīng)失效。然而,國內(nèi)多個(gè)團(tuán)隊(duì)卻接連推出重磅 AI 大模型,用事實(shí)證明 Scaling 依然有效,只不過并不是無腦堆硬件、堆算力。

Kimi k1.5的這次推出的大模型就是以推理能力見長的模型。

不知道你們有沒有注意到Recipe這個(gè)詞,在Kimi k1.5的技術(shù)報(bào)告提到了好多次,它的意思是「菜譜」,相當(dāng)于說把一道菜需要的原材料、炊具以及注意事項(xiàng)都明明白白告訴你了。

技術(shù)報(bào)告鏈接:

https://github.com/MoonshotAI/Kimi-k1.5/blob/main/Kimi_k1.5.pdf

可以說,一向閉源的Kimi這次的技術(shù)報(bào)告可以理解為「半開源」,就像把西紅柿雞蛋的做法一步步的列出來,你模仿它的方法即可,唯一不同的就是具體的操作差異。

比如你的火力大一點(diǎn)兒,鍋的材質(zhì)不同等等,并且Kimi k1.5的性能在好幾個(gè)方面的性能都已經(jīng)事實(shí)上的超過了OpenAI o1滿血版,可以說是含金量非常高的一次「半開源」。

特別是OpenAI o3,也就是在FrontierMath這個(gè)非常難的數(shù)學(xué)測(cè)試集上達(dá)到了變態(tài)成績(jī)后的幾周,被曝出暗中資助了這個(gè)比賽的丑聞。

如果o3是靠在數(shù)據(jù)集和答案上預(yù)訓(xùn)練出來的,那么它這種既當(dāng)運(yùn)動(dòng)員也當(dāng)裁判員的操作,也才拿到了25%左右的正確率,這只能證明o3僅是o1的特殊微調(diào)版,只是用來維持OpenAI紙面榮譽(yù)的工具。

那Kimi k1.5的含金量就直線上升了,long CoT在Math數(shù)學(xué)推理,Code編程能力以及Vision視覺多模態(tài)上的表現(xiàn),4/6超過了最強(qiáng)的o1正式版模型。

Kimi k1.5還用了Long2short的方法,將Long CoT的能力遷移到Short CoT上,也在大多數(shù)的任務(wù)上達(dá)到了SOTA的水平,最牛的是在AIME的Pass@1實(shí)驗(yàn)中,效果遠(yuǎn)超其他幾家(第一個(gè)子圖藍(lán)色的Kimi獨(dú)樹一幟)。

特別是Long2short之后迭代出來的幾個(gè)short CoT,在下面這兩個(gè)數(shù)學(xué)數(shù)據(jù)集上的性能甚至超過了long CoT,可見CoT可以深挖甚至scaling的地方還有很多。

這些數(shù)據(jù)基本上表明了OpenAI o1滿血版的性能全面在Kimi k1.5上實(shí)現(xiàn),更重要的是Kimi K系列的快速迭代能力,從初代 Kimi k0 math 到Top級(jí)別的 Kimi 1.5,就倆月多點(diǎn),直接數(shù)學(xué)偏科到全科專精。

其中第一個(gè)長上下文是最近發(fā)布的幾個(gè)大模型的共性,因?yàn)槌醮鶯LM的思路簡(jiǎn)單直接,就是一問一答,單步操作;

但是后來發(fā)現(xiàn)這樣的單步操作對(duì)于比較復(fù)雜的問題,比如數(shù)學(xué)物理等需要更多邏輯思考且一步完不成的任務(wù),就需要思維鏈(CoT)這樣的技術(shù),相比起初代LLM,推理大模型可以將復(fù)雜的任務(wù)分成簡(jiǎn)單的單步任務(wù)進(jìn)行。

這樣的好處很直接,不過缺點(diǎn)也很明顯,那就是這些思考過程明顯是需要更多的“記憶力”,換到LLM大模型領(lǐng)域就是上下文長度了,理論上越長越好,最近發(fā)布的MiniMax-01就把上下文長度記錄拉到了400萬。

Kimi k1.5并沒有在極限上下文上做文章,而是將long context長度定為128K,然后用Partial Rollout的方法重復(fù)利用歷史記錄,而不是重新生成,這樣的策略從結(jié)果上表明非常有效。

再加上如果用過OpenAI o1的話,很多簡(jiǎn)單的問題o1會(huì)出現(xiàn)過度思考(overthinking)的現(xiàn)象,其實(shí)這也是一種對(duì)于計(jì)算能力的浪費(fèi)以及策略不夠優(yōu)化的表現(xiàn)。

菜譜也提到了這個(gè)點(diǎn),他們采用了長度懲罰(Length Penalty)的措施,倒逼大模型跟人類對(duì)齊,畢竟人類不會(huì)對(duì)一個(gè)簡(jiǎn)單問題思考6分鐘。

最后,我特意看了看Kimi微信公眾號(hào)對(duì)于自己新模型的介紹,開頭的一句話特別契合Kimi k1.5這個(gè)模型。

簡(jiǎn)單的方法在很多時(shí)候被認(rèn)為是取巧的,但事實(shí)支配上人類社會(huì)以及整個(gè)自然界運(yùn)轉(zhuǎn)的規(guī)律都是非常簡(jiǎn)潔且優(yōu)雅的,既不存在無限資源這種美夢(mèng),也沒有出現(xiàn)普遍的窮思竭慮。

總的來說,Kimi k1.5的這次更新,無疑將中國的大模型和國外最頂尖的OpenAI差距拉到了幾乎同一個(gè)水平線,同時(shí)這次的「半開源」更是給AI 大模型社區(qū)注入了一些「做菜秘訣」,相信這些東西可以讓整個(gè)大模型社區(qū)的進(jìn)化速度更進(jìn)一步。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
羅榮桓提議由賀龍擔(dān)任國防部長,毛主席聞言說道:還是讓賀老總出任軍委第二副主席吧

羅榮桓提議由賀龍擔(dān)任國防部長,毛主席聞言說道:還是讓賀老總出任軍委第二副主席吧

清風(fēng)鑒史
2025-12-27 19:37:17
1948年,王耀武被俘后,陳毅不解地問:你家里為何會(huì)藏了兩臺(tái)拖拉機(jī)?

1948年,王耀武被俘后,陳毅不解地問:你家里為何會(huì)藏了兩臺(tái)拖拉機(jī)?

宅家伍菇?jīng)?/span>
2025-12-07 09:00:04
日本僧人做出驚人之舉!日本住持向中國捐贈(zèng)5000份日軍侵華史料

日本僧人做出驚人之舉!日本住持向中國捐贈(zèng)5000份日軍侵華史料

扶蘇聊歷史
2025-12-27 11:14:51
回顧:斯大林看完長津湖戰(zhàn)報(bào),當(dāng)即下令:將36個(gè)師的裝備支援我國

回顧:斯大林看完長津湖戰(zhàn)報(bào),當(dāng)即下令:將36個(gè)師的裝備支援我國

清澈之玹
2024-12-25 21:16:59
南博新消息,徐鶯被曝領(lǐng)國家專項(xiàng)補(bǔ)助,還有人冒出頭為她站臺(tái)

南博新消息,徐鶯被曝領(lǐng)國家專項(xiàng)補(bǔ)助,還有人冒出頭為她站臺(tái)

奇思妙想草葉君
2025-12-26 23:17:24
1945年,女八路忍痛將剛出生的女兒放在路旁,當(dāng)上總理后才敢相認(rèn)

1945年,女八路忍痛將剛出生的女兒放在路旁,當(dāng)上總理后才敢相認(rèn)

古書記史
2025-12-24 20:24:21
60歲以后打斷筋都不要做的14件事,做三件就糊涂到家了,馬上收藏

60歲以后打斷筋都不要做的14件事,做三件就糊涂到家了,馬上收藏

情感大使館
2025-12-01 10:40:53
張靚穎透視裝被批擦邊,老粉心疼:除了露肉,忘了海豚音?

張靚穎透視裝被批擦邊,老粉心疼:除了露肉,忘了海豚音?

情感大頭說說
2025-12-28 06:05:04
保時(shí)捷中心總經(jīng)理帶頭連夜搬空車輛,貴陽鄭州兩地三店暫停營業(yè),控股方否認(rèn)“投資人跑路”

保時(shí)捷中心總經(jīng)理帶頭連夜搬空車輛,貴陽鄭州兩地三店暫停營業(yè),控股方否認(rèn)“投資人跑路”

大風(fēng)新聞
2025-12-27 10:39:04
體重降不下來?5個(gè)方法幫你突破減肥平臺(tái)期,讓體重咔咔掉!

體重降不下來?5個(gè)方法幫你突破減肥平臺(tái)期,讓體重咔咔掉!

運(yùn)動(dòng)健身號(hào)
2025-12-26 11:38:19
大波業(yè)主的傳奇

大波業(yè)主的傳奇

求實(shí)處
2025-12-28 00:00:09
17億美元賣掉公司,美國一老板給540名員工發(fā)2.4億美元獎(jiǎng)金

17億美元賣掉公司,美國一老板給540名員工發(fā)2.4億美元獎(jiǎng)金

瀟湘晨報(bào)
2025-12-26 16:32:15
沉默五天,蔡英文重磅發(fā)文,臺(tái)北全城已警戒,國民黨揪出罪惡根源

沉默五天,蔡英文重磅發(fā)文,臺(tái)北全城已警戒,國民黨揪出罪惡根源

現(xiàn)代小青青慕慕
2025-12-27 15:04:15
回顧探花大神:害人害己,多位女主被親戚認(rèn)出當(dāng)場(chǎng)“社死”

回顧探花大神:害人害己,多位女主被親戚認(rèn)出當(dāng)場(chǎng)“社死”

就一點(diǎn)
2025-10-09 12:19:42
中俄為啥不結(jié)盟?俄專家:中國拒絕與俄羅斯結(jié)盟,原因有3個(gè)

中俄為啥不結(jié)盟?俄專家:中國拒絕與俄羅斯結(jié)盟,原因有3個(gè)

博覽歷史
2025-12-26 06:40:03
刀郎為愛徒徐子堯發(fā)聲不到一周,惡心一幕發(fā)生,云朵的話有人信了

刀郎為愛徒徐子堯發(fā)聲不到一周,惡心一幕發(fā)生,云朵的話有人信了

仙味少女心
2025-12-28 08:24:10
云南省委省政府:嚴(yán)肅追責(zé)問責(zé)16名廳級(jí)干部

云南省委省政府:嚴(yán)肅追責(zé)問責(zé)16名廳級(jí)干部

上觀新聞
2025-12-27 14:42:10
汪小菲一家過圣誕節(jié)!11歲小玥兒露正臉瘦好多,黑黑瘦瘦太像大S

汪小菲一家過圣誕節(jié)!11歲小玥兒露正臉瘦好多,黑黑瘦瘦太像大S

娛樂圈圈圓
2025-12-26 19:52:29
對(duì)等攔截!報(bào)仇不隔夜!1000萬升走私燃料被截,背后竟是美國人?

對(duì)等攔截!報(bào)仇不隔夜!1000萬升走私燃料被截,背后竟是美國人?

現(xiàn)代小青青慕慕
2025-12-27 13:39:34
惡毒奶奶掌摑孫女后續(xù)!孫女嘴被打腫,父親發(fā)聲,母親哭了一夜

惡毒奶奶掌摑孫女后續(xù)!孫女嘴被打腫,父親發(fā)聲,母親哭了一夜

奇思妙想草葉君
2025-12-27 11:51:12
2025-12-28 09:56:49
平凡AI incentive-icons
平凡AI
高校AI從業(yè)者
54文章數(shù) 23關(guān)注度
往期回顧 全部

科技要聞

新任NASA掌門放話:特朗普任期內(nèi)必將重返月球

頭條要聞

四川原副省長葉寒冰被通報(bào):長期出入私人會(huì)所聚餐飲酒

頭條要聞

四川原副省長葉寒冰被通報(bào):長期出入私人會(huì)所聚餐飲酒

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂要聞

張昊唯逃稅涉黃風(fēng)波落幕:法院認(rèn)定朋友造謠

財(cái)經(jīng)要聞

英偉達(dá)的收購史

汽車要聞

好音響比大屏更重要?車企開始“聽”用戶的

態(tài)度原創(chuàng)

本地
旅游
家居
數(shù)碼
公開課

本地新聞

云游安徽|踏訪池州,讀懂山水間的萬年史書

旅游要聞

來松江,就放松丨連續(xù)4天上演煙花秀!上海歡樂谷閃耀歡禧節(jié)開啟

家居要聞

格調(diào)時(shí)尚 智慧品質(zhì)居所

數(shù)碼要聞

彩殼版蘋果初代AirPods耳機(jī)曝光:風(fēng)格酷似iPhone 5C

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版