国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Kimi超過(guò)DeepSeek的新模型被指“套殼”Qwen?到底怎么回事兒

0
分享至

作者 | 周一笑
郵箱 | zhouyixiao@pingwest.com

昨天深夜,月之暗面發(fā)布了開源代碼模型Kimi-Dev-72B。這個(gè)模型在軟件工程任務(wù)基準(zhǔn)測(cè)試SWE-bench Verified上取得了60.4%的成績(jī),創(chuàng)下開源模型新紀(jì)錄,超越了包括DeepSeek在內(nèi)的多個(gè)競(jìng)爭(zhēng)對(duì)手。

然而,當(dāng)開發(fā)者們深入了解這個(gè)模型時(shí),發(fā)現(xiàn)它明確標(biāo)注了:Base model: Qwen/Qwen2.5-72B。這引發(fā)了一些人的疑問(wèn),Kimi-Dev的優(yōu)異表現(xiàn),究竟是創(chuàng)新還是“套殼”?

Kimi-Dev-72B并非從零開始訓(xùn)練的模型。根據(jù)月之暗面在Hugging Face上的說(shuō)明,這個(gè)模型明確標(biāo)注了Base model: Qwen/Qwen2.5-72B。在官方博客中也寫到:以 Qwen 2.5-72B 基礎(chǔ)模型為起點(diǎn),我們收集了數(shù)百萬(wàn)個(gè) GitHub 問(wèn)題單和 PR 提交作為中期訓(xùn)練數(shù)據(jù)集。這意味著Kimi-Dev是基于阿里巴巴Qwen團(tuán)隊(duì)的72B參數(shù)模型進(jìn)行二次開發(fā)的。

從技術(shù)角度看,Kimi-Dev的創(chuàng)新主要體現(xiàn)在訓(xùn)練方法上。月之暗面采用了大規(guī)模強(qiáng)化學(xué)習(xí)技術(shù),讓模型在Docker環(huán)境中自主修復(fù)真實(shí)代碼倉(cāng)庫(kù)的問(wèn)題,只有當(dāng)完整測(cè)試套件通過(guò)時(shí)才能獲得獎(jiǎng)勵(lì)。這種訓(xùn)練方式確保了模型生成的代碼不僅正確,而且符合實(shí)際開發(fā)標(biāo)準(zhǔn)。

在軟件工程任務(wù)基準(zhǔn)測(cè)試上,Kimi-Dev-72B展現(xiàn)了出色的性能。它在SWE-bench Verified上取得了60.4%的成績(jī),這是一個(gè)專門評(píng)估模型解決真實(shí)GitHub issues能力的基準(zhǔn)測(cè)試。相比之下,前一名開源模型的成績(jī)僅為約50%左右,Kimi-Dev實(shí)現(xiàn)了顯著的提升。

在許可證方面,Kimi-Dev-72B的LICENSE.md文件顯示其采用MIT協(xié)議發(fā)布。

但同時(shí),月之暗面也在文檔中明確說(shuō)明:“Kimi-Dev-72B is built with Qwen-2.5-72B. Qwen-2.5-72B is licensed under the Qwen LICENSE AGREEMENT, Copyright (c) Alibaba Cloud. All Rights Reserved.Subject to the Qwen LICENSE AGREEMENT, Kimi-Dev-72B is under MIT license”。

也就是說(shuō)Kimi-Dev-72B需要遵守Qwen-2.5-72B的原始許可限制,同時(shí)將自己的創(chuàng)新工作(即通過(guò)強(qiáng)化學(xué)習(xí)獲得的微調(diào)權(quán)重)以MIT協(xié)議開源。這種做法在開源社區(qū)中被稱為“delta權(quán)重”發(fā)布,即只發(fā)布相對(duì)于基礎(chǔ)模型的增量部分。

一個(gè)“歷史遺留”問(wèn)題

爭(zhēng)議的起源是社區(qū)對(duì)“月之暗面是否獲得了使用Qwen-2.5-72B的特殊許可”的質(zhì)疑。根據(jù)Qwen的許可協(xié)議體系,雖然較小的模型采用Apache 2.0協(xié)議,但72B這個(gè)旗艦?zāi)P筒捎玫氖恰锻x千問(wèn)許可協(xié)議》(Qwen LICENSE AGREEMENT)。

這份協(xié)議規(guī)定,當(dāng)產(chǎn)品的月活躍用戶(MAU)超過(guò)1億時(shí),需要向阿里申請(qǐng)商業(yè)授權(quán)??紤]到Kimi作為熱門AI助手的用戶規(guī)模,可能將Kimi-Dev-72B引入其產(chǎn)品,這個(gè)限制條款引起了關(guān)注。

面對(duì)社區(qū)詢問(wèn),Qwen團(tuán)隊(duì)負(fù)責(zé)人林俊旸(Junyang Lin)在X平臺(tái)上的第一個(gè)回復(fù)簡(jiǎn)短而直接:"no we did not give them the permission"(不,我們沒有給他們授權(quán))。

這個(gè)回復(fù)立即引發(fā)討論,然而,僅僅一個(gè)多小時(shí)后,林俊旸發(fā)布了第二條推文,改變了事件走向:“nvm this is our legacy issue. for qwen3, all are under apache 2.0 now.”(沒事了,這是我們的歷史遺留問(wèn)題。對(duì)于qwen3,現(xiàn)在所有模型都采用apache 2.0協(xié)議了。)

林俊旸的第二條推文揭示了問(wèn)題的本質(zhì),這不是月之暗面的違規(guī)使用,而是Qwen團(tuán)隊(duì)自身許可策略演進(jìn)中的“歷史遺留問(wèn)題”。

具體來(lái)說(shuō),Qwen2.5系列采用了復(fù)雜的分級(jí)許可體系:大部分模型(包括 0.5?B、1.5?B、7?B、14?B、32?B、VL、Omni 等)采用Apache 2.0協(xié)議,屬于完全開源許可,而3B和72B模型采用的是《通義千問(wèn)許可協(xié)議》,包含商業(yè)限制條款。

這種分級(jí)許可策略在開源社區(qū)中并不罕見,目的是在推動(dòng)技術(shù)普及的同時(shí)保護(hù)核心商業(yè)利益。但隨著時(shí)間推移,Qwen團(tuán)隊(duì)可能意識(shí)到這種策略可能會(huì)阻礙生態(tài)發(fā)展。

在2025年4月底發(fā)布的Qwen3系列中,所有模型都已經(jīng)采用了更加開放的Apache 2.0協(xié)議。Apache 2.0是一種廣受歡迎的開源協(xié)議,它具有以下特點(diǎn):

商業(yè)友好:全球開發(fā)者、研究機(jī)構(gòu)和企業(yè)均可免費(fèi)下載并商用,無(wú)需額外申請(qǐng)授權(quán)。

無(wú)限制使用:允許商業(yè)使用與二次開發(fā),用戶可以修改代碼并以其他協(xié)議重新發(fā)布。

社區(qū)驅(qū)動(dòng):通過(guò)降低使用門檻,促進(jìn)更多開發(fā)者參與,推動(dòng)技術(shù)的快速迭代和創(chuàng)新。

通過(guò)全面轉(zhuǎn)向Apache 2.0,Qwen試圖正在構(gòu)建一個(gè)更加開放和活躍的AI生態(tài)系統(tǒng)。

在這種背景下,將Kimi-Dev基于“舊協(xié)議”模型的使用定性為“歷史遺留問(wèn)題”,實(shí)際上是一種著眼未來(lái),支持生態(tài)伙伴的創(chuàng)新的選擇。

開源協(xié)作的新范式

從技術(shù)角度看,這個(gè)案例反映了當(dāng)前AI創(chuàng)業(yè)的現(xiàn)實(shí)。根據(jù)MosaicML的數(shù)據(jù),訓(xùn)練一個(gè)達(dá)到GPT-3質(zhì)量的30B參數(shù)模型需要約45萬(wàn)美元,而更大規(guī)模的模型如70B參數(shù)級(jí)別,成本會(huì)達(dá)到數(shù)百萬(wàn)美元。對(duì)于希望從零開始訓(xùn)練一個(gè)70B模型的機(jī)構(gòu)來(lái)說(shuō),需要準(zhǔn)備好數(shù)百萬(wàn)美元的基礎(chǔ)預(yù)算,還需要配備頂尖的AI研究和工程團(tuán)隊(duì),并且要考慮到隨著技術(shù)發(fā)展,未來(lái)模型的訓(xùn)練成本可能會(huì)進(jìn)一步攀升。

而月之暗面選擇Qwen-2.5-72B作為基座并非偶然。根據(jù)多項(xiàng)評(píng)測(cè),Qwen2.5系列在代碼、數(shù)學(xué)、多語(yǔ)言等方面都達(dá)到了業(yè)界領(lǐng)先水平。站在這樣的基座模型上,月之暗面可以在類似這樣的研究項(xiàng)目中,將資源集中在自己的核心優(yōu)勢(shì)——強(qiáng)化學(xué)習(xí)訓(xùn)練方法上。

NebulaGraph GenAI負(fù)責(zé)人Wey Gu對(duì)硅星人表示:“我認(rèn)為他們(Kimi)的開放權(quán)重、透明地分享paper的工作對(duì)社區(qū)是非常有益處的”,他還指出,Kimi-Dev分發(fā)MIT協(xié)議的delta權(quán)重文件沒有問(wèn)題,“不過(guò)模型的消費(fèi)者是繞不過(guò)base model的Qwen license的”。

值得注意的是,盡管Kimi-Dev在SWE-bench上取得了優(yōu)異成績(jī),但實(shí)際應(yīng)用中仍有改進(jìn)空間。有開發(fā)者測(cè)試發(fā)現(xiàn),模型生成的代碼有時(shí)需要調(diào)試才能運(yùn)行,對(duì)復(fù)雜需求的理解也不夠完整。這說(shuō)明即使基于強(qiáng)大的基礎(chǔ)模型,要做出真正優(yōu)秀的垂直應(yīng)用仍需要大量創(chuàng)新。

這場(chǎng)“套殼”爭(zhēng)議最終成為了一個(gè)行業(yè)發(fā)展的縮影。開源策略正在從限制性許可向完全開放轉(zhuǎn)變,這是贏得開發(fā)者生態(tài)的必然選擇。同時(shí),基于優(yōu)秀基礎(chǔ)模型的“二次創(chuàng)新”正在興起,關(guān)鍵是找到自己的差異化價(jià)值。大廠與創(chuàng)業(yè)公司不再是簡(jiǎn)單的競(jìng)爭(zhēng)關(guān)系,而是在開源生態(tài)中形成新的協(xié)作模式。

隨著更多的開源模型采用Apache 2.0協(xié)議,類似的許可爭(zhēng)議將越來(lái)越少。而像Kimi-Dev這樣基于開源模型的專項(xiàng)優(yōu)化案例,或許會(huì)越來(lái)越多,這正是開源AI生態(tài)繁榮發(fā)展的標(biāo)志。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
德黑蘭上空的“血色夜幕”:美以“隱形屠刀”如何肢解伊朗防空?

德黑蘭上空的“血色夜幕”:美以“隱形屠刀”如何肢解伊朗防空?

聰明小石頭
2026-03-01 15:44:16
難怪伊朗如此瘋狂反擊,真相大白:原來(lái)哈梅內(nèi)伊一開始就被炸死了

難怪伊朗如此瘋狂反擊,真相大白:原來(lái)哈梅內(nèi)伊一開始就被炸死了

健身狂人
2026-03-01 18:24:42
全體注意,最新預(yù)測(cè)來(lái)了!明天周一A股大概會(huì)這樣走!

全體注意,最新預(yù)測(cè)來(lái)了!明天周一A股大概會(huì)這樣走!

一擔(dān)金
2026-03-01 15:01:43
迪麗熱巴腳真大啊

迪麗熱巴腳真大啊

手工制作阿殲
2026-03-01 11:20:11
誰(shuí)能無(wú)悔?大羅后悔逼宮,卡卡承認(rèn)選錯(cuò),連穆里尼奧都曾哭成淚人

誰(shuí)能無(wú)悔?大羅后悔逼宮,卡卡承認(rèn)選錯(cuò),連穆里尼奧都曾哭成淚人

足籃大世界
2026-03-01 15:34:01
A股:周日下午傳來(lái)3個(gè)特大級(jí)消息!明周一或迎來(lái)史詩(shī)級(jí)別大行情?

A股:周日下午傳來(lái)3個(gè)特大級(jí)消息!明周一或迎來(lái)史詩(shī)級(jí)別大行情?

股市皆大事
2026-03-01 17:33:07
確認(rèn)參賽!941萬(wàn)美金戰(zhàn)場(chǎng),鄭欽文攜新帥出征,首戰(zhàn)即考驗(yàn)?

確認(rèn)參賽!941萬(wàn)美金戰(zhàn)場(chǎng),鄭欽文攜新帥出征,首戰(zhàn)即考驗(yàn)?

卿子書
2026-03-01 09:25:20
交了物業(yè)費(fèi)還收車位管理費(fèi)?2026年這4種情況,你可以直接拒交

交了物業(yè)費(fèi)還收車位管理費(fèi)?2026年這4種情況,你可以直接拒交

阿離家居
2026-03-01 16:53:47
一旦戰(zhàn)爭(zhēng)爆發(fā)中國(guó)或?qū)⒈粐?,?duì)中國(guó)而言,最危險(xiǎn)的不只戰(zhàn)爭(zhēng)

一旦戰(zhàn)爭(zhēng)爆發(fā)中國(guó)或?qū)⒈粐ィ瑢?duì)中國(guó)而言,最危險(xiǎn)的不只戰(zhàn)爭(zhēng)

來(lái)科點(diǎn)譜
2026-01-23 11:04:18
美國(guó)終于明白,當(dāng)年他們“誤炸”中國(guó)大使館,中國(guó)為什么不反擊

美國(guó)終于明白,當(dāng)年他們“誤炸”中國(guó)大使館,中國(guó)為什么不反擊

蜉蝣說(shuō)
2025-10-07 16:08:53
演員李茂發(fā)視頻稱“想回家”:航班被取消了,改簽的航班也被取消

演員李茂發(fā)視頻稱“想回家”:航班被取消了,改簽的航班也被取消

韓小娛
2026-03-01 16:36:25
哈梅內(nèi)伊遇害,“中東火藥桶”徹底引爆,連鎖反應(yīng)正逐漸顯現(xiàn)

哈梅內(nèi)伊遇害,“中東火藥桶”徹底引爆,連鎖反應(yīng)正逐漸顯現(xiàn)

上觀新聞
2026-03-01 12:28:31
王皓爆粗!鼓勵(lì)林詩(shī)棟:你要XX想肯定能贏他,要有斗志,要敢抽他

王皓爆粗!鼓勵(lì)林詩(shī)棟:你要XX想肯定能贏他,要有斗志,要敢抽他

風(fēng)過(guò)鄉(xiāng)
2026-03-01 12:30:03
特朗普:若伊朗進(jìn)行報(bào)復(fù) 將對(duì)伊朗發(fā)動(dòng)打擊

特朗普:若伊朗進(jìn)行報(bào)復(fù) 將對(duì)伊朗發(fā)動(dòng)打擊

財(cái)聯(lián)社
2026-03-01 13:27:05
意媒:特奧狀態(tài)出現(xiàn)斷崖式下跌,若這樣下去恐難參加世界杯

意媒:特奧狀態(tài)出現(xiàn)斷崖式下跌,若這樣下去恐難參加世界杯

懂球帝
2026-03-01 14:11:10
不被任何人拿捏的頂級(jí)思維:不要回答別人的問(wèn)題,要回答別人的目的

不被任何人拿捏的頂級(jí)思維:不要回答別人的問(wèn)題,要回答別人的目的

古代經(jīng)典
2026-02-25 15:40:12
外媒:伊朗要從中國(guó)購(gòu)買鷹擊-12E!網(wǎng)友:中國(guó)導(dǎo)彈大戰(zhàn)美軍航母?

外媒:伊朗要從中國(guó)購(gòu)買鷹擊-12E!網(wǎng)友:中國(guó)導(dǎo)彈大戰(zhàn)美軍航母?

軍武次位面
2026-02-28 18:51:27
永遠(yuǎn)不要向任何人,包括你的親戚和好友,透露你真實(shí)的財(cái)務(wù)狀況

永遠(yuǎn)不要向任何人,包括你的親戚和好友,透露你真實(shí)的財(cái)務(wù)狀況

流蘇晚晴
2026-02-27 18:09:29
母親80大壽三姐只送5斤排骨,飯沒吃完三姐就走,母親追到大門口

母親80大壽三姐只送5斤排骨,飯沒吃完三姐就走,母親追到大門口

人間百態(tài)大全
2026-03-01 06:40:03
賣國(guó)求榮!為討美國(guó)歡心,不惜將總統(tǒng)送進(jìn)大牢,如今結(jié)局大快人心

賣國(guó)求榮!為討美國(guó)歡心,不惜將總統(tǒng)送進(jìn)大牢,如今結(jié)局大快人心

顧史
2026-01-22 20:28:11
2026-03-01 19:35:00
硅星GenAI incentive-icons
硅星GenAI
比一部分人更先進(jìn)入GenAl。
243文章數(shù) 14關(guān)注度
往期回顧 全部

科技要聞

小米超跑概念車全球首秀!殺入頂豪俱樂(lè)部

頭條要聞

普京就哈梅內(nèi)伊遇害表示哀悼:一次無(wú)恥殺害

頭條要聞

普京就哈梅內(nèi)伊遇害表示哀悼:一次無(wú)恥殺害

體育要聞

火箭輸給熱火:烏度卡又輸斯波教練

娛樂(lè)要聞

《江山為聘》:吳謹(jǐn)言陳哲遠(yuǎn)燃炸朝堂

財(cái)經(jīng)要聞

中東局勢(shì)升級(jí) 如何影響A股、黃金和原油

汽車要聞

理想汽車2月交付26421輛 歷史累計(jì)交付超159萬(wàn)輛

態(tài)度原創(chuàng)

家居
本地
旅游
健康
公開課

家居要聞

素色肌理 品意式格調(diào)

本地新聞

津南好·四時(shí)總相宜

旅游要聞

文旅新探|伊春鐵力:三月雪未央 林都嬉冬長(zhǎng)

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版