国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

代碼+視覺不再“偏科”,國產(chǎn)模型真正平替Claude還有多遠(yuǎn)?

0
分享至



出品 | 創(chuàng)業(yè)最前線

作者 | 白華

編輯 | 閃電

美編 | 邢靜

審核 | 頌文

過去一年,AI編程工具邁入“軍備競賽”階段。以Anthropic的Claude系列為代表的閉源模型,憑借領(lǐng)先的代碼生成和Agent能力,成為全球主流開發(fā)平臺(tái)的首選。然而,其對(duì)中國市場的服務(wù)限制、高昂的API成本,以及缺乏本地化支持,正倒逼國內(nèi)開發(fā)者尋找高性能、高性價(jià)比的替代方案。

與此同時(shí),國產(chǎn)大模型在純文本任務(wù)上已取得顯著進(jìn)展,但在視覺理解、復(fù)雜Agent工具調(diào)用等真實(shí)工程場景中仍存在明顯短板——多數(shù)編程模型要么不支持圖像輸入,要么支持圖像的模型編程能力不足。因?yàn)閳D文能力割裂,難以支撐現(xiàn)代軟件開發(fā)中日益增長的代碼+多模態(tài)基礎(chǔ)需求。

近期,Kimi新發(fā)布的K2.5模型在開發(fā)者群體中引發(fā)廣泛關(guān)注,因?yàn)榫幊绦阅艿奶嵘c視覺能力的補(bǔ)齊,讓開發(fā)者終于等到了完整Claude平替的希望。

在全球最大的大模型API聚合平臺(tái)OpenRouter上,Kimi K2.5模型發(fā)布次日就沖上了全球前三。



這份亮眼表現(xiàn)也迅速獲得了頭部編程工具平臺(tái)的認(rèn)可與青睞。Cursor的核心競品,由GitLab創(chuàng)始人打造的知名編程工具Kilo Code宣布推出Kimi K2.5的首周免費(fèi)活動(dòng)后,K2.5也成為該平臺(tái)上最受歡迎的模型,單日消耗超過380億Token。



最近很火的Claude Code開源版OpenCode,也宣布限時(shí)免費(fèi)來吸引開發(fā)者用戶。



國內(nèi)大廠旗下的編程工具同樣第一時(shí)間接入了K2.5模型。騰訊CodeBuddy將其設(shè)定為首選模型;字節(jié)Trae宣布提供免費(fèi)額度,阿里Qoder、美團(tuán)CatPaw等據(jù)傳也在接入中。



1、K2.5代碼能力究竟如何?

從知名匿名評(píng)測(cè)機(jī)構(gòu)大模型競技場LMarena公布的數(shù)據(jù)來看,K2.5在Thinking模式下,代碼能力以1509分與Claude Sonnet 4.5持平。排在它前面的,只有Claude和Gemini最新的旗艦?zāi)P?。這應(yīng)該是開源模型代碼能力的新高。



不止代碼能力表現(xiàn)亮眼,K2.5在視覺能力上的評(píng)測(cè)成績同樣令人驚喜。從大模型競技場的視覺能力匿名評(píng)測(cè)來看,K2.5模型的視覺能力比Claude更能打。



我們也從開發(fā)者社區(qū)看到一些真實(shí)反饋,K2.5的實(shí)際表現(xiàn)和體感,與榜單呈現(xiàn)的結(jié)果比較接近,代碼能力確實(shí)有了提升。





一位Sezxy的網(wǎng)友表示Kimi K2.5+OpenCode感覺很不錯(cuò),幾個(gè)需求都用它倆解決。



不過,似乎編程能力的提升,也有一定的“副作用”,部分網(wǎng)友表示,之前K2模型的創(chuàng)意寫作能力好像在K2.5模型上減弱了。



2、代碼模型為什么需要視覺?

在知乎問題《Kimi發(fā)布并開源K2.5模型,哪些信息值得關(guān)注?》下,有Kimi的工程師分享了Kimi做多模態(tài)的背后思路,其中一段提到了視覺能力對(duì)代碼模型的價(jià)值,其中一個(gè)關(guān)鍵場景是模型可以自己發(fā)現(xiàn)前端頁面的視覺bug,然后有機(jī)會(huì)在后續(xù)的流程中自己進(jìn)行修正:

其實(shí)對(duì)于很多任務(wù)而言,Agent模型也能去自己debug,去根據(jù)Console Log的文本內(nèi)容去解決問題,但是我們還是會(huì)遇到一些沒有任何Error或者Warnning,但又不得不再次提出Feedback的時(shí)刻,比如:“網(wǎng)站兩個(gè)組件產(chǎn)生了堆疊遮擋,你修改下”“放在首頁的圖裂開了,應(yīng)該是Link失效了,麻煩你check下”“這是一個(gè)介紹中學(xué)生的網(wǎng)頁,配圖不應(yīng)該是工作人員”。

這些問題總是在不斷提出,我們總是希望模型能不犯這些錯(cuò)誤。是的,模型是有可能one-shot出來沒有任何問題的代碼,但是,只要我們給模型一雙眼睛,這些吐槽的問題或者就有可能會(huì)讓模型自己形成一個(gè)Action-Critic的Refine閉環(huán),而沒有Human的工作流水線是有更高效率的理想上限。



這可能是K2.5模型上線后,立即受到開發(fā)者群體歡迎的關(guān)鍵原因之一。此前的中國編程模型,普遍沒有視覺能力,遇到圖片和視頻都無法處理,只能報(bào)錯(cuò)?;蛘咝枰浅?fù)雜的流程,自行接入另一個(gè)模型來處理,對(duì)編程的效率影響很大。另一個(gè)關(guān)鍵原因則是Claude模型太貴了,燒錢太快。Kimi新模型的API價(jià)格只有Claude中號(hào)模型Sonnet 4.5的1/5,用起來錢包不會(huì)太疼。

3、更多K2.5的幕后

除了市場端的亮眼表現(xiàn),K2.5的技術(shù)研發(fā)背后還有不少值得深挖的細(xì)節(jié)。

因此在1月29日凌晨,Kimi核心團(tuán)隊(duì)在Reddit平臺(tái)舉行了一場長達(dá)3小時(shí)的AMA(有問必答)活動(dòng),CEO楊植麟、算法團(tuán)隊(duì)負(fù)責(zé)人周昕宇、吳育昕三位聯(lián)合創(chuàng)始人,與全球網(wǎng)友交流了K2.5的技術(shù)細(xì)節(jié)、產(chǎn)品規(guī)劃與行業(yè)看法。這場對(duì)話中,許多關(guān)鍵問題的回應(yīng),讓外界了解了更多K2.5的幕后。



有網(wǎng)友拋出尖銳問題:Kimi K2.5非常棒,但我看到有人說模型會(huì)自稱為Claude,并把這當(dāng)作你們大量蒸餾(distill)自Claude模型的證據(jù)。這是怎么回事?

楊植麟回應(yīng)稱:“我們的觀察是,在正確的系統(tǒng)提示詞下,它有很高的概率回答‘Kimi’,尤其是在思考模式下。但當(dāng)系統(tǒng)提示為空時(shí),它就進(jìn)入了一個(gè)未定義區(qū)域,這更多地反映了預(yù)訓(xùn)練數(shù)據(jù)的分布情況。其中一項(xiàng)改進(jìn)是,我們?cè)陬A(yù)訓(xùn)練階段對(duì)來自互聯(lián)網(wǎng)的最新編程數(shù)據(jù)進(jìn)行了上采樣,而這些數(shù)據(jù)似乎與詞元‘Claude’的關(guān)聯(lián)性更強(qiáng)。事實(shí)上,K2.5在許多基準(zhǔn)測(cè)試中似乎都優(yōu)于Claude,例如HLE、BrowseComp、MMMU Pro和MathVision等等?!?/p>



對(duì)于“Kimi Code和Claude Code有什么區(qū)別?為什么Kimi要開發(fā)自己的編程工具?”的問題,楊植麟表示:“我們認(rèn)為我們需要一個(gè)與模型最匹配的框架。但使用Claude Code時(shí),框架會(huì)不斷變化,兼容性有時(shí)會(huì)成為問題。此外,Kimi Code還擁有一些獨(dú)有的功能。我們認(rèn)為video2code(視頻生代碼)非常重要,代表著前端開發(fā)的未來。”



而被問及“訓(xùn)練VLM的主要挑戰(zhàn)是什么?為什么Kimi如此堅(jiān)定地投入視覺模型的訓(xùn)練?”時(shí),楊植麟給出了深入的技術(shù)解讀:“主要挑戰(zhàn)在于同步提升文本與視覺能力。我們發(fā)現(xiàn),只要配方得當(dāng),兩者可以相互增強(qiáng):在視覺任務(wù)上做RL訓(xùn)練,反而提高了文本知識(shí)基準(zhǔn);反過來,像K2這樣扎實(shí)的文本基礎(chǔ),也是視覺性能的關(guān)鍵?!?/p>

從技術(shù)突破到市場認(rèn)可,再到研發(fā)底層的邏輯拆解,K2.5的出現(xiàn)為國產(chǎn)大模型的發(fā)展提供了全新的思路和樣本。

4、結(jié)束語

中國企業(yè)和開發(fā)者都亟需一個(gè)真正的Clauce平替,“代碼和視覺功能完備+性能全面對(duì)標(biāo)+性價(jià)比優(yōu)勢(shì)”。現(xiàn)在看起來,kimi2.5暫時(shí)彌補(bǔ)了這一空缺。但我們還是希望看到更多中國模型可以站起來,讓企業(yè)和開發(fā)者有更多選擇。

*注:文中題圖來自界面圖庫。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
50歲男子酷愛喝濃茶,茶葉能占半個(gè)杯子!連續(xù)5年確診腎結(jié)石,痛到打滾如生孩子!醫(yī)生提醒→

50歲男子酷愛喝濃茶,茶葉能占半個(gè)杯子!連續(xù)5年確診腎結(jié)石,痛到打滾如生孩子!醫(yī)生提醒→

大象新聞
2026-02-26 13:45:08
馬筱梅產(chǎn)后首表態(tài)遭小S怒罵,前夫顏面掃地

馬筱梅產(chǎn)后首表態(tài)遭小S怒罵,前夫顏面掃地

曉劗就是我
2026-02-27 04:07:15
重磅!新華社官宣:我國造出全球首款纖維芯片,打破芯片規(guī)則

重磅!新華社官宣:我國造出全球首款纖維芯片,打破芯片規(guī)則

Thurman在昆明
2026-02-27 00:05:04
性能之王!新機(jī)官宣:3月17日,正式發(fā)布上市!

性能之王!新機(jī)官宣:3月17日,正式發(fā)布上市!

科技堡壘
2026-02-25 13:21:31
逆轉(zhuǎn)日本!趙繼偉回應(yīng)輸韓國與上半場低迷原因,強(qiáng)調(diào)組織上的帶動(dòng)

逆轉(zhuǎn)日本!趙繼偉回應(yīng)輸韓國與上半場低迷原因,強(qiáng)調(diào)組織上的帶動(dòng)

籃球資訊達(dá)人
2026-02-26 22:36:14
放進(jìn)冰箱變毒藥,這7種食物千萬不能放在冰箱里!尤其是第六種!

放進(jìn)冰箱變毒藥,這7種食物千萬不能放在冰箱里!尤其是第六種!

路醫(yī)生健康科普
2026-02-06 16:16:28
宗馥莉在上海高檔餐廳露面,與外籍男士共進(jìn)晚餐,同行女孩畫面溫馨

宗馥莉在上海高檔餐廳露面,與外籍男士共進(jìn)晚餐,同行女孩畫面溫馨

東方不敗然多多
2026-02-25 16:20:33
丁俊暉的商業(yè)帝國:3600萬獎(jiǎng)金根本不值一提

丁俊暉的商業(yè)帝國:3600萬獎(jiǎng)金根本不值一提

寶哥精彩賽事
2026-02-26 18:26:59
聯(lián)合國現(xiàn)場撕破臉!英法怒懟俄羅斯:公然謊言,粗劣虛假信息!

聯(lián)合國現(xiàn)場撕破臉!英法怒懟俄羅斯:公然謊言,粗劣虛假信息!

老馬拉車莫少裝
2026-02-27 02:46:39
新加坡大滿貫:陳幸同3-0日本第一美女,靜待陳熠大戰(zhàn)最強(qiáng)削球手

新加坡大滿貫:陳幸同3-0日本第一美女,靜待陳熠大戰(zhàn)最強(qiáng)削球手

釘釘陌上花開
2026-02-26 20:35:54
喝酒后出現(xiàn)3個(gè)現(xiàn)象,說明你已不適合喝酒,再喝就是“玩命”

喝酒后出現(xiàn)3個(gè)現(xiàn)象,說明你已不適合喝酒,再喝就是“玩命”

奇妙的本草
2026-02-25 11:58:54
哈登!骨折?騎士接下來怎么辦?

哈登!骨折?騎士接下來怎么辦?

籃球盛世
2026-02-26 10:40:39
歐洲小偷,都傳瘋了,達(dá)成了一個(gè)行業(yè)共識(shí),中國人的錢包,隨便拿

歐洲小偷,都傳瘋了,達(dá)成了一個(gè)行業(yè)共識(shí),中國人的錢包,隨便拿

西樓知趣雜談
2026-02-14 18:35:51
女生失聯(lián)16天遺體被找到,其母否認(rèn)懸賞加碼至100萬元

女生失聯(lián)16天遺體被找到,其母否認(rèn)懸賞加碼至100萬元

大象新聞
2026-02-26 17:05:04
上海65歲以上老人留意! 多項(xiàng)便民服務(wù)可享, 辦事生活更省心!

上海65歲以上老人留意! 多項(xiàng)便民服務(wù)可享, 辦事生活更省心!

荷蘭豆愛健康
2026-02-27 01:12:12
中央軍委全力反腐敗,說明中國人民解放軍將要擔(dān)大任,干大事!

中央軍委全力反腐敗,說明中國人民解放軍將要擔(dān)大任,干大事!

安安說
2026-01-29 09:33:17
確認(rèn)了!是知名演員張嘉益

確認(rèn)了!是知名演員張嘉益

看盡落塵花q
2026-01-04 11:55:44
郭士強(qiáng):全隊(duì)奮勇向前,誓言沖擊對(duì)手取得勝利!

郭士強(qiáng):全隊(duì)奮勇向前,誓言沖擊對(duì)手取得勝利!

劉哥談體育
2026-02-27 02:30:25
廣州23號(hào)陪跑出局,增城僅20號(hào)線入圍4期,這些郊區(qū)地鐵規(guī)劃難了

廣州23號(hào)陪跑出局,增城僅20號(hào)線入圍4期,這些郊區(qū)地鐵規(guī)劃難了

娛樂圈見解說
2026-02-26 21:47:03
硬抗3天后,特朗普接受現(xiàn)實(shí):全球關(guān)稅大戰(zhàn)結(jié)束,中國預(yù)測(cè)太準(zhǔn)了

硬抗3天后,特朗普接受現(xiàn)實(shí):全球關(guān)稅大戰(zhàn)結(jié)束,中國預(yù)測(cè)太準(zhǔn)了

藍(lán)色海邊
2026-02-27 03:18:16
2026-02-27 05:48:49
創(chuàng)業(yè)最前線 incentive-icons
創(chuàng)業(yè)最前線
創(chuàng)業(yè)有道·創(chuàng)新中國|長期關(guān)注中國科技創(chuàng)新經(jīng)濟(jì)市場,提供更有價(jià)值的創(chuàng)投科技報(bào)道。
3559文章數(shù) 53579關(guān)注度
往期回顧 全部

科技要聞

單季營收681億凈利429億!英偉達(dá)再次炸裂

頭條要聞

美國政府對(duì)外交官下令:開始行動(dòng)

頭條要聞

美國政府對(duì)外交官下令:開始行動(dòng)

體育要聞

從排球少女到冰壺女神,她在米蘭冬奧練出6塊腹肌

娛樂要聞

向華強(qiáng)公開表態(tài) 財(cái)產(chǎn)留給兒媳婦郭碧婷

財(cái)經(jīng)要聞

中國AI調(diào)用量超美國 4款大模型霸榜前5

汽車要聞

40歲的吉利,不惑于內(nèi)外

態(tài)度原創(chuàng)

本地
手機(jī)
時(shí)尚
游戲
公開課

本地新聞

津南好·四時(shí)總相宜

手機(jī)要聞

魅族手機(jī)被傳將于3月退市 客服回應(yīng):未接到通知 線下運(yùn)營仍正常

今年春天最美搭配:西裝+半裙,怎么穿都好看!

穿不起內(nèi)衣的啥子國王,是怎么從妮姬表情包之王變成底層邏輯的?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版