国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Qwen3-代碼能力非常強(qiáng)悍,0.6B模型竟然比Gemma4B模型還要強(qiáng)

0
分享至

你沒看錯(cuò),千問3(Qwen3)的這次更新不是一個(gè)模型,而是一堆模型,Dense模型一共6款,大小從0.6B到32B不等;MoE混合專家模型有兩個(gè),30B和235B。

我上手就先用235B這個(gè)旗艦版測(cè)試了一下代碼性能,用的是這個(gè)Prompt:

Write a p5.js script that simulates 25 particles in a vacuum space of a cylindrical container, bouncing within its boundaries. Use different colors for each ball and ensure they leave a trail showing their movement. Add a slow rotation of the container to give better view of what's going on in the scene. Make sure to create proper collision detection and physic rules to ensure particles remain in the container. Add an external spherical container. Add a slow zoom in and zoom out effect to the whole scene.

目的是生成25個(gè)粒子在圓柱形的真空環(huán)境里彈跳,小球每個(gè)使用不同顏色,顯示軌跡,同時(shí)還要附加一個(gè)外部的球形容器,以及緩慢的運(yùn)動(dòng)和視角變化,是一個(gè)很復(fù)雜的Prompt,因?yàn)樗婕暗搅撕芏喾矫娴闹R(shí)需求。

這是我用Qwen3-235B-A22B的實(shí)現(xiàn)效果,可以說非常好,跟在編程領(lǐng)域的隱形王者Claude3.5不相上下。

同時(shí)我也用30B的MoE模型又測(cè)試了一下,效果也出乎意料的不錯(cuò),雖然不如235B,但是仔細(xì)看的話,基本上也滿足了Prompt的要求。

從Github上公布的模型性能也可見一斑,尤其是 235B-MoE,已經(jīng)在數(shù)學(xué)推理和算法競(jìng)賽級(jí)別的編程任務(wù)中領(lǐng)先優(yōu)勢(shì)很明顯。

現(xiàn)在Qwen Chat已經(jīng)可以免費(fèi)使用了,我建議你也可以試試看,可以用30B和235B的MoE模型和32B的Dense模型。

更多的資源也可以從這里面,比如Github,Huggingface等。

Qwen Chat: https://chat.qwen.ai/

Github: https://github.com/QwenLM/Qwen3

HuggingFace:https://huggingface.co/collections/Qwen/qwen3-67dd247413f0e2e4f653967f

魔搭:https://modelscope.cn/collections/Qwen3-9743180bdc6b48

Kaggle: https://www.kaggle.com/models/qwen-lm/qwen-3

我這次分別嘗試了本地部署和云端 Qwen Chat兩種方式來用千問3,本地部署主要是針對(duì)與小于等于30B的模型,對(duì)于旗艦版235B就只能用云端了。

這次的一大亮點(diǎn)就是混合推理模型,也就是說推理模式是可以手動(dòng)開啟和關(guān)閉的,千問3的所有模型都原生支持這個(gè)特性,最小的0.6B模型也不例外,部署起來非常的簡(jiǎn)單,這是用huggingface提供的transformers庫部署的千問3。

這是我用的0.6B小模型做的測(cè)試,問題是:請(qǐng)簡(jiǎn)要的描述下大語言模型。

第一個(gè)是開啟了推理的回答,可以看到enable_thinking=Ture(第一個(gè)紅框),第二個(gè)紅框內(nèi)的內(nèi)容包含了兩部分內(nèi)容,分別是thinking content和content,代表了推理思考內(nèi)容和最終的輸出內(nèi)容。

你仔細(xì)看的話,即使是這個(gè)最小的模型,推理邏輯也很完整,輸出的答案也非常不錯(cuò)。

下面這個(gè)就是手動(dòng)關(guān)閉推理模式后的回答,可以看到thinking content那里是空的,答案也不差。

這種模式的好處非常大,因?yàn)閷?duì)于一些非推理型的問題,比如簡(jiǎn)單的數(shù)學(xué)題1+1=?,開啟推理模式后反而有可能會(huì)失敗。

這個(gè)時(shí)候,只需要對(duì)于題目加一層篩選模式,然后自動(dòng)的開啟或者關(guān)閉推理模型,不僅可以加速輸出,同時(shí)還能省不少的token,真降本增效!這個(gè)特性暫時(shí)我只在閉源的Claude-3.7上看到過,在開源模型中還是頭一號(hào)!

這次大版本更新把它大模型源神的稱號(hào)坐實(shí)了,畢竟一次性放8個(gè)模型可謂是空前絕后,特別是這次的更新幾乎把所有的大模型要素都集齊了。

1全尺寸開源且同級(jí)別領(lǐng)先:從0.6B 到235B,涵蓋了端側(cè)超小模型到B端友好的模型尺寸。

0.6B的推理模型,還是可以任意切換是否開啟推理的模型,包括手機(jī)在內(nèi)的很多端側(cè)模型估計(jì)迎來一大波更新。

對(duì)第一個(gè)測(cè)試,我用DeepSeek R1也試了下,671B的模型效果比起235B的千問3差點(diǎn)意思,不過現(xiàn)在才R1,提升空間也很大,畢竟是中國的開源大模型雙子星。

小型MoE模型,總大小30B激活參數(shù)3B。32B的Dense模型非常的符合直覺,畢竟Qwen家族的32B模型在業(yè)內(nèi)的威望有目共睹,不管是QwQ的32B模型在Marketing和Finance領(lǐng)域力壓Google,OpenAI和Anthropic的一眾大模型。

還是DeepSeek嚴(yán)選的蒸餾模型,千問系列的32B跟Llama的70B性能不相上下,但是模型足足小了一倍還多,可以看得出Dense模型在“智能密度”這個(gè)維度上的得分高的嚇人。

而這次的30B的MoE模型更是有講究的,可以說是目前最強(qiáng)的可以在消費(fèi)級(jí)顯卡上部署的MoE大模型,因?yàn)榫湍胵wq這個(gè)模型來舉例,32b的模型在經(jīng)過4bit量化后,顯存占用20GB,而英偉達(dá)的90系顯卡正好有24GB顯存,一塊顯卡就能正好讓模型跑起來,再加上性能足夠,基本上可以讓很多想要本地部署的個(gè)人和小型企業(yè)都滿足需求。

千問3的性能可以說是全尺寸都很強(qiáng),我看到@劉聰NLP測(cè)試了這么一個(gè)問題:生蠔煮熟了叫什么?

30B以上的大模型都能答得對(duì),對(duì)他們沒什么難度,我試了下本地部署的0.6B模型,照樣也可以做對(duì)。

而最小尺寸的deepseek r1 1.5b蒸餾版,答案不太對(duì)。

而同樣是開源的Gemma 4B,給出的回答更是讓人哭笑不得。

可以說,不管是百B以上的大模型,還是可以部署在端側(cè)的超小模型,千問3表現(xiàn)出來的效果都非常的好。

并且從官方介紹可以看到,千問3還同時(shí)對(duì)于Agent和MCP能力做了優(yōu)化,再加上其可以本地部署的最大優(yōu)勢(shì),可以說是現(xiàn)在大模型市場(chǎng)最稀缺的能力。

性能好,型號(hào)多,所以我宣布,千問3才是真正的源神!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
人物|好歹開和維爾茨證明自己沒那么“水”

人物|好歹開和維爾茨證明自己沒那么“水”

北青網(wǎng)-北京青年報(bào)
2025-12-28 09:38:11
你們這些所謂的上海人,怎么能跟我們比呢?我們可是“新上海人”

你們這些所謂的上海人,怎么能跟我們比呢?我們可是“新上海人”

上海云河
2025-12-27 22:25:26
女排積分榜大變臉,山東首次登頂,頭號(hào)魚腩出爐,施海榮引發(fā)爭(zhēng)議

女排積分榜大變臉,山東首次登頂,頭號(hào)魚腩出爐,施海榮引發(fā)爭(zhēng)議

章民解說體育
2025-12-27 23:26:12
AI基建三劍客火了!CPO、PCB、液冷,為啥是算力時(shí)代的“硬剛需”

AI基建三劍客火了!CPO、PCB、液冷,為啥是算力時(shí)代的“硬剛需”

我不叫阿哏
2025-12-28 08:45:34
視頻丨一份計(jì)劃兩個(gè)版本 烏總統(tǒng)再赴美談“和平協(xié)議”

視頻丨一份計(jì)劃兩個(gè)版本 烏總統(tǒng)再赴美談“和平協(xié)議”

國際在線
2025-12-28 07:47:02
原來是他娶了譚維維!被譽(yù)為“不老男神”,曾在海拔5600米上求婚

原來是他娶了譚維維!被譽(yù)為“不老男神”,曾在海拔5600米上求婚

韓馳
2025-12-25 20:04:01
日媒:給中國50年也造不出日本發(fā)動(dòng)機(jī),馬斯克:中國車企值得尊重

日媒:給中國50年也造不出日本發(fā)動(dòng)機(jī),馬斯克:中國車企值得尊重

知鑒明史
2025-12-28 08:55:06
中國制裁絕不拖泥帶水,時(shí)間一到,30道通牒發(fā)往美國,財(cái)產(chǎn)全凍結(jié)

中國制裁絕不拖泥帶水,時(shí)間一到,30道通牒發(fā)往美國,財(cái)產(chǎn)全凍結(jié)

起喜電影
2025-12-28 08:17:45
1978 年,中央為彭德懷舉行追悼大會(huì),其侄子侄女聯(lián)名要求:不準(zhǔn)她參加

1978 年,中央為彭德懷舉行追悼大會(huì),其侄子侄女聯(lián)名要求:不準(zhǔn)她參加

老杉說歷史
2025-12-21 14:29:12
天津大爆發(fā)!上海隊(duì)翻船!

天津大爆發(fā)!上海隊(duì)翻船!

墨韻書語
2025-12-28 06:28:25
Shams:小德里克-瓊斯從膝蓋副韌帶扭傷中恢復(fù),周一有望復(fù)出

Shams:小德里克-瓊斯從膝蓋副韌帶扭傷中恢復(fù),周一有望復(fù)出

懂球帝
2025-12-28 09:07:59
《老舅》演技大賞,誰的演技最差?以為是姚安娜,實(shí)則是張可盈

《老舅》演技大賞,誰的演技最差?以為是姚安娜,實(shí)則是張可盈

黔鄉(xiāng)小姊妹
2025-12-28 09:11:46
烏專家:中國“榨干”蘇聯(lián)遺產(chǎn),我們圖紙沒看懂,他們?cè)斐?.0!

烏專家:中國“榨干”蘇聯(lián)遺產(chǎn),我們圖紙沒看懂,他們?cè)斐?.0!

小莜讀史
2025-12-25 20:46:05
積極信號(hào)釋放!老百姓:建議把電動(dòng)輕便摩托車劃歸為非機(jī)動(dòng)車

積極信號(hào)釋放!老百姓:建議把電動(dòng)輕便摩托車劃歸為非機(jī)動(dòng)車

電動(dòng)車小辣椒
2025-12-27 07:05:20
女子高峰期占電梯后續(xù):被暴打,正面曝光,已社死,結(jié)局很舒適

女子高峰期占電梯后續(xù):被暴打,正面曝光,已社死,結(jié)局很舒適

尋墨閣
2025-12-27 08:45:27
美對(duì)華下死手,封殺中國無人機(jī),不到24小時(shí),中方下通牒警告

美對(duì)華下死手,封殺中國無人機(jī),不到24小時(shí),中方下通牒警告

阿晪美食
2025-12-27 17:04:07
人到中年別硬凹“少女感”,無齡感穿搭才是王道,優(yōu)雅顯貴

人到中年別硬凹“少女感”,無齡感穿搭才是王道,優(yōu)雅顯貴

靜兒時(shí)尚達(dá)人
2025-12-28 08:12:51
原來很多長(zhǎng)輩對(duì)生育損傷是絕口不提的,看完網(wǎng)友的評(píng)論細(xì)思極恐!

原來很多長(zhǎng)輩對(duì)生育損傷是絕口不提的,看完網(wǎng)友的評(píng)論細(xì)思極恐!

阿燕姐說育兒
2025-12-27 14:25:00
探訪浙江龐萊臣舊宅:展出9件真跡,龐家曾捐藏品給故宮南博

探訪浙江龐萊臣舊宅:展出9件真跡,龐家曾捐藏品給故宮南博

大風(fēng)新聞
2025-12-27 17:59:04
張寧復(fù)出潘江心有底!4條件對(duì)廣東不利,粵媒支招杜鋒:要用好2人

張寧復(fù)出潘江心有底!4條件對(duì)廣東不利,粵媒支招杜鋒:要用好2人

后仰大風(fēng)車
2025-12-28 07:10:10
2025-12-28 10:04:49
平凡AI incentive-icons
平凡AI
高校AI從業(yè)者
54文章數(shù) 23關(guān)注度
往期回顧 全部

科技要聞

新任NASA掌門放話:特朗普任期內(nèi)必將重返月球

頭條要聞

四川原副省長(zhǎng)葉寒冰被通報(bào):長(zhǎng)期出入私人會(huì)所聚餐飲酒

頭條要聞

四川原副省長(zhǎng)葉寒冰被通報(bào):長(zhǎng)期出入私人會(huì)所聚餐飲酒

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂要聞

張昊唯逃稅涉黃風(fēng)波落幕:法院認(rèn)定朋友造謠

財(cái)經(jīng)要聞

英偉達(dá)的收購史

汽車要聞

好音響比大屏更重要?車企開始“聽”用戶的

態(tài)度原創(chuàng)

家居
健康
游戲
親子
房產(chǎn)

家居要聞

格調(diào)時(shí)尚 智慧品質(zhì)居所

這些新療法,讓化療不再那么痛苦

《Arc Raiders》發(fā)售兩個(gè)月 Steam在線仍超40萬人

親子要聞

62歲懷二胎真相驚人!醫(yī)生擔(dān)憂的惡心一幕曝光!

房產(chǎn)要聞

年銷20億+!中交·藍(lán)色港灣用好房子致敬好生活

無障礙瀏覽 進(jìn)入關(guān)懷版