国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

實測Qwen3.6-27B:4分鐘做了個跑酷游戲,驗證碼識別正確率超90%

0
分享至


智東西
編譯 楊京麗
編輯 陳駿達(dá)

智東西4月23日報道,昨晚,阿里通義千問團(tuán)隊宣布開源Qwen3.6-27B——一款270億參數(shù)的稠密多模態(tài)模型,支持思考與非思考模式。

與阿里上一代開源模型Qwen3.5-397B-A17B相比,Qwen3.6-27B以1/15的參數(shù)規(guī)模,在SWE-bench Verified、SWE-bench Pro、Terminal-Bench 2.0以及SkillsBench上實現(xiàn)了反超,其編程能力提升明顯,同時還具備較強(qiáng)的文本和多模態(tài)推理能力。

與相似尺寸的Gemma 4-31B模型對比,Qwen3.6-27B在大部分維度上,展現(xiàn)出較大領(lǐng)先優(yōu)勢。


隨著Qwen3.6-27B的發(fā)布,阿里稱Qwen3.6系列已完整發(fā)布,包括開源模型Qwen3.6-35B-A3B和閉源模型Qwen3.6-Plus、Qwen3.6-Max-Preview。

阿里云百煉平臺上,現(xiàn)在已經(jīng)可以看到Qwen3.6-27B的價格,每百萬Token輸入價格3元,輸出價格18元。由于Qwen3.6-27B是稠密模型,價格并不便宜。


Qwen3.6-27B現(xiàn)已上線Qwen Studio,并以開源權(quán)重形式發(fā)布于Hugging Face和ModelScope,阿里云百煉API即將上線,屆時將支持preserve_thinking功能以適配智能體任務(wù)。該模型也可接入OpenClaw、Claude Code、Qwen Code等主流第三方編程助手。


體驗地址:
https://chat.qwen.ai/

開源地址:
https://huggingface.co/Qwen/Qwen3.6-27B
https://modelscope.cn/models/Qwen/Qwen3.6-27B

一、編程能力:界面美觀、功能完備,復(fù)雜需求一次到位

官方對比了Qwen3.6-27B和Qwen3.5-397B-A17B,在編程基準(zhǔn)上,Qwen3.6-27B在多方面領(lǐng)先:SWE-bench Verified(77.2 vs. 76.2)、SWE-bench Pro(53.5 vs. 50.9)、Terminal-Bench 2.0(59.3 vs. 52.5)以及SkillsBench(48.2 vs. 30.0)。在推理任務(wù)上,Qwen3.6-27B 在GPQA Diamond上取得了87.8的成績,略次于Qwen3.5-397B-A17B的88.4。


為直觀驗證Qwen3.6-27B編程能力,智東西進(jìn)行了如下的幾個測試。

首先,我們先讓它做了一個跑酷小游戲,測試其編程和前端能力,要求滿足角色動作、關(guān)卡要素、道具系統(tǒng)、UI設(shè)計等多維度約束。


它用時四分鐘左右,寫完了1200多行代碼。從實測結(jié)果來看,游戲設(shè)計與前端實現(xiàn)上,Qwen3.6-27B基本還原了提示詞中列舉的全部核心要素:玩家的跳躍、二段跳等均已實現(xiàn),添加了無人機(jī)、針刺等障礙物,能量電池、金幣、磁鐵等均可拾取。美術(shù)風(fēng)格符合設(shè)定,UI層完整展示了血量、分?jǐn)?shù)、速度、距離等指標(biāo),游戲可玩性強(qiáng)


細(xì)節(jié)層面仍存在一些小問題,針刺懸浮在天上有點怪;吃到電池后,沒有能量條顯示;撞到箱子,就自動過去了,沒有扣除血量。

另外,我們還讓Qwen3.6-27B制作了個人記賬應(yīng)用,考察的是模型應(yīng)用開發(fā)能力和對閉環(huán)設(shè)計的理解,包括統(tǒng)計邏輯怎么算、數(shù)據(jù)怎么持久化、異常輸入怎么攔截,比寫一個靜態(tài)頁面要復(fù)雜得多。


在應(yīng)用開發(fā)上,Qwen3.6-27B的表現(xiàn)相對穩(wěn)健。生成的應(yīng)用完整實現(xiàn)了記錄的增刪改查、按月份篩選、總收入/總支出/結(jié)余的統(tǒng)計以及近7天收支趨勢圖表,刷新頁面后數(shù)據(jù)沒有丟失,說明localStorage持久化已正確實現(xiàn)。

唯一的小Bug是刷新頁面后,7日收支柱狀圖一度不顯示,再記一筆賬后恢復(fù),屬于“初始渲染時機(jī)”問題。模型在異步狀態(tài)初始化的順序上,沒處理到位。從界面上看,這個記賬應(yīng)用視覺設(shè)計較為簡約,是一套偏實用向的標(biāo)準(zhǔn)控件組合。業(yè)務(wù)邏輯維度上,它把一個日常工具該有的數(shù)據(jù)流、統(tǒng)計邏輯與異常處理都串起來了,對于應(yīng)用開發(fā)全流程的理解比較清晰。

之后,我們還讓它做了個新聞網(wǎng)站前端設(shè)計,看起來還是有模有樣的。


Qwen3.6-27B自行規(guī)劃,分了科技、財經(jīng)、體育、娛樂、健康五大板塊,設(shè)有國內(nèi)新聞和國際新聞,界面右側(cè),還展示了熱門排行、標(biāo)簽、北京的天氣,甚至把商業(yè)化都想好了,留出了廣告的位置。界面條理清晰,內(nèi)容完整,可視化效果好,模型對“一個新聞網(wǎng)站長什么樣”有較為成熟的認(rèn)知。

二、多模態(tài)能力:識別驗證碼、找不同,通通拿下

作為原生多模態(tài)模型,Qwen3.6-27B支持視覺語言思考與非思考模式,可處理圖像、視頻與文本的聯(lián)合理解,覆蓋視覺推理、文檔理解、視覺問答等場景,能力基本上與Qwen3.5-397B-A17B想當(dāng)。


針對多模態(tài)能力,我們也對Qwen3.6-27B進(jìn)行了測試,首先讓它識別了下面這幾個驗證碼。


可以看到,它較為清楚的判斷出了絕大多數(shù)驗證碼,只有第八個0AIs,他把s認(rèn)成了6,其他都判斷的比較準(zhǔn)確,同時也注明了自己不確定的部分。這種帶置信度反饋的識別方式,對后續(xù)的自動化校驗鏈路更友好,下游系統(tǒng)可以基于置信度決定是否自動通過。


展開思考過程,我們可以看到它多次確認(rèn)圖8的驗證碼0AIs,最后一位它在b和6之間反復(fù)糾結(jié),被旁邊字母干擾,在錯誤的道路上越走越遠(yuǎn)了,而正確答案s自始至終沒有進(jìn)入過它的候選集。

這樣看下來,Qwen3.6-27B的圖像識別和推理能力還是過關(guān)的,得到相對模糊的反饋后,還需進(jìn)行人工驗證。

另外,我們還讓Qwen3.6-27B進(jìn)行了“找不同”測試,讓它看看左右兩張圖有什么區(qū)別。


Qwen3.6-27B識別出了5處差異,不同難度的不同點都注意到了:鳥窩、打開的書、燈籠、顏色差異,還有墻上的掛飾,這個我自己一開始都沒注意到。


值得注意的是,它的思考過程非常簡單,簡單比對就完成了分析,而且描述也很清晰,展示出模型的較強(qiáng)的視覺識別與推理能力

結(jié)語:阿里開源戰(zhàn)略漸趨聚焦,27B模型瞄準(zhǔn)開發(fā)者核心需求

Qwen3.6系列的發(fā)布,折射出阿里在開源策略的轉(zhuǎn)向。此前,阿里曾開源從幾十億參數(shù)量到數(shù)千億參數(shù)量的各種模型,但本次Qwen3.6系列僅開源了小尺寸MoE模型和稠密模型,體現(xiàn)出其開源戰(zhàn)略的聚焦。

此類小模型面向開發(fā)者、研究者及小團(tuán)隊,可以直接本地部署,或在其基礎(chǔ)上做進(jìn)一步研究和微調(diào)。Qwen3.6-27B恰好卡在了這個需求的中心位置。

開源社區(qū)對這一尺寸的模型呼聲很高;從實際價值看,27B的稠密模型也更能滿足開發(fā)者對部署靈活性和可控性的現(xiàn)實要求。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
美國國務(wù)院宣布:批準(zhǔn)向以色列、阿聯(lián)酋、卡塔爾和科威特的86億美元巨額軍售!且不需國會審查

美國國務(wù)院宣布:批準(zhǔn)向以色列、阿聯(lián)酋、卡塔爾和科威特的86億美元巨額軍售!且不需國會審查

魯中晨報
2026-05-02 18:03:06
聞泰科技“帶帽”首日一字跌停 封單超41億元

聞泰科技“帶帽”首日一字跌停 封單超41億元

財聞
2026-05-06 11:08:36
1992年,陸定一問秦川:如果黨的一把手腐敗了,那么該由誰來管?

1992年,陸定一問秦川:如果黨的一把手腐敗了,那么該由誰來管?

阿器談史
2026-04-26 14:13:38
新西蘭鄰國HIV爆發(fā)!感染方式太瘋狂,“像野火一樣蔓延,已成國家危機(jī)”

新西蘭鄰國HIV爆發(fā)!感染方式太瘋狂,“像野火一樣蔓延,已成國家危機(jī)”

發(fā)現(xiàn)新西蘭
2026-05-06 13:20:33
提鞋都不配?國米名宿無情貶低槍手邊后衛(wèi) 認(rèn)為他跟廷貝爾差太遠(yuǎn)

提鞋都不配?國米名宿無情貶低槍手邊后衛(wèi) 認(rèn)為他跟廷貝爾差太遠(yuǎn)

雪狼侃體育
2026-05-06 19:18:33
蔣介石在他的日記里坦言:重慶談判時放走毛澤東,全是因為這2點

蔣介石在他的日記里坦言:重慶談判時放走毛澤東,全是因為這2點

倫倫媽愛歷史
2026-05-02 10:01:48
斯洛伐克擬派F-16戰(zhàn)機(jī)參加北約防空任務(wù),從2028年起計劃參與北約輪換式防空任務(wù),并將為此部署兩套來自以色列的Barak MX防空系統(tǒng)

斯洛伐克擬派F-16戰(zhàn)機(jī)參加北約防空任務(wù),從2028年起計劃參與北約輪換式防空任務(wù),并將為此部署兩套來自以色列的Barak MX防空系統(tǒng)

魯中晨報
2026-05-06 19:54:03
1938年,彭德懷和蔣介石的合影,看兩人的衣服,就知道不是一路人

1938年,彭德懷和蔣介石的合影,看兩人的衣服,就知道不是一路人

興趣知識
2026-05-05 17:43:16
牛皮吹得沒邊了,某國產(chǎn)車企要沖擊2000萬輛,這是要碾壓豐田么?

牛皮吹得沒邊了,某國產(chǎn)車企要沖擊2000萬輛,這是要碾壓豐田么?

柏銘銳談
2026-05-04 20:40:53
小鹿好局痛失,淚灑賽場,中韓女團(tuán)五強(qiáng)對決,韓國3:1獲勝

小鹿好局痛失,淚灑賽場,中韓女團(tuán)五強(qiáng)對決,韓國3:1獲勝

月滿大江流
2026-05-06 16:58:31
妻子升副局長跟我離婚,半年后我去開會,見她在門口等我2小時

妻子升副局長跟我離婚,半年后我去開會,見她在門口等我2小時

千秋文化
2026-03-25 21:49:57
估值數(shù)億美元,A.O.史密斯中國要賣了

估值數(shù)億美元,A.O.史密斯中國要賣了

融資中國
2026-05-05 09:59:32
以色列死局已定,無人能救!

以色列死局已定,無人能救!

大國觀察眼
2026-04-28 06:05:05
賈斯汀·比伯:一場音樂節(jié)如何讓播放量暴漲18倍

賈斯汀·比伯:一場音樂節(jié)如何讓播放量暴漲18倍

熱搜摘要官
2026-05-05 18:09:18
內(nèi)部人士爆料:東契奇赴西班牙療傷純屬假消息,歐洲之行另有原因

內(nèi)部人士爆料:東契奇赴西班牙療傷純屬假消息,歐洲之行另有原因

夜白侃球
2026-05-06 15:19:02
伊斯蘭革命衛(wèi)隊:如果美國再犯錯誤,就燒毀報廢他們的巨型戰(zhàn)艦!

伊斯蘭革命衛(wèi)隊:如果美國再犯錯誤,就燒毀報廢他們的巨型戰(zhàn)艦!

混沌錄
2026-04-30 00:12:11
“最美港姐”上浪姐一夜爆火!網(wǎng)友:完全是真人版迪士尼在逃公主……

“最美港姐”上浪姐一夜爆火!網(wǎng)友:完全是真人版迪士尼在逃公主……

美芽
2026-05-06 18:30:49
森林狼主帥:文班至少4個蓋帽是干擾球 沒必要申訴那是浪費時間

森林狼主帥:文班至少4個蓋帽是干擾球 沒必要申訴那是浪費時間

羅說NBA
2026-05-06 05:52:40
官宣:杰倫·布朗因公開批評裁判將被處以5萬美元罰款

官宣:杰倫·布朗因公開批評裁判將被處以5萬美元罰款

北青網(wǎng)-北京青年報
2026-05-06 19:59:03
吳宜澤:奧沙利文在決賽關(guān)鍵時刻給我發(fā)短信,讓我試著打出自己的風(fēng)格

吳宜澤:奧沙利文在決賽關(guān)鍵時刻給我發(fā)短信,讓我試著打出自己的風(fēng)格

懂球帝
2026-05-05 21:25:07
2026-05-06 20:35:00
智東西 incentive-icons
智東西
智東西,AI產(chǎn)業(yè)新媒體,專注報道人工智能的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來的千行百業(yè)產(chǎn)業(yè)變革。
11749文章數(shù) 117061關(guān)注度
往期回顧 全部

科技要聞

“馬斯克不懂AI”:OpenAI當(dāng)庭戳老底

頭條要聞

中國發(fā)布阻斷禁令后魯比奧聲稱將二次制裁 外交部回應(yīng)

頭條要聞

中國發(fā)布阻斷禁令后魯比奧聲稱將二次制裁 外交部回應(yīng)

體育要聞

活塞1比0騎士:坎寧安不再是一個人了

娛樂要聞

神仙友誼!楊紫連續(xù)10年為張一山慶生

財經(jīng)要聞

最新GDP!全國30強(qiáng)城市,又變了

汽車要聞

領(lǐng)克10/領(lǐng)克10+ 無論能源形式 領(lǐng)克都要快樂

態(tài)度原創(chuàng)

健康
教育
藝術(shù)
數(shù)碼
軍事航空

干細(xì)胞治燒燙傷面臨這些“瓶頸”

教育要聞

點贊!這些北京學(xué)子登上《人民日報》

藝術(shù)要聞

震撼!康斯坦丁攝影作品里的性感曲線讓人驚艷!

數(shù)碼要聞

消息稱三星蘇州家電生產(chǎn)繼續(xù),傳聞此前未能與塞夫就國行銷售談妥

軍事要聞

實施不到48小時 特朗普緊急喊停"霍爾木茲自由計劃"

無障礙瀏覽 進(jìn)入關(guān)懷版