国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

實測阿里Qwen3.6-Plus:8分鐘做了個官網(wǎng),被北京地鐵繞暈

0
分享至


智東西
作者 陳駿達
編輯 心緣

智東西4月2日報道,今天,阿里推出了新一代大語言模型Qwen3.6-Plus,這也是Qwen3.6系列的首個模型。與上一代模型相比,Qwen3.6-Plus重點提升了編程Coding能力、智能體Agent能力和工具調(diào)用能力,默認支持100萬上下文窗口

這一模型還適配了主流Agent框架,也就是各種“龍蝦”和編程工具。官方提到的包括OpenClaw、Qwen Code、ClaudeCode、KiloCode、Cline和OpenCode。

在大模型調(diào)用平臺OpenRouter上,免費體驗的Qwen3.6-Plus預(yù)覽版調(diào)用量排名日榜第二。值得一提的是,前五名的模型中有四個都是國產(chǎn)模型。


在SWE-bench Verified、Terminal-Bench 2、NL2Repo等編程基準測試中,Qwen3.6-Plus取得了超過GLM-5、Kimi K2.5的成績,不過在部分基準測試中的得分仍低于Claude Opus 4.5。

在Claw-Eval、QwenClawBench等真實世界Agent能力評測中,Qwen3.6-Plus的表現(xiàn)同樣超過了多款國產(chǎn)模型,與Claude Opus 4.5同處一個梯隊。


▲Qwen3.6-Plus基準測試對比(圖源:阿里)

不過,需要注意的是,這張基準測試圖的圖表縱軸刻度間隔并不一致,在SWE-bench Verified、MMMU、RealWorldQA、QwenClawBench等測試中,幾個對比模型的實際得分差距并沒有特別明顯。

智東西立刻上手體驗了Qwen3.6-Plus的編程能力,讓它在Claude官方的前端設(shè)計Skill指導(dǎo)下,打造了一個AI眼鏡獨立站,歷經(jīng)三輪對話,耗時8分鐘左右,消耗2.5萬個token(約等于0.15元)。

可以看到在提示詞的要求下它打造的網(wǎng)頁完成度不錯,根據(jù)Skill的要求避免了一些老掉牙的AI味設(shè)計風(fēng)格,不過在字體選擇上依然是較為常見的類型。


實測結(jié)果:

https://mcp.edgeone.site/share/57IuyACJqUk1GjKHY9I4c

與上一代模型類似,Qwen3.6-Plus也是一個原生多模態(tài)模型。Qwen3.6-Plus這次重點提升了多模態(tài)推理和指令模式實用性。

官方Demo中用北京地鐵路徑規(guī)劃的題目考了考Qwen3.6-Plus,我們同樣試了一下,讓模型規(guī)劃出從北京大興機場到北京首都機場的最快路線,它的方案與高德上的最快路徑一致。


將編程能力與多模態(tài)能力結(jié)合后,Qwen3.6-Plus還解鎖了視覺智能體編程能力,可基于界面截圖、設(shè)計稿或自然圖文描述,完成前端頁面生成、代碼補全、交互修改等任務(wù)。

目前,Qwen3.6-Plus的API已經(jīng)開放調(diào)用,用戶可在Qwen Chat中體驗到這一模型。這次阿里還為API引入了一項新功能“preserve_thinking”,可保留消息中所有前序輪次的思維內(nèi)容,該功能推薦用于智能體任務(wù)。其API的原價為4元/百萬輸入tokens,12元/百萬輸出tokens,目前有限時5折的優(yōu)惠。


值得一提的是,阿里在企業(yè)級市場的AI應(yīng)用“悟空”第一時間接入了Qwen3.6-Plus。


Qwen Chat:

https://chat.qwen.ai/

阿里云百煉:

https://bailian.console.aliyun.com/cn-beijing?tab=model#/model-market/detail/qwen3.6-plus 一、可完成長鏈路任務(wù)與多輪工具調(diào)用,token效率有提升空間

在自然語言能力方面,Qwen3.6-Plus通過融合推理、記憶與執(zhí)行能力,在編程智能體、通用智能體和工具調(diào)用上實現(xiàn)提升。

具體來看,在編程智能體維度其表現(xiàn)較Qwen3.5實現(xiàn)較大幅度的提升,得分略微高于GLM-5和Kimi-K2.5,略低于Claude Opus 4.5。

在通用智能體方面,其得分在部分基準測試中優(yōu)于Claude Opus 4.5。在通用能力中,其得分和Qwen3.5基本一致。


在實測中,我們的這一案例融合考察了編程與工具調(diào)用能力,要求Qwen3.6-Plus統(tǒng)計A股目前股價最高的10家公司,并生成完整統(tǒng)計網(wǎng)頁,帶有每家公司的跳轉(zhuǎn)鏈接。

在任務(wù)執(zhí)行過程中,Qwen3.6-Plus調(diào)用了7輪搜索工具,統(tǒng)計了數(shù)十個網(wǎng)站的數(shù)據(jù),最終交付了如下的結(jié)果,耗時大概7分鐘左右。


▲Qwen3.6-Plus生成的排名

Qwen3.6-Plus選擇了權(quán)威的數(shù)據(jù)來源,右側(cè)查看詳情鏈接的跳轉(zhuǎn)正常,排名正確,數(shù)據(jù)則取的是近似值。在思維鏈中可以看到它多次在同一個問題上反復(fù)思考,搜索多次但獲得的內(nèi)容差不多,在任務(wù)執(zhí)行速度和token效率上仍有一定提升空間。


▲右側(cè)是Qwen3.6-Plus的思維鏈摘要

接下來,我們又要求Qwen3.6-Plus生成一個《潛水員戴夫》的同款游戲,不過,Qwen3.6-Plus先是拒絕了這一要求,稱它無法直接生成可執(zhí)行的游戲文件,但可以為我生成核心概念美術(shù)圖,并提供一套完整的《潛水員戴夫》風(fēng)格游戲設(shè)計藍圖+開發(fā)指南+基礎(chǔ)代碼框架,作為開發(fā)起點。


再次要求后,Qwen3.6-Plus開始了開發(fā),但是在寫到200多行代碼時出現(xiàn)了問題,于是停止了開發(fā)。


之后我們嘗試了通過API調(diào)用這一模型,完成同一任務(wù)。模型認為,打造《潛水員戴夫》同款獨立游戲的核心在于復(fù)刻其“白天探索采集+夜晚模擬經(jīng)營+輕敘事驅(qū)動+循環(huán)成長”的節(jié)奏,而非照搬題材或代碼。它決定打造一個白天深入動態(tài)霧林采集食材與古物,夜晚經(jīng)營一家能“烹飪記憶”的森林酒館的游戲。

最終Qwen3.6-Plus交付的MVP版本(最小可用版本)如下,不過我們試玩了一下,這一游戲在可玩性上仍然需要持續(xù)迭代。


試玩鏈接:

https://mcp.edgeone.site/share/hkGsoqs3OCUQyXtxsYCal

二、實測高難度路徑規(guī)劃,被北京地鐵轉(zhuǎn)暈

在視覺語言能力方面,Qwen3.6-Plus的主要圍繞著多模態(tài)推理、指令模式實用性進行改進,其在復(fù)雜文檔理解、物理世界視覺理解、視頻推理和視覺編程等任務(wù)上的得分有所提升。


為考察其視覺推理能力,我們在之前的地鐵路徑規(guī)劃任務(wù)上加了點難度,假設(shè)某一線路遇到了極端天氣停運了,看看模型還能不能反應(yīng)過來。


Qwen3.6-Plus通過較長時間的思考后,得出了兩個結(jié)論,第一個結(jié)論其實是正確的,但是它判斷這條路線有點復(fù)雜,于是認為可以在“牡丹園站換乘昌平線”,這樣更直接。Qwen3.6-Plus的最終結(jié)論有個bug,昌平線可能至少要等到2029年才能和19號線在牡丹園換乘。


在其他多模態(tài)能力方面,阿里官方還展示了多個demo。比如,Qwen3.6-Plus可以對視頻進行分析,并生成圖文并茂的講義。


或是根據(jù)界面截圖、產(chǎn)品原型、設(shè)計稿或自然圖文描述,完成前端頁面生成、代碼補全、交互修改等任務(wù)。


結(jié)語:阿里全面押注原生多模態(tài)

隨著Qwen3.6-Plus的發(fā)布,千問團隊稱,他們近期的工作重心將全面轉(zhuǎn)向Qwen3.6系列的整體發(fā)布。在未來不久,千問還將開源更小規(guī)模的模型版本。同時,性能更強的旗艦?zāi)P蚎wen3.6-Max也將很快亮相。

值得注意的是,自Qwen3.5發(fā)布后,千問已經(jīng)全面將其主力模型Qwen轉(zhuǎn)向了原生多模態(tài)。該團隊稱,他們希望模型逐步演進為一個能夠在真實環(huán)境中持續(xù)感知、推理和行動的原生多模態(tài)智能體。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
人到晚年才明白,每月8000的退休金,沒有子女養(yǎng)老,根本就是做夢

人到晚年才明白,每月8000的退休金,沒有子女養(yǎng)老,根本就是做夢

人間百態(tài)大全
2026-04-02 07:20:03
1951年,戴笠的兒子戴善武被執(zhí)行死刑,被槍斃的時候才36歲

1951年,戴笠的兒子戴善武被執(zhí)行死刑,被槍斃的時候才36歲

百年歷史老號
2026-03-28 20:32:38
縣委書記接受調(diào)查后,妻子瘋了,19歲女兒被縣長帶進一個山洞里

縣委書記接受調(diào)查后,妻子瘋了,19歲女兒被縣長帶進一個山洞里

喬生桂
2025-04-20 16:17:47
狂轟31+6+3!登頂歷史第一,杰倫格林再超神下去,火箭就要后悔了

狂轟31+6+3!登頂歷史第一,杰倫格林再超神下去,火箭就要后悔了

巴叔GO聊體育
2026-04-02 15:17:24
假山假景假臉!《白日提燈》爆火,打臉內(nèi)娛多少流水線古裝劇!

假山假景假臉!《白日提燈》爆火,打臉內(nèi)娛多少流水線古裝。

悅君兮君不知
2026-04-01 11:33:27
發(fā)展聯(lián)盟賽場又一次起到了關(guān)鍵性的作用,湖人真不打算轉(zhuǎn)正他嗎?

發(fā)展聯(lián)盟賽場又一次起到了關(guān)鍵性的作用,湖人真不打算轉(zhuǎn)正他嗎?

稻谷與小麥
2026-04-03 00:17:04
出大事了,伊朗導(dǎo)彈精準斬首!大批美軍官被抬走?英法德俄失聲

出大事了,伊朗導(dǎo)彈精準斬首!大批美軍官被抬走?英法德俄失聲

東風(fēng)寄的千愁
2026-04-03 04:03:55
國務(wù)院國資委:高質(zhì)量開展國有企業(yè)一線擴崗增招專項行動

國務(wù)院國資委:高質(zhì)量開展國有企業(yè)一線擴崗增招專項行動

中國網(wǎng)
2026-04-02 12:16:16
說唱歌手J.Cole加盟同曦引熱議 國內(nèi)媒體炸開鍋歷史最高身價外援

說唱歌手J.Cole加盟同曦引熱議 國內(nèi)媒體炸開鍋歷史最高身價外援

狼叔評論
2026-04-02 12:26:05
BTCC花3000萬押注阿根廷隊:世界杯年最騷的加密營銷

BTCC花3000萬押注阿根廷隊:世界杯年最騷的加密營銷

閃存獵手
2026-04-03 07:06:45
網(wǎng)貸迎最強監(jiān)管,一刀切24%,要么合規(guī)要么去死,九成平臺將出局

網(wǎng)貸迎最強監(jiān)管,一刀切24%,要么合規(guī)要么去死,九成平臺將出局

潮鹿逐夢
2026-03-30 11:17:52
楊蘭蘭最新:不上課、不社交、英語差,喜歡買買買,香奈兒VVIP

楊蘭蘭最新:不上課、不社交、英語差,喜歡買買買,香奈兒VVIP

麥大人
2025-10-09 16:23:06
重創(chuàng)!曼聯(lián)中場目標口頭同意加盟馬競,夏窗重建再遇挫折

重創(chuàng)!曼聯(lián)中場目標口頭同意加盟馬競,夏窗重建再遇挫折

瀾歸序
2026-04-03 05:10:46
東風(fēng)導(dǎo)彈泄密案!間諜郭萬鈞一家三口,全部被處以死刑

東風(fēng)導(dǎo)彈泄密案!間諜郭萬鈞一家三口,全部被處以死刑

番外行
2026-03-31 08:28:28
中南大學(xué)副教授因勞累過度去世,享年60歲

中南大學(xué)副教授因勞累過度去世,享年60歲

超級數(shù)學(xué)建模
2026-04-02 22:32:25
斯諾克4強誕生!特魯姆普絕殺墨菲,趙心童5-3,丁俊暉天降喜訊!

斯諾克4強誕生!特魯姆普絕殺墨菲,趙心童5-3,丁俊暉天降喜訊!

曹說體育
2026-04-02 11:54:47
馬德里競技 vs 巴塞羅那:五大必看理由,對決不容錯過

馬德里競技 vs 巴塞羅那:五大必看理由,對決不容錯過

體育產(chǎn)業(yè)獨立評論
2026-04-02 16:28:18
伊朗伊斯蘭革命衛(wèi)隊發(fā)布公告

伊朗伊斯蘭革命衛(wèi)隊發(fā)布公告

揚子晚報
2026-04-01 07:45:25
一招制敵!伊朗襲擊沙特空軍基地,美軍半支電戰(zhàn)機隊直接趴窩

一招制敵!伊朗襲擊沙特空軍基地,美軍半支電戰(zhàn)機隊直接趴窩

軍迷戰(zhàn)情室
2026-04-03 07:50:09
令人不解的痛史:東北抗聯(lián)內(nèi)斗悲劇與大量叛徒

令人不解的痛史:東北抗聯(lián)內(nèi)斗悲劇與大量叛徒

柳絮憶史
2026-03-30 09:15:02
2026-04-03 08:23:00
智東西 incentive-icons
智東西
聚焦智能變革,服務(wù)產(chǎn)業(yè)升級。
11501文章數(shù) 117022關(guān)注度
往期回顧 全部

科技要聞

三年虧20億,最新估值58億,Xreal沖刺港股

頭條要聞

特朗普剛說"要打擊一些橋梁" 伊朗標志性大橋就被炸

頭條要聞

特朗普剛說"要打擊一些橋梁" 伊朗標志性大橋就被炸

體育要聞

邵佳一的改革,從讓每個人踢舒服開始

娛樂要聞

《浪姐》人氣榜出爐!曾沛慈斷層第一

財經(jīng)要聞

市場被特朗普一句話打醒 滯脹交易回歸

汽車要聞

軸距2米7/后排能蹺腿 試駕后驅(qū)小車QQ3 EV

態(tài)度原創(chuàng)

數(shù)碼
房產(chǎn)
本地
教育
公開課

數(shù)碼要聞

華為Mate X8折疊屏:8.15英寸巨幕+麒麟9040,最強折疊屏要來了

房產(chǎn)要聞

巨無霸來了!?诔歉,突然又爆大動作!

本地新聞

從學(xué)徒到世界冠軍,為什么說張雪的底氣在重慶?

教育要聞

國際奧林匹克競賽題,求n,太難了

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版