国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

除夕迎「源神」?Qwen3.5以小勝大,大模型競賽下半場開始了

0
分享至



編輯|+0、張倩

農(nóng)歷蛇年的最后一天,當(dāng)所有人都覺得「今年就卷到這里」的時候,Qwen3.5-Plus來了!



它的特點一句話就可以概括:又強(qiáng)又便宜。

「強(qiáng)」體現(xiàn)在,模型發(fā)布即登頂。大家現(xiàn)在最關(guān)注的幾項核心能力 —— 多模態(tài)理解、復(fù)雜推理、編程、Agent 智能體,Qwen3.5-Plus 在同級開源模型里都沒有對手,又一次強(qiáng)化了社區(qū)里「最強(qiáng)開源 = 千問」的思想烙印。在多項基準(zhǔn)上,它甚至能媲美或超越 GPT-5.2、Gemini-3-pro 等幾個第一梯隊的閉源模型。



那它有多「便宜」呢?每百萬 Token 只要 0.8 元,還沒今天你手里拿的一小把瓜子貴。而它對標(biāo)的 Gemini-3-pro,價格足足是它的 18 倍。

這一定價不是刻意壓縮成本的結(jié)果,而是由技術(shù)決定的。在一系列架構(gòu)創(chuàng)新的加持下,Qwen3.5-Plus 的參數(shù)被極致精簡,但性能卻更強(qiáng)悍 —— 只用 3970 億的參數(shù)(激活參數(shù)只有 170 億)就超過了萬億參數(shù)的 Qwen3-Max。參數(shù)少了,跑起來自然輕盈,部署成本直降 60%,推理吞吐量最大提升 19 倍,效率大大提升。

這是第一次,「最強(qiáng)」和「最便宜」出現(xiàn)在了同一個模型上。

在開發(fā)者們頭疼都快用不起頂級 AI 的今天,Qwen3.5-Plus 這一「源神」的發(fā)布似乎讓大家打消了顧慮:技術(shù)紅利不再只屬于金字塔尖,而是開始真正向下滲透,成為人們手中用起來沒有成本焦慮的趁手工具。



Qwen3.5 可以協(xié)助進(jìn)行網(wǎng)頁開發(fā),尤其在構(gòu)建網(wǎng)頁和設(shè)計用戶界面等前端任務(wù)方面表現(xiàn)出色。



通過將 OpenClaw 作為第三方智能體環(huán)境集成,Qwen3.5 能夠進(jìn)行網(wǎng)頁搜索、信息收集和結(jié)構(gòu)化報告生成。



借助對圖像像素級位置信息的建模,Qwen3.5 在物體計數(shù)、相對位置判斷、空間關(guān)系描述等任務(wù)中表現(xiàn)更準(zhǔn)確。

體驗地址:https://chat.qwen.ai/

當(dāng)然,性能、價格只是結(jié)果,真正值得展開講講的,是支撐這一切的那套底層技術(shù)邏輯。讓我們一起看看,Qwen 這次是怎么又一次捅破天花板的。

告別「力大磚飛」

Qwen3.5-Plus 的「以小博大」架構(gòu)革命

在過去兩年的大模型軍備競賽中,行業(yè)普遍信奉「大力出奇跡」,參數(shù)量從千億一路狂飆至萬億級別。這種「力大磚飛」的模式雖然推高了性能上限,但也讓算力成本和部署門檻水漲船高。

Qwen3.5-Plus 則展示了一種更為靈巧的解法:不拼絕對體量,拼「聰明程度」與底層架構(gòu)的極致效率。

具體而言,Qwen3.5-Plus 以 397B 的總參數(shù)量,實現(xiàn)了對自家萬億參數(shù)模型 Qwen3-Max 的性能超越,且多項基準(zhǔn)測試媲美 Gemini-3-pro 和 GPT-5.2 等閉源第一梯隊模型。

這種「以小勝大」的跨級表現(xiàn),主要歸功于以下四項核心架構(gòu)創(chuàng)新:

  • 混合注意力機(jī)制: 傳統(tǒng)大模型在處理長文本時,每個 Token 都需要進(jìn)行全量的上下文注意力計算,這導(dǎo)致算力消耗隨文本長度呈指數(shù)級增長。Qwen3.5-Plus 引入的混合機(jī)制賦予了模型「有詳有略」的閱讀能力,能夠根據(jù)信息權(quán)重動態(tài)分配注意力資源,實現(xiàn)了精度與效率的雙重提升。
  • 極致稀疏的 MoE 架構(gòu):不同于每次推理都需要激活全量參數(shù)的稠密模型,Qwen3.5-Plus 將 MoE(混合專家)架構(gòu)推向了極致。在其 397B 的總參數(shù)中,每次推理僅需激活 17B 的參數(shù)量。這意味著模型只需動用不到 5% 的算力,就能調(diào)用全局的知識儲備。
  • 原生多 Token 預(yù)測:模型打破了傳統(tǒng)大模型「逐字吐出」的生成邏輯,在訓(xùn)練階段就掌握了對后續(xù)多個位置進(jìn)行聯(lián)合預(yù)測的能力。這種「一次想好幾步再說」的機(jī)制,使其在代碼補(bǔ)全、長文本生成等高頻場景中,推理速度接近翻倍,為用戶帶來幾乎「秒回」的交互體驗。
  • 系統(tǒng)級訓(xùn)練穩(wěn)定性優(yōu)化: 為了讓上述復(fù)雜架構(gòu)在大規(guī)模訓(xùn)練中不翻車,阿里引入了多項深層優(yōu)化,包括歸一化策略與專家路由初始化等。其中最值得一提的是榮獲 NeurIPS 2025 最佳論文獎的「注意力門控機(jī)制」。它在注意力層的輸出端精準(zhǔn)調(diào)控信息流,既過濾了無效噪音,又防止了關(guān)鍵信息的流失,大幅增強(qiáng)了長上下文的泛化能力。

在這套組合拳的加持下,Qwen3.5-Plus 不僅訓(xùn)練成本大降,算力部署成本較 Qwen3-Max 也降低了 60%,推理吞吐量在 256K 長文本下提升 19 倍,這為大規(guī)模提供推理服務(wù)奠定了基礎(chǔ),也直接促成了其極致的定價策略。



拒絕「外掛拼裝」

Qwen3.5-Plus 的原生多模態(tài)「地基」

除了在推理效率上「減負(fù)」,Qwen3.5-Plus 的另一大技術(shù)看點在于其跨模態(tài)理解力的重構(gòu)。

目前業(yè)內(nèi)許多主打「多模態(tài)」的模型,本質(zhì)上仍是工程上的「拼裝」:先訓(xùn)練一個優(yōu)秀的語言基座,再外掛視覺或音頻模塊,中間通過適配層進(jìn)行勉強(qiáng)對齊。這種做法不僅難以實現(xiàn)真正的特征融合,有時還會出現(xiàn)「視覺能力增強(qiáng),語言能力降智」的尷尬局面。

Qwen3.5-Plus 選擇了從地基開始重構(gòu),真正實現(xiàn)了「原生多模態(tài)」。

從預(yù)訓(xùn)練的第一天起,Qwen3.5-Plus 就在文本與視覺混合數(shù)據(jù)上進(jìn)行聯(lián)合學(xué)習(xí)。模型在統(tǒng)一的參數(shù)空間內(nèi)深度融合視覺與語言特征,沒有中間翻譯帶來的信息損耗,從而具備了「見圖知意、讀文生境」的直覺理解力。

為了讓這種原生融合跑出效率,阿里摒棄了讓視覺和語言共享同一套并行策略的傳統(tǒng)做法,而是讓不同模態(tài)「各走各的最優(yōu)路徑」,僅在關(guān)鍵節(jié)點進(jìn)行高效匯合。配合精巧的 FP8/FP32 精度應(yīng)用策略,該架構(gòu)成功將激活內(nèi)存減少約 50%,訓(xùn)練提速 10%。更硬核的是,哪怕同時喂入文本、圖像、視頻三種數(shù)據(jù),它的訓(xùn)練速度也幾乎不受影響,依然能保持和只訓(xùn)練純文本時相當(dāng)?shù)男省?/p>

研發(fā)團(tuán)隊針對純文本、多模態(tài)和多輪對話場景搭建了專門的強(qiáng)化學(xué)習(xí)框架,將整體訓(xùn)練效率提升了 3 至 5 倍,確保模型能夠在海量真實場景中持續(xù)進(jìn)化。

這種底層架構(gòu)的躍遷,賦予了 Qwen3.5-Plus 超越「簡單讀圖」的廣闊能力邊界。目前的 Qwen3.5-Plus 不僅能進(jìn)行圖像的像素級空間定位,還能理解長達(dá) 2 小時視頻的因果時序,甚至能將手繪草圖直譯為前端代碼,或者化身視覺智能體自主操控手機(jī)與電腦、跨應(yīng)用完成多步復(fù)雜任務(wù)

結(jié)合此前在 AI Arena 榜單上位居全球前三、被譽為「國產(chǎn) Nano Banana Pro」的 Qwen-image-2.0,阿里在多模態(tài)理解與生成兩條路線上正加速向全面掌握看、聽、說、做能力的 AGI 目標(biāo)邁進(jìn)。

算不過賬的時代結(jié)束了

新的競賽開始了

過去兩年,如果你一直在關(guān)注大模型的發(fā)展,其實會發(fā)現(xiàn)一件挺有意思的事:閉源模型是你方唱罷我登場,前三輪流做,明天榜首指不定是誰家。但開源領(lǐng)域就很明朗了,很多關(guān)鍵能力的「天花板刷新」,幾乎都發(fā)生在 Qwen 發(fā)新模型的時候,每一代、每一個尺寸都能穩(wěn)定輸出。這種創(chuàng)新的連續(xù)性,意味著它已經(jīng)形成了一條可以穩(wěn)定產(chǎn)出的技術(shù)路線,比單次跑分高更說明問題。

而這次,Qwen3.5-Plus 又在捅一個新的天花板 —— 頂級智能的「性價比」。當(dāng)模型性能逐漸逼近閉源第一梯隊,同時價格卻大幅往下走,事情的性質(zhì)就開始變了。以前很多企業(yè)不是不想用最好的 AI,而是算不過賬?,F(xiàn)在成本結(jié)構(gòu)一變,決策邏輯自然就松動了。技術(shù)擴(kuò)散往往卡的不是能力,而是門檻。

歷史上類似的轉(zhuǎn)折其實出現(xiàn)過很多次。真正改變行業(yè)的,往往不是最貴、最極致的系統(tǒng),而是那個最后變成基礎(chǔ)設(shè)施的東西。Linux 當(dāng)年是這樣,Android 也是這樣:開源降低門檻,生態(tài)把它鋪開,等你意識到的時候,它已經(jīng)無處不在了。

而 Qwen3.5-Plus 之所以能捅破這個天花板,背后不只是一個模型,而是一整套從模型到算力再到云的聯(lián)動。阿里一邊把模型能力通過開源釋放出來,一邊又用阿里云和自研芯片把部署和推理成本繼續(xù)往下壓,本質(zhì)是在同時解決「用得好嗎」和「用得起嗎」兩個問題。生態(tài)里的采用者也越來越多,從李飛飛團(tuán)隊到 Airbnb 這樣的公司,都在把它當(dāng)作實際可用的底座,而不只是研究對象。

所以如果把 Qwen3.5-Plus 只看成又一次模型升級,其實有點低估它了。更值得關(guān)注的是,一種新的競爭方式正在成形:不再只是比誰的模型最強(qiáng),而是比誰能把足夠強(qiáng)的能力,變成最多人日常用得到的基礎(chǔ)設(shè)施。技術(shù)真正的大規(guī)模落地,往往就是從這種時刻開始的。

文中視頻鏈接:https://mp.weixin.qq.com/s/MZ_BPDKLsF8uT0XyOhCbrw

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
WTT大滿貫!女單8強(qiáng)賽對陣,世界亞軍1-3出局,王曼昱肩負(fù)重任

WTT大滿貫!女單8強(qiáng)賽對陣,世界亞軍1-3出局,王曼昱肩負(fù)重任

以茶帶書
2026-02-25 19:20:55
中國游客親歷莫斯科機(jī)場關(guān)閉:滯留時很焦慮,后續(xù)行程全打亂

中國游客親歷莫斯科機(jī)場關(guān)閉:滯留時很焦慮,后續(xù)行程全打亂

南方都市報
2026-02-25 16:52:10
為什么奉勸老人不要去跳交誼舞?63歲阿姨說道:交誼舞害人不淺

為什么奉勸老人不要去跳交誼舞?63歲阿姨說道:交誼舞害人不淺

烙任情感
2026-02-25 10:47:33
外交部:中方一貫反對沒有國際法依據(jù)、未經(jīng)聯(lián)合國安理會授權(quán)的單邊制裁

外交部:中方一貫反對沒有國際法依據(jù)、未經(jīng)聯(lián)合國安理會授權(quán)的單邊制裁

環(huán)球網(wǎng)資訊
2026-02-25 15:30:23
“霍金與比基尼女性同游照”現(xiàn)愛潑斯坦檔案 ,曾被“辟謠”稱系偽造

“霍金與比基尼女性同游照”現(xiàn)愛潑斯坦檔案 ,曾被“辟謠”稱系偽造

揚子晚報
2026-02-26 10:09:32
見義勇為的平頂山抱孩子大姐找見了,平頂山的口碑,大姐一個人扛起

見義勇為的平頂山抱孩子大姐找見了,平頂山的口碑,大姐一個人扛起

觀察鑒娛
2026-02-25 10:29:44
我外公是位風(fēng)水先生,他常說,人最好的風(fēng)水一定要記?。?>
    </a>
        <h3>
      <a href=楓紅染山徑
2026-02-26 09:05:17
朝鮮“新星女將軍”金主愛:下一代領(lǐng)導(dǎo)者?她頻頻露面原因為何?

朝鮮“新星女將軍”金主愛:下一代領(lǐng)導(dǎo)者?她頻頻露面原因為何?

洞鑒歷史
2024-04-24 15:10:54
春節(jié)后,這4種蔬菜不要隨便買!菜販子:我從來不吃,顧客搶著買

春節(jié)后,這4種蔬菜不要隨便買!菜販子:我從來不吃,顧客搶著買

阿龍美食記
2026-02-26 10:37:19
正在熱播的3部爛劇,沒有最爛只有更爛,一部沒看算你慧眼識珠!

正在熱播的3部爛劇,沒有最爛只有更爛,一部沒看算你慧眼識珠!

觀察鑒娛
2026-02-26 09:21:30
碧桂園7000億項目爛尾

碧桂園7000億項目爛尾

地產(chǎn)微資訊
2026-02-23 21:46:01
孩子走丟到小賣鋪求助,老板好心給其父母打電話,卻被5人按倒

孩子走丟到小賣鋪求助,老板好心給其父母打電話,卻被5人按倒

另子維愛讀史
2026-02-25 23:35:20
男籃VS日本隊!郭士強(qiáng)想要贏球,需要少用2人,重用3人

男籃VS日本隊!郭士強(qiáng)想要贏球,需要少用2人,重用3人

體育哲人
2026-02-26 08:01:51
34歲東北姑娘拿下81歲全球首富,長的很漂亮,一年抱倆娃身價上億

34歲東北姑娘拿下81歲全球首富,長的很漂亮,一年抱倆娃身價上億

云舟史策
2025-09-13 07:37:04
宇樹機(jī)器人去年只賣了5500多臺,普通家庭基本沒有買的

宇樹機(jī)器人去年只賣了5500多臺,普通家庭基本沒有買的

爆角追蹤
2026-02-25 10:08:50
上海一日料店,倆女子誤認(rèn)為是自助餐,專門撿貴的點,結(jié)賬時4302

上海一日料店,倆女子誤認(rèn)為是自助餐,專門撿貴的點,結(jié)賬時4302

苗苗情感說
2026-02-26 04:31:53
安史之亂八年里,叛軍為何死戰(zhàn)不降?不是安祿山想反,他也很無奈

安史之亂八年里,叛軍為何死戰(zhàn)不降?不是安祿山想反,他也很無奈

今日養(yǎng)生之道
2026-02-22 16:18:50
挪威前首相被曝自殺未遂,目前生命情況危急,此前被指控犯有與愛潑斯坦相關(guān)的“嚴(yán)重腐敗”罪名

挪威前首相被曝自殺未遂,目前生命情況危急,此前被指控犯有與愛潑斯坦相關(guān)的“嚴(yán)重腐敗”罪名

每日經(jīng)濟(jì)新聞
2026-02-26 10:13:33
俞飛鴻竇文濤二十年相伴不結(jié)婚,抵押房產(chǎn)賠光四千萬他仍守在身邊

俞飛鴻竇文濤二十年相伴不結(jié)婚,抵押房產(chǎn)賠光四千萬他仍守在身邊

動物奇奇怪怪
2026-02-25 19:00:15
放棄爭奪260億遺產(chǎn),帶著女兒遠(yuǎn)赴美國,如今才知她是人間清醒

放棄爭奪260億遺產(chǎn),帶著女兒遠(yuǎn)赴美國,如今才知她是人間清醒

林輕吟
2026-01-31 11:44:55
2026-02-26 11:12:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12362文章數(shù) 142569關(guān)注度
往期回顧 全部

科技要聞

單季營收681億凈利429億!英偉達(dá)再次炸裂

頭條要聞

"花壇白骨案"2名兇手因4萬元殺人埋尸 受害人兒子發(fā)聲

頭條要聞

"花壇白骨案"2名兇手因4萬元殺人埋尸 受害人兒子發(fā)聲

體育要聞

從排球少女到冰壺女神,她在米蘭冬奧練出6塊腹肌

娛樂要聞

尼格買提撒貝寧滑雪被偶遇 17年老友情

財經(jīng)要聞

短劇市場風(fēng)云突變!有人投百萬賠得精光

汽車要聞

雷克薩斯ES雙色特別版上市 售30.79萬元起

態(tài)度原創(chuàng)

親子
健康
游戲
教育
旅游

親子要聞

筱梅沉浸當(dāng)母親喜悅!分享小寶睜眼吃奶照!箖箖看弟弟一舉動被贊

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

劇情設(shè)定已有爆料!《德軍總部》新作真要來了?

教育要聞

留學(xué)澳洲,住哪兒更安全?這份全澳榜單給了答案!

旅游要聞

“引客入滇”入境旅游激勵3月1日起申報 符合條件的企業(yè)最高可獲50萬元激勵資金

無障礙瀏覽 進(jìn)入關(guān)懷版