国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AI春節(jié)檔最強殺手锏來了!千問3.5除夕強勢亮相,開源SOTA、性價比之王

0
分享至


大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自AI科技評論

作者丨劉 偉

編輯丨林覺民

這可能是有史以來AI濃度最高的一次春節(jié)。千問、豆包、元寶等C端AI助手爭相贊助春晚,借紅包與補貼快速拉升日活;各家基礎(chǔ)大模型也悄然迭代版本,蓄勢展開行業(yè)角逐。

而這輪AI春節(jié)檔迎來了最強殺手锏!2 月 16日除夕當(dāng)天,阿里開源全新一代大模型Qwen3.5-Plus,其性能媲美 Gemini-3-pro、GPT-5.2 等頂級閉源模型,一舉登頂全球最強開源模型寶座。

這款模型在模型架構(gòu)上全面創(chuàng)新,是旗下首款原生多模態(tài)模型,并且在性能和推理效率上均實現(xiàn)大幅提升。此次發(fā)布的Qwen3.5-Plus 總參數(shù)達(dá) 3970 億,實際激活僅 170 億,性能卻超越萬億參數(shù)的 Qwen3-Max 模型;同時部署顯存占用降低 60%,最大吞吐量可提升至19倍,真正實現(xiàn)以小勝大。

實測結(jié)果顯示,千問 3.5 在 MMLU-Pro 認(rèn)知能力評測中拿下 87.8 分,超越 GPT5.2;在博士級難題 GPQA 測評中斬獲 88.4 分,高于 Claude 4.5;在指令遵循 IFBench 評測中以 76.5 分刷新所有模型紀(jì)錄;在通用 Agent 評測 BFCL-V4、搜索 Agent 評測 Browsecomp 等基準(zhǔn)中,表現(xiàn)均超越 Gemini-3-Pro。


這次,阿里還把底層模型架構(gòu)和AI infra創(chuàng)新的紅利釋放給了廣大企業(yè)和開發(fā)者,千問 3.5 加量不加價 —— 性能大幅躍升的同時,使用成本再創(chuàng)新低。阿里云百煉上的千問 3.5 API 價格已經(jīng)出爐:每百萬 Token 輸入低至 0.8 元,僅為 Gemini-3-pro 的 1/18。

01模型架構(gòu)多項創(chuàng)新,

千問3.5性能、效率大幅提升

過去數(shù)年,大模型行業(yè)陷入近乎偏執(zhí)的 “參數(shù)崇拜”。從千億到萬億,參數(shù)規(guī)模的膨脹被視作性能提升的唯一路徑,而這種粗放式發(fā)展也存在諸多問題:部署門檻高,推理消耗天價成本…… 技術(shù)創(chuàng)新與實際應(yīng)用之間,形成一道難以跨越的鴻溝。

Qwen3.5-Plus打破了這一固有思路,它不僅在架構(gòu)層面實現(xiàn)創(chuàng)新,還采用了全新的原生多模態(tài)預(yù)訓(xùn)練范式,直接打破開源模型的性能天花板。

Qwen3.5-Plus 的技術(shù)與架構(gòu)創(chuàng)新,主要體現(xiàn)在四大核心維度:首先是注意力機制的革新。面對長文本,傳統(tǒng) Transformer 模型需對每個詞與所有上下文做全量計算,算力消耗隨文本長度指數(shù)級增長。Qwen3.5-Plus 引入混合注意力機制,讓模型學(xué)會 “有詳有略地讀”,自動識別關(guān)鍵信息精讀、非關(guān)鍵部分快讀,既大幅降低長文本處理的算力成本,又保障信息處理精度。

其次是架構(gòu)層面的代際躍遷。Qwen3.5-Plus 采用極致稀疏的混合專家(MoE)架構(gòu)。傳統(tǒng)稠密模型每次推理都要激活全部參數(shù),如同讓整個工廠的工人同時作業(yè),無論任務(wù)大?。欢?MoE 架構(gòu)恰似一支特種部隊,僅根據(jù)任務(wù)需求調(diào)用最相關(guān)的 “專家” 子網(wǎng)絡(luò)。Qwen3.5-Plus 將這一理念做到極致 ——3970 億總參數(shù)中,僅需激活不到 5%(170億),就能調(diào)動全部知識儲備,從根本上解決算力浪費問題。

三是原生多 Token 預(yù)測。以往的模型如同打字時每按一個鍵都要停頓思考下一個字,效率低下;而千問3.5在訓(xùn)練時就學(xué)會了 “預(yù)判”,能同時規(guī)劃多個詞甚至一整句話的輸出并一次性生成。這并非簡單的多字打包發(fā)送,而是模型在內(nèi)部真正 “提前規(guī)劃” 后續(xù)內(nèi)容,讓長文本生成、代碼補全、多輪對話等高頻場景的響應(yīng)速度近乎翻倍,用戶能感受到近乎 “秒出” 的流暢體驗。

最后是系統(tǒng)級訓(xùn)練穩(wěn)定性優(yōu)化。為讓模型在超大規(guī)模訓(xùn)練中保持穩(wěn)定,千問團隊完成多項底層優(yōu)化。根據(jù)官方信息,阿里千問團隊入選NeurIPS2025最佳論文的注意力門控機制研究這次也被用上了,一年前的前瞻性研究現(xiàn)在已成為打破模型性能天花板的重要一環(huán)。在256K超長上下文情況下,千問3.5推理吞吐量最大提升至19倍,推理效率大幅提升。

值得注意的是,和絕大多數(shù)多模態(tài)模型不同,Qwen3.5-Plus在多模態(tài)理解的實現(xiàn)上嘗試了新的路徑。據(jù)介紹,從預(yù)訓(xùn)練第一天起,千問模型就在文本和視覺的混合數(shù)據(jù)上聯(lián)合學(xué)習(xí),讓視覺與語言在統(tǒng)一的參數(shù)空間內(nèi)深度融合。這樣的技術(shù)路徑帶來的效果顯著。

在訓(xùn)練階段,千問3.5在文本、圖像、視頻等混合數(shù)據(jù)訓(xùn)練吞吐量,幾近100%持平純文本基座模型訓(xùn)練,大舉降低了原生多模態(tài)訓(xùn)練的難度門檻;同時,通過設(shè)計精巧的FP8、FP32精度應(yīng)用策略,在訓(xùn)練穩(wěn)定擴展到數(shù)十萬億個token時,激活內(nèi)存減少約50% ,訓(xùn)練還能提速10% ,進(jìn)一步節(jié)約了模型訓(xùn)練成本、提升了訓(xùn)練效率。

在推理階段,測試數(shù)據(jù)顯示,千問3.5在多模態(tài)推理(MathVison)、通用視覺問答VQA(RealWorldQA)、文本識別和文件理解(CC_OCR)、空間智能(RefCOCO-avg)、視頻理解(MLVU)等眾多權(quán)威評測中,均斬獲最佳性能。

02技術(shù)紅利全面釋放,

千問要做人人都能用的AI

如果說技術(shù)創(chuàng)新解決了大模型 “能不能用” 和“好不好用”的問題,那么普惠定價則破解了 “用不用得起” 的難題。

長期以來,高昂的 API 調(diào)用成本是 AI 技術(shù)落地的最大障礙。對于預(yù)算有限的中小企業(yè)和個人開發(fā)者而言,動輒數(shù)元的單次調(diào)用費用,足以扼殺無數(shù)創(chuàng)新想法。

盡管近兩年大模型的價格在不斷降低,但這輪價格的下調(diào)更多來自各大云服務(wù)商和模型廠商的商業(yè)策略。這次阿里云百煉上給出的Qwen3.5-Plus API 定價同樣急劇競爭,每百萬 Token 輸入僅需 0.8 元,Gemini-3-pro 的 1/18。

這種極致普惠定價的底氣,來自阿里在模型和AI基礎(chǔ)設(shè)施層面的協(xié)同創(chuàng)新。

除了上述模型架構(gòu)的技術(shù)創(chuàng)新,千問大模型還可通過阿里云和平頭哥自研芯片的加持,進(jìn)一步提升推理效率。這種模型、芯片和云的軟硬件緊密耦合,最終實現(xiàn)了1+1+1>3的效果,不僅能更好發(fā)揮芯片的算力潛力,以及集群的算力效率,還能更好有效提升模型訓(xùn)練以及推理的效率。

例如,平頭哥真武芯片針對以千問3為代表的主流MoE架構(gòu)模型做了大量優(yōu)化,可滿足千問大模型對大規(guī)模計算的需求。這種通過模型、芯片以及云的協(xié)同創(chuàng)新,打破了性能、效率和成本的不可能三角。

另一方面,為讓更多群體用上這款SOTA模型,千問3.5還面向全球開發(fā)者開源,開發(fā)者可在魔搭社區(qū)和 HuggingFace 免費下載部署模型,阿里還將陸續(xù)開源不同尺寸、不同功能的Qwen3.5 系列模型,支持本地、端側(cè)等多場景部署,滿足個性化開發(fā)需求。

事實上,千問自誕生以來,就一直堅持開源路線,千問系列已開源 400 多個模型,衍生模型數(shù)量超 20 萬,全球下載量突破 10 億次,遠(yuǎn)超美國的 Llama,極大地推動了AI在千行百業(yè)普及。

03結(jié)語

事實上,千問3.5的性能和成本突破,是阿里在云、芯片和模型三大技術(shù)領(lǐng)域持續(xù)深耕的結(jié)果。這種全棧自研帶來的價值遠(yuǎn)不局限于單線業(yè)務(wù),三大業(yè)務(wù)深度協(xié)同產(chǎn)生的化學(xué)反應(yīng),正在釋放更大的勢能。

最顯著的變化是,千問大模型的持續(xù)爆火讓阿里云再次進(jìn)入高速增長期。根據(jù)市場調(diào)研機構(gòu) Omdia 數(shù)據(jù),2025 年上半年,中國 AI 云整體市場(AI IaaS+PaaS+MaaS)規(guī)模達(dá) 223 億元,阿里云占比 35.8 %,超過第二到第四名總和。Omdia 數(shù)據(jù)還顯示,2025年,阿里云在中國云市場的份額從上季度的33%提升至36%,領(lǐng)先優(yōu)勢進(jìn)一步擴大。

GPU 訓(xùn)練特惠!

H100/H200 GPU算力按秒計費,平均節(jié)省開支30%以上!

掃碼了解詳情?

點「贊」的人都變好看了哦!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
斯諾克世錦賽現(xiàn)罕見失誤,羅伯遜算錯分認(rèn)輸被罰250英鎊

斯諾克世錦賽現(xiàn)罕見失誤,羅伯遜算錯分認(rèn)輸被罰250英鎊

懂球帝
2026-04-23 12:07:03
普京終于動真格了,俄軍發(fā)動大規(guī)模轟炸,烏軍高層或遭慘重傷亡!

普京終于動真格了,俄軍發(fā)動大規(guī)模轟炸,烏軍高層或遭慘重傷亡!

漫步獨行俠
2026-04-23 08:49:10
死了這條心!人民日報攤牌:中國不會救菲律賓,馬科斯投機到頭了

死了這條心!人民日報攤牌:中國不會救菲律賓,馬科斯投機到頭了

黑翼天使
2026-04-23 19:51:23
每體:皇馬準(zhǔn)備動用一切手段,阻止維克托-穆尼奧斯加盟巴薩

每體:皇馬準(zhǔn)備動用一切手段,阻止維克托-穆尼奧斯加盟巴薩

懂球帝
2026-04-23 09:06:06
這才是宋美齡和繼子蔣經(jīng)國的一張真實合影,都是真人的容貌

這才是宋美齡和繼子蔣經(jīng)國的一張真實合影,都是真人的容貌

喜歡歷史的阿繁
2026-04-16 11:17:28
中國工資重回3000時代,月薪3000元成常態(tài)

中國工資重回3000時代,月薪3000元成常態(tài)

念得小柔
2026-04-22 16:42:12
港媒:江旻憓已完成放棄加拿大護照

港媒:江旻憓已完成放棄加拿大護照

澎湃新聞
2026-04-23 13:06:27
不再是120/80,“新血壓標(biāo)準(zhǔn)”已公布,別再自己嚇自己!

不再是120/80,“新血壓標(biāo)準(zhǔn)”已公布,別再自己嚇自己!

芹姐說生活
2026-04-14 23:27:03
伊朗新任最高領(lǐng)袖傷情嚴(yán)重 面部燒傷已影響發(fā)聲能力——紐約時報

伊朗新任最高領(lǐng)袖傷情嚴(yán)重 面部燒傷已影響發(fā)聲能力——紐約時報

桂系007
2026-04-24 02:13:45
導(dǎo)彈直逼上海?中方忍無可忍,打出禁空令,覆蓋范圍超臺灣兩倍

導(dǎo)彈直逼上海?中方忍無可忍,打出禁空令,覆蓋范圍超臺灣兩倍

小楊侃事
2026-04-23 14:17:02
大衣哥再登熱搜!高鐵站席地而坐刷手機,衣著樸素、毫無明星架子

大衣哥再登熱搜!高鐵站席地而坐刷手機,衣著樸素、毫無明星架子

火山詩話
2026-04-23 16:00:38
馬斯克:約400萬輛特斯拉HW3車型將無法獲得FSD

馬斯克:約400萬輛特斯拉HW3車型將無法獲得FSD

CNMO科技
2026-04-23 07:44:09
突發(fā)!印度“發(fā)動襲擊”!

突發(fā)!印度“發(fā)動襲擊”!

財經(jīng)要參
2026-04-23 09:00:12
原油巨震!美伊局勢再攪市場

原油巨震!美伊局勢再攪市場

Wind萬得
2026-04-23 09:41:49
A股:大家坐穩(wěn)扶好了,明天周五,大牛市或?qū)⒃俅沃匮輾v史了!

A股:大家坐穩(wěn)扶好了,明天周五,大牛市或?qū)⒃俅沃匮輾v史了!

夜深愛雜談
2026-04-23 20:05:57
連裝都懶得裝了?漏洞這么多

連裝都懶得裝了?漏洞這么多

走讀新生
2026-04-22 13:46:02
安徽宿州一中學(xué)突發(fā)火災(zāi),現(xiàn)場黑煙滾滾,從教學(xué)樓內(nèi)噴涌而出,學(xué)生緊急疏散,無人員傷亡,應(yīng)急部門:起火點并非教室,具體原因仍在調(diào)查中

安徽宿州一中學(xué)突發(fā)火災(zāi),現(xiàn)場黑煙滾滾,從教學(xué)樓內(nèi)噴涌而出,學(xué)生緊急疏散,無人員傷亡,應(yīng)急部門:起火點并非教室,具體原因仍在調(diào)查中

瀟湘晨報
2026-04-23 20:16:52
羨慕!某研究所員工曬出26年前三個月收入

羨慕!某研究所員工曬出26年前三個月收入

微微熱評
2026-04-23 22:11:36
7個月不吃主食、每天做暴汗減肥操!浙江20歲小伙減肥80斤后把自己送進(jìn)了醫(yī)院……

7個月不吃主食、每天做暴汗減肥操!浙江20歲小伙減肥80斤后把自己送進(jìn)了醫(yī)院……

都市快報橙柿互動
2026-04-23 19:57:03
美歐聯(lián)手封殺霍爾木茲,普通人油價破百倒計時?

美歐聯(lián)手封殺霍爾木茲,普通人油價破百倒計時?

陸棄
2026-04-23 09:54:26
2026-04-24 04:16:49
大數(shù)據(jù)文摘 incentive-icons
大數(shù)據(jù)文摘
專注大數(shù)據(jù),每日有分享!
6852文章數(shù) 94541關(guān)注度
往期回顧 全部

科技要聞

馬斯克喊出"史上最大產(chǎn)品",但量產(chǎn)難預(yù)測

頭條要聞

以色列:只要美國同意 將刺殺伊朗最高領(lǐng)袖

頭條要聞

以色列:只要美國同意 將刺殺伊朗最高領(lǐng)袖

體育要聞

給文班剃頭的馬刺DJ,成為NBA最佳第六人

娛樂要聞

王大陸因涉黑討債被判 女友也一同獲刑

財經(jīng)要聞

普華永道賠償10億 恒大股東見到"回頭錢"

汽車要聞

預(yù)售30.29萬起 嵐圖泰山X8配896線激光雷達(dá)

態(tài)度原創(chuàng)

教育
游戲
親子
家居
健康

教育要聞

推薦一款高考志愿卡,五大功能助你解決志愿疑難

任天堂NS2銷量4倍碾壓PS5!差距懸殊 索尼難挽頹勢

親子要聞

新華讀報|打乒乓球有助提高兒童注意力

家居要聞

浪漫協(xié)奏 法式風(fēng)格

干細(xì)胞如何讓燒燙傷皮膚"再生"?

無障礙瀏覽 進(jìn)入關(guān)懷版