国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

AI春節(jié)檔最強殺手锏來了!千問3.5除夕強勢亮相,開源SOTA、性價比之王

0
分享至



大模型進入原生多模態(tài)時代!

作者丨劉偉

編輯丨林覺民

這可能是有史以來AI濃度最高的一次春節(jié)。千問、豆包、元寶等 C 端 AI助手爭相贊助春晚,借紅包與補貼快速拉升日活;各家基礎大模型也悄然迭代版本,蓄勢展開行業(yè)角逐。

而這輪AI春節(jié)檔迎來了最強殺手锏!2 月 16日除夕當天,阿里開源全新一代大模型Qwen3.5-Plus,其性能媲美Gemini-3-pro、GPT-5.2等頂級閉源模型,一舉登頂全球最強開源模型寶座。

這款模型在模型架構上全面創(chuàng)新,是旗下首款原生多模態(tài)模型,并且在性能和推理效率上均實現大幅提升。此次發(fā)布的Qwen3.5-Plus 總參數達 3970 億,實際激活僅 170 億,性能卻超越萬億參數的 Qwen3-Max 模型;同時部署顯存占用降低 60%,最大吞吐量可提升至19倍,真正實現以小勝大。

實測結果顯示,千問 3.5 在 MMLU-Pro 認知能力評測中拿下 87.8 分,超越 GPT5.2;在博士級難題 GPQA 測評中斬獲 88.4 分,高于 Claude 4.5;在指令遵循 IFBench 評測中以 76.5 分刷新所有模型紀錄;在通用 Agent 評測 BFCL-V4、搜索 Agent 評測 Browsecomp 等基準中,表現均超越 Gemini-3-Pro。


這次,阿里還把底層模型架構和AI infra創(chuàng)新的紅利釋放給了廣大企業(yè)和開發(fā)者,千問 3.5 加量不加價 —— 性能大幅躍升的同時,使用成本再創(chuàng)新低。阿里云百煉上的千問 3.5 API 價格已經出爐:每百萬 Token 輸入低至 0.8 元,僅為 Gemini-3-pro 的 1/18。

01

模型架構多項創(chuàng)新,

千問3.5性能、效率大幅提升

過去數年,大模型行業(yè)陷入近乎偏執(zhí)的 “參數崇拜”。從千億到萬億,參數規(guī)模的膨脹被視作性能提升的唯一路徑,而這種粗放式發(fā)展也存在諸多問題:部署門檻高,推理消耗天價成本…… 技術創(chuàng)新與實際應用之間,形成一道難以跨越的鴻溝。

Qwen3.5-Plus打破了這一固有思路,它不僅在架構層面實現創(chuàng)新,還采用了全新的原生多模態(tài)預訓練范式,直接打破開源模型的性能天花板。

Qwen3.5-Plus 的技術與架構創(chuàng)新,主要體現在四大核心維度:首先是注意力機制的革新。面對長文本,傳統 Transformer 模型需對每個詞與所有上下文做全量計算,算力消耗隨文本長度指數級增長。Qwen3.5-Plus 引入混合注意力機制,讓模型學會 “有詳有略地讀”,自動識別關鍵信息精讀、非關鍵部分快讀,既大幅降低長文本處理的算力成本,又保障信息處理精度。

其次是架構層面的代際躍遷。Qwen3.5-Plus 采用極致稀疏的混合專家(MoE)架構。傳統稠密模型每次推理都要激活全部參數,如同讓整個工廠的工人同時作業(yè),無論任務大?。欢?MoE 架構恰似一支特種部隊,僅根據任務需求調用最相關的 “專家” 子網絡。Qwen3.5-Plus 將這一理念做到極致 ——3970 億總參數中,僅需激活不到 5%(170億),就能調動全部知識儲備,從根本上解決算力浪費問題。

三是原生多Token預測。以往的模型如同打字時每按一個鍵都要停頓思考下一個字,效率低下;而千問3.5在訓練時就學會了 “預判”,能同時規(guī)劃多個詞甚至一整句話的輸出并一次性生成。這并非簡單的多字打包發(fā)送,而是模型在內部真正 “提前規(guī)劃” 后續(xù)內容,讓長文本生成、代碼補全、多輪對話等高頻場景的響應速度近乎翻倍,用戶能感受到近乎 “秒出” 的流暢體驗。

最后是系統級訓練穩(wěn)定性優(yōu)化。為讓模型在超大規(guī)模訓練中保持穩(wěn)定,千問團隊完成多項底層優(yōu)化。根據官方信息,阿里千問團隊入選NeurIPS2025最佳論文的注意力門控機制研究這次也被用上了,一年前的前瞻性研究現在已成為打破模型性能天花板的重要一環(huán)。在256K超長上下文情況下,千問3.5推理吞吐量最大提升至19倍,推理效率大幅提升。

值得注意的是,和絕大多數多模態(tài)模型不同,Qwen3.5-Plus在多模態(tài)理解的實現上嘗試了新的路徑。據介紹,從預訓練第一天起,千問模型就在文本和視覺的混合數據上聯合學習,讓視覺與語言在統一的參數空間內深度融合。這樣的技術路徑帶來的效果顯著。

在訓練階段,千問3.5在文本、圖像、視頻等混合數據訓練吞吐量,幾近100%持平純文本基座模型訓練,大舉降低了原生多模態(tài)訓練的難度門檻;同時,通過設計精巧的FP8、FP32精度應用策略,在訓練穩(wěn)定擴展到數十萬億個token時,激活內存減少約50% ,訓練還能提速10% ,進一步節(jié)約了模型訓練成本、提升了訓練效率。

在推理階段,測試數據顯示,千問3.5在多模態(tài)推理(MathVison)、通用視覺問答VQA(RealWorldQA)、文本識別和文件理解(CC_OCR)、空間智能(RefCOCO-avg)、視頻理解(MLVU)等眾多權威評測中,均斬獲最佳性能。

02

技術紅利全面釋放,

千問要做人人都能用的AI

如果說技術創(chuàng)新解決了大模型 “能不能用” 和“好不好用”的問題,那么普惠定價則破解了 “用不用得起” 的難題。

長期以來,高昂的 API 調用成本是 AI 技術落地的最大障礙。對于預算有限的中小企業(yè)和個人開發(fā)者而言,動輒數元的單次調用費用,足以扼殺無數創(chuàng)新想法。

盡管近兩年大模型的價格在不斷降低,但這輪價格的下調更多來自各大云服務商和模型廠商的商業(yè)策略。這次阿里云百煉上給出的Qwen3.5-Plus API 定價同樣急劇競爭,每百萬 Token 輸入僅需 0.8 元,Gemini-3-pro 的 1/18。

這種極致普惠定價的底氣,來自阿里在模型和AI基礎設施層面的協同創(chuàng)新。

除了上述模型架構的技術創(chuàng)新,千問大模型還可通過阿里云和平頭哥自研芯片的加持,進一步提升推理效率。這種模型、芯片和云的軟硬件緊密耦合,最終實現了1+1+1>3的效果,不僅能更好發(fā)揮芯片的算力潛力,以及集群的算力效率,還能更好有效提升模型訓練以及推理的效率。

例如,平頭哥真武芯片針對以千問3為代表的主流MoE架構模型做了大量優(yōu)化,可滿足千問大模型對大規(guī)模計算的需求。這種通過模型、芯片以及云的協同創(chuàng)新,打破了性能、效率和成本的不可能三角。

另一方面,為讓更多群體用上這款SOTA模型,千問3.5還面向全球開發(fā)者開源,開發(fā)者可在魔搭社區(qū)和 HuggingFace 免費下載部署模型,阿里還將陸續(xù)開源不同尺寸、不同功能的Qwen3.5系列模型,支持本地、端側等多場景部署,滿足個性化開發(fā)需求。

事實上,千問自誕生以來,就一直堅持開源路線,千問系列已開源 400 多個模型,衍生模型數量超 20 萬,全球下載量突破 10 億次,遠超美國的 Llama,極大地推動了AI在千行百業(yè)普及。

03

結語

事實上,千問3.5的性能和成本突破,是阿里在云、芯片和模型三大技術領域持續(xù)深耕的結果。這種全棧自研帶來的價值遠不局限于單線業(yè)務,三大業(yè)務深度協同產生的化學反應,正在釋放更大的勢能。

最顯著的變化是,千問大模型的持續(xù)爆火讓阿里云再次進入高速增長期。根據市場調研機構 Omdia 數據,2025 年上半年,中國 AI 云整體市場(AI IaaS+PaaS+MaaS)規(guī)模達 223 億元,阿里云占比 35.8 %,超過第二到第四名總和。Omdia 數據還顯示,2025年,阿里云在中國云市場的份額從上季度的33%提升至36%,領先優(yōu)勢進一步擴大。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
伊朗不值得同情!兩大國親手為他搭好擂臺,卻反手被賣

伊朗不值得同情!兩大國親手為他搭好擂臺,卻反手被賣

毛豆論道
2026-03-02 17:01:06
外媒:特朗普對伊朗發(fā)出新威脅

外媒:特朗普對伊朗發(fā)出新威脅

參考消息
2026-03-01 15:52:28
伊朗反擊太快,只給以2小時,導彈從天而降,以色列民眾抱頭鼠竄

伊朗反擊太快,只給以2小時,導彈從天而降,以色列民眾抱頭鼠竄

書紀文譚
2026-03-02 17:24:46
560名美軍死傷,彈藥庫劇烈大爆炸,伊朗導彈雨把以色列炸成火海

560名美軍死傷,彈藥庫劇烈大爆炸,伊朗導彈雨把以色列炸成火海

策略述
2026-03-02 14:41:25
“伊朗德黑蘭飛烏魯木齊航班進入中國領空 機艙內傳來廣播”視頻熱傳 川航:未開通伊朗航線

“伊朗德黑蘭飛烏魯木齊航班進入中國領空 機艙內傳來廣播”視頻熱傳 川航:未開通伊朗航線

閃電新聞
2026-03-02 17:29:47
嚴厲制止網絡上過度宣揚“失業(yè)潮失業(yè)人數及躺平”等不良思想——

嚴厲制止網絡上過度宣揚“失業(yè)潮失業(yè)人數及躺平”等不良思想——

葉初七
2026-03-02 17:06:05
內賈德沒有死,秘書公布遇襲細節(jié)

內賈德沒有死,秘書公布遇襲細節(jié)

世家寶
2026-03-02 14:06:27
新華時評:當炸彈落在校園,文明底線何在

新華時評:當炸彈落在校園,文明底線何在

澎湃新聞
2026-03-01 22:32:48
35年前,美國科學家進行實驗,4男4女共處一室2年,結果怎么樣?

35年前,美國科學家進行實驗,4男4女共處一室2年,結果怎么樣?

小豫講故事
2026-03-02 06:00:03
重大進展!伊朗作出“前所未有”承諾:同意永遠不擁有可制造核武器的核材料,將實現“零積累、零庫存”,并接受全面核查!特朗普最新表態(tài)

重大進展!伊朗作出“前所未有”承諾:同意永遠不擁有可制造核武器的核材料,將實現“零積累、零庫存”,并接受全面核查!特朗普最新表態(tài)

每日經濟新聞
2026-02-28 10:40:45
如果伊朗提出請求中俄會向其提供軍事支持嗎?外交部回應

如果伊朗提出請求中俄會向其提供軍事支持嗎?外交部回應

澎湃新聞
2026-03-02 15:36:48
28場造20球!韋世豪疑不滿無緣金球獎:發(fā)笑哭表情 配樂《偷感》

28場造20球!韋世豪疑不滿無緣金球獎:發(fā)笑哭表情 配樂《偷感》

風過鄉(xiāng)
2026-03-02 19:54:23
內塔尼亞胡辦公室遭猛烈襲擊!伊朗:摧毀美國一總領館及一軍事基地,擊落3架美軍機

內塔尼亞胡辦公室遭猛烈襲擊!伊朗:摧毀美國一總領館及一軍事基地,擊落3架美軍機

新民晚報
2026-03-02 19:04:01
全國政協委員劉永好:建議全民發(fā)放500元通用消費券 可拉動消費近2萬億元

全國政協委員劉永好:建議全民發(fā)放500元通用消費券 可拉動消費近2萬億元

財聯社
2026-03-02 10:57:04
伊朗發(fā)射近1200枚導彈報復美國和以色列

伊朗發(fā)射近1200枚導彈報復美國和以色列

中國網
2026-03-01 16:43:10
海瀾之家被“全軍拉黑”!中標后拒簽合同,200億撐不起一單軍需

海瀾之家被“全軍拉黑”!中標后拒簽合同,200億撐不起一單軍需

新浪財經
2026-03-02 16:03:13
中國與伊朗接近達成超音速導彈采購協議?外交部:不屬實!

中國與伊朗接近達成超音速導彈采購協議?外交部:不屬實!

澎湃新聞
2026-03-02 15:36:40
寧可放棄中國市場,也不刪鏡頭!《蜘蛛俠:英雄無歸》沒引進的真相終于來了

寧可放棄中國市場,也不刪鏡頭!《蜘蛛俠:英雄無歸》沒引進的真相終于來了

小椰的奶奶
2026-03-02 10:32:14
剛剛,全線暴跌!緊急救市!

剛剛,全線暴跌!緊急救市!

中國基金報
2026-03-02 17:11:34
“斬首”行動細節(jié)揭秘:美以戰(zhàn)機同地起飛,直撲哈梅內伊

“斬首”行動細節(jié)揭秘:美以戰(zhàn)機同地起飛,直撲哈梅內伊

中國新聞周刊
2026-03-02 10:32:04
2026-03-02 23:51:00
雷峰網 incentive-icons
雷峰網
關注智能與未來!
68618文章數 656082關注度
往期回顧 全部

科技要聞

蘋果中國官網上線iPhone 17e,4499元起

頭條要聞

媒體:拉里賈尼走向前臺 四大關鍵變量將決定伊朗命運

頭條要聞

媒體:拉里賈尼走向前臺 四大關鍵變量將決定伊朗命運

體育要聞

“想要我簽名嗎” 梅西逆轉后嘲諷對手主帥

娛樂要聞

李亞鵬與哥哥和解 只有一條真心話短信

財經要聞

油價飆升 美伊沖突將如何攪動全球經濟

汽車要聞

國民SUV再添一員 瑞虎7L靜態(tài)體驗

態(tài)度原創(chuàng)

本地
手機
房產
公開課
軍事航空

本地新聞

津南好·四時總相宜

手機要聞

iPhone 17系列:國內銷量已破2200萬!網友:華為仍需努力

房產要聞

方案突然曝光!??诒睅煷蟾叫#钟袝蟊P殺出!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美國中央司令部透露對伊朗動武全部武器裝備清單

無障礙瀏覽 進入關懷版