国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

阿里發(fā)布千問最強(qiáng)推理模型Qwen3-Max-Thinking,性能媲美GPT-5.2、Gemini 3 Pro

0
分享至

阿里巴巴1月26日正式發(fā)布千問旗艦推理模型Qwen3-Max-Thinking,在多項(xiàng)權(quán)威評測中刷新全球紀(jì)錄,成為迄今最接近國際頂尖模型的國產(chǎn)AI大模型。這標(biāo)志著中國大模型從“追平”到“領(lǐng)跑"的關(guān)鍵突破。

據(jù)阿里云發(fā)布的信息,該模型總參數(shù)量超萬億,預(yù)訓(xùn)練數(shù)據(jù)量達(dá)36T Tokens,是目前阿里規(guī)模最大、能力最強(qiáng)的千問推理模型。在涵蓋事實(shí)知識、復(fù)雜推理、指令遵循、人類偏好對齊、Agent能力等19項(xiàng)公認(rèn)基準(zhǔn)測試中,Qwen3-Max-Thinking整體性能可媲美GPT-5.2-Thinking、Claude Opus 4.5和Gemini 3 Pro等國際頂尖模型。

該模型采用全新的測試時擴(kuò)展機(jī)制,實(shí)現(xiàn)推理性能大幅提升的同時更具經(jīng)濟(jì)性。在啟用工具的HLE(Humanity's Last Exam)評測中,千問得分58.3,大幅超過GPT-5.2-Thinking的45.5和Gemini 3 Pro的45.8,錄得當(dāng)前所有模型的最高分。

阿里巴巴同日宣布,根據(jù)Hugging Face數(shù)據(jù),Qwen衍生模型數(shù)量突破20萬,成為全球首個達(dá)成此目標(biāo)的開源大模型。Qwen系列模型累計(jì)下載量突破10億次,被開發(fā)者日均下載110萬次,穩(wěn)居全球開源大模型首位。

推理技術(shù)實(shí)現(xiàn)代際突破

Qwen3-Max-Thinking的核心創(chuàng)新在于測試時擴(kuò)展機(jī)制的應(yīng)用。阿里云表示,這種機(jī)制可對此前推理的結(jié)果進(jìn)行"經(jīng)驗(yàn)提取"式的提煉,并據(jù)此進(jìn)行多輪自我迭代,在相同的上下文中實(shí)現(xiàn)更高效的推理計(jì)算。

這一技術(shù)路徑區(qū)別于業(yè)界普遍采用的推理計(jì)算方式。阿里云指出,傳統(tǒng)方法只會簡單增加并行推理路徑,重復(fù)推導(dǎo)已知結(jié)論的情況常見,導(dǎo)致冗余推理效率低下。而千問新模型通過"經(jīng)驗(yàn)提取"機(jī)制,可識別并剪枝冗余的邏輯路徑,確保算力被用于探索最有價值的分支。

該模型進(jìn)行了更大規(guī)模的強(qiáng)化學(xué)習(xí)后訓(xùn)練。阿里云數(shù)據(jù)顯示,在此前預(yù)覽版Qwen3-Max-Thinking斬獲數(shù)學(xué)推理AIME 25和HMMT 25國內(nèi)首個雙滿分的基礎(chǔ)上,通義團(tuán)隊(duì)進(jìn)一步提升了正式版性能,在多項(xiàng)基準(zhǔn)測試中刷新最佳表現(xiàn)紀(jì)錄。

在HLE這一被稱為"人類最后的測試"的評測中,千問得分58.3,較GPT-5.2-Thinking和Gemini 3 Pro分別高出12.8分和12.5分。在AI評測領(lǐng)域,超過10分的差距通常意味著代際級的領(lǐng)先。


原生Agent能力大幅增強(qiáng)

面向智能體時代,Qwen3-Max-Thinking大幅增強(qiáng)了自主調(diào)用工具的原生Agent能力。該模型可在對話過程中自主選用搜索、個性化記憶和代碼解釋器等核心工具功能,提供更符合用戶需求的智能回答。

阿里云介紹,這種能力源自通義團(tuán)隊(duì)專門設(shè)計(jì)的訓(xùn)練流程。在完成初步的工具使用微調(diào)后,團(tuán)隊(duì)對模型在大量多樣化任務(wù)上進(jìn)行了基于規(guī)則獎勵與模型獎勵的聯(lián)合強(qiáng)化學(xué)習(xí)訓(xùn)練,使Qwen3-Max-Thinking能夠更智能地結(jié)合工具進(jìn)行思考。

這一能力的提升帶來實(shí)際應(yīng)用價值的改變。模型不再是單純的"大腦",需要外掛工具導(dǎo)致指令遵循不穩(wěn)定,而是可以自主判斷何時搜索互聯(lián)網(wǎng)、何時編寫代碼、何時查閱知識庫,并根據(jù)反饋動態(tài)調(diào)整計(jì)劃。阿里云表示,這種機(jī)制大幅降低了模型幻覺,為企業(yè)級應(yīng)用提供了必要的可靠性保障。

目前,開發(fā)者可在QwenChat上免費(fèi)體驗(yàn)Qwen3-Max-Thinking模型,企業(yè)可通過阿里云百煉獲取新模型API服務(wù)。普通用戶可通過千問PC端和網(wǎng)頁端試用模型,千問APP也即將接入新模型。

開源生態(tài)確立全球領(lǐng)先地位

Qwen系列在開源生態(tài)的表現(xiàn)展現(xiàn)了中國大模型的全球影響力。根據(jù)Hugging Face數(shù)據(jù),基于Qwen的衍生模型數(shù)量突破20萬個,成為全球首個達(dá)成此目標(biāo)的開源家族。其累計(jì)下載量突破10億次,日均下載量達(dá)110萬次。

這一數(shù)據(jù)意味著Qwen已完全超越此前被視為開源大模型默認(rèn)標(biāo)準(zhǔn)的Meta Llama系列。據(jù)此前報道,Meta內(nèi)部代號“牛油果”的秘密項(xiàng)目,在訓(xùn)練新模型時采用了“蒸餾”技術(shù)向包括Qwen在內(nèi)的多方開源模型學(xué)習(xí),在技術(shù)層面間接承認(rèn)了Qwen在特定能力上的領(lǐng)先。

Qwen的全球采用份額持續(xù)擴(kuò)大。阿里巴巴采用"全尺寸、全模態(tài)"策略,從0.5B到480B的全參數(shù)段覆蓋,以及對119種語言的支持,使其在東南亞、中東等新興市場迅速成為首選。

這一開源戰(zhàn)略正在轉(zhuǎn)化為實(shí)際的市場優(yōu)勢。千問APP上線首周下載量突破1000萬,兩個月月活突破1億。該應(yīng)用全面接入淘寶、支付寶、飛豬、高德等生態(tài),用戶可通過語音指令完成訂機(jī)票、叫外賣等全流程,將AI價值從信息層推向交易層。

全棧布局構(gòu)建競爭護(hù)城河

阿里巴巴在AI領(lǐng)域的布局覆蓋算力、模型、應(yīng)用全棧。在底層算力方面,平頭哥研發(fā)的PPU在特定推理任務(wù)上的性能已與英偉達(dá)H20相當(dāng),配合倚天710服務(wù)器芯片,構(gòu)建了"一云多芯"的異構(gòu)算力體系。據(jù)市場消息,阿里巴巴已決定支持平頭哥未來獨(dú)立上市。

阿里云已構(gòu)建起中國最完整的AI基礎(chǔ)設(shè)施。據(jù)摩根士丹利預(yù)測,阿里云收入將在三年內(nèi)翻倍,從2025財年的1180億元增長至2028財年的2400億元。其目標(biāo)是在2026年拿下中國AI云市場增量的80%。

阿里CEO吳泳銘去年宣布,未來三年將投入超過3800億元用于建設(shè)云和AI硬件基礎(chǔ)設(shè)施。這一投入規(guī)模與谷歌、Meta和亞馬遜等美股科技巨頭的AI資本開支處于同一量級,體現(xiàn)了阿里對AI長期競爭力的戰(zhàn)略判斷。

Qwen3-Max-Thinking的發(fā)布標(biāo)志著阿里巴巴在AI算法上的頂級實(shí)力得到驗(yàn)證,配合其在算力、應(yīng)用層面的全棧能力,為中國大模型從"追平"到"領(lǐng)跑"的轉(zhuǎn)變提供了關(guān)鍵案例。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
外資撤不走,中國攔不住,如今的中國廣東,制造早已不是代工

外資撤不走,中國攔不住,如今的中國廣東,制造早已不是代工

甜檸聊史
2026-01-23 14:01:57
閑魚不愧是全國最大的黑市,網(wǎng)民:只有你想不到,沒有你買不到

閑魚不愧是全國最大的黑市,網(wǎng)民:只有你想不到,沒有你買不到

小熊侃史
2026-01-16 07:40:07
他是上海知名主持人,曾和王志文是好兄弟,如今活成'不老神話'

他是上海知名主持人,曾和王志文是好兄弟,如今活成'不老神話'

完善法
2026-01-26 20:21:04
終于知道生兒子的真實(shí)體驗(yàn)了!這是我見過最通俗易懂的答案

終于知道生兒子的真實(shí)體驗(yàn)了!這是我見過最通俗易懂的答案

另子維愛讀史
2026-01-24 21:32:39
最新業(yè)績預(yù)增股名單,這3股增超10倍

最新業(yè)績預(yù)增股名單,這3股增超10倍

數(shù)據(jù)寶
2026-01-26 10:46:39
岳父大人的狠毒用心,他是一點(diǎn)看不懂!

岳父大人的狠毒用心,他是一點(diǎn)看不懂啊!

BenSir本色說
2026-01-26 22:03:54
蘇聯(lián)讓中國生產(chǎn)AK47,廠長拿到圖紙眼前一亮,連喊幾句:好槍!

蘇聯(lián)讓中國生產(chǎn)AK47,廠長拿到圖紙眼前一亮,連喊幾句:好槍!

Ck的蜜糖
2026-01-27 01:49:30
你從哪一刻認(rèn)識到天賦的可怕?網(wǎng)友破防:那天我被秒的渣都不剩

你從哪一刻認(rèn)識到天賦的可怕?網(wǎng)友破防:那天我被秒的渣都不剩

特約前排觀眾
2025-08-06 06:49:56
重磅!官方宣布:禁止房子大降價,“限跌令”重出江湖!

重磅!官方宣布:禁止房子大降價,“限跌令”重出江湖!

常州壹樓市
2026-01-17 23:59:54
老干部和女幼師的聊天記錄,竟然讓網(wǎng)友看得停不下來!

老干部和女幼師的聊天記錄,竟然讓網(wǎng)友看得停不下來!

特約前排觀眾
2026-01-27 00:20:03
李昊:看到球迷接機(jī)很激動!沒什么雖敗猶榮,決賽輸了就是輸了

李昊:看到球迷接機(jī)很激動!沒什么雖敗猶榮,決賽輸了就是輸了

奧拜爾
2026-01-26 15:45:53
第三艘航母的建造失敗,損失200多億,軍方承認(rèn)失去亞洲第一寶座

第三艘航母的建造失敗,損失200多億,軍方承認(rèn)失去亞洲第一寶座

芳芳?xì)v史燴
2025-12-08 19:12:01
洪森最大的失誤:低估了西哈莫尼國王,高估了兒子洪瑪奈!

洪森最大的失誤:低估了西哈莫尼國王,高估了兒子洪瑪奈!

阿柒的訊
2025-12-23 18:22:55
好事:多名民營企業(yè)家獲罪后改判,或與中國欲積極加入CPTPP?協(xié)定有關(guān)

好事:多名民營企業(yè)家獲罪后改判,或與中國欲積極加入CPTPP?協(xié)定有關(guān)

蛙蛙和洼
2025-11-08 10:01:55
國產(chǎn)香煙加了助燃劑?測試發(fā)現(xiàn)只能燒4分鐘,而日本煙能燒7分鐘

國產(chǎn)香煙加了助燃劑?測試發(fā)現(xiàn)只能燒4分鐘,而日本煙能燒7分鐘

回旋鏢
2026-01-01 21:00:24
為何很多藏傳佛教高僧都痛恨金庸?為了寫好這個大反派,他到底干了什么出格的事?

為何很多藏傳佛教高僧都痛恨金庸?為了寫好這個大反派,他到底干了什么出格的事?

歷史回憶室
2026-01-13 22:56:07
突發(fā)!理想汽車戰(zhàn)略重大轉(zhuǎn)向!

突發(fā)!理想汽車戰(zhàn)略重大轉(zhuǎn)向!

電動知家
2026-01-26 16:16:17
出道23年零緋聞,演了86部劇也沒紅,如今53歲終于被劉宇寧帶紅

出道23年零緋聞,演了86部劇也沒紅,如今53歲終于被劉宇寧帶紅

小熊侃史
2025-12-16 07:05:07
情緒再多,也只留給自己的三個星座

情緒再多,也只留給自己的三個星座

星座不求人
2026-01-26 19:35:09
揭秘女太監(jiān)“凈身”過程,殘忍至極令人心疼,過程比男太監(jiān)要痛苦

揭秘女太監(jiān)“凈身”過程,殘忍至極令人心疼,過程比男太監(jiān)要痛苦

談史論天地
2026-01-14 15:30:02
2026-01-27 02:39:00
華爾街見聞官方 incentive-icons
華爾街見聞官方
中國領(lǐng)先的金融商業(yè)信息提供商
140725文章數(shù) 2652294關(guān)注度
往期回顧 全部

科技要聞

印奇再上牌桌,階躍融資50億

頭條要聞

印度尼帕病毒現(xiàn)跨區(qū)域傳播 世衛(wèi):或引起全球大流行

頭條要聞

印度尼帕病毒現(xiàn)跨區(qū)域傳播 世衛(wèi):或引起全球大流行

體育要聞

叛逆的大公子,要砸了貝克漢姆這塊招牌

娛樂要聞

張雨綺被抵制成功!遼視春晚已將她除名

財經(jīng)要聞

從美式斬殺線看中國社會的制度韌性構(gòu)建

汽車要聞

賓利第四臺Batur敞篷版發(fā)布 解鎖四項(xiàng)定制創(chuàng)新

態(tài)度原創(chuàng)

數(shù)碼
教育
親子
藝術(shù)
公開課

數(shù)碼要聞

蘋果推出第二代AirTag 具備更遠(yuǎn)搜索距離、更響亮的揚(yáng)聲器等

教育要聞

2024成都師范學(xué)院公費(fèi)英語專業(yè)錄取分揭曉!

親子要聞

“生孩子老了就這下場”,母親用按摩機(jī)被女兒網(wǎng)暴,網(wǎng)友看不下去

藝術(shù)要聞

沙特急剎車,NEOM規(guī)模大縮水,線性摩天樓留小段

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版