国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

阿里Qwen3深夜發(fā)布,能終結(jié)汪峰式尷尬嗎

0
分享至

很多人大概不知道通義Qwen的地位。蘋果公司已選定Qwen作為其在中國市場的大模型技術(shù)合作伙伴,這標(biāo)志著Qwen在商業(yè)應(yīng)用領(lǐng)域取得重要突破。

與此同時(shí),學(xué)術(shù)界也展現(xiàn)出對(duì)Qwen的青睞。李飛飛團(tuán)隊(duì)正基于Qwen架構(gòu)開發(fā)具備超低推理成本的AI模型,通用智能體平臺(tái)Manus已將其作為核心決策引擎。而最被大家熟悉的DeepSeekR1,其小尺寸模型的訓(xùn)練也用到了Qwen。

實(shí)際上,我和身邊多位朋友都有聊過,國外最受追捧的中國大模型,一個(gè)是DeepSeek,另一個(gè)就是通義Qwen了。

盡管Qwen在技術(shù)社區(qū)持續(xù)引發(fā)關(guān)注,但在國內(nèi)的公眾感知度常常與之不相稱。開發(fā)者社群中流傳著"大模型界汪峰"的戲稱,意思是其技術(shù)實(shí)力常被行業(yè)熱點(diǎn)事件暫時(shí)遮蔽,幾次重大版本發(fā)布均遭遇其他科技頭條的"截胡"現(xiàn)象。

這種技術(shù)影響力與商業(yè)聲量的錯(cuò)位,恰恰反映出Qwen作為底層基礎(chǔ)模型,在一個(gè)特殊時(shí)期技術(shù)內(nèi)核上的堅(jiān)定。

言歸正傳。從主流學(xué)術(shù)基準(zhǔn)的權(quán)威數(shù)據(jù)看,這次Qwen3對(duì)DeepSeek R1實(shí)現(xiàn)了全方位壓制,這里的"全方位"并非夸張表述,而是實(shí)打?qū)嵉臄?shù)學(xué)、推理與代碼三大核心領(lǐng)域的集體突破。

尤其值得關(guān)注的是其代碼生成能力,在LiveCodeBench和Codeforces雙榜中不僅甩開所有競品,甚至將當(dāng)前業(yè)界最強(qiáng)的Gemini2.5-Pro也拉入了追趕行列。

具體來看,Qwen3在推理、指令遵循、工具調(diào)用、多語言能力等方面均大幅增強(qiáng)。在奧數(shù)水平的AIME25測評(píng)中,Qwen3斬獲81.5分,刷新開源紀(jì)錄。在考察代碼能力的LiveCodeBench評(píng)測中,Qwen3突破70分大關(guān),表現(xiàn)甚至超過Grok3。在評(píng)估模型人類偏好對(duì)齊的ArenaHard測評(píng)中,Qwen3以95.6分超越OpenAI-o1及DeepSeek-R1。

而且Qwen3成本很低,旗艦?zāi)P?35B參數(shù)部署成本只要DeepSeek R1的三分之一。

這些硬核數(shù)據(jù)背后,是Qwen3通過動(dòng)態(tài)參數(shù)激活架構(gòu)(MoE)實(shí)現(xiàn)的質(zhì)變。在2350億總參數(shù)中精準(zhǔn)調(diào)用220億激活參數(shù),既保證了算力密度,又將硬件成本壓縮至行業(yè)平均水平的1/3。

如今它已不只是"全球最強(qiáng)開源模型"的稱號(hào)持有者,更是重新定義了大模型性能評(píng)估的標(biāo)準(zhǔn)坐標(biāo)系。

01

再繼續(xù)說點(diǎn)干貨,本次Qwen的發(fā)布包含MoE 和Dense 兩種架構(gòu)。

MoE:有30B(3B激活)和235B(22B激活)兩種。Dense:包含0.6B、1.7B、4B、8B、14B 和32B 這六款。

模型的詳細(xì)參數(shù)

旗艦?zāi)P褪荙wen3-235B-A22B,后綴235B指的是模型大小2350億參數(shù),A22B指的是激活參數(shù)220億。

如果你以為大模型的世界只有“參數(shù)越大越強(qiáng)”的套路,那Qwen3可能會(huì)讓你重新認(rèn)識(shí)什么叫“小而精”。

作為阿里巴巴通義千問系列的最新一代模型,Qwen3在性能、成本和靈活性上玩出了新花樣,甚至可以用“降維打擊”來形容它對(duì)前代模型的碾壓,不是夸張,而是實(shí)打?qū)嵉挠脭?shù)據(jù)說話。

先說說Qwen3為什么參數(shù)“瘦身”,反而更聰明。

Qwen3的旗艦版Qwen3-235B-A22B總參數(shù)高達(dá)2350億,但激活參數(shù)僅需220億。換句話說,它就像一個(gè)學(xué)霸,考試時(shí)只翻220頁筆記就能完勝對(duì)手。相比之下,Qwen2.5-72B-Instruct這類前輩,可得靠“死記硬背”720億參數(shù)才能勉強(qiáng)跟上節(jié)奏。

更絕的是,Qwen3的“小型號(hào)”也藏著玄機(jī)。比如Qwen3-4B這個(gè)迷你模型,居然能在代碼生成、數(shù)學(xué)推理等任務(wù)中匹敵Qwen2.5-72B-Instruct的性能。

對(duì)比來看,Qwen3-4B VS Qwen2.5-72B-Instruct:參數(shù)量縮小18倍,性能不降反升。Qwen3-30B-A3B VS Qwen2.5-32B:激活參數(shù)僅為10%,但性能直接跨級(jí)超越。

這次Qwen3最被業(yè)內(nèi)稱道的是,引入了思考模式和非思考模式,類似人類的大腦高速切換狀態(tài)。

思考模式,適合解決復(fù)雜問題,比如寫論文、做數(shù)學(xué)題,模型會(huì)一步步推理,像考試時(shí)反復(fù)演算一樣細(xì)致。非思考模式,用于簡單任務(wù),比如聊天、查天氣,直接給出答案,省電又高效。

舉個(gè)例子,如果你問Qwen3:請證明費(fèi)馬大定理。它會(huì)啟動(dòng)學(xué)霸模式,用長思維鏈逐步推導(dǎo)。但如果你問:今天北京天氣如何?它會(huì)立刻切換成快問快答,省下你寶貴的等待時(shí)間。

在不同思考深度下,模型的得分情況

我們都知道,DeepSeek R1就是深度思考,關(guān)閉R1選項(xiàng),它就用v3來給你回答。 但是Qwen3把這兩個(gè)功能融為了一體,方便很多。

另一個(gè)亮點(diǎn),是Agent能力的增強(qiáng)。

如今,Agent已經(jīng)是大模型領(lǐng)域重點(diǎn)關(guān)注的能力之一,尤其是最近MCP模型上下文協(xié)議的引入,更是大大增強(qiáng)了Agent 的適用性和靈活性,拓寬了應(yīng)用場景。

這次Qwen3模型的Agent和代碼能力得到增強(qiáng),包括加強(qiáng)了對(duì)MCP 的支持。我們可以看下面一個(gè)示例(提取QwenLM 庫的markdown 內(nèi)容,然后繪制顯示項(xiàng)目stars 數(shù)量的條形圖),展示了Qwen3 如何思考并與環(huán)境進(jìn)行交互:

很多人可能更關(guān)心這個(gè)模型是怎么訓(xùn)出來的。

Qwen3模型訓(xùn)練數(shù)據(jù)體量較前代實(shí)現(xiàn)指數(shù)級(jí)增長,從Qwen2.5的18萬億token擴(kuò)容至36萬億token,覆蓋119種語言及方言體系。

數(shù)據(jù)采集采用多源融合策略:一方面通過全網(wǎng)爬取獲取泛化文本,另一方面部

署Qwen2.5-VL視覺語言模型實(shí)現(xiàn)PDF文檔的深度解析,同時(shí)結(jié)合Qwen2.5基礎(chǔ)模型進(jìn)行多輪數(shù)據(jù)精煉,確保信息質(zhì)量。

針對(duì)數(shù)學(xué)與編程垂直領(lǐng)域,通義研發(fā)團(tuán)隊(duì)構(gòu)建了專用數(shù)據(jù)生成管線。Qwen2.5-Math:生成復(fù)雜公式推導(dǎo)、幾何證明等數(shù)學(xué)專項(xiàng)訓(xùn)練數(shù)據(jù)。Qwen2.5-Coder:產(chǎn)出代碼注釋、算法實(shí)現(xiàn)等編程領(lǐng)域合成語料。

通過這種領(lǐng)域自適應(yīng)的數(shù)據(jù)增強(qiáng)策略,顯著提升模型在專業(yè)場景的推理精度。

三階段漸進(jìn)式預(yù)訓(xùn)練

1.基礎(chǔ)能力構(gòu)建階段
在30萬億token數(shù)據(jù)池上進(jìn)行基礎(chǔ)預(yù)訓(xùn)練,采用4K固定上下文窗口,重點(diǎn)培養(yǎng)模型的語言組織能力與常識(shí)推理基礎(chǔ)。此階段相當(dāng)于構(gòu)建認(rèn)知底座,使模型掌握自然語言的底層表達(dá)規(guī)律。

2.專業(yè)能力深化階段
新增5萬億token專項(xiàng)訓(xùn)練數(shù)據(jù),聚焦STEM學(xué)科(科學(xué)/技術(shù)/工程/數(shù)學(xué))與編程任務(wù)。通過高密度專業(yè)語料注入,實(shí)現(xiàn)復(fù)雜邏輯推演能力的跨越式提升,特別強(qiáng)化代碼生成、科學(xué)計(jì)算等場景表現(xiàn)。

3.長程理解突破階段
引入高質(zhì)量長文本語料庫,將上下文處理能力從4K擴(kuò)展至32K,使模型具備處理學(xué)術(shù)長文、多輪技術(shù)對(duì)話等超長文本的能力。該階段突破了傳統(tǒng)模型的記憶限制,可完整理解萬字量級(jí)的專業(yè)文檔。

這種分層訓(xùn)練架構(gòu)既保證了基礎(chǔ)能力的廣度,又通過專項(xiàng)強(qiáng)化實(shí)現(xiàn)了深度能力的突破,最終構(gòu)建出兼具通用性與專業(yè)性的新一代語言大模型。

如果說Qwen2開源時(shí)還帶著點(diǎn)“技術(shù)保留”,Qwen3則徹底放飛自我。2款MoE模型+6款Dense模型全部開源,連協(xié)議都換成Apache 2.0(商用隨便薅?。?。反觀Llama3,至今還在“開源但不可商用”的扭捏狀態(tài)。

02

斯坦福《2025人工智能指數(shù)報(bào)告》顯示,通義千問有六款模型入選全球前三,技術(shù)貢獻(xiàn)位列中國第一,全球第三,僅次于谷歌和OpenAI。

增加模型在海外的部署,也是大廠在AI方面的競賽之一。開源模型成為技術(shù)出海的重要抓手,DeepSeek推出的MoE架構(gòu)模型,通過動(dòng)態(tài)路由技術(shù)將推理成本降至GPT-4的17%,吸引全球3.6萬開發(fā)者參與優(yōu)化。百度文心一言、阿里Qwen等模型也在GitHub開源基礎(chǔ)版本,形成“開源獲客+閉源變現(xiàn)”的雙軌模式。

今天上午和一個(gè)做算力的資深業(yè)內(nèi)人士聊,他說:“各大廠把模型做的越來越快,技術(shù)上沒有本質(zhì)上的變革,目的是在海外擴(kuò)大自己的模型部署,不過就提升模型的能力方面,對(duì)大廠來說也是利好?!?/p>

他認(rèn)為,阿里這一次發(fā)布8個(gè)模型,是因?yàn)樗懔υ诓粩嗵嵘?,大模型就像?shù)學(xué)原理上的發(fā)展,數(shù)學(xué)原理發(fā)展的越好未必能直接帶來效益,但能帶來AI應(yīng)用方面的增長,AI應(yīng)用全部依賴于大模型的基礎(chǔ),沒有大模型的發(fā)展,應(yīng)用很難實(shí)現(xiàn)突破。

相較于Llama 4系列模型獲得的社區(qū)反響,Qwen系列已憑借扎實(shí)的數(shù)據(jù)支撐確立其全球開源領(lǐng)域的領(lǐng)先地位。作為目前全球規(guī)模最大的開源模型體系,阿里通義已向公眾開放200余個(gè)預(yù)訓(xùn)練模型,累計(jì)下載量突破3億次(綜合 Hugging Face、魔搭等社區(qū)數(shù)據(jù))。

更值得關(guān)注的是,基于Qwen核心架構(gòu)衍生的定制化模型已超過10萬個(gè),這一數(shù)字不僅超越了Llama系列,更標(biāo)志著Qwen生態(tài)已成長為全球最活躍的開源模型矩陣。這種指數(shù)級(jí)增長,印證了中國開源大模型在技術(shù)創(chuàng)新與社區(qū)共建方面的雙重突破。

自通義千問自2023年首次亮相以來,幾乎以驚人的迭代速度和技術(shù)突破,從一款基礎(chǔ)語言模型逐步成長為橫跨多模態(tài)、全生態(tài)的AI平臺(tái)。這一歷程不僅展現(xiàn)了阿里巴巴在大模型領(lǐng)域的布局野心,也折射出國產(chǎn)人工智能技術(shù)在全球競爭中的崛起軌跡。

2023年4月,通義千問1.0作為阿里巴巴推出的首款超大規(guī)模語言模型,正式開啟探索之路。該版本初步實(shí)現(xiàn)了中文、英文等多語言文本生成與對(duì)話交互能力,并通過阿里云峰會(huì)展開定向企業(yè)測試。

盡管此時(shí)其整體技術(shù)成熟度仍落后于國際頭部模型(如GPT-3.5),但已在國內(nèi)首批通用型大模型中占據(jù)先機(jī),與百度文心一言、騰訊混元形成早期競爭格局。

同年10月31日發(fā)布的通義千問2.0標(biāo)志著性能的飛躍。參數(shù)規(guī)模突破千億級(jí),復(fù)雜指令理解、文學(xué)創(chuàng)作與數(shù)學(xué)推理能力顯著提升,并推出8大垂直領(lǐng)域子模型(如編程助手通義靈碼、法律助手通義法睿)。

App端向個(gè)人用戶開放后,其綜合性能接近GPT-3.5,超越Meta Llama-2-70B,成為國內(nèi)首個(gè)實(shí)現(xiàn)工具化鏈路的企業(yè)級(jí)大模型平臺(tái)。

2024年4月至5月,Qwen1.5系列的開源策略進(jìn)一步鞏固了其行業(yè)地位。覆蓋5億至1100億參數(shù)的全尺寸模型矩陣滿足多樣化部署需求,CodeQwen1.5-7B成為智能編碼標(biāo)桿,下載量超700萬次。

2024年5月9日,通義千問2.5在多模態(tài)任務(wù)上實(shí)現(xiàn)質(zhì)的突破。深度推理能力優(yōu)化后,邏輯與數(shù)學(xué)題解答準(zhǔn)確率大幅提升,旗艦?zāi)P蚎wen-VL-Max性能超越Gemini Ultra和GPT-4V,成為多模態(tài)領(lǐng)域的標(biāo)桿產(chǎn)品。同年8月30日,視覺語言模型Qwen2-VL-72B重新定義視頻分析邊界。

今年3月27日,Qwen2.5-Omni開創(chuàng)端到端全模態(tài)處理范式。文本、圖像、音頻、視頻同步處理能力實(shí)現(xiàn)人機(jī)交互體驗(yàn)革新,實(shí)時(shí)語音合成與情緒識(shí)別功能適配智能家居、車載系統(tǒng),輕量化設(shè)計(jì)支持手機(jī)端高效部署,對(duì)標(biāo)OpenAI GPT-4o和Google Gemini 2.5 Pro,引領(lǐng)下一代交互體驗(yàn)。

直到這次發(fā)布Qwen3,正式成長為從初代通用模型到全球開源領(lǐng)袖,通義千問的演進(jìn)軌跡映射出中國AI力量的成長路徑。

你已經(jīng)嘗鮮Qwen3了嗎,感覺怎么樣,歡迎評(píng)論區(qū)交流。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
洗草莓時(shí),有人放食鹽,有人放面粉,果農(nóng):都不對(duì),教你正確做法

洗草莓時(shí),有人放食鹽,有人放面粉,果農(nóng):都不對(duì),教你正確做法

阿龍美食記
2026-02-28 10:49:43
國家自然科學(xué)基金委員會(huì)發(fā)布重要提醒

國家自然科學(xué)基金委員會(huì)發(fā)布重要提醒

生物學(xué)霸
2026-03-13 17:14:14
午睡后腦梗人數(shù)增多!醫(yī)生怒斥:不管多大年齡,午睡牢記6不做!

午睡后腦梗人數(shù)增多!醫(yī)生怒斥:不管多大年齡,午睡牢記6不做!

醫(yī)學(xué)科普匯
2026-03-11 20:55:04
天氣預(yù)報(bào)|一夜“春返冬”!重慶大部地區(qū)日平均氣溫將下降6~10℃

天氣預(yù)報(bào)|一夜“春返冬”!重慶大部地區(qū)日平均氣溫將下降6~10℃

上游新聞
2026-03-13 15:45:15
3月13日譯名發(fā)布:阿里·拉里賈尼

3月13日譯名發(fā)布:阿里·拉里賈尼

參考消息
2026-03-13 11:37:45
我娶了單位32歲前臺(tái),結(jié)婚半個(gè)月后董事長:你知道你老婆是啥人不

我娶了單位32歲前臺(tái),結(jié)婚半個(gè)月后董事長:你知道你老婆是啥人不

千秋歷史
2026-03-12 19:18:12
賴清德率五大軍頭發(fā)出通牒,收到大陸信號(hào)的鄭麗文,直接反將一軍

賴清德率五大軍頭發(fā)出通牒,收到大陸信號(hào)的鄭麗文,直接反將一軍

東極妙嚴(yán)
2026-02-13 18:58:56
“上午春分,暖洋洋;下午春分,凍死?!?,今年春分在幾點(diǎn)?

“上午春分,暖洋洋;下午春分,凍死?!保衲甏悍衷趲c(diǎn)?

阿龍美食記
2026-03-10 16:36:10
德國2月,比亞迪大漲1550%,零跑大漲486%,小鵬大漲104%

德國2月,比亞迪大漲1550%,零跑大漲486%,小鵬大漲104%

極速車情speed
2026-03-13 18:25:46
又一支頂級(jí)男籃誕生?29歲的MVP有望加入牙買加,聯(lián)手3大NBA球星

又一支頂級(jí)男籃誕生?29歲的MVP有望加入牙買加,聯(lián)手3大NBA球星

禾三千體育
2026-03-13 17:43:58
59歲宋祖英現(xiàn)身活動(dòng)狀態(tài)驚艷!短發(fā)利落大氣,黑色套裝優(yōu)雅端莊

59歲宋祖英現(xiàn)身活動(dòng)狀態(tài)驚艷!短發(fā)利落大氣,黑色套裝優(yōu)雅端莊

琴聲飛揚(yáng)
2026-02-12 11:51:25
突發(fā)利好!首款侵入式腦機(jī)接口醫(yī)療器械獲批上市,概念股批量拉漲

突發(fā)利好!首款侵入式腦機(jī)接口醫(yī)療器械獲批上市,概念股批量拉漲

21世紀(jì)經(jīng)濟(jì)報(bào)道
2026-03-13 14:52:06
冷冷冷!中央氣象臺(tái)發(fā)布暴雪藍(lán)色預(yù)警!云南多地降溫降雨!這波是“倒春寒”嗎?

冷冷冷!中央氣象臺(tái)發(fā)布暴雪藍(lán)色預(yù)警!云南多地降溫降雨!這波是“倒春寒”嗎?

云南新聞廣播
2026-03-13 16:23:33
比利時(shí)女籃主帥:張子宇的身高讓人印象深刻,籃下技術(shù)很出色

比利時(shí)女籃主帥:張子宇的身高讓人印象深刻,籃下技術(shù)很出色

懂球帝
2026-03-12 23:37:03
出大事了,高市身體亮紅燈,能源線被徹底掐斷,更棘手的還在后面

出大事了,高市身體亮紅燈,能源線被徹底掐斷,更棘手的還在后面

面包夾知識(shí)
2026-03-13 18:06:20
陳小群解密:老鴨頭形態(tài)吃透,不是漲停就是漲個(gè)不停!

陳小群解密:老鴨頭形態(tài)吃透,不是漲停就是漲個(gè)不停!

一方聊市
2026-03-13 14:35:47
警衛(wèi)員在街上被人打進(jìn)醫(yī)院,成都軍區(qū)司令大怒:把他們給我抓起來

警衛(wèi)員在街上被人打進(jìn)醫(yī)院,成都軍區(qū)司令大怒:把他們給我抓起來

芊芊子吟
2026-03-12 21:00:04
中國教育的三大魔幻困局,應(yīng)該如何破局?

中國教育的三大魔幻困局,應(yīng)該如何破局?

楓冷慕詩
2026-03-13 12:19:33
從安徽開往廣東!多輛“巨無霸”運(yùn)輸車違法上路被查!

從安徽開往廣東!多輛“巨無霸”運(yùn)輸車違法上路被查!

荷蘭豆愛健康
2026-03-12 15:23:42
1912年,前清將軍志銳兩拒革命黨人后,被拖至鐘鼓樓東側(cè)槍決示眾

1912年,前清將軍志銳兩拒革命黨人后,被拖至鐘鼓樓東側(cè)槍決示眾

兵卒史
2026-03-10 19:11:07
2026-03-13 19:04:49
白鯨實(shí)驗(yàn)室one incentive-icons
白鯨實(shí)驗(yàn)室one
記錄 AI改變世界的瞬間
102文章數(shù) 14關(guān)注度
往期回顧 全部

科技要聞

龍蝦熱卷到AI硬件 “無腦”硬件或被淘汰

頭條要聞

47歲男子娶82歲老太 還硬塞1000元和20個(gè)雞蛋當(dāng)彩禮

頭條要聞

47歲男子娶82歲老太 還硬塞1000元和20個(gè)雞蛋當(dāng)彩禮

體育要聞

叕戰(zhàn)奧運(yùn),張雨霏要做回“小將”

娛樂要聞

小S復(fù)工錄制 感謝賈永婕陪大S走到最后

財(cái)經(jīng)要聞

2月M2同增9% 前兩個(gè)月存款增加9.26萬億

汽車要聞

大眾汽車與小鵬首款聯(lián)合開發(fā)車型與眾08正式量產(chǎn)

態(tài)度原創(chuàng)

數(shù)碼
游戲
旅游
藝術(shù)
公開課

數(shù)碼要聞

逛AWE看這里,太平洋科技“夢想生活家”展臺(tái)正式亮相

決非故意!團(tuán)隊(duì)回應(yīng)漫威爭鋒女性皮膚過分性感問題

旅游要聞

棗莊:千畝杏花迎春開 漫山春色醉游人

藝術(shù)要聞

吳冠中:歷代畫竹大都缺乏厚度與深度

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版