国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

阿里春節(jié)突襲,用千問3.5把頂尖模型干成了白菜價(jià)

0
分享至



自 AI 概念火熱之后,要說每年過年最熱鬧的地方在哪里?知危覺得答案得是各個(gè)大廠的 AI 實(shí)驗(yàn)室和各個(gè)媒體編輯部了。

昨晚剛過完年,馬年的第一天,AI 界的 “ 源神 ” Qwen3.5( 千問 3.5 )就突然發(fā)布,雖說之前已經(jīng)有 Qwen3.5 的信息傳出,心里已經(jīng)做好了預(yù)期準(zhǔn)備,但是仔細(xì)看了看這次的新模型特性,還是得感嘆一句,不愧是源神啊!

作為開源界的扛把子,這次新發(fā)的 Qwen3.5-Plus 不僅在推理、編程、Agent 智能體等全方位基準(zhǔn)評(píng)估中均表現(xiàn)優(yōu)異,還在視覺理解能力的權(quán)威評(píng)測(cè)中斬獲數(shù)項(xiàng)性能最佳,性能媲美 Gemini3-Pro 等一線閉源模型。

如果說性能提升是預(yù)期內(nèi)的,那這次更新最令人吃驚的是其同等參數(shù)下的性能表現(xiàn)提升十分驚人。之前萬億參數(shù)的 Qwen3-max,在如今,被只有 4000 億參數(shù)的 Qwen3.5-Plus 所超越。只用不到一半的參數(shù),就能帶來更強(qiáng)的性能,直接的影響就是大眾在算力上的花費(fèi)更低了。同等性能,Qwen3.5-Plus每百萬 token 現(xiàn)在最低只要 8 毛錢。這比以性價(jià)比著稱的 DeepSeek 還要便宜數(shù)倍。在杭州,一公斤白菜也就賣這價(jià)。





一般來說,大語言模型界向來奉行 Scaling Law,即誰的參數(shù)大,誰的性能就可能更好,那么這次的千問 3.5 怎么就反其道而行之,參數(shù)變小了,性能反而提升了呢?

這就不得不提到千問大模型團(tuán)隊(duì)在語言模型架構(gòu)上的不斷精進(jìn)。

我們思考一下過去幾年 AI 界的情況,正是因?yàn)榇蠹姨^于遵守 Scaling Law,導(dǎo)致那些做模型的沒怎么賺到錢。反而是老黃這個(gè)賣顯卡的,市值一飛沖天,一度登頂全球市值第一。

參數(shù)暴漲帶來的直接影響就是:我能訓(xùn)練得起,但是用不起了。這在應(yīng)用落地上可不是啥好消息。所以,千問 3.5 就換了個(gè)思路,既然現(xiàn)在參數(shù)的邊際效應(yīng)逐漸遞減,那么我們就想辦法提升每個(gè)參數(shù)的性價(jià)比。

總的來說,千問 3.5 之所以能縮小參數(shù),主要是這幾方面的技術(shù)突破,涉及到技術(shù)方面的事情稍微有點(diǎn)枯燥,咱們就盡量短著點(diǎn)說。

首先是混合注意力機(jī)制。這個(gè)大家應(yīng)該都聽爛了,不管是訓(xùn)練還是推理,注意力機(jī)制所占據(jù)的計(jì)算量都是最大的,原因就是它需要讓每個(gè)詞和每個(gè)詞之間都做( 點(diǎn)積 )計(jì)算,來算出詞與詞之間的關(guān)聯(lián)度。所以,這種算法就有個(gè)大問題,當(dāng)文本量越來越長之后,每多一個(gè)詞,需要的計(jì)算量都是遞增的,比如只有十個(gè)詞的時(shí)候,你多一個(gè)詞可能只要多算 10 次,但是當(dāng)達(dá)到 10 萬上下文時(shí),你再加一個(gè)詞,就得多算十萬次了,這也是為什么語言模型這么難解決上下文長度的原因。而混合注意力機(jī)制,就是在標(biāo)準(zhǔn)注意力機(jī)制的基礎(chǔ)上,引入了一種 “ 按需計(jì)算 ” 的動(dòng)態(tài)策略,能根據(jù)語義的重要程度進(jìn)行 “ 差異化處理 ”,如果我發(fā)現(xiàn)某個(gè)詞不重要,比如 “ 我養(yǎng)了一只狗 ” 里面的 “ 只 ”,你把 “ 只 ” 說成 “ 條 ”、“ 個(gè) ” 大家也能看懂,那我就不去和每個(gè)前文做計(jì)算,只計(jì)算它身邊的少部分詞,而重要的詞,比如這句話里的 “ 狗 ”,你換成其它的 “ 貓 ”、“ 豬 ” 就完全變意思了,這就會(huì)去做全局計(jì)算,這樣就能讓效率和精度同時(shí)提升。

第二點(diǎn)就是比傳統(tǒng)混合專家( MOE )更極致的稀疏架構(gòu),MOE 架構(gòu)在 DeepSeek V3 那會(huì)就火過一陣,簡單理解一下,這就好像把龐大的參數(shù)量,按照知識(shí)分類,分成不同的專家,這樣就能通過減少激活的參數(shù),加快推理速度。而千問 3.5 通過更加極致的專家分類,讓整個(gè) 397B 參數(shù)的模型,最小只需要激活 17B,這計(jì)算量就一下減少了 20 多倍。

剩下的還有原生多 Token 預(yù)測(cè),通過多同時(shí)生成幾個(gè)詞,加快推理的速度,以及 25 年剛拿了最佳論文獎(jiǎng)的用于精確控制輸出結(jié)果的門控機(jī)制之類的技術(shù),這四項(xiàng)技術(shù)相輔相成,當(dāng)它們同時(shí)作用于一個(gè)模型時(shí),帶來的效率躍遷是顛覆性的。想想,每次推理僅激活 17B,卻可以實(shí)現(xiàn)與 GPT-5.2、Gemini-3-pro 同級(jí)的性能表現(xiàn)。與上一代超萬億 的Qwen3-Max 相比,Qwen3.5-Plus 還以 4000 億參數(shù)實(shí)現(xiàn)了性能上的超越,部署顯存占用更是降低 60% 。同時(shí),推理吞吐量最高提升至 19 倍,推理效率大幅提升。



總之,千問3.5通過這些技術(shù)突破,讓模型盡量減少無用的計(jì)算,這樣不僅能使用小參數(shù)獲得更好的性能,還能大大減少部署模型對(duì)硬件的苛刻要求。

這些技術(shù)非常前沿,但對(duì)普通人來說,想要感知技術(shù)那實(shí)在是太難了。

那巧了不是,這次的千問 3.5 還有個(gè)非常 “ 好用 ” 的更新,除了這些架構(gòu)上的新技術(shù),這次的千問 3.5 在自身能力上,也是展現(xiàn)了團(tuán)隊(duì)對(duì)于未來趨勢(shì)的判斷,那就是“ 原生多模態(tài) ”

和一般的語言模型通過文字標(biāo)簽來理解圖片不同,原生多模態(tài),是能直接看懂圖像、視頻、音頻的。它們之間的差別猶如盲人摸象,一個(gè)只能看到局部,而原生多模態(tài),則是能完完整整的繞著大象看。

之所以說它 “ 好用 ”,是因?yàn)橛辛嗽嗄B(tài),你就不只能通過文字和 AI 聊天,你還能通過圖像,更準(zhǔn)確的讓 AI 知道你的意思。

說得多不如上手一試,我們?cè)诘谝粫r(shí)間拿到千問3.5的使用資格后也是快速的上手試了試,一上手我就給新模型來了個(gè)下馬威,直接給它來一個(gè)洗車難題。



結(jié)果,回答還沒出,這跳 Token 的速度就把我震驚到了。



這思考鏈 chua~chua~ 的,一行接一行的蹦出來,不愧是加持了四項(xiàng)架構(gòu)黑科技的千問 3.5,而且,它不僅回答得快,這答的也好,在思考完畢后,簡單直接的給出它最終的答案 ——開車過去。

你看,這第一題就把其它某些模型給比下去了,這給了我極大的信心,秉承測(cè)不死就往死里測(cè)的精神,接下來的測(cè)試會(huì)直接上一個(gè)臺(tái)階。

首先,測(cè)試一下編程能力,我讓千問 3.5 直接幫我寫一個(gè)貪吃蛇的小游戲,問題一提出來,千問 3.5 就開始對(duì)任務(wù)進(jìn)行快速拆解。



等思路捋清之后,這代碼和之前一樣,寫得飛快,超長的上下文也是一次就讓整個(gè)代碼輸出完成。



等它結(jié)束后,拿千問 3.5 給的代碼去測(cè)試,果不其然,一次性成功,中間我沒有給過任何的其它提示,代碼編寫出來的貪吃蛇游戲完整度也非常的高,這個(gè)任務(wù)從功能上來說,處理得非常完美。



但只有功能還不夠,于是我又給它提出要求,讓它做好看點(diǎn),加上特效試試。



程序太長,這里就不展示所有代碼,對(duì)于果,夸獎(jiǎng)的話我不想多說,大家直接看動(dòng)圖。



之后我又測(cè)試了讓它去做一個(gè)創(chuàng)新類的游戲,我告訴它,做一個(gè)坦克大戰(zhàn),但是肉鴿版!



千問 3.5 依舊是先思考思路,拆分任務(wù)。





然后chua~chua~的用超長的token,把代碼一口氣寫出來。



這是它完成的第一版游戲,可以說相當(dāng)完善,而且非常好玩,坦克不僅有等級(jí),而且每升一級(jí)都能選一個(gè)威能提升,要知道,這些都是我只說了一句話讓它做到的。



而這,是我讓它改進(jìn)視覺后的效果。。。



中間我也僅僅只是說了八個(gè)字:讓這個(gè)游戲好看點(diǎn)。



到這里,編程已經(jīng)沒什么好挑剔的了,但是,讓它僅僅是編程可沒用到任何多模態(tài)的能力,所以第二項(xiàng),就是要試試它對(duì)圖像的理解到底有多深!

首先,我讓它根據(jù)這個(gè)圖片來幫我找找茬。



在它短暫的思考過后,直接給出了 6 處不同的結(jié)論,其中有一處女孩的泳衣顏色居然還在思考后,自己給否定掉了,這真的有點(diǎn)像人在對(duì)比圖像,然后再思考是不是了。





不過最后從答案上來看,它還是有兩處錯(cuò)誤的,一個(gè)是男人的頭發(fā),一個(gè)是那女孩的蝴蝶結(jié)沒找到,但是大家要注意,我給的是一張圖片而不是兩張,它并不能直接去對(duì)比兩幅圖的像素,它是需要理解這個(gè)圖是分上下的,然后理解上下還有很多相似的圖像,然后再從相似的圖像中找到不對(duì)的畫面,這對(duì)于一個(gè)語言模型來說,這個(gè)結(jié)果已經(jīng)夠驚人了。



之后我又給了它一張圖片,這次它不僅能知道圖片里是什么,甚至還能理解反光,最離譜的是,它居然從細(xì)節(jié)信息中,讀出了這張圖片可能是 AI 生成的,而事實(shí)也確實(shí)如此,只能說它的圖片識(shí)別能力,至少在識(shí)別 AI 上,已經(jīng)超越大部分人類了!



圖像,編碼似乎都不能難到它,接下來,我得給它一個(gè)終極考驗(yàn),讓它看視頻??匆曨l和圖片的難度可是天差地別,圖片只有一張,視頻可是一連串的,而且視頻還有分鏡、角度等因素,千問 3.5 想要讀懂視頻,必須對(duì)每個(gè)鏡頭都能理解到位才行。

首先來個(gè)簡單的,我讓它看看這個(gè)視頻中,這個(gè)帥氣的男人打球技術(shù)如何。

結(jié)果讓我吃驚,它先從整體概況給出答案,然后再分析技術(shù)細(xì)節(jié)分析了戰(zhàn)術(shù)策略,還知道最后扣籃了。甚至還給出了面對(duì)這種對(duì)手要怎么改進(jìn),這完全就像一個(gè)籃球教練在看著你的動(dòng)作一步步的給你分析,最后給你指導(dǎo)。











看它完成的這么棒,我只能繼續(xù)加大力度,這次我給它來了個(gè)畫中畫!這是一個(gè)小貓?jiān)谧冯娔X屏幕里的元素的視頻,千問 3.5 要理解它,首先得分辨屏幕和現(xiàn)實(shí)。







結(jié)果只能說完全難不倒它!!

它不僅知道小貓?jiān)谄聊磺?,它甚至還知道里面的游戲名字叫什么,然后分析畫面,為什么小貓會(huì)抓屏幕??梢哉f它完全知道怎么回事。

視頻完全拿捏,那如果讓千問 3.5 去根據(jù)視頻要求來編程呢?

我錄制了一段訪問某品牌網(wǎng)站的視頻。



我告訴它,讓它先看視頻,分析一下視頻的內(nèi)容是什么,然后,直接讓它根據(jù)視頻內(nèi)容,編寫出類似的網(wǎng)頁。

中間只是提醒它一次,把沒有的圖片,用色塊表示。







它的編程速度是這樣的。



而這,就是它給的結(jié)果。



不能說一模一樣吧,也至少能說從功能上,幾乎沒有差別。

隨后我又測(cè)試了一些其它的視頻畫面。

比如奇怪的搖滾貓。









到現(xiàn)在我其實(shí)已經(jīng)對(duì)它的能力折服了,不過最后,我還得再測(cè)試一下工作場景,所以我給了它一段動(dòng)畫軟件的視頻。讓它告訴我這里的是什么內(nèi)容。









結(jié)果也在意料之中,經(jīng)過之前的洗禮,我已經(jīng)見怪不怪了,千問 3.5 很好的看出了這是什么軟件,視頻在做什么內(nèi)容,也基本把畫面中所有的文字都讀懂了,可以說,它完全的理解了這個(gè)視頻。

那么,這次的測(cè)試到這里就結(jié)束了,不知道大家意識(shí)到?jīng)]有,在前文的多模態(tài)那部分,我就提到了一點(diǎn),多模態(tài)的部分代表著千問他們對(duì)未來趨勢(shì)的判斷。

所以這就有個(gè)問題。

拋開價(jià)格戰(zhàn)的喧囂,為什么,阿里要死磕 “ 以小勝大 ” 和 “ 原生多模態(tài) ”?

答案很可能就是:智能體。

前段時(shí)間,一直改名一直火的 AI Agent OpenClaw,相信關(guān)注 AI 行業(yè)的人應(yīng)該都知道。它是一個(gè)通過大語言模型自動(dòng)幫你辦公的助手,只需要告訴它你要干什么,它直接就能在后臺(tái)操作電腦把你想做的事情做完,而要實(shí)現(xiàn)它,那么多模態(tài)的能力是必不可少的, 它必須得從畫面中理解現(xiàn)在的電腦在干什么,然后才能指導(dǎo)自己去做。

但這就導(dǎo)致了非常重要的痛點(diǎn)難題:一個(gè)是如果我考慮隱私想自己部署,能力強(qiáng)的模型我用不起,能力弱的又沒有用,而如果直接調(diào)用API,假如任務(wù)卡住的話,干一個(gè)活,一晚上幾百美元就沒了。。。

在國內(nèi),吐槽它太耗 Token 的人也不少。

而千問 3.5 可能是這些問題目前的最優(yōu)解,既開源,API 也便宜,想自己搭也行,給了大家自由的空間。

在 AI 亟需應(yīng)用落地的時(shí)代,盲目的追求“大”語言模型可能越來越不是一個(gè)明智的選擇,而像千問 3.5 這樣,不僅針對(duì)真實(shí)的需求做出對(duì)應(yīng)的改進(jìn),而且還堅(jiān)持開源,說實(shí)話,就算是我想找茬,我也找不出要說它不好的點(diǎn)在哪。

可能唯一要吐槽的點(diǎn)就在于,這么好的模型,為什么我今年才用到!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
所有發(fā)達(dá)國家都有一個(gè)共性:人工很貴,勞動(dòng)很值錢。

所有發(fā)達(dá)國家都有一個(gè)共性:人工很貴,勞動(dòng)很值錢。

流蘇晚晴
2026-01-27 18:18:22
比張鎮(zhèn)麟還差!中國男籃逆轉(zhuǎn)夜最失意之人:失誤被換下 僅出場30

比張鎮(zhèn)麟還差!中國男籃逆轉(zhuǎn)夜最失意之人:失誤被換下 僅出場30

郝小小看體育
2026-03-02 00:43:15
活塞力克魔術(shù)鞏固聯(lián)盟第一 坎寧安29+7+11完勝班凱羅24+11

活塞力克魔術(shù)鞏固聯(lián)盟第一 坎寧安29+7+11完勝班凱羅24+11

醉臥浮生
2026-03-02 09:33:01
周扒皮都怕!女兒替父請(qǐng)假2小時(shí)遭辭退,店已關(guān)門,老板底褲被扒

周扒皮都怕!女兒替父請(qǐng)假2小時(shí)遭辭退,店已關(guān)門,老板底褲被扒

千言娛樂記
2026-02-28 14:42:55
3月30日起執(zhí)行!國務(wù)院824號(hào)令:農(nóng)村土葬老墳處置規(guī)則與權(quán)益保護(hù)

3月30日起執(zhí)行!國務(wù)院824號(hào)令:農(nóng)村土葬老墳處置規(guī)則與權(quán)益保護(hù)

三農(nóng)雷哥
2026-02-26 19:39:24
重要賽事!3月2晚上19:30,中央5套CCTV5、CCTV5+直播節(jié)目表

重要賽事!3月2晚上19:30,中央5套CCTV5、CCTV5+直播節(jié)目表

皮皮觀天下
2026-03-02 08:15:22
一百名癌癥科專家已證實(shí):吸煙和肺癌的關(guān)系,最好花點(diǎn)時(shí)間看看

一百名癌癥科專家已證實(shí):吸煙和肺癌的關(guān)系,最好花點(diǎn)時(shí)間看看

展望云霄
2026-02-28 10:42:38
自家名宿不護(hù)著,賴特:賴斯的動(dòng)作絕對(duì)是一個(gè)點(diǎn)球

自家名宿不護(hù)著,賴特:賴斯的動(dòng)作絕對(duì)是一個(gè)點(diǎn)球

懂球帝
2026-03-02 09:48:07
女子離鄉(xiāng)返程時(shí)兒子沒有送別,看監(jiān)控發(fā)現(xiàn)兒子打開電視把頭埋沙發(fā)下,用聲音掩蓋自己的哭聲

女子離鄉(xiāng)返程時(shí)兒子沒有送別,看監(jiān)控發(fā)現(xiàn)兒子打開電視把頭埋沙發(fā)下,用聲音掩蓋自己的哭聲

觀威海
2026-03-01 13:27:08
大年初二回娘家拜年,看到繼母一個(gè)人忙著做菜,我做了一個(gè)決定

大年初二回娘家拜年,看到繼母一個(gè)人忙著做菜,我做了一個(gè)決定

人間百態(tài)大全
2026-03-02 06:35:03
伊朗遭襲,俄成最大贏家,美媒一語驚人,伊朗對(duì)中國沒那么重要?

伊朗遭襲,俄成最大贏家,美媒一語驚人,伊朗對(duì)中國沒那么重要?

讓我的世界更加精彩
2026-03-02 10:54:52
馬年第一顆雷爆了!燒光500億,“中國寶馬”還是倒下了

馬年第一顆雷爆了!燒光500億,“中國寶馬”還是倒下了

華庭講美食
2026-03-01 13:39:18
哈梅內(nèi)伊死了,美伊戰(zhàn)爭烈度比想象的要大很多

哈梅內(nèi)伊死了,美伊戰(zhàn)爭烈度比想象的要大很多

黑噪音
2026-03-01 09:49:45
居然是真的,特斯拉新車漲價(jià)了 !

居然是真的,特斯拉新車漲價(jià)了 !

花果科技
2026-03-01 20:29:33
美總統(tǒng)稱美軍在對(duì)伊行動(dòng)中打死48名伊朗指揮官

美總統(tǒng)稱美軍在對(duì)伊行動(dòng)中打死48名伊朗指揮官

界面新聞
2026-03-02 07:33:10
陳盈駿發(fā)布會(huì)回應(yīng)輸球!多次強(qiáng)調(diào)可惜,直指攻守執(zhí)行已經(jīng)很好了!

陳盈駿發(fā)布會(huì)回應(yīng)輸球!多次強(qiáng)調(diào)可惜,直指攻守執(zhí)行已經(jīng)很好了!

籃球資訊達(dá)人
2026-03-01 19:50:54
蒙古國的人,為啥如此仇視中國人?

蒙古國的人,為啥如此仇視中國人?

賤議你讀史
2026-02-27 15:12:56
產(chǎn)蛋比不過雞,長肉比不過鴨,人類為何要馴服兇猛的大鵝?

產(chǎn)蛋比不過雞,長肉比不過鴨,人類為何要馴服兇猛的大鵝?

翰林冷知識(shí)
2026-03-01 11:52:05
你有知道哪些炸裂的秘密?網(wǎng)友:我有個(gè)秘密說出來肯定大家要笑死

你有知道哪些炸裂的秘密?網(wǎng)友:我有個(gè)秘密說出來肯定大家要笑死

帶你感受人間冷暖
2026-01-29 00:10:05
稀土庫存全面告急,美企破防,美媒:中國再不批準(zhǔn),談判等于作廢

稀土庫存全面告急,美企破防,美媒:中國再不批準(zhǔn),談判等于作廢

紀(jì)中百大事
2026-03-01 11:56:34
2026-03-02 12:24:49
知危 incentive-icons
知危
投資不立危墻之下
539文章數(shù) 1833關(guān)注度
往期回顧 全部

科技要聞

榮耀發(fā)布機(jī)器人手機(jī)、折疊屏、人形機(jī)器人

頭條要聞

牛彈琴:伊朗之戰(zhàn)比俄烏之戰(zhàn)更生猛 給世界5個(gè)深刻教訓(xùn)

頭條要聞

牛彈琴:伊朗之戰(zhàn)比俄烏之戰(zhàn)更生猛 給世界5個(gè)深刻教訓(xùn)

體育要聞

卡里克主場5連勝!隊(duì)史第2人通過最大考驗(yàn)

娛樂要聞

美伊以沖突爆發(fā),多位明星被困中東

財(cái)經(jīng)要聞

中東局勢(shì)影響如何?十大券商策略來了

汽車要聞

預(yù)售11.28萬起 狐全新阿爾法S5標(biāo)配寧德時(shí)代

態(tài)度原創(chuàng)

數(shù)碼
藝術(shù)
教育
本地
軍事航空

數(shù)碼要聞

軍規(guī)可靠:聯(lián)想發(fā)布ThinkTab X11強(qiáng)固型Android平板電腦

藝術(shù)要聞

2025北京青年美術(shù)作品展 | 油畫作品選刊

教育要聞

2027–28申請(qǐng)季:當(dāng)背景趨同、高分扎堆,你還能靠什么贏得offer?

本地新聞

津南好·四時(shí)總相宜

軍事要聞

美軍動(dòng)用新型武器:山寨伊朗的

無障礙瀏覽 進(jìn)入關(guān)懷版