国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Agent原生模型時(shí)代開啟!階躍Step 3.5 Flash上線,2天登頂OpenRouter全球趨勢(shì)榜

0
分享至


從 chatbot 到 Agent,大模型以「缸中之腦」為起點(diǎn),正在悄然進(jìn)化出屬于自己的四肢百骸。

但在 Agent 應(yīng)用狂飆突進(jìn)的同時(shí),各種安全事故也層出不窮。初具雛形的 Agent 應(yīng)用,正在急切呼喚一個(gè)更聰明、更可靠的「原生大腦」。

爆改基模結(jié)構(gòu),開啟 AI 模型

「Agent 原生」時(shí)代

Agent 時(shí)代,由于外部工具和任務(wù)重試需求等因素的介入,令上下文長(zhǎng)度相比 coding、chatbot 等應(yīng)用場(chǎng)景,迎來了一輪暴漲。同時(shí),用戶對(duì)即時(shí)性也有了更高的要求。相比 chatbot 時(shí)代,吐字比閱讀速度快的基本訴求,等待 Agent 工具交付結(jié)果的時(shí)間,必須被進(jìn)一步壓縮。

所以,上一個(gè)時(shí)代的 Reasoning 模型,已經(jīng)不能再適應(yīng)本世代的需求。一個(gè)好的 Agent 原生模型,在推理成本、速度和智能水平三個(gè)層面,都必須再次迎來進(jìn)化。

基于此,階躍星辰新上線的 Step 3.5 Flash,可謂「多快好省」:

為了滿足 Agent 時(shí)代的訴求,Step 3.5 Flash 從基礎(chǔ)模型層面,就采用了十分獨(dú)特的結(jié)構(gòu)設(shè)計(jì)。作為一款旗艦級(jí)語言推理模型,它并未盲目追逐模型尺寸,而是選擇了稀疏混合專家(MoE)架構(gòu)??倕?shù)量為 1960 億,每次推理僅激活約 110 億參數(shù)。

同時(shí),Step 3.5 Flash,將傳統(tǒng)的 Linear Attention(線性注意力機(jī)制),打散為滑動(dòng)窗口注意力(SWA)+ 全局注意力(Full Attention)3:1 的混合架構(gòu)。如果要找個(gè)比喻的話,這種結(jié)構(gòu),十分接近推理小說的閱讀體驗(yàn):大部分注意力依舊集中在當(dāng)前段落附近的文本,但當(dāng)一個(gè)伏筆回收時(shí),幾章之前埋下的劇情鉤子,仍然能快速的浮現(xiàn)出來。

最后,在模型技術(shù)層面,Step 3.5 Flash 還使用了 MTP-3「多 token 并行預(yù)測(cè)」機(jī)制。

如果說傳統(tǒng)大模型,是一個(gè)詞接一個(gè)詞的“文字接龍”,那么 MTP-3,就像是先打草稿,再深入潤色。在 Transformer 主干之后,MTP-3 會(huì)附加一個(gè)專用的預(yù)測(cè)網(wǎng)絡(luò)層,讓模型根據(jù)當(dāng)前上下文同時(shí)推斷多個(gè)未來 token 的概率分布。這樣的設(shè)計(jì),在保證因果一致性的前提下,實(shí)現(xiàn)了多 token 的并行推理。

架構(gòu)精巧,推理速度

可達(dá)每秒 350 個(gè) token

多方加持下,Step 3.5 Flash 擁有了高達(dá) 256K 的超長(zhǎng)上下文,和十分夸張的推理速度。在單請(qǐng)求代碼類任務(wù)上,Step 3.5 Flash 最高推理速度可達(dá)每秒 350 個(gè) token,確保了復(fù)雜 Agent 任務(wù)的低延遲響應(yīng)。

和它的名字一樣,「快」,是 Step 3.5 Flash 最顯著的特點(diǎn)。但速度不能以犧牲智力為代價(jià)。在推理速度狂飆突進(jìn)的同時(shí),它的邏輯能力,同樣不容小覷。

在例行刷榜環(huán)節(jié)當(dāng)中,Step 3.5 Flash 拿下了 AIME 2025(美國數(shù)學(xué)邀請(qǐng)賽)97.3 分; IMOAnswerBench(國際奧林匹克數(shù)學(xué)基準(zhǔn)測(cè)試)85.4 分;HMMT 2025(哈佛 - 麻省理工數(shù)學(xué)競(jìng)賽) 96.2 分的好成績(jī)。

與國內(nèi)頂級(jí)開源模型相比,上述項(xiàng)目得分,Step 3.5 Flash 均為第一。

縮放定律似乎暗示我們,模型的能力,直接和尺寸掛鉤。但 Step 3.5 Flash 用事實(shí)證明,合適尺寸 + 充分的后訓(xùn)練,完全可以兼顧速度與效率,得到一個(gè)精致、且有強(qiáng)邏輯內(nèi)核的大模型。

拋棄「規(guī)模迷信」的背后,是階躍星辰對(duì)大模型的獨(dú)特理解:模型應(yīng)該凝縮「邏輯」,而非用超大規(guī)模,簡(jiǎn)單地對(duì)文本模式死記硬背。

「高智商」,才是硬道理

這種認(rèn)知的回報(bào),在真實(shí)世界的任務(wù)當(dāng)中體現(xiàn)的尤為明顯:coding 榜單當(dāng)中,Step 3.5 Flash 拿下了 Terminal-Bench 2.0(終端任務(wù)自動(dòng)化),和 LiveCodeBench-V6(實(shí)時(shí)編碼調(diào)試)國內(nèi)開源第一的好成績(jī),整體測(cè)試水平屬于全球第一梯隊(duì)。

Agent 相關(guān)的測(cè)試項(xiàng)目更是手到擒來:τ2-Bench(多步任務(wù)規(guī)劃)88.2 分 ;xbench-DeepSearch(深度搜索與信息整合)54 分,均為國內(nèi)開源模型第一。BrowseComp(網(wǎng)頁瀏覽與上下文管理) 69 分,實(shí)現(xiàn)了對(duì)海外御三家模型的成功反超。

更大的認(rèn)可,來自 AI 社群:在真實(shí)世界任務(wù)中,Step 3.5 Flash 以高達(dá) 167 Tokens/s 的推理速度,發(fā)布首日,即進(jìn)入全球知名 AI 模型聚合平臺(tái) OpenRouter “Fastest Models”速度榜前列。


發(fā)布 2 天,登頂 OpenRouter 全球趨勢(shì)榜(Trending)榜單。


作為匯聚了 OpenAI、Anthropic、Google 等主流模型的 API 平臺(tái),OpenRouter 的全球趨勢(shì)榜單,實(shí)時(shí)反映著開發(fā)者在實(shí)際應(yīng)用中的模型偏好與付費(fèi)選擇。此次登頂,意味著 Step 3.5 Flash 在真實(shí)任務(wù)當(dāng)中的表現(xiàn),已收獲了全球 AI 開發(fā)者的積極認(rèn)可。

Reddit、X 等平臺(tái)上也有不少用戶,對(duì) Step 3.5 Flash 的表現(xiàn)給出了很高的評(píng)價(jià):多語言混用時(shí)切換自然,很少出現(xiàn)同尺寸模型身上常見的「夾雜」情況;行事穩(wěn)定可靠,幻覺率極低,且對(duì)自身的能力邊界有著清晰的認(rèn)知,不會(huì)為了強(qiáng)行接話而編造答案。




而這一切,都發(fā)生在一臺(tái) 128G 內(nèi)存、M3 Max 芯片的 mac 電腦上。

本地 Agent,從此平權(quán)

據(jù)社區(qū)反饋,借助 llama.cpp,Step 3.5 Flash 在 mac 平臺(tái)上的推理速度極佳。平均速度 35 tokens/ 秒,約為該平臺(tái)理論最大效率的 70%。

某種程度上,這是階躍星辰 CTO 朱亦博「私心」的結(jié)果:他希望這個(gè)模型,能支持 4-bit 量化后,運(yùn)行在 128GB 內(nèi)存的 MacBook 上。

但 Step 3.5 Flash 最終發(fā)布時(shí)的支持范圍遠(yuǎn)不止于此:云服務(wù)層面,包括華為昇騰、沐曦股份、壁仞科技、燧原科技、天數(shù)智芯、阿里平頭哥等在內(nèi)的多家芯片廠商,均已率先完成了對(duì) Step 3.5 Flash 的適配工作。同時(shí),經(jīng)過 4-bit 量化以后,Step 3.5 Flash 也支持在 NVIDIA DGX Spark、Apple M3/M4 Max 以及 AMD AI Max+ 395 等主流個(gè)人 AI 終端上,進(jìn)行本地部署——同時(shí)依然保持著 256K context 的超長(zhǎng)上下文能力。

朱亦博在博客文章里不無自豪地表示,這是你在 128GB 內(nèi)存的 Macbook 和 DGX Spark 上,用 4-bit 暢快跑 256K context 的最強(qiáng)模型,沒有之一。

AI 模型的又一個(gè)「中國時(shí)刻」?

在過去的一年中,來自中國的開源模型,用更低的獲取門檻、推理成本和打平的性能,一舉擊碎了“超大規(guī)模 + 閉源 = 先進(jìn)”的行業(yè)迷信,無數(shù) AI 應(yīng)用因此涌現(xiàn),也將大模型競(jìng)爭(zhēng),重新拉回了效率與架構(gòu)創(chuàng)新的主航道。

現(xiàn)在,國內(nèi)幾家 AI 公司動(dòng)作頻頻、傳聞不斷,今年大模型領(lǐng)域的「春節(jié)檔」,注定熱鬧非常。而最近發(fā)布的 Step 3.5 Flash,或許正悄然復(fù)刻又一個(gè) AI 領(lǐng)域的「中國時(shí)刻」——高性能、低門檻、新范式。只是這一次,范式轉(zhuǎn)移的焦點(diǎn),從“推理模型”轉(zhuǎn)向了更具顛覆性的“Agent 原生(開源)基座模型”。

當(dāng)行業(yè)還在用稠密模型硬扛 Agent 場(chǎng)景時(shí),它用 1960 億總參數(shù)、僅 110 億激活參數(shù)的精巧架構(gòu),同時(shí)解決了 Agent 時(shí)代的三大死結(jié)——超長(zhǎng)上下文下的低延遲響應(yīng)、復(fù)雜任務(wù)中的高幻覺風(fēng)險(xiǎn)、以及終端設(shè)備上的本地化部署。

當(dāng)海外巨頭將 Agent 能力鎖死在云端 API 時(shí),Step 3.5 Flash,讓 256K 上下文的 Agent 大腦,跑在 128GB 內(nèi)存的 MacBook 上——這是對(duì) AI 權(quán)力結(jié)構(gòu)的重構(gòu):Agent 的智能不應(yīng)被云廠商壟斷,開發(fā)者理應(yīng)擁有在終端側(cè)構(gòu)建私有化 Agent 工作流的自由。

這種“終端平權(quán)”邏輯,恰是此前中國 AI 大模型引領(lǐng)的范式轉(zhuǎn)移,在新環(huán)境下進(jìn)一步的延續(xù)與深化:從模型獲取的平權(quán),進(jìn)階到 Agent 能力的平權(quán)。

歷史從不重復(fù),但常常押韻。如果說之前的國產(chǎn)大模型,打破的是“對(duì)規(guī)模和閉源的迷信”,那么 Step 3.5 Flash 正在擊碎的,就是“速度與智能不可兼得”的新迷信。當(dāng)行業(yè)還在用“參數(shù)量”“榜單分?jǐn)?shù)”這類舊范式衡量模型價(jià)值時(shí),Step 3.5 Flash 已用 OpenRouter 趨勢(shì)榜登頂、Reddit 開發(fā)者自發(fā)安利、多芯片廠商 Day 0 適配的事實(shí)證明:真正的范式轉(zhuǎn)移,永遠(yuǎn)始于真實(shí)世界中,解決真實(shí)訴求的能力。

我們或許正站在 Agent 時(shí)代的分水嶺上:過去一年,市場(chǎng)狂熱追逐 Agent 應(yīng)用層的“四肢百骸”,卻忽略了為其注入靈魂的“原生大腦”。而 Step 3.5 Flash 的此時(shí)此刻,又恰似 2025 年春節(jié)的彼時(shí)彼刻——盡管暫時(shí)被 Agent 應(yīng)用的喧囂浪潮所掩蓋,但歷史終將被證明,在 Agent 時(shí)代,是階躍星辰,完成了一次基礎(chǔ)設(shè)施層,最關(guān)鍵的范式躍遷。

會(huì)議推薦

InfoQ 2026 全年會(huì)議規(guī)劃已上線!從 AI Infra 到 Agentic AI,從 AI 工程化到產(chǎn)業(yè)落地,從技術(shù)前沿到行業(yè)應(yīng)用,全面覆蓋 AI 與軟件開發(fā)核心賽道!集結(jié)全球技術(shù)先鋒,拆解真實(shí)生產(chǎn)案例、深挖技術(shù)與產(chǎn)業(yè)落地痛點(diǎn),探索前沿領(lǐng)域、聚焦產(chǎn)業(yè)賦能,獲取實(shí)戰(zhàn)落地方案與前瞻產(chǎn)業(yè)洞察,高效實(shí)現(xiàn)技術(shù)價(jià)值轉(zhuǎn)化。把握行業(yè)變革關(guān)鍵節(jié)點(diǎn),搶占 2026 智能升級(jí)發(fā)展先機(jī)!

今日薦文

你也「在看」嗎?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
證監(jiān)會(huì)短線交易新規(guī)出爐:13種情形可豁免,中長(zhǎng)期資金迎利好

證監(jiān)會(huì)短線交易新規(guī)出爐:13種情形可豁免,中長(zhǎng)期資金迎利好

徐sir財(cái)經(jīng)
2026-03-07 11:47:28
宇樹科技創(chuàng)始人王興興相親帖曝光!女友標(biāo)準(zhǔn)引熱議

宇樹科技創(chuàng)始人王興興相親帖曝光!女友標(biāo)準(zhǔn)引熱議

江南晚報(bào)
2026-03-07 14:39:25
小龍蝦接入 QQ,只要 2 分鐘!

小龍蝦接入 QQ,只要 2 分鐘!

AI范兒
2026-03-07 19:39:02
陳冠希近照刷屏!45歲老成這樣,網(wǎng)友直呼:到底怎么了?

陳冠希近照刷屏!45歲老成這樣,網(wǎng)友直呼:到底怎么了?

觀魚聽雨
2026-03-06 23:51:42
烏克蘭被曝正幫美國對(duì)抗伊朗無人機(jī),澤連斯基:已收到美國請(qǐng)求!專家:一架無人機(jī)3萬多美元,一枚攔截導(dǎo)彈上百萬美元,“完全不可持續(xù)”

烏克蘭被曝正幫美國對(duì)抗伊朗無人機(jī),澤連斯基:已收到美國請(qǐng)求!專家:一架無人機(jī)3萬多美元,一枚攔截導(dǎo)彈上百萬美元,“完全不可持續(xù)”

每日經(jīng)濟(jì)新聞
2026-03-07 01:03:56
誰最希望美國、以色列與伊朗一直打下去?

誰最希望美國、以色列與伊朗一直打下去?

總在茶余后
2026-03-07 23:44:29
魯尼大兒曬家中1.8億豪宅 占地22個(gè)足球場(chǎng)能養(yǎng)14匹馬長(zhǎng)子已承家業(yè)

魯尼大兒曬家中1.8億豪宅 占地22個(gè)足球場(chǎng)能養(yǎng)14匹馬長(zhǎng)子已承家業(yè)

勁爆體壇
2026-03-07 07:18:04
開戰(zhàn)第七天,最大贏家浮現(xiàn),不是伊朗,不是以色列,也不是美國

開戰(zhàn)第七天,最大贏家浮現(xiàn),不是伊朗,不是以色列,也不是美國

徐徐道史
2026-03-07 15:04:03
中國最“閑”的3座機(jī)場(chǎng):每天飛1趟航班,飛機(jī)一走員工就集體下班

中國最“閑”的3座機(jī)場(chǎng):每天飛1趟航班,飛機(jī)一走員工就集體下班

青眼財(cái)經(jīng)
2026-03-07 23:26:43
炫富!2名高盛員工闖禍了!

炫富!2名高盛員工闖禍了!

新浪財(cái)經(jīng)
2026-03-08 00:08:20
詹姆斯今年是否會(huì)退役?韋德:我覺得不會(huì),他還能再多打兩年

詹姆斯今年是否會(huì)退役?韋德:我覺得不會(huì),他還能再多打兩年

懂球帝
2026-03-07 20:03:37
69年周總理擔(dān)心蘇聯(lián)動(dòng)用核武器,毛主席反問總理:你讀過明史嗎

69年周總理擔(dān)心蘇聯(lián)動(dòng)用核武器,毛主席反問總理:你讀過明史嗎

兵卒史
2026-03-07 07:01:17
楊尚昆和哈梅內(nèi)伊的“三無”會(huì)見,楊尚昆說了幾句轉(zhuǎn)身就走

楊尚昆和哈梅內(nèi)伊的“三無”會(huì)見,楊尚昆說了幾句轉(zhuǎn)身就走

犀利強(qiáng)哥
2026-03-04 21:40:54
伊朗重磅宣布:擊中美國油輪!

伊朗重磅宣布:擊中美國油輪!

占豪
2026-03-05 19:01:59
山西王閻錫山的妹妹,沒來得及跟哥哥逃到臺(tái)灣,她的結(jié)局如何?

山西王閻錫山的妹妹,沒來得及跟哥哥逃到臺(tái)灣,她的結(jié)局如何?

老范談史
2026-03-03 17:43:41
很多人還不知道,原來只要知道對(duì)方手機(jī)號(hào)碼,就可以查到對(duì)方位置了!

很多人還不知道,原來只要知道對(duì)方手機(jī)號(hào)碼,就可以查到對(duì)方位置了!

CG說科技
2026-03-05 16:59:05
自食惡果!伊朗全球追殺特朗普,倆百歲大佬下死令,永無期限

自食惡果!伊朗全球追殺特朗普,倆百歲大佬下死令,永無期限

愛看劇的阿峰
2026-03-06 17:08:17
爆冷!林俊易2-1逆轉(zhuǎn)昆拉武特!2026全英男單決賽懸念拉滿

爆冷!林俊易2-1逆轉(zhuǎn)昆拉武特!2026全英男單決賽懸念拉滿

小蘭看體育
2026-03-07 20:41:19
3月7日俄烏最新:小澤上前線

3月7日俄烏最新:小澤上前線

西樓飲月
2026-03-07 20:59:30
中國造價(jià)最高大樓:買地花費(fèi)63億,奢華程度超乎想象

中國造價(jià)最高大樓:買地花費(fèi)63億,奢華程度超乎想象

聚焦真實(shí)瞬間
2026-03-06 06:41:19
2026-03-08 01:03:00
AI前線 incentive-icons
AI前線
面向AI愛好者、開發(fā)者和科學(xué)家,提供AI領(lǐng)域技術(shù)資訊。
1347文章數(shù) 133關(guān)注度
往期回顧 全部

科技要聞

OpenClaw爆火,六位"養(yǎng)蝦人"自述與AI共生

頭條要聞

伊朗總統(tǒng):號(hào)召所有伊朗人挺身而出 保衛(wèi)領(lǐng)土

頭條要聞

伊朗總統(tǒng):號(hào)召所有伊朗人挺身而出 保衛(wèi)領(lǐng)土

體育要聞

塔圖姆298天走完這段路 只用27分鐘征服這座城

娛樂要聞

汪小菲曝親媽猛料,張?zhí)m公開財(cái)產(chǎn)分配

財(cái)經(jīng)要聞

針對(duì)"不敢休、不讓休"怪圈 國家出手了

汽車要聞

逃離ICU,上汽通用“止血”企穩(wěn)

態(tài)度原創(chuàng)

家居
數(shù)碼
本地
公開課
軍事航空

家居要聞

暖棕撞色 輕法奶油風(fēng)

數(shù)碼要聞

英特爾 Core Ultra 3 “Panther Lake-H” 結(jié)構(gòu)細(xì)節(jié)曝光

本地新聞

食味印象|一口入魂!康樂烤肉串起千年絲路香

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美第三個(gè)航母打擊群據(jù)稱準(zhǔn)備部署至中東

無障礙瀏覽 進(jìn)入關(guān)懷版