国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

匿名大象模型被螞蟻認(rèn)領(lǐng)!推理速度沖到第一,還能生成百萬(wàn)小說(shuō)

0
分享至


智東西
作者 李水青
編輯 心緣

智東西4月22日?qǐng)?bào)道,上周沖上OpenRouter熱榜(Trending)第一的匿名測(cè)試模型Elephant Alpha今早正式揭曉真身——螞蟻旗下的百靈模型Ling-2.6-flash


匿名上線以來(lái),該模型調(diào)用量持續(xù)增長(zhǎng),連續(xù)多日位列熱榜榜首,日均tokens調(diào)用量達(dá)100B級(jí)別。不少網(wǎng)友試用后表示印象深刻,有人稱這是“用過(guò)最快的模型”“token效率很高”。

螞蟻今日宣布正式推出Ling-2.6-flash。該模型總參數(shù)量104B,激活參數(shù)7.4B,為Instruct模型。如下圖所示,該模型在Agent相關(guān)基準(zhǔn)上達(dá)到同尺寸SOTA水平,并在其他核心能力上表現(xiàn)出色。


Ling-2.6-flash追求的是在控制token消耗的前提下,保持對(duì)Agent任務(wù)的強(qiáng)競(jìng)爭(zhēng)力,主要具備以下三大核心能力:

1、混合線性架構(gòu),釋放推理效率:通過(guò)引入混合線性架構(gòu),模型從底層優(yōu)化計(jì)算效率。在4卡H20條件下,推理速度最快可達(dá)340 tokens/s,Prefill吞吐達(dá)到Nemotron-3-Super的2.2倍。

2、token效率優(yōu)化,提升智效比:訓(xùn)練過(guò)程中對(duì)token效率進(jìn)行針對(duì)性校準(zhǔn),力求以更精簡(jiǎn)輸出完成目標(biāo)。在Artificial Analysis完整評(píng)測(cè)中,Ling-2.6-flash僅消耗15M tokens,約為Nemotron-3-Super等模型的1/10。

3、面向Agent場(chǎng)景定向增強(qiáng):針對(duì)工具調(diào)用、多步規(guī)劃與任務(wù)執(zhí)行能力持續(xù)打磨。在BFCL-V4、TAU2-bench、SWE-bench Verified、Claw-Eval、PinchBench等評(píng)測(cè)中,即使面對(duì)激活參數(shù)更大的模型,依然取得相近甚至SOTA級(jí)別的表現(xiàn)。

從智東西上周對(duì)該模型的實(shí)測(cè)來(lái)看,其在執(zhí)行速度、指令響應(yīng)、前端原型開發(fā)與長(zhǎng)文件處理上表現(xiàn)高效,Agent規(guī)劃與工具調(diào)用能力較強(qiáng),但在項(xiàng)目級(jí)應(yīng)用開發(fā)上仍有局限??傮w而言,這是一款在輕量級(jí)、高頻任務(wù)中具有優(yōu)勢(shì)的高效模型。


▲智東西用該模型接入類OpenClaw產(chǎn)品生成泰國(guó)7日游攻略網(wǎng)站

Ling-2.6-flash將在OpenRouter與官方平臺(tái)同步提供一周免費(fèi)API調(diào)用。

官方免費(fèi)期結(jié)束后,平臺(tái)仍將提供每日50萬(wàn)tokens免費(fèi)額度;超出部分按量計(jì)費(fèi):輸入0.6元/百萬(wàn)tokens,輸出1.8元/百萬(wàn)tokens。模型的BF16、FP8、INT4等版本也將于近期開源。

OpenRouter體驗(yàn)地址:
https://openrouter.ai/inclusionai/ling-2.6-flash:free

Ling-2.6-flash官方體驗(yàn)及API地址:
https://ling.tbox.cn/chat


一、實(shí)測(cè):秒級(jí)響應(yīng)、指哪打哪,幾十分鐘產(chǎn)出百萬(wàn)字長(zhǎng)篇

智東西在體驗(yàn)中首先嘗試了一些編程小項(xiàng)目,發(fā)現(xiàn)其響應(yīng)速度和Agent工具調(diào)用能力較強(qiáng)。

首先是一個(gè)網(wǎng)站,這主要考察模型的前端能力。拿到開發(fā)任務(wù)后,該模型對(duì)網(wǎng)站的幾個(gè)核心組件進(jìn)行了規(guī)劃,并主動(dòng)為這一網(wǎng)站加入了明暗模式切換、移動(dòng)端響應(yīng)式設(shè)計(jì)等我們并未要求的功能,最終耗時(shí)1分鐘左右完成開發(fā)。


當(dāng)我們要求它將網(wǎng)站的主色調(diào)改成綠色后,該模型用不到10秒鐘就完成了修改,其他大部分模型在處理修改任務(wù)時(shí)往往需要通讀上下文,逐一修改,花上幾分鐘。

而它基本做到了指哪兒打哪兒,這對(duì)于一些快速、高頻的網(wǎng)站調(diào)試需求是很實(shí)用的。


我們也試了試它有沒(méi)有打造項(xiàng)目級(jí)任務(wù)的能力,讓它根據(jù)自己的內(nèi)部知識(shí),復(fù)刻一個(gè)支付軟件。我們是在Kilo Code插件中體驗(yàn)的模型編程,由該模型驅(qū)動(dòng)的多個(gè)子Agent并行工作,進(jìn)一步放大了它的輸出速度優(yōu)勢(shì),但是其最終打造的結(jié)果僅能算是一個(gè)原型。這種表現(xiàn)可能與其較小的參數(shù)量有關(guān)。


(更多體驗(yàn)案例移步→《匿名模型“大象”攪局OpenRouter:100B參數(shù)沖到熱榜第一,實(shí)測(cè)結(jié)果如何》)

螞蟻官方也公布了一些Ling-2.6-flash的實(shí)戰(zhàn)演示:

在代碼場(chǎng)景,以網(wǎng)頁(yè)生成為例,Ling-2.6-flash兼具高審美表達(dá)與高速代碼生成能力,能準(zhǔn)確調(diào)用前端組件與圖標(biāo)庫(kù),適合單頁(yè)面演示和原型制作中的快速驗(yàn)證。

其INT4量化版本可在DGX Spark上運(yùn)行,下面視頻為基于Ling-2.6-flash&DGX Spark 構(gòu)建業(yè)界SOTA Hermes一體機(jī)教程。

Ling-2.6-flash結(jié)合Kilo Code可將視覺(jué)指令快速轉(zhuǎn)化為高質(zhì)量界面,勝任個(gè)性化視覺(jué)風(fēng)格生成、報(bào)刊級(jí)排版及周刊、報(bào)告等辦公內(nèi)容的即時(shí)生成。

在文本場(chǎng)景,Ling-2.6-flash僅憑Prompt即可勝任多步驟文本任務(wù)執(zhí)行,在指令遵循、文風(fēng)調(diào)整與實(shí)時(shí)生成方面表現(xiàn)突出。

在Agent工具調(diào)用場(chǎng)景,該模型具備強(qiáng)大的上下文檢索、工具調(diào)用與高速響應(yīng)能力,適合復(fù)雜信息處理與知識(shí)增強(qiáng)場(chǎng)景。

基于Ling-2.6-flash,長(zhǎng)篇寫作助手autonovel可覆蓋世界觀設(shè)定、角色構(gòu)建、大綱生成到正文創(chuàng)作的全流程,以200+ tokens/s的生成速度,僅需幾十分鐘即可產(chǎn)出百萬(wàn)字長(zhǎng)稿。

在需求整理和排期等真實(shí)工作場(chǎng)景中,Ling-2.6-flash能穩(wěn)定參與信息檢索、任務(wù)拆解、內(nèi)容處理與工具協(xié)同,具備較低的幻覺(jué)率與較高的結(jié)果可用性。

二、架構(gòu)升級(jí):推理吞吐最高提升4倍

Ling-2.6-flash延用了Ling 2.5的模型架構(gòu)設(shè)計(jì):在Ling 2.0架構(gòu)基礎(chǔ)上引入混合線性注意力機(jī)制,通過(guò)增量訓(xùn)練將GQA注意力機(jī)制升級(jí)為1:7的MLA+Lightning Linear高效混合架構(gòu)。


得益于混合注意力機(jī)制與高度稀疏化的MoE架構(gòu),Ling-2.6-flash在推理效率上優(yōu)勢(shì)顯著。與同尺寸級(jí)別的主流SOTA模型相比,首字響應(yīng)更快,長(zhǎng)輸出場(chǎng)景下的生成效率更高,Prefill吞吐與Decode吞吐最高均可達(dá)到約4倍提升。隨著上下文長(zhǎng)度和生成長(zhǎng)度增加,吞吐優(yōu)勢(shì)進(jìn)一步放大。



在預(yù)訓(xùn)練階段,團(tuán)隊(duì)通過(guò)大規(guī)模算子融合提升訓(xùn)練效率;推理側(cè)則圍繞真實(shí)部署場(chǎng)景深度適配,使融合算子在融合粒度、實(shí)現(xiàn)路徑與數(shù)值行為上盡可能與訓(xùn)練側(cè)保持一致。相關(guān)推理算子將隨linghe陸續(xù)開源。

針對(duì)不同精度場(chǎng)景,推理鏈路進(jìn)行了系統(tǒng)性優(yōu)化:

BF16推理:實(shí)現(xiàn)QK Norm+RoPE、Group RMSNorm+Sigmoid Gate等關(guān)鍵算子深度融合,MoE Router GEMM與LM Head GEMM采用BF16 Input+FP32 Output計(jì)算方式。

FP8推理:進(jìn)一步融合RMSNorm、SwiGLU與量化算子,針對(duì)小Batch Size引入Split-K的Blockwise FP8 GEMM,以此帶來(lái)更高的系統(tǒng)吞吐、單用戶TPS、更短的等待時(shí)間,以及在真實(shí)交互場(chǎng)景下更穩(wěn)定、更流暢的使用體驗(yàn)。


在Artificial Analysis榜單的Output Speed維度測(cè)評(píng)中,Ling-2.6-flash以215 tokens/s的輸出速度處于第一梯隊(duì)。


三、更優(yōu)性能,token消耗僅為同行十分之一

在Artificial Analysis的Intelligence vs. Output tokens對(duì)比中,Ling-2.6-flash展現(xiàn)了突出的token效率優(yōu)勢(shì):以15M output tokens實(shí)現(xiàn)了26分的Intelligence Index,在保持較強(qiáng)智能水平的同時(shí)將輸出消耗控制在相對(duì)更低的位置。相比部分依賴更長(zhǎng)輸出換取更高分?jǐn)?shù)的模型,它在“智能表現(xiàn)”與“輸出成本”之間取得了更優(yōu)平衡。

對(duì)于開發(fā)者和企業(yè)場(chǎng)景而言,這種能力帶來(lái)的價(jià)值可能是更低的推理開銷、更快的首字響應(yīng)、更短的整體生成時(shí)延,以及更流暢的交互體驗(yàn)。


▲基于AA榜單的官方測(cè)評(píng)分?jǐn)?shù)繪制

從token消耗看,在 Artificial Analysis Intelligence Index 的完整評(píng)測(cè)中,Ling-2.6-flash的總消耗僅為15M tokens,而Nemotron-3-Super等模型達(dá)到或超過(guò)110M tokens——僅用約1/10的token消耗完成同類評(píng)測(cè)任務(wù),智效比更高。


四、強(qiáng)化學(xué)習(xí)特訓(xùn):Agent能力對(duì)標(biāo)SOTA

為增強(qiáng)模型Agent能力,團(tuán)隊(duì)顯著擴(kuò)展了Ling-2.6-flash訓(xùn)練數(shù)據(jù)的難度與廣度,依托自研的大規(guī)模高保真交互環(huán)境,進(jìn)行了針對(duì)性的General Agent與Coding Agent強(qiáng)化學(xué)習(xí)(RL)訓(xùn)練。

模型在指令遵循、工具調(diào)用、多步規(guī)劃及長(zhǎng)程執(zhí)行方面表現(xiàn)提升顯著,在BFCL-V4、TAU2-bench、SWE-bench Verified、PinchBench等榜單上表現(xiàn)優(yōu)異。通過(guò)RL優(yōu)化泛化性與穩(wěn)定性,在Claude Code、Kilo Code、Qwen Code、Hermes Agent、OpenClaw等框架中均展現(xiàn)了良好的使用體驗(yàn)。

此外,Ling-2.6-flash在通用知識(shí)、數(shù)學(xué)推理、指令遵循及長(zhǎng)文本解析等維度保持優(yōu)秀水準(zhǔn),各項(xiàng)指標(biāo)對(duì)齊同尺寸SOTA模型。


結(jié)語(yǔ):部分高復(fù)雜度場(chǎng)景受限,將繼續(xù)探索智效比邊界

經(jīng)過(guò)一周的持續(xù)迭代和優(yōu)化,Ling-2.6-flash在Agent場(chǎng)景的泛化性和穩(wěn)定性方面獲得進(jìn)一步提升。

Ling-2.6-flash在工具調(diào)用、多步規(guī)劃與長(zhǎng)程任務(wù)執(zhí)行等關(guān)鍵維度上實(shí)現(xiàn)了明顯提升。但百靈團(tuán)隊(duì)坦言,部分高復(fù)雜度場(chǎng)景中,受限于推理深度,模型仍可能出現(xiàn)一定的工具幻覺(jué);此外,在中英雙語(yǔ)自然切換、復(fù)雜指令遵循等方面仍有優(yōu)化空間。

該模型后續(xù)迭代將繼續(xù)探索智效比的更優(yōu)邊界,在保持高效推理特性的同時(shí),進(jìn)一步推動(dòng)智能產(chǎn)出質(zhì)量與token效率之間的深度平衡。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
美國(guó)國(guó)務(wù)院宣布:批準(zhǔn)向以色列、阿聯(lián)酋、卡塔爾和科威特的86億美元巨額軍售!且不需國(guó)會(huì)審查

美國(guó)國(guó)務(wù)院宣布:批準(zhǔn)向以色列、阿聯(lián)酋、卡塔爾和科威特的86億美元巨額軍售!且不需國(guó)會(huì)審查

魯中晨報(bào)
2026-05-02 18:03:06
聞泰科技“帶帽”首日一字跌停 封單超41億元

聞泰科技“帶帽”首日一字跌停 封單超41億元

財(cái)聞
2026-05-06 11:08:36
1992年,陸定一問(wèn)秦川:如果黨的一把手腐敗了,那么該由誰(shuí)來(lái)管?

1992年,陸定一問(wèn)秦川:如果黨的一把手腐敗了,那么該由誰(shuí)來(lái)管?

阿器談史
2026-04-26 14:13:38
新西蘭鄰國(guó)HIV爆發(fā)!感染方式太瘋狂,“像野火一樣蔓延,已成國(guó)家危機(jī)”

新西蘭鄰國(guó)HIV爆發(fā)!感染方式太瘋狂,“像野火一樣蔓延,已成國(guó)家危機(jī)”

發(fā)現(xiàn)新西蘭
2026-05-06 13:20:33
提鞋都不配?國(guó)米名宿無(wú)情貶低槍手邊后衛(wèi) 認(rèn)為他跟廷貝爾差太遠(yuǎn)

提鞋都不配?國(guó)米名宿無(wú)情貶低槍手邊后衛(wèi) 認(rèn)為他跟廷貝爾差太遠(yuǎn)

雪狼侃體育
2026-05-06 19:18:33
蔣介石在他的日記里坦言:重慶談判時(shí)放走毛澤東,全是因?yàn)檫@2點(diǎn)

蔣介石在他的日記里坦言:重慶談判時(shí)放走毛澤東,全是因?yàn)檫@2點(diǎn)

倫倫媽愛(ài)歷史
2026-05-02 10:01:48
斯洛伐克擬派F-16戰(zhàn)機(jī)參加北約防空任務(wù),從2028年起計(jì)劃參與北約輪換式防空任務(wù),并將為此部署兩套來(lái)自以色列的Barak MX防空系統(tǒng)

斯洛伐克擬派F-16戰(zhàn)機(jī)參加北約防空任務(wù),從2028年起計(jì)劃參與北約輪換式防空任務(wù),并將為此部署兩套來(lái)自以色列的Barak MX防空系統(tǒng)

魯中晨報(bào)
2026-05-06 19:54:03
1938年,彭德懷和蔣介石的合影,看兩人的衣服,就知道不是一路人

1938年,彭德懷和蔣介石的合影,看兩人的衣服,就知道不是一路人

興趣知識(shí)
2026-05-05 17:43:16
牛皮吹得沒(méi)邊了,某國(guó)產(chǎn)車企要沖擊2000萬(wàn)輛,這是要碾壓豐田么?

牛皮吹得沒(méi)邊了,某國(guó)產(chǎn)車企要沖擊2000萬(wàn)輛,這是要碾壓豐田么?

柏銘銳談
2026-05-04 20:40:53
小鹿好局痛失,淚灑賽場(chǎng),中韓女團(tuán)五強(qiáng)對(duì)決,韓國(guó)3:1獲勝

小鹿好局痛失,淚灑賽場(chǎng),中韓女團(tuán)五強(qiáng)對(duì)決,韓國(guó)3:1獲勝

月滿大江流
2026-05-06 16:58:31
妻子升副局長(zhǎng)跟我離婚,半年后我去開會(huì),見她在門口等我2小時(shí)

妻子升副局長(zhǎng)跟我離婚,半年后我去開會(huì),見她在門口等我2小時(shí)

千秋文化
2026-03-25 21:49:57
估值數(shù)億美元,A.O.史密斯中國(guó)要賣了

估值數(shù)億美元,A.O.史密斯中國(guó)要賣了

融資中國(guó)
2026-05-05 09:59:32
以色列死局已定,無(wú)人能救!

以色列死局已定,無(wú)人能救!

大國(guó)觀察眼
2026-04-28 06:05:05
賈斯汀·比伯:一場(chǎng)音樂(lè)節(jié)如何讓播放量暴漲18倍

賈斯汀·比伯:一場(chǎng)音樂(lè)節(jié)如何讓播放量暴漲18倍

熱搜摘要官
2026-05-05 18:09:18
內(nèi)部人士爆料:東契奇赴西班牙療傷純屬假消息,歐洲之行另有原因

內(nèi)部人士爆料:東契奇赴西班牙療傷純屬假消息,歐洲之行另有原因

夜白侃球
2026-05-06 15:19:02
伊斯蘭革命衛(wèi)隊(duì):如果美國(guó)再犯錯(cuò)誤,就燒毀報(bào)廢他們的巨型戰(zhàn)艦!

伊斯蘭革命衛(wèi)隊(duì):如果美國(guó)再犯錯(cuò)誤,就燒毀報(bào)廢他們的巨型戰(zhàn)艦!

混沌錄
2026-04-30 00:12:11
“最美港姐”上浪姐一夜爆火!網(wǎng)友:完全是真人版迪士尼在逃公主……

“最美港姐”上浪姐一夜爆火!網(wǎng)友:完全是真人版迪士尼在逃公主……

美芽
2026-05-06 18:30:49
森林狼主帥:文班至少4個(gè)蓋帽是干擾球 沒(méi)必要申訴那是浪費(fèi)時(shí)間

森林狼主帥:文班至少4個(gè)蓋帽是干擾球 沒(méi)必要申訴那是浪費(fèi)時(shí)間

羅說(shuō)NBA
2026-05-06 05:52:40
官宣:杰倫·布朗因公開批評(píng)裁判將被處以5萬(wàn)美元罰款

官宣:杰倫·布朗因公開批評(píng)裁判將被處以5萬(wàn)美元罰款

北青網(wǎng)-北京青年報(bào)
2026-05-06 19:59:03
吳宜澤:奧沙利文在決賽關(guān)鍵時(shí)刻給我發(fā)短信,讓我試著打出自己的風(fēng)格

吳宜澤:奧沙利文在決賽關(guān)鍵時(shí)刻給我發(fā)短信,讓我試著打出自己的風(fēng)格

懂球帝
2026-05-05 21:25:07
2026-05-06 20:35:00
智東西 incentive-icons
智東西
智東西,AI產(chǎn)業(yè)新媒體,專注報(bào)道人工智能的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來(lái)的千行百業(yè)產(chǎn)業(yè)變革。
11749文章數(shù) 117061關(guān)注度
往期回顧 全部

科技要聞

“馬斯克不懂AI”:OpenAI當(dāng)庭戳老底

頭條要聞

中國(guó)發(fā)布阻斷禁令后魯比奧聲稱將二次制裁 外交部回應(yīng)

頭條要聞

中國(guó)發(fā)布阻斷禁令后魯比奧聲稱將二次制裁 外交部回應(yīng)

體育要聞

活塞1比0騎士:坎寧安不再是一個(gè)人了

娛樂(lè)要聞

神仙友誼!楊紫連續(xù)10年為張一山慶生

財(cái)經(jīng)要聞

最新GDP!全國(guó)30強(qiáng)城市,又變了

汽車要聞

領(lǐng)克10/領(lǐng)克10+ 無(wú)論能源形式 領(lǐng)克都要快樂(lè)

態(tài)度原創(chuàng)

本地
時(shí)尚
游戲
教育
公開課

本地新聞

用青花瓷的方式,打開西溪濕地

夏天的白裙,可以像赫本那樣穿

《生化危機(jī)9》大量廢案曝光 里昂有8項(xiàng)身體強(qiáng)化

教育要聞

點(diǎn)贊!這些北京學(xué)子登上《人民日?qǐng)?bào)》

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版