国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

匿名大象模型被螞蟻認(rèn)領(lǐng)!推理速度沖到第一,還能生成百萬(wàn)小說(shuō)

0
分享至


智東西
作者 李水青
編輯 心緣

智東西4月22日?qǐng)?bào)道,上周沖上OpenRouter熱榜(Trending)第一的匿名測(cè)試模型Elephant Alpha今早正式揭曉真身——螞蟻旗下的百靈模型Ling-2.6-flash。


匿名上線(xiàn)以來(lái),該模型調(diào)用量持續(xù)增長(zhǎng),連續(xù)多日位列熱榜榜首,日均tokens調(diào)用量達(dá)100B級(jí)別。不少網(wǎng)友試用后表示印象深刻,有人稱(chēng)這是“用過(guò)最快的模型”“token效率很高”。

螞蟻今日宣布正式推出Ling-2.6-flash。該模型總參數(shù)量104B,激活參數(shù)7.4B,為Instruct模型。如下圖所示,該模型在Agent相關(guān)基準(zhǔn)上達(dá)到同尺寸SOTA水平,并在其他核心能力上表現(xiàn)出色。


Ling-2.6-flash追求的是在控制token消耗的前提下,保持對(duì)Agent任務(wù)的強(qiáng)競(jìng)爭(zhēng)力,主要具備以下三大核心能力:

1、混合線(xiàn)性架構(gòu),釋放推理效率:通過(guò)引入混合線(xiàn)性架構(gòu),模型從底層優(yōu)化計(jì)算效率。在4卡H20條件下,推理速度最快可達(dá)340 tokens/s,Prefill吞吐達(dá)到Nemotron-3-Super的2.2倍。

2、token效率優(yōu)化,提升智效比:訓(xùn)練過(guò)程中對(duì)token效率進(jìn)行針對(duì)性校準(zhǔn),力求以更精簡(jiǎn)輸出完成目標(biāo)。在Artificial Analysis完整評(píng)測(cè)中,Ling-2.6-flash僅消耗15M tokens,約為Nemotron-3-Super等模型的1/10。

3、面向Agent場(chǎng)景定向增強(qiáng):針對(duì)工具調(diào)用、多步規(guī)劃與任務(wù)執(zhí)行能力持續(xù)打磨。在BFCL-V4、TAU2-bench、SWE-bench Verified、Claw-Eval、PinchBench等評(píng)測(cè)中,即使面對(duì)激活參數(shù)更大的模型,依然取得相近甚至SOTA級(jí)別的表現(xiàn)。

從智東西上周對(duì)該模型的實(shí)測(cè)來(lái)看,其在執(zhí)行速度、指令響應(yīng)、前端原型開(kāi)發(fā)與長(zhǎng)文件處理上表現(xiàn)高效,Agent規(guī)劃與工具調(diào)用能力較強(qiáng),但在項(xiàng)目級(jí)應(yīng)用開(kāi)發(fā)上仍有局限。總體而言,這是一款在輕量級(jí)、高頻任務(wù)中具有優(yōu)勢(shì)的高效模型。


▲智東西用該模型接入類(lèi)OpenClaw產(chǎn)品生成泰國(guó)7日游攻略網(wǎng)站

Ling-2.6-flash將在OpenRouter與官方平臺(tái)同步提供一周免費(fèi)API調(diào)用。

官方免費(fèi)期結(jié)束后,平臺(tái)仍將提供每日50萬(wàn)tokens免費(fèi)額度;超出部分按量計(jì)費(fèi):輸入0.6元/百萬(wàn)tokens,輸出1.8元/百萬(wàn)tokens。模型的BF16、FP8、INT4等版本也將于近期開(kāi)源。

OpenRouter體驗(yàn)地址:
https://openrouter.ai/inclusionai/ling-2.6-flash:free

Ling-2.6-flash官方體驗(yàn)及API地址:
https://ling.tbox.cn/chat


一、實(shí)測(cè):秒級(jí)響應(yīng)、指哪打哪,幾十分鐘產(chǎn)出百萬(wàn)字長(zhǎng)篇

智東西在體驗(yàn)中首先嘗試了一些編程小項(xiàng)目,發(fā)現(xiàn)其響應(yīng)速度和Agent工具調(diào)用能力較強(qiáng)。

首先是一個(gè)網(wǎng)站,這主要考察模型的前端能力。拿到開(kāi)發(fā)任務(wù)后,該模型對(duì)網(wǎng)站的幾個(gè)核心組件進(jìn)行了規(guī)劃,并主動(dòng)為這一網(wǎng)站加入了明暗模式切換、移動(dòng)端響應(yīng)式設(shè)計(jì)等我們并未要求的功能,最終耗時(shí)1分鐘左右完成開(kāi)發(fā)。


當(dāng)我們要求它將網(wǎng)站的主色調(diào)改成綠色后,該模型用不到10秒鐘就完成了修改,其他大部分模型在處理修改任務(wù)時(shí)往往需要通讀上下文,逐一修改,花上幾分鐘。

而它基本做到了指哪兒打哪兒,這對(duì)于一些快速、高頻的網(wǎng)站調(diào)試需求是很實(shí)用的。


我們也試了試它有沒(méi)有打造項(xiàng)目級(jí)任務(wù)的能力,讓它根據(jù)自己的內(nèi)部知識(shí),復(fù)刻一個(gè)支付軟件。我們是在Kilo Code插件中體驗(yàn)的模型編程,由該模型驅(qū)動(dòng)的多個(gè)子Agent并行工作,進(jìn)一步放大了它的輸出速度優(yōu)勢(shì),但是其最終打造的結(jié)果僅能算是一個(gè)原型。這種表現(xiàn)可能與其較小的參數(shù)量有關(guān)。


(更多體驗(yàn)案例移步→《匿名模型“大象”攪局OpenRouter:100B參數(shù)沖到熱榜第一,實(shí)測(cè)結(jié)果如何》)

螞蟻官方也公布了一些Ling-2.6-flash的實(shí)戰(zhàn)演示:

在代碼場(chǎng)景,以網(wǎng)頁(yè)生成為例,Ling-2.6-flash兼具高審美表達(dá)與高速代碼生成能力,能準(zhǔn)確調(diào)用前端組件與圖標(biāo)庫(kù),適合單頁(yè)面演示和原型制作中的快速驗(yàn)證。

其INT4量化版本可在DGX Spark上運(yùn)行,下面視頻為基于Ling-2.6-flash&DGX Spark 構(gòu)建業(yè)界SOTA Hermes一體機(jī)教程。

Ling-2.6-flash結(jié)合Kilo Code可將視覺(jué)指令快速轉(zhuǎn)化為高質(zhì)量界面,勝任個(gè)性化視覺(jué)風(fēng)格生成、報(bào)刊級(jí)排版及周刊、報(bào)告等辦公內(nèi)容的即時(shí)生成。

在文本場(chǎng)景,Ling-2.6-flash僅憑Prompt即可勝任多步驟文本任務(wù)執(zhí)行,在指令遵循、文風(fēng)調(diào)整與實(shí)時(shí)生成方面表現(xiàn)突出。

在Agent工具調(diào)用場(chǎng)景,該模型具備強(qiáng)大的上下文檢索、工具調(diào)用與高速響應(yīng)能力,適合復(fù)雜信息處理與知識(shí)增強(qiáng)場(chǎng)景。

基于Ling-2.6-flash,長(zhǎng)篇寫(xiě)作助手autonovel可覆蓋世界觀設(shè)定、角色構(gòu)建、大綱生成到正文創(chuàng)作的全流程,以200+ tokens/s的生成速度,僅需幾十分鐘即可產(chǎn)出百萬(wàn)字長(zhǎng)稿。

在需求整理和排期等真實(shí)工作場(chǎng)景中,Ling-2.6-flash能穩(wěn)定參與信息檢索、任務(wù)拆解、內(nèi)容處理與工具協(xié)同,具備較低的幻覺(jué)率與較高的結(jié)果可用性。

二、架構(gòu)升級(jí):推理吞吐最高提升4倍

Ling-2.6-flash延用了Ling 2.5的模型架構(gòu)設(shè)計(jì):在Ling 2.0架構(gòu)基礎(chǔ)上引入混合線(xiàn)性注意力機(jī)制,通過(guò)增量訓(xùn)練將GQA注意力機(jī)制升級(jí)為1:7的MLA+Lightning Linear高效混合架構(gòu)。


得益于混合注意力機(jī)制與高度稀疏化的MoE架構(gòu),Ling-2.6-flash在推理效率上優(yōu)勢(shì)顯著。與同尺寸級(jí)別的主流SOTA模型相比,首字響應(yīng)更快,長(zhǎng)輸出場(chǎng)景下的生成效率更高,Prefill吞吐與Decode吞吐最高均可達(dá)到約4倍提升。隨著上下文長(zhǎng)度和生成長(zhǎng)度增加,吞吐優(yōu)勢(shì)進(jìn)一步放大。



在預(yù)訓(xùn)練階段,團(tuán)隊(duì)通過(guò)大規(guī)模算子融合提升訓(xùn)練效率;推理側(cè)則圍繞真實(shí)部署場(chǎng)景深度適配,使融合算子在融合粒度、實(shí)現(xiàn)路徑與數(shù)值行為上盡可能與訓(xùn)練側(cè)保持一致。相關(guān)推理算子將隨linghe陸續(xù)開(kāi)源。

針對(duì)不同精度場(chǎng)景,推理鏈路進(jìn)行了系統(tǒng)性?xún)?yōu)化:

BF16推理:實(shí)現(xiàn)QK Norm+RoPE、Group RMSNorm+Sigmoid Gate等關(guān)鍵算子深度融合,MoE Router GEMM與LM Head GEMM采用BF16 Input+FP32 Output計(jì)算方式。

FP8推理:進(jìn)一步融合RMSNorm、SwiGLU與量化算子,針對(duì)小Batch Size引入Split-K的Blockwise FP8 GEMM,以此帶來(lái)更高的系統(tǒng)吞吐、單用戶(hù)TPS、更短的等待時(shí)間,以及在真實(shí)交互場(chǎng)景下更穩(wěn)定、更流暢的使用體驗(yàn)。


在Artificial Analysis榜單的Output Speed維度測(cè)評(píng)中,Ling-2.6-flash以215 tokens/s的輸出速度處于第一梯隊(duì)。


三、更優(yōu)性能,token消耗僅為同行十分之一

在Artificial Analysis的Intelligence vs. Output tokens對(duì)比中,Ling-2.6-flash展現(xiàn)了突出的token效率優(yōu)勢(shì):以15M output tokens實(shí)現(xiàn)了26分的Intelligence Index,在保持較強(qiáng)智能水平的同時(shí)將輸出消耗控制在相對(duì)更低的位置。相比部分依賴(lài)更長(zhǎng)輸出換取更高分?jǐn)?shù)的模型,它在“智能表現(xiàn)”與“輸出成本”之間取得了更優(yōu)平衡。

對(duì)于開(kāi)發(fā)者和企業(yè)場(chǎng)景而言,這種能力帶來(lái)的價(jià)值可能是更低的推理開(kāi)銷(xiāo)、更快的首字響應(yīng)、更短的整體生成時(shí)延,以及更流暢的交互體驗(yàn)。


▲基于AA榜單的官方測(cè)評(píng)分?jǐn)?shù)繪制

從token消耗看,在 Artificial Analysis Intelligence Index 的完整評(píng)測(cè)中,Ling-2.6-flash的總消耗僅為15M tokens,而Nemotron-3-Super等模型達(dá)到或超過(guò)110M tokens——僅用約1/10的token消耗完成同類(lèi)評(píng)測(cè)任務(wù),智效比更高。


四、強(qiáng)化學(xué)習(xí)特訓(xùn):Agent能力對(duì)標(biāo)SOTA

為增強(qiáng)模型Agent能力,團(tuán)隊(duì)顯著擴(kuò)展了Ling-2.6-flash訓(xùn)練數(shù)據(jù)的難度與廣度,依托自研的大規(guī)模高保真交互環(huán)境,進(jìn)行了針對(duì)性的General Agent與Coding Agent強(qiáng)化學(xué)習(xí)(RL)訓(xùn)練。

模型在指令遵循、工具調(diào)用、多步規(guī)劃及長(zhǎng)程執(zhí)行方面表現(xiàn)提升顯著,在BFCL-V4、TAU2-bench、SWE-bench Verified、PinchBench等榜單上表現(xiàn)優(yōu)異。通過(guò)RL優(yōu)化泛化性與穩(wěn)定性,在Claude Code、Kilo Code、Qwen Code、Hermes Agent、OpenClaw等框架中均展現(xiàn)了良好的使用體驗(yàn)。

此外,Ling-2.6-flash在通用知識(shí)、數(shù)學(xué)推理、指令遵循及長(zhǎng)文本解析等維度保持優(yōu)秀水準(zhǔn),各項(xiàng)指標(biāo)對(duì)齊同尺寸SOTA模型。


結(jié)語(yǔ):部分高復(fù)雜度場(chǎng)景受限,將繼續(xù)探索智效比邊界

經(jīng)過(guò)一周的持續(xù)迭代和優(yōu)化,Ling-2.6-flash在Agent場(chǎng)景的泛化性和穩(wěn)定性方面獲得進(jìn)一步提升。

Ling-2.6-flash在工具調(diào)用、多步規(guī)劃與長(zhǎng)程任務(wù)執(zhí)行等關(guān)鍵維度上實(shí)現(xiàn)了明顯提升。但百靈團(tuán)隊(duì)坦言,部分高復(fù)雜度場(chǎng)景中,受限于推理深度,模型仍可能出現(xiàn)一定的工具幻覺(jué);此外,在中英雙語(yǔ)自然切換、復(fù)雜指令遵循等方面仍有優(yōu)化空間。

該模型后續(xù)迭代將繼續(xù)探索智效比的更優(yōu)邊界,在保持高效推理特性的同時(shí),進(jìn)一步推動(dòng)智能產(chǎn)出質(zhì)量與token效率之間的深度平衡。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
十五部門(mén):加強(qiáng)青年婚戀觀引導(dǎo),深入實(shí)施育兒補(bǔ)貼制度,探索住房、出行、消費(fèi)等多領(lǐng)域聯(lián)動(dòng)的生育支持政策

十五部門(mén):加強(qiáng)青年婚戀觀引導(dǎo),深入實(shí)施育兒補(bǔ)貼制度,探索住房、出行、消費(fèi)等多領(lǐng)域聯(lián)動(dòng)的生育支持政策

每日經(jīng)濟(jì)新聞
2026-04-22 15:16:09
10-6!韋克林進(jìn)16強(qiáng),小將錯(cuò)失百萬(wàn)獎(jiǎng)金,塞爾比對(duì)手單局被罰20分

10-6!韋克林進(jìn)16強(qiáng),小將錯(cuò)失百萬(wàn)獎(jiǎng)金,塞爾比對(duì)手單局被罰20分

劉姚堯的文字城堡
2026-04-22 20:16:16
長(zhǎng)沙市天心區(qū)人民法院審判委員會(huì)原專(zhuān)職委員、四級(jí)高級(jí)法官尹利民被查

長(zhǎng)沙市天心區(qū)人民法院審判委員會(huì)原專(zhuān)職委員、四級(jí)高級(jí)法官尹利民被查

三湘都市報(bào)
2026-04-22 17:05:16
東風(fēng)導(dǎo)彈泄密案!間諜郭萬(wàn)鈞一家三口,全部被處以死刑

東風(fēng)導(dǎo)彈泄密案!間諜郭萬(wàn)鈞一家三口,全部被處以死刑

番外行
2026-03-31 08:28:28
空軍司令王海上將專(zhuān)門(mén)看望吳法憲:謝謝當(dāng)年的保護(hù)

空軍司令王海上將專(zhuān)門(mén)看望吳法憲:謝謝當(dāng)年的保護(hù)

文史茶館2020
2026-04-22 10:56:11
空軍全軍覆沒(méi)?伊朗突亮地下底牌!美以傻眼了,就這樣被騙幾十億

空軍全軍覆沒(méi)?伊朗突亮地下底牌!美以傻眼了,就這樣被騙幾十億

琨玉秋霜
2026-04-21 00:11:13
爆料瘋傳,中南醫(yī)院“王護(hù)士長(zhǎng)”被扒,她到底有沒(méi)有問(wèn)題??!

爆料瘋傳,中南醫(yī)院“王護(hù)士長(zhǎng)”被扒,她到底有沒(méi)有問(wèn)題??!

鬼菜生活
2026-04-22 18:11:04
白鹿北京的家餐桌要30000元,親自下廚給助理吃,自己卻不吃晚飯

白鹿北京的家餐桌要30000元,親自下廚給助理吃,自己卻不吃晚飯

椰黃娛樂(lè)
2026-04-22 11:09:10
新款本田思域上市 現(xiàn)時(shí)售9.79萬(wàn)元起

新款本田思域上市 現(xiàn)時(shí)售9.79萬(wàn)元起

太平洋汽車(chē)
2026-04-22 17:44:34
網(wǎng)友爸爸2年前垃圾堆里撿回72條32GB DDR4內(nèi)存:如今價(jià)值近14萬(wàn)

網(wǎng)友爸爸2年前垃圾堆里撿回72條32GB DDR4內(nèi)存:如今價(jià)值近14萬(wàn)

快科技
2026-04-20 10:51:04
蘋(píng)果換CEO原因:庫(kù)克不夠果斷、搞垮了Vision Pro、汽車(chē)等項(xiàng)目

蘋(píng)果換CEO原因:庫(kù)克不夠果斷、搞垮了Vision Pro、汽車(chē)等項(xiàng)目

Switch2來(lái)了
2026-04-22 17:00:33
這才是宋美齡和繼子蔣經(jīng)國(guó)的一張真實(shí)合影,都是真人的容貌

這才是宋美齡和繼子蔣經(jīng)國(guó)的一張真實(shí)合影,都是真人的容貌

喜歡歷史的阿繁
2026-04-16 11:17:28
許家印認(rèn)罪!2.4萬(wàn)億窟窿,家族只拿走500億,其余真金白銀去哪了

許家印認(rèn)罪!2.4萬(wàn)億窟窿,家族只拿走500億,其余真金白銀去哪了

混沌錄
2026-04-21 20:59:13
A股:今天突破4100了,做好準(zhǔn)備,明天周四行情分析!

A股:今天突破4100了,做好準(zhǔn)備,明天周四行情分析!

明心
2026-04-22 15:17:44
收拾完伊朗,下一個(gè)輪到中國(guó)?以色列發(fā)戰(zhàn)爭(zhēng)威脅,中方送出5個(gè)字

收拾完伊朗,下一個(gè)輪到中國(guó)?以色列發(fā)戰(zhàn)爭(zhēng)威脅,中方送出5個(gè)字

千羽解讀
2026-04-18 10:12:15
趙心童即便衛(wèi)冕成功也成不了世界第1!特魯姆普:大熱必死你小心

趙心童即便衛(wèi)冕成功也成不了世界第1!特魯姆普:大熱必死你小心

風(fēng)過(guò)鄉(xiāng)
2026-04-22 13:16:46
王清海教授:山楂的3個(gè)黃金組合,掃清血管“垃圾”,便宜又好用

王清海教授:山楂的3個(gè)黃金組合,掃清血管“垃圾”,便宜又好用

蠟筆小小子
2026-04-21 14:43:37
紅綠燈倒計(jì)時(shí)取消!全國(guó)推行新規(guī),以后過(guò)路口記住這1句話(huà)

紅綠燈倒計(jì)時(shí)取消!全國(guó)推行新規(guī),以后過(guò)路口記住這1句話(huà)

阿振觀點(diǎn)
2026-04-22 06:00:49
王治郅入選FIBA名人堂!入堂儀式發(fā)言:感謝國(guó)家和部隊(duì)培養(yǎng)

王治郅入選FIBA名人堂!入堂儀式發(fā)言:感謝國(guó)家和部隊(duì)培養(yǎng)

全景體育V
2026-04-22 07:04:26
賭狗的話(huà)能信嗎網(wǎng)友說(shuō)早些年百度貼吧有個(gè)戒賭吧是最大的一個(gè)貼吧

賭狗的話(huà)能信嗎網(wǎng)友說(shuō)早些年百度貼吧有個(gè)戒賭吧是最大的一個(gè)貼吧

侃神評(píng)故事
2026-04-22 17:25:03
2026-04-22 21:07:00
智東西 incentive-icons
智東西
智東西,AI產(chǎn)業(yè)新媒體,專(zhuān)注報(bào)道人工智能的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來(lái)的千行百業(yè)產(chǎn)業(yè)變革。
11668文章數(shù) 117037關(guān)注度
往期回顧 全部

科技要聞

對(duì)話(huà)梅濤:沒(méi)有視頻底座,具身智能走不遠(yuǎn)

頭條要聞

伊朗扣留兩艘船并強(qiáng)調(diào)"紅線(xiàn)" 責(zé)令美國(guó)釋放被扣貨船

頭條要聞

伊朗扣留兩艘船并強(qiáng)調(diào)"紅線(xiàn)" 責(zé)令美國(guó)釋放被扣貨船

體育要聞

網(wǎng)易傳媒再度簽約法國(guó)隊(duì)和阿根廷隊(duì)

娛樂(lè)要聞

復(fù)婚無(wú)望!baby黃曉明陪小海綿零交流

財(cái)經(jīng)要聞

醫(yī)院專(zhuān)家號(hào)"秒空"!警方牽出黑色產(chǎn)業(yè)鏈

汽車(chē)要聞

純電續(xù)航301km+激光雷達(dá) 宋Pro DM-i飛馳版9.99萬(wàn)起

態(tài)度原創(chuàng)

數(shù)碼
親子
健康
公開(kāi)課
軍事航空

數(shù)碼要聞

Beats發(fā)布3米USB-C數(shù)據(jù)線(xiàn):售229元 最高240W快充

親子要聞

素食飲食減緩衰老,根據(jù)一項(xiàng)新的雙胞胎研究

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普宣布延長(zhǎng)停火 伊朗表態(tài)

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版