国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Elephant走紅:AI開始為“Token浪費”算細賬

0
分享至

2026年春季,大模型行業(yè)的高燒似乎正在退去,取而代之的是一種近乎冷酷的理性。近日,《財經(jīng)》報道指出,全球企業(yè)級 AI 應(yīng)用中,約50%的Token正在被浪費。

浪費的原因很具體,AI應(yīng)用從“對話”轉(zhuǎn)向“執(zhí)行”,這些計算資源流向了較貴的大型旗艦?zāi)P?,Agent在復(fù)雜多輪任務(wù)中,歷史文件、對話會不斷累積,大量無用、冗余、過期的信息會不斷產(chǎn)生并且重復(fù)計算,Token消耗因此指數(shù)級增長。也就是說,企業(yè)和開發(fā)者在用最貴的車跑最短的路。

OpenRouter的流量數(shù)據(jù)反映了這個轉(zhuǎn)變:過去一個季度,旗艦級模型的調(diào)用占比在下降,100B–300B區(qū)間的模型調(diào)用量則明顯上升。以近日上線的100B 模型Elephant為例,單日流量暴漲500%,沖上熱榜榜首,成為OpenClaw等 Agent 最受歡迎的選型。開發(fā)者開始按任務(wù)類型分配模型,而不是一律用最頂配。這是工程理性回歸的信號,不是對旗艦?zāi)P偷姆穸ā?/p>



為什么現(xiàn)在才開始算這筆賬

幾年前,"選最強的模型"是最省心的工程決策。旗艦?zāi)P蛶缀踉谒腥蝿?wù)上都更好,成本問題還沒到逼人重新設(shè)計架構(gòu)的程度。

現(xiàn)在情況變了,Agent需要“執(zhí)行”大量工作。一個客服Agent處理一張工單,可能需要調(diào)用模型十幾次:理解意圖、查詢知識庫、判斷優(yōu)先級、生成回復(fù)、核查格式。如果同時有幾千張工單在處理,每天的調(diào)用量輕松進入百萬級別。在這種頻率下,每次調(diào)用多付的溢價開始在賬單上顯現(xiàn)。

今年3月,一位名為shelvenzhou的開發(fā)者在Github進行了一項基準測試,引發(fā)了廣泛討論。他記錄自己的OpenClaw日常工作(包括代碼、郵件、PDF、圖片、搜索等)Token消耗情況——第一輪對話Token成本0.0050美元;第五輪對話Token成本0.0665美元,是第一輪的13.3倍;第10輪的Token成本達到了0.13美元,是第一輪的26倍。

根據(jù)報道,《財經(jīng)》統(tǒng)計了GitHub上有關(guān)“Token Waste”相關(guān)Issues的數(shù)量。這一討論至少有5200個,僅2026年一季度就誕生了4150個。越來越多的開發(fā)者在實際業(yè)務(wù)中正面臨控制Token浪費的問題。


目前大多數(shù)Agent的工程實現(xiàn)還相當(dāng)粗糙。面對Agent的多步任務(wù),Token消耗以接近線性的速度增長,而其中大量內(nèi)容對當(dāng)前步驟毫無意義。這類問題催生了一個新的工程概念——Agent Harness,它不是模型本身,而是包裹在模型外部、負責(zé)管理上下文、編排工具調(diào)用、控制執(zhí)行生命周期的“韁繩”和“馬具”。

Token 效率因此形成了兩條并行的壓力線,一條來自 Agent 框架側(cè),Harness 的出現(xiàn)就是典型代表;另一條來自模型側(cè),推動廠商用更精簡的參數(shù)完成同等質(zhì)量的推理。


模型,向?qū)嵱弥髁x靠攏

在這場范式轉(zhuǎn)移中,一批深耕“token效率”的模型成為了舞臺中央的主角。它們不比拼參數(shù)規(guī)模,而是在單位Token成本下,比拼推理速度、指令遵循度以及長上下文的穩(wěn)定性。

根據(jù)OpenRouter 的 LLM Leaderboard在4月16日的數(shù)據(jù),模型格局呈現(xiàn)出明顯的“大模型控榜,小模型控場”的分化態(tài)勢。

在前20名的榜單中,傳統(tǒng)意義上的大尺寸旗艦?zāi)P停ㄈ鏑laude Opus 4.6、DeepSeek V3.2等),主要分布在榜單頭部和中上部,依然掌握著復(fù)雜任務(wù)的話語權(quán);而主打輕量化、高性價比的小尺寸模型(如Gemini 3 Flash、Grok 4.1 Fast、GPT-5.4 Nano等),且多集中在第 8 名至第 20 名的區(qū)間,形成了不可忽視的“腰部力量”。

可以明顯看到,小尺寸模型的漲幅驚人。根據(jù)4月16日數(shù)據(jù),排名第17位的 GPT-5.4 Nano以48%的驚人漲幅領(lǐng)跑增長榜,100B模型Elephant單日漲幅 38%。


從App使用情況來看,OpenClaw、Hermes Agent、Kilo Code、CLaude Code 等成為這些小尺寸模型的“最大流量貢獻”,開發(fā)者正在將小尺寸模型作為高頻、低延遲任務(wù)的首選。

在業(yè)界看來,100B-300B已然成為一個實用主義區(qū)間。GPT-5.4-Mini是目前這條路線的典型代表之一,以更低延遲和更低成本大幅縮小與旗艦?zāi)P偷男阅懿罹唷?/p>

OpenAI 此前著重強調(diào)了新模型在多模型分層系統(tǒng)中的位置:以其自研編程助手Codex為例,GPT-5.4負責(zé)規(guī)劃、協(xié)調(diào)與最終判斷,而GPT-5.4 mini子智能體則并行處理代碼庫檢索、大文件審閱及輔助文檔處理等粒度更細的子任務(wù)。

OpenAI表示,隨著小型模型速度更快、功能更強大,開發(fā)者無需使用單一模型處理所有任務(wù),而是可以構(gòu)建系統(tǒng),由大型模型負責(zé)決策,小型模型則快速大規(guī)模地執(zhí)行任務(wù)。這種分層調(diào)用的模式開始變得實用而非將就。

Elephant Alpha是另一個值得關(guān)注的案例,該模型于4月13日深夜上線 Openrouter。同為100B參數(shù),Elephant定位為“智能效率”優(yōu)先,在保持256K 上下文窗口的同時,重點優(yōu)化Token使用效率,適合代碼補全、快速文檔處理和輕量Agent交互等場景。由于來源匿名,其具體技術(shù)細節(jié)尚不透明,但在開發(fā)者社區(qū)已有相當(dāng)?shù)膶崪y關(guān)注。




效率不是降級,是分工

旗艦?zāi)P筒粫?。在需要跨領(lǐng)域深度推理、多步驟規(guī)劃、復(fù)雜代碼生成的任務(wù)上,它們?nèi)匀皇潜匾?。沒有人認真地認為100B模型可以在所有場景下替代旗艦版。

但在日常的業(yè)務(wù)執(zhí)行層——那些占據(jù)大多數(shù)調(diào)用量的任務(wù)——用旗艦?zāi)P褪窃跒椴恍枰哪芰Ω顿M。把這部分流量遷移到效率更高的模型上,毫無疑問是更具性價比的決策。

這種分工在軟件工程里有先例。CPU發(fā)展從追求單核主頻轉(zhuǎn)向多核協(xié)作,不是因為單核不重要,而是因為在實際工作負載下,多核架構(gòu)的整體吞吐遠超單純堆主頻。數(shù)據(jù)庫領(lǐng)域也有類似的演變:OLTP和OLAP長期共存,不同的查詢特征對應(yīng)不同的存儲和計算架構(gòu)。

模型選型的邏輯正在經(jīng)歷類似的成熟。Token效率正在成為工程師評估模型的核心維度之一——不是因為便宜,而是因為在高頻調(diào)用的場景下,它直接關(guān)系到產(chǎn)品的商業(yè)可行性。那些在單位成本下能提供足夠推理質(zhì)量的模型,正在成為 Agentic應(yīng)用的默認底座。

一條路線日漸清晰:規(guī)模繼續(xù)重要,但效率開始定價......

*以上內(nèi)容不構(gòu)成投資建議,不代表刊登平臺之觀點,市場有風(fēng)險,投資需謹慎,請獨立判斷和決策。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
特朗普:必須查明美聯(lián)儲大樓翻修成本超支的原因

特朗普:必須查明美聯(lián)儲大樓翻修成本超支的原因

財聯(lián)社
2026-04-21 20:46:05
騎士115-105擊敗猛龍!系列賽2-0,哈登創(chuàng)80年NBA紀錄,前無古人

騎士115-105擊敗猛龍!系列賽2-0,哈登創(chuàng)80年NBA紀錄,前無古人

籃球大視野
2026-04-21 09:53:34
李小冉稱《心愿便利貼》讓她哭了兩個晚上:不知道我唱歌那么難聽

李小冉稱《心愿便利貼》讓她哭了兩個晚上:不知道我唱歌那么難聽

紅星新聞
2026-04-21 12:22:12
英偉達的天塌了,AI芯片果然被動了手腳!外媒:真有“后門”?

英偉達的天塌了,AI芯片果然被動了手腳!外媒:真有“后門”?

瘋狂小菠蘿
2026-04-20 23:41:56
CBA球員退步榜:胡明軒徐杰上榜,張寧少7分排第四

CBA球員退步榜:胡明軒徐杰上榜,張寧少7分排第四

體娛荒原
2026-04-21 19:53:55
光模塊再創(chuàng)歷史新高!社?;鹉陥笮逻M4家光模塊,市盈率低至30

光模塊再創(chuàng)歷史新高!社?;鹉陥笮逻M4家光模塊,市盈率低至30

長風(fēng)價值掘金
2026-04-21 19:36:39
“小人物”黃澄澄:科班出身,10年沒戲拍,今41歲搭檔趙麗穎火了

“小人物”黃澄澄:科班出身,10年沒戲拍,今41歲搭檔趙麗穎火了

洲洲影視娛評
2026-04-10 16:32:33
去兒子家送菜籽油,從親家母嘴里得知兒子年薪30萬我當(dāng)即做了決定

去兒子家送菜籽油,從親家母嘴里得知兒子年薪30萬我當(dāng)即做了決定

人間百態(tài)大全
2026-04-21 06:45:03
沉默1天,中方準時發(fā)話,“高市下崗”傳遍日本,石破茂判斷沒錯

沉默1天,中方準時發(fā)話,“高市下崗”傳遍日本,石破茂判斷沒錯

云上烏托邦
2026-04-21 19:24:08
欲哭無淚!47歲男子赴深圳求職一個月無果,住低價旅館,一日一餐

欲哭無淚!47歲男子赴深圳求職一個月無果,住低價旅館,一日一餐

火山詩話
2026-04-21 06:36:18
上海一奧迪女銷售請客戶吃飯,細節(jié)被爆出,父母:臉都被丟盡了

上海一奧迪女銷售請客戶吃飯,細節(jié)被爆出,父母:臉都被丟盡了

紅豆講堂
2025-04-14 12:25:10
囂張!拼多多竟把執(zhí)法人員手指夾骨折。網(wǎng)友調(diào)侃:“砍一刀”不是白叫的,15 億罰輕了

囂張!拼多多竟把執(zhí)法人員手指夾骨折。網(wǎng)友調(diào)侃:“砍一刀”不是白叫的,15 億罰輕了

新浪財經(jīng)
2026-04-20 07:43:33
大的要來了!穆杰塔巴擼掉伊朗革命衛(wèi)隊總司令,換了個不怕死的

大的要來了!穆杰塔巴擼掉伊朗革命衛(wèi)隊總司令,換了個不怕死的

杰絲聊古今
2026-04-11 19:07:34
最狠的諷刺,熱銷第一名訂單數(shù)千輛,銷量落后的動輒萬輛

最狠的諷刺,熱銷第一名訂單數(shù)千輛,銷量落后的動輒萬輛

柏銘銳談
2026-04-19 10:55:35
金卡戴珊與F1七冠王正式官宣!當(dāng)年侃爺?shù)暮眯值?,如今摟“嫂子”全球秀恩愛?>
    </a>
        <h3>
      <a href=英國報姐
2026-04-20 21:11:24
賴文峰出獄后已做爸爸!如今直播帶貨,吃楊鈺瑩過往愛情的紅利

賴文峰出獄后已做爸爸!如今直播帶貨,吃楊鈺瑩過往愛情的紅利

TVB的四小花
2026-04-20 18:57:25
不歡迎中國人的7個國家,不待見寫在臉上,中國游客仍蜂擁而至

不歡迎中國人的7個國家,不待見寫在臉上,中國游客仍蜂擁而至

史行途
2026-04-20 00:15:27
沒有副作用,又不會上癮的安眠藥,你知道有哪些嗎?

沒有副作用,又不會上癮的安眠藥,你知道有哪些嗎?

岐黃傳人孫大夫
2026-04-21 11:30:03
特朗普稱最終將達成重大協(xié)議

特朗普稱最終將達成重大協(xié)議

新華社
2026-04-21 20:43:37
太棒了!蘋果推出基帶大更新,iPhone 信號顯著增強

太棒了!蘋果推出基帶大更新,iPhone 信號顯著增強

XCiOS俱樂部
2026-04-21 11:20:14
2026-04-21 21:39:00
華爾街見聞官方 incentive-icons
華爾街見聞官方
中國領(lǐng)先的金融商業(yè)信息提供商
144919文章數(shù) 2653329關(guān)注度
往期回顧 全部

科技要聞

創(chuàng)造4萬億帝國、訪華20次,庫克留下了什么

頭條要聞

媒體:急于擺脫對華稀土依賴 美企28億美元在巴西搶礦

頭條要聞

媒體:急于擺脫對華稀土依賴 美企28億美元在巴西搶礦

體育要聞

62歲,成為中國足壇最火的人

娛樂要聞

周潤發(fā)時隔16年再賣樓,變現(xiàn)數(shù)億資產(chǎn)

財經(jīng)要聞

現(xiàn)實是最大的荒誕:千億平臺的沖突始末

汽車要聞

全新坦克700正式上市 售價42.8萬-50.8萬元

態(tài)度原創(chuàng)

手機
親子
本地
房產(chǎn)
公開課

手機要聞

OPPO Find X9 Ultra旗艦手機發(fā)布,7499元起

親子要聞

孤獨力有多重要?聰明的父母懂得牢牢把握,影響孩子的人生高度

本地新聞

春色滿城關(guān)不?。座N梅浪漫盛放,吳山藏了一片四月雪

房產(chǎn)要聞

年薪40-50萬!海南地產(chǎn)圈還在猛招人

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版