国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

具身龍蝦,上車理想

0
分享至

henry 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

別人家的“龍蝦”還在盯著屏幕玩電腦,理想已經(jīng)把“龍蝦”帶上車了!

最近,理想發(fā)布了全新的流式視頻理解與具身智能統(tǒng)一的Agent框架——

StreamingClaw



在保持與OpenClaw框架完全兼容的基礎(chǔ)上,StreamingClaw原生支持實時的多模態(tài)流式交互

這意味著,系統(tǒng)在面對視覺輸入時,不再將其視為死板的離線視頻文件,而是像人類感知世界一樣,實時捕獲流數(shù)據(jù)(Stream)并進行即時推理。

比如,這只蝦不僅能在駕駛中盯著你,檢測可疑動作(哈欠、玩手機)并主動預(yù)警。

還能在你取車的時候,主動跟你打招呼。

與此同時,StreamingClaw還引入了自主多代理調(diào)度機制

依托主-從代理的緊密協(xié)同,它不僅能自主完成復(fù)雜的任務(wù)規(guī)劃與邏輯決策,更深度集成了豐富的工具及技能庫,在現(xiàn)實場景中實現(xiàn)了指令驅(qū)動的具身智能。

在StreamingClaw的加持下,機器人與終端設(shè)備實現(xiàn)了極低延遲的“邊看、邊記、邊行動”:

比如,它可以實時上識別你手持的物品,幫你解題。

不難看出,在這些復(fù)雜場景中,StreamingClaw的核心硬實力在于實時推理與瞬時響應(yīng)。

而支撐這只“理想龍蝦”在物理世界靈活行動的,正是一整套圍繞“流式架構(gòu)”展開的系統(tǒng)設(shè)計。

從“離線處理”到“主動閉環(huán)”

不同于大模型等對延遲(相對)不敏感的場景,在具身智能、AI硬件及智能座艙等領(lǐng)域,系統(tǒng)往往需要在毫秒級完成感知—決策—執(zhí)行的閉環(huán):

  • 感知(看):通過攝像頭捕獲環(huán)境;
  • 決策(想):AI大腦規(guī)劃對策;
  • 執(zhí)行(做):驅(qū)動硬件或指令,并根據(jù)動作后的新環(huán)境再次循環(huán)。

然而,現(xiàn)有的視頻Agent在處理實時感知(流式感知)時往往面臨著延遲較高的問題。

之所以這樣是因為,傳統(tǒng)方法通常將視頻視為完整文件處理。長視頻的計算量呈指數(shù)級爆炸,難以實時響應(yīng);

同時,模型難以持續(xù)追蹤長時程信息,導(dǎo)致決策草率、頻繁遺忘,甚至直接任務(wù)失敗。

針對這些問題,以往的研究嘗試通過視覺壓縮或Token精簡來緩解負載,但同時也導(dǎo)致了細節(jié)丟失,無法準確定位等問題。

更致命的是,傳統(tǒng)模型大多是被動觸發(fā):你不問,它不動,缺乏對環(huán)境風險的主動感知。

StreamingClaw通過“增量計算”改寫了這一邏輯。

它不再機械地重復(fù)處理歷史畫面,而是將環(huán)境的細微變化視為增量信號進行推理更新。

這意味著,它不僅能“看”得更準、記”得更久,還能在思考過程中自主調(diào)用工具,實現(xiàn)從感知到物理干預(yù)的真正閉環(huán)。

這就是所謂的流式推理,與處理現(xiàn)成文件的“離線模式”不同,其要求AI必須像觀看直播一樣,在數(shù)據(jù)不斷涌入的同時即時分析,不允許任何嚴重滯后。

接下來,我們具體來看StreamingClaw是怎么做到的。

具身智能的流式交互引擎

總體來看,StreamingClaw是一個高度協(xié)同的多代理(Multi-agent)架構(gòu)。它通過一套標準化的流水線,打破了不同硬件之間的壁壘:



首先,無論是智能眼鏡、自動駕駛芯片還是具身機器人,所有多模態(tài)流式輸入都會通過時間戳對齊共享流式緩存*進行標準化處理,確保AI擁有統(tǒng)一的“時間尺度”。

其次,核心大腦StreamingReasoning(主代理)負責實時感知與規(guī)劃;StreamingMemoryStreamingProactivity(從代理)則分別提供長效記憶支撐與主動交互決策。

最后,代理生成的決策指令會直接驅(qū)動工具箱與技能庫。

從簡單的視頻剪切到復(fù)雜的具身動作序列,執(zhí)行結(jié)果會即時反饋至代理,形成一套完整的“感知—決策—執(zhí)行”閉環(huán)。

這種架構(gòu)讓StreamingClaw不僅能聽懂指令,更能通過自主規(guī)劃與工具調(diào)用,真正深入現(xiàn)實場景解決問題。

流式推理::StreamingReasoning

流式推理(StreamingReasoning)主要針對具有連續(xù)輸入輸出的流視頻理解場景。

其核心目標是在極低延遲的約束下,實現(xiàn)對現(xiàn)實世界的實時感知、理解與推理。



實時流式推理方面,系統(tǒng)會將輸入的視頻流拆分為細粒度片段,并通過動態(tài)滑動窗口嚴格控制上下文范圍,從源頭上避免無效信息的堆積。

在此基礎(chǔ)上,結(jié)合經(jīng)過剪枝優(yōu)化的流式KV-Cache機制,StreamingReasoning可以持續(xù)進行高效的增量解碼,使整體推理過程始終緊貼視頻流節(jié)奏運行,而不會出現(xiàn)延遲堆積。

在此之上,系統(tǒng)引入了自規(guī)劃調(diào)度能力,充當整個流程的“總指揮”。

它能夠動態(tài)解析用戶指令,并自主規(guī)劃任務(wù)路徑。在面對復(fù)雜任務(wù)時,系統(tǒng)會根據(jù)需要選擇調(diào)用層級化記憶進行檢索,或轉(zhuǎn)而觸發(fā)主動交互決策;

而在常規(guī)場景下,則保持直接、低延遲的流式多模態(tài)推理,使整體交互過程始終順暢自然。

流式存儲:StreamingMemory

StreamingMemory存儲真正的多模態(tài)向量,通過層級記憶演化(HME)機制,以應(yīng)對復(fù)雜的流視頻理解任務(wù)。



具體來說,在記憶機制上,系統(tǒng)以視覺為核心,將多模態(tài)信息組織為可持續(xù)增長的增量式記憶節(jié)點,避免原始數(shù)據(jù)的簡單堆疊。

這些記憶進一步從碎片演化為更高層級的“行動”和“事件”,使檢索對象從畫面本身轉(zhuǎn)向可用于決策的結(jié)構(gòu)化經(jīng)驗。

在此基礎(chǔ)上,系統(tǒng)通過命令驅(qū)動的并行時間遍歷實現(xiàn)高效檢索,在長時序信息中快速定位關(guān)鍵內(nèi)容,同時保證魯棒性。

同時,統(tǒng)一的接口設(shè)計打通跨代理記憶,使不同Agent既能共享關(guān)鍵經(jīng)驗,又能進行差異化管理,從而支撐更高效的協(xié)同。

從代理:StreamingProactivity

StreamingProactivity面向未來事件預(yù)測、推理與主動交互設(shè)計,其目標既可以由用戶預(yù)先設(shè)定,也可以在流式過程中持續(xù)演化。

當請求被識別為主動交互時,主代理會將其轉(zhuǎn)化為持續(xù)在線的監(jiān)控任務(wù),例如追蹤行為、判斷事件或監(jiān)控風險。

一旦滿足觸發(fā)條件,系統(tǒng)即刻生成通知或解釋性響應(yīng),形成“感知—推理—觸發(fā)—反饋”的閉環(huán),避免反復(fù)查詢。



這一機制主要覆蓋兩類場景,一類是時間感知交互,強調(diào)對狀態(tài)隨時間演化的持續(xù)跟蹤;

另一類是事件定位交互,聚焦關(guān)鍵事件在時間流中的精確識別,常見于異常檢測與自動標注等任務(wù)。

在實現(xiàn)上,系統(tǒng)分為免訓練適配與訓練適配兩種路徑。



免訓練適配無需額外訓練,通過將觸發(fā)條件結(jié)構(gòu)化為可監(jiān)控節(jié)點,在流式過程中匹配視覺信號并即時生成響應(yīng);同時支持目標在線更新,形成持續(xù)演化的主動交互閉環(huán)。

訓練適配則將狀態(tài)變化建模為視覺語言信號,引入場景專用觸發(fā)Token,使感知與任務(wù)解耦,并在單次推理中完成多事件識別與響應(yīng)生成。

該方案在復(fù)雜場景下具備更高精度、更強泛化能力,同時顯著降低并發(fā)任務(wù)下的推理開銷。

整體來看,StreamingProactivity實現(xiàn)了全天候在線的主動交互,使系統(tǒng)能夠持續(xù)感知變化并觸發(fā)響應(yīng)。

可擴展的工具與技能:閉環(huán)的最后一公里

為了真正讓AI影響物理世界,StreamingClaw還提供了高效工具與技能接口,從而完成了“感知—決策—執(zhí)行”閉環(huán)的最后一個環(huán)節(jié)。

除了標準的工具組合外,研究還引入了專為視頻理解和流式交互定制的專業(yè)工具。

比如,Video Cut工具可以在關(guān)鍵片段中精準裁剪時間戳,將內(nèi)容送入大型多模態(tài)模型進行“顯微級分析”,再輸出精簡文本結(jié)果。



總體而言,StreamingClaw面向流式視頻場景,基于多模態(tài)大模型實現(xiàn)感知、理解與語音輸出,但當前仍以“視覺+文本”為核心輸入范式,對音頻輸入、精細時序?qū)R及跨模態(tài)聯(lián)合推理的支持仍有限。

未來,系統(tǒng)將演進為統(tǒng)一的全模態(tài)代理框架,打通視頻、圖像、音頻與文本的輸入輸出,實現(xiàn)真正的感知-執(zhí)行閉環(huán);

同時強化長時程建模、空間理解與跨模態(tài)對齊能力,并持續(xù)優(yōu)化低延遲部署與記憶、工具調(diào)用機制,以支撐更真實世界的具身交互。

[1]https://jackyu6.github.io/StreamingClaw-Page/

[2]https://arxiv.org/pdf/2603.22120

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
哲凱說場地太干?墨菲:就算是真的,他們也沒送出多少長傳球

哲凱說場地太干?墨菲:就算是真的,他們也沒送出多少長傳球

懂球帝
2026-04-12 21:01:25
特朗普已做好開戰(zhàn)準備?王毅曾警告:中美一旦沖突,結(jié)局只有1個

特朗普已做好開戰(zhàn)準備?王毅曾警告:中美一旦沖突,結(jié)局只有1個

史行途
2026-04-12 12:15:00
后母與17歲繼子偷嘗禁果!相當有 c 度!

后母與17歲繼子偷嘗禁果!相當有 c 度!

電影分享會
2026-03-21 11:14:18
開國上將鬧離婚:結(jié)發(fā)40年竟遭發(fā)妻死命舉報,六名子女為何如釋重負

開國上將鬧離婚:結(jié)發(fā)40年竟遭發(fā)妻死命舉報,六名子女為何如釋重負

睡前講故事
2026-04-07 14:43:34
萬萬沒有想到,賴清德的父親賴永都,非但不是日本鬼子他是中國人

萬萬沒有想到,賴清德的父親賴永都,非但不是日本鬼子他是中國人

史行途
2026-03-30 08:13:47
72歲王健林健康引擔憂,眼神癡呆嘴歪到認不出,疑患癌后消耗暴瘦

72歲王健林健康引擔憂,眼神癡呆嘴歪到認不出,疑患癌后消耗暴瘦

往史過眼云煙
2026-03-15 17:12:00
晚年被三個子女輪流養(yǎng)老才發(fā)現(xiàn):人老了,存款和退休金有多么重要

晚年被三個子女輪流養(yǎng)老才發(fā)現(xiàn):人老了,存款和退休金有多么重要

熱心柚子姐姐
2026-04-11 20:28:11
11年前優(yōu)衣庫男女主現(xiàn)狀曝光,他們還在一起生了兩個孩子

11年前優(yōu)衣庫男女主現(xiàn)狀曝光,他們還在一起生了兩個孩子

半糖甜而不膩
2026-04-06 12:09:15
何潔自曝養(yǎng)家艱難,40歲斷崖式衰老?明明一手好牌,為何被打爛

何潔自曝養(yǎng)家艱難,40歲斷崖式衰老?明明一手好牌,為何被打爛

扒點半吃瓜
2026-03-10 07:00:13
財務(wù)造假,退市!300391明日將摘牌

財務(wù)造假,退市!300391明日將摘牌

新浪財經(jīng)
2026-04-12 19:07:51
對中國的制裁來了!意大利政府這次是打算明搶了!

對中國的制裁來了!意大利政府這次是打算明搶了!

達文西看世界
2026-04-12 13:49:52
陳云晚年首次披露:遵義會議上這兩個人死活不同意毛主席,吵得面紅耳赤

陳云晚年首次披露:遵義會議上這兩個人死活不同意毛主席,吵得面紅耳赤

老杉說歷史
2026-03-21 17:38:44
知名時政記者爆料王石被抓,本人回應(yīng)了

知名時政記者爆料王石被抓,本人回應(yīng)了

財通社
2026-04-12 19:53:51
難以置信!張雪峰離世后,峰學蔚來員工從10點變?yōu)槠甙它c主動到崗

難以置信!張雪峰離世后,峰學蔚來員工從10點變?yōu)槠甙它c主動到崗

火山詩話
2026-04-11 19:37:49
巴基斯坦怒了:巴基斯坦不是卡塔爾,動我們的人,打到你服!

巴基斯坦怒了:巴基斯坦不是卡塔爾,動我們的人,打到你服!

人生錄
2026-04-08 00:37:17
風向都變了!以美國為首的多國認為:中國已在換電等關(guān)鍵領(lǐng)域崛起

風向都變了!以美國為首的多國認為:中國已在換電等關(guān)鍵領(lǐng)域崛起

潮鹿逐夢
2026-04-11 11:22:49
湖人vs爵士前瞻:爵士8人缺陣,湖人是否有意西部第3成關(guān)鍵

湖人vs爵士前瞻:爵士8人缺陣,湖人是否有意西部第3成關(guān)鍵

體壇野秀才
2026-04-12 16:39:12
涉嫌嚴重違紀違法,王世林被查

涉嫌嚴重違紀違法,王世林被查

吉刻新聞
2026-04-12 13:03:49
續(xù)航100公里僅跑30公里 充電31秒電量猛漲10% 東莞網(wǎng)約車司機:深藍SL03虛到不敢接單

續(xù)航100公里僅跑30公里 充電31秒電量猛漲10% 東莞網(wǎng)約車司機:深藍SL03虛到不敢接單

信網(wǎng)
2026-04-11 17:05:04
毛主席從不批評劉伯承和徐向前,一個是不忍批評,另一個無需批評

毛主席從不批評劉伯承和徐向前,一個是不忍批評,另一個無需批評

鶴羽說個事
2026-04-08 22:21:11
2026-04-12 21:23:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
12460文章數(shù) 176449關(guān)注度
往期回顧 全部

科技要聞

理想稱遭惡意拉踩,東風日產(chǎn):尊重同行

頭條要聞

上海阿婆被"干兒子"分80次轉(zhuǎn)走95萬氣癱 畢生積蓄沒了

頭條要聞

上海阿婆被"干兒子"分80次轉(zhuǎn)走95萬氣癱 畢生積蓄沒了

體育要聞

創(chuàng)造歷史!五大聯(lián)賽首位女性主教練誕生

娛樂要聞

賭王女兒何超蕸病逝,常年和乳癌斗爭

財經(jīng)要聞

美伊談判破裂的三大癥結(jié)

汽車要聞

煥新極氪007/007GT上市 限時19.39萬起

態(tài)度原創(chuàng)

游戲
藝術(shù)
手機
數(shù)碼
時尚

誠意不足!《星空》新DLC褒貶不一:性價比太差

藝術(shù)要聞

殯葬新規(guī)落地,小區(qū)里的“骨灰房”真能絕跡嗎?

手機要聞

iPhone17 國內(nèi)銷量破2700 萬臺!高端市場壟斷加劇,國產(chǎn)機壓力山大

數(shù)碼要聞

破壁機哪個牌子好?安全無毒材質(zhì)是重點,揭秘TOP10家用哪種好

臺灣票房第一,讓人邊哭邊罵?

無障礙瀏覽 進入關(guān)懷版