国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

VLA不夠了?觸覺,將改寫具身智能新格局

0
分享至



機器之心發(fā)布

2026 年,「數(shù)據(jù)」正成為具身智能競賽的新焦點,京東、百度等科技巨頭紛紛入局。然而,喧囂之中,一個根本問題懸而未決:什么樣的數(shù)據(jù),才是具身智能真正需要的?

近日,全球最大的工程與應(yīng)用科學專業(yè)組織 IEEE(電氣電子工程師學會)旗下的旗艦出版物 IEEE Spectrum,對機器人學家王煜進行了一次深度專訪。

這位深耕機器人領(lǐng)域近 40 年的學者給出了自己的判斷:當前主流的 VLA(視覺 - 語言 - 動作)架構(gòu)不足以支撐機器人真正走向落地,包含物理交互信息的數(shù)據(jù),才是機器人理解現(xiàn)實世界、實現(xiàn)穩(wěn)定操作的關(guān)鍵所在。



  • 訪談鏈接:https://spectrum.ieee.org/daimon-robotics-physical-ai
  • 原文作者:Sujeet Dutta,Wiley 科學與工程部高級編輯

上世紀80年代,作為中國首批公派留學生,王煜進入卡內(nèi)基梅隆大學機器人研究所,成為時任所長的 Matt Mason 教授招收的第一位博士生,專攻機器人抓取力學與操作規(guī)劃——這正是當下具身智能操作能力的學術(shù)源頭。他曾在多所院校任教,與李澤湘共同創(chuàng)辦香港科技大學機器人研究院,培養(yǎng)了大批活躍于今日產(chǎn)業(yè)一線的人才。

王煜被斯坦福大學評為全球前 2% 頂尖科學家,并作為 IEEE 機器人與自動化協(xié)會管理委員會唯一代表中國機構(gòu)的學者,持續(xù)在國際具身智能領(lǐng)域傳遞中國聲音。

從液壓到電動、從工業(yè)到生活場景,再到如今的人工智能時代,王煜經(jīng)歷了現(xiàn)代機器人學的每一次范式轉(zhuǎn)換。因此,他對當下狂熱中的思考格外值得傾聽。

在王煜看來,機器人下一個亟待解鎖的能力是「操作」(manipulation),且時機日臻成熟。

如今機器人能完成驚艷的 demo,卻仍難以在真實環(huán)境中自主感知、決策并穩(wěn)定執(zhí)行操作,根本原因在于對視覺的過度依賴—— 當機器人嘗試拿起一只玻璃杯、采摘一顆草莓、插拔一根電線時,視覺只能告訴它「物體在哪兒」,卻無法告知它力度是否恰當、角度是否到位、操作是否完成。

材質(zhì)、摩擦、接觸力、形變,這些決定操作成敗的物理反饋信息,恰恰是視覺的盲區(qū),也是機器人操作中長期缺失的一環(huán)。

王煜認為,觸覺是打開這扇大門的鑰匙。觸覺包含了接觸力、接觸狀態(tài)、形變、紋理與材質(zhì)等信息,能夠填補視覺的盲區(qū)與錯覺,讓機器人從「識別物體」走向「理解物體、操控物體」。

基于這一判斷,他與團隊提出了 VTLA(視覺 - 觸覺 - 語言 - 動作)框架,在主流 VLA 架構(gòu)中引入觸覺,將其視作與視覺同等重要的感知模態(tài)。



王煜教授

這些主張并未停留在論文里。幾年前,王煜與博士后段江嘩共同創(chuàng)立「戴盟機器人」,將多年積累的觸覺感知研究推向工程化落地。這家公司過去以含觸覺感知的硬件研發(fā)為聞名,2026 年第一季度的營收已超過去年全年。

上個月,戴盟正式發(fā)布含觸覺模態(tài)的物理世界具身數(shù)據(jù)集 Daimon Infinity,并開源其中 10000 小時數(shù)據(jù),正式入場眼下最熱的具身數(shù)據(jù)賽道。

一位以「操作」為研究命題的學者,為何在此刻選擇加入數(shù)據(jù)之爭?這背后的判斷,或許能讓我們窺見未來幾年的具身智能走向。

在這次專訪中,王煜系統(tǒng)闡釋了他對機器人操作、觸覺感知、具身數(shù)據(jù)與物理 AI 的思考:為什么 VLA 架構(gòu)會遭遇瓶頸?觸覺數(shù)據(jù)為何被長期忽視,又為何不可或缺?所謂「物理智能」究竟意味著什么?作為一位見證了機器人學半個世紀發(fā)展的研究者,他如何看待人形機器人未來的可能性與邊界?

以下為 IEEE Spectrum 專訪王煜的譯文,出于篇幅考慮略有刪減:

提問:今年 4 月,戴盟機器人聯(lián)合多家頭部學術(shù)機構(gòu)和企業(yè),共同發(fā)布規(guī)模最大、最全面的具身操作數(shù)據(jù)集。為何選擇現(xiàn)在發(fā)布數(shù)據(jù)集,而不是繼續(xù)專注硬件開發(fā)?

王煜:隨著具身智能的發(fā)展,越來越多人意識到數(shù)據(jù)的重要性:數(shù)據(jù)不足是目前具身智能發(fā)展的瓶頸,尤其是包含物理交互信息的數(shù)據(jù),這將是提升機器人在現(xiàn)實世界操作能力的關(guān)鍵。

數(shù)據(jù)的質(zhì)量、可靠性和成本,已成為研發(fā)和商業(yè)落地需要重點關(guān)注的問題。

這恰好也是戴盟擅長的事。依托領(lǐng)先的視觸覺技術(shù),我們能夠提供含多模態(tài)觸覺的高質(zhì)量數(shù)據(jù) ——不僅包含接觸力,還有接觸形變、接觸狀態(tài)、滑移摩擦、物體材質(zhì)與紋理等信息,完整還原物理交互的過程?;谶^往的技術(shù)積累,我們也研發(fā)了數(shù)據(jù)處理管線,將觸覺與視覺、動作軌跡、語音文本等模態(tài)精準融合,轉(zhuǎn)化為模型訓練可用的數(shù)據(jù)。

面對行業(yè)的數(shù)據(jù)空缺,我想采集數(shù)據(jù)是我們戴盟能做好、也應(yīng)該做的事情。



今年 4 月,戴盟發(fā)布含觸覺全模態(tài)物理世界數(shù)據(jù)集 Daimon-Infinity

提問:戴盟聲稱數(shù)據(jù)集年底能達到超百萬小時規(guī)模,你們是如何做到這一點的?

王煜:我們打造了全球最大規(guī)模的外發(fā)式具身數(shù)據(jù)采集網(wǎng)絡(luò)—— 依托于輕便化設(shè)備,數(shù)據(jù)采集不再局限于數(shù)采場,而是可以進入各類真實場景,不受空間限制,實現(xiàn)了低成本、跨場景、高度真實性的采集,從而具備了每年數(shù)百萬小時數(shù)據(jù)的生產(chǎn)能力。

提問:Daimon-Infinity 由多家機構(gòu)聯(lián)合發(fā)布,他們?nèi)绾螀⑴c其中?

王煜:此次數(shù)據(jù)集,我們聯(lián)合了全球數(shù)十家機構(gòu)合作共建,包括北京大學、清華大學、香港科技大學等中國高校,以及 DeepMind、美國西北大學、新加坡國立大學等全球頂尖研究團隊,另外還有中國移動、匯川技術(shù)、上聲電子等產(chǎn)業(yè)方。他們選擇與戴盟合作,是對我們將觸覺加入具身數(shù)據(jù)這一路線的認可。

通過在科研、制造等實際場景下進行采集,這些合作方幫助我們收集到了高度真實、以實際場景為驅(qū)動的數(shù)據(jù);反過來,他們將這些數(shù)據(jù)用于自己的模型訓練。此外,我們開源了 10000 小時數(shù)據(jù),希望含觸覺的數(shù)據(jù)能推動更多具身模型的進化。

提問:目前機器人領(lǐng)域的主流范式是 VLA 模型,但戴盟團隊提出了 VTLA 框架。為什么加入了觸覺?

王煜:觸覺信息對于機器人的操作能力至關(guān)重要,它能提供與物體接觸時的物理反饋, 引導機器人手進行可靠的操作。如果沒有觸覺,機器人可能無法在黑暗環(huán)境中判斷物體的位置,可能因無法感知滑移狀態(tài)而導致玻璃杯掉落,更有可能因為無法控制力度而導致操作任務(wù)失敗,甚至造成損害。

VLA 已經(jīng)不足以滿足機器人操作的需求,因此我們擴展了框架,納入觸覺數(shù)據(jù),創(chuàng)建了 VTLA。

重要的是,我們采用的視觸覺感知技術(shù),與 VLA 所基于的視覺框架非常契合。它捕捉指尖表面的形變,將觸覺信息轉(zhuǎn)化為視覺圖像,并從中推斷出力和其他接觸狀態(tài) —— 而圖像數(shù)據(jù)天然適合集成到 VLA 中,這降低了框架擴展的門檻。



搭載視觸覺傳感器的夾爪,通過精準感知觸覺,賦能精細操作

提問:您和團隊開發(fā)了世界上首個單色光視觸覺技術(shù),為什么選擇了這條技術(shù)路線?

王煜:從開始研究觸覺感知時,我們就明確了自身需求:我們想要的是能夠高度模擬人類指尖皮膚觸覺的傳感器。

生理學研究已充分證實人類指尖所具備的能力 —— 知道我們觸摸了什么、是什么材質(zhì)、力如何分布,以及當大腦控制手時,它是否移動到正確的位置。我們知道,在機器人手上復制這些能力將大有裨益。

在調(diào)研現(xiàn)有技術(shù)時,我們發(fā)現(xiàn)了多種類型的觸覺感知技術(shù),包括三色光視觸覺傳感及其他更簡單的設(shè)計。我們將這些技術(shù)的優(yōu)勢整合到一個解決方案中,使其在保持良好性能的同時又不會過于復雜,并將成本、可靠性和靈敏度控制在令人滿意的范圍內(nèi),最終研發(fā)了單色光視觸覺技術(shù)。隨著人們對觸覺認知的日益加深,這些技術(shù)將攜手并進。



全模態(tài)觸覺信息,包含力 / 力矩、形狀、材質(zhì)、接觸信息四大維度

提問:你們的視觸覺傳感器正是基于這一技術(shù),相比傳統(tǒng)觸覺傳感器有什么核心優(yōu)勢?

王煜:我們在去年推出了全球首個多維高分辨率高頻率視觸覺傳感器,在指尖大小的模塊上裝載了 11 萬個感知單元,是業(yè)內(nèi)目前最高的密度。

另一個優(yōu)勢是頻率和帶寬,即我們檢測觸覺變化、傳輸并實時處理信號的速度。其他方面則主要與工程技術(shù)相關(guān),如可靠性、漂移、硅膠表面耐用性及對電磁、光學及其他環(huán)境因素的抗干擾能力。

觸覺的重要性正被越來越多人意識到,我們的視觸覺傳感器也得到了更多人的使用,我相信這會讓整個行業(yè)都邁上一個新臺階。

我們的一位潛在客戶正在便利店中部署人形機器人,在密密麻麻的貨架上,機器人需要伸入非常狹小的空間才能取出物品 —— 人類至少需要三根纖細的手指才能完成抓取任務(wù)。諸如此類的場景,我們看到了對于觸覺的非常具體的需求。



戴盟視觸覺傳感器具有高感知單元密度

提問:戴盟目前的商業(yè)模式和戰(zhàn)略重點是什么?數(shù)據(jù)集在其中是什么角色?

王煜:我們最初專注于制造高性能的觸覺感知設(shè)備,尤其是搭載于機器人手的傳感器。但隨著具身智能的發(fā)展,大家逐漸意識到,行業(yè)需要不僅僅是一個組件,而是整個技術(shù)鏈:設(shè)備、大規(guī)模高質(zhì)量的數(shù)據(jù),以及最終能夠在實際應(yīng)用環(huán)境中構(gòu)建、訓練和部署機器人模型的框架。

現(xiàn)在,我們將自己的商業(yè)戰(zhàn)略定位為「3D」:設(shè)備(Devices)、數(shù)據(jù)(Data)和部署(Deployment)。我們研發(fā)用于數(shù)據(jù)采集和構(gòu)建觸覺生態(tài)的設(shè)備,并通過在合作伙伴的應(yīng)用場景里部署,完成含觸覺數(shù)據(jù)的落地與閉環(huán)驗證。在這個模式里,任何一環(huán)都不可或缺。

提問:您之前提出了「具身技能」的概念,認為這是人形機器人超越「僅擁有先進人工智能大腦」的關(guān)鍵。您為什么會提出這一觀點?過去兩年行業(yè)快速發(fā)展,您對具身技能的定義是否有所改變?

王煜:機器人的發(fā)展一路走來,如今已到了電氣、電子和機電一體化硬件技術(shù)融合的階段,這是過去 20 年里取得的巨大進步。由于硬件的快速發(fā)展,機器人現(xiàn)在完全是電動的,不再需要液壓系統(tǒng)?,F(xiàn)代電子技術(shù)提供了高帶寬和高扭矩,如果我們能將智能融入這些機械系統(tǒng),就能創(chuàng)造出真正意義上的人形機器人 —— 能夠在非結(jié)構(gòu)化環(huán)境中運行、決策并自主穩(wěn)定地執(zhí)行操作的機器人。

人工智能的出現(xiàn)恰逢其時,大量資源投入其中,特別是大語言模型。它們?nèi)缃癖煌茝V到世界模型中,賦能物理智能(physical AI)—— 我們希望這些能力最終能在現(xiàn)實世界中落地。如今研究重點更加明確,例如在家庭環(huán)境中,人們更傾向于使用人形機器人。這是一個令人興奮的領(lǐng)域,如果我們最終能夠制造出安全、可靠且經(jīng)濟高效的機器人,它將為社會帶來巨大的益處。



搭載了戴盟觸覺感知技術(shù)的機器人在工廠線上部署

提問:機器人如今能進行令人印象深刻的 demo,但距離真正進入實際應(yīng)用仍存在差距。什么因素可能觸發(fā)實際部署?哪些場景最有可能率先實現(xiàn)大規(guī)模部署?

王煜:我認為通用機器人的大規(guī)模部署之路仍然漫長,但我們已經(jīng)看到特定領(lǐng)域的可行性。

這與自動駕駛汽車非常相似,無人駕駛出租車尚未全面部署,但移動機器人在酒店業(yè)已經(jīng)得到廣泛應(yīng)用。在中國,幾乎所有大型酒店都配備了送餐機器人 —— 沒有機械臂,只是一臺從酒店大堂取外賣的小型機器人。外賣員只需放置食物并選擇房間號,機器人便會自行導航、自行使用電梯,最終將食物送達客房。

酒店及餐廳的機器人,為其他場景的應(yīng)用提供了范本,例如夜間藥店和便利店。我預(yù)計在短期內(nèi),這些場所將全面部署人形機器人,并在之后擴展到其他領(lǐng)域。我們可以期待,在未來,包括人形機器人在內(nèi)的自主機器人將逐步滲透到特定行業(yè),為行業(yè)創(chuàng)造價值。

我們的愿景始終是讓機器人實現(xiàn)強大的操控能力,并發(fā)展成為人類可靠的合作伙伴。未來,機器人或許會無縫融入我們的日常生活,真正造福并服務(wù)于人類。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
湖人不敵雷霆!證明3件事,1人被高估+老詹帶不動,火箭成背景板

湖人不敵雷霆!證明3件事,1人被高估+老詹帶不動,火箭成背景板

生活新鮮市
2026-05-06 11:31:23
技術(shù)越牛,死得越快?一個蘇州新材料老板的深夜困惑

技術(shù)越牛,死得越快?一個蘇州新材料老板的深夜困惑

胡華成
2026-04-05 18:18:14
恭喜5月惹不起的三大生肖,職場喜事頻發(fā),貴人帶著錢找上門!

恭喜5月惹不起的三大生肖,職場喜事頻發(fā),貴人帶著錢找上門!

毅談生肖
2026-05-06 11:27:46
知名港星曝家丑!被大兒子榨干百萬積蓄,宣布身后事交給幼子代辦

知名港星曝家丑!被大兒子榨干百萬積蓄,宣布身后事交給幼子代辦

草莓解說體育
2026-05-06 07:54:46
過氣明星太可憐?五一假期景區(qū)落魄打工,有人無戲可拍,令人心酸

過氣明星太可憐?五一假期景區(qū)落魄打工,有人無戲可拍,令人心酸

攬星河的筆記
2026-05-04 15:45:23
跟兒子“換血”的硅谷富豪,成為世界首位返老還童的人,如今怎樣

跟兒子“換血”的硅谷富豪,成為世界首位返老還童的人,如今怎樣

談史論天地
2026-04-28 06:34:30
我借調(diào)回來任廳長,聚會時小舅子讓我倒酒說:來我公司,一月3500

我借調(diào)回來任廳長,聚會時小舅子讓我倒酒說:來我公司,一月3500

千秋文化
2026-05-02 19:49:56
0-1落后!單場7次失誤,哈登讓東部第一展現(xiàn)真實水準?

0-1落后!單場7次失誤,哈登讓東部第一展現(xiàn)真實水準?

Haviven聊球
2026-05-06 12:16:20
強詞奪理!“中國不應(yīng)獲得最先進芯片,美國才應(yīng)領(lǐng)先”

強詞奪理!“中國不應(yīng)獲得最先進芯片,美國才應(yīng)領(lǐng)先”

觀察者網(wǎng)
2026-05-05 18:52:05
女子玩懸崖秋千墜亡,上一秒還連聲驚呼繩子“沒拴緊”!四川官方通報:已停業(yè)整頓

女子玩懸崖秋千墜亡,上一秒還連聲驚呼繩子“沒拴緊”!四川官方通報:已停業(yè)整頓

新民晚報
2026-05-06 10:00:32
16歲女孩景區(qū)內(nèi)墜亡,目擊者發(fā)聲,賠償金額曝光,景區(qū)運營僅49天

16歲女孩景區(qū)內(nèi)墜亡,目擊者發(fā)聲,賠償金額曝光,景區(qū)運營僅49天

溫柔看世界
2026-05-06 11:48:44
康熙長子被圈禁26年,瘋狂納妃生下20個孩子,卻因禍得福成贏家

康熙長子被圈禁26年,瘋狂納妃生下20個孩子,卻因禍得福成贏家

浩渺青史
2026-05-06 00:41:01
普京:若烏克蘭襲擊紅場閱兵式,將用堪比核彈的高超音速導彈報復

普京:若烏克蘭襲擊紅場閱兵式,將用堪比核彈的高超音速導彈報復

讓你大開眼界
2026-05-06 08:16:32
鄧文迪三母女閃耀紐約紅毯,高定禮服很東方美,倆女兒又瘦又優(yōu)秀

鄧文迪三母女閃耀紐約紅毯,高定禮服很東方美,倆女兒又瘦又優(yōu)秀

攬星河的筆記
2026-05-05 16:55:54
湖人負雷霆里夫斯16投僅3中 他的大合同要不翼而飛了?

湖人負雷霆里夫斯16投僅3中 他的大合同要不翼而飛了?

仰臥撐FTUer
2026-05-06 12:14:17
姆巴佩慌了!皇馬新帥頭號熱門,竟是他當年趕走的死對頭

姆巴佩慌了!皇馬新帥頭號熱門,竟是他當年趕走的死對頭

瀾歸序
2026-05-06 01:32:04
施工員丈夫生病住院,妻子:你不是有家人嗎?用不著我這個外人

施工員丈夫生病住院,妻子:你不是有家人嗎?用不著我這個外人

施工員小天哥
2026-05-05 10:56:17
比日本還囂張!為支持臺灣與中國斷交后,又要求中國主動低頭求和

比日本還囂張!為支持臺灣與中國斷交后,又要求中國主動低頭求和

杰絲聊古今
2026-05-02 11:06:33
《陳翔六點半》核心演員接連出走的背后,是團隊運作的必然選擇

《陳翔六點半》核心演員接連出走的背后,是團隊運作的必然選擇

歪歌社團
2026-05-06 03:43:34
墨菲:英國年輕球員應(yīng)向吳宜澤學習,趙心童不可能統(tǒng)治斯諾克!

墨菲:英國年輕球員應(yīng)向吳宜澤學習,趙心童不可能統(tǒng)治斯諾克!

世界體壇觀察家
2026-05-06 05:35:12
2026-05-06 13:00:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12922文章數(shù) 142643關(guān)注度
往期回顧 全部

科技要聞

“馬斯克不懂AI”:OpenAI當庭戳老底

頭條要聞

綏化兩名十一二歲女孩失聯(lián)多日遭遇不測 警方回應(yīng)

頭條要聞

綏化兩名十一二歲女孩失聯(lián)多日遭遇不測 警方回應(yīng)

體育要聞

活塞1比0騎士:坎寧安不再是一個人了

娛樂要聞

神仙友誼!楊紫連續(xù)10年為張一山慶生

財經(jīng)要聞

人形機器人七小龍:誰真能賣 誰在講故事?

汽車要聞

吉利原生新能源越野架構(gòu)亮相 AI如何帶來極致越野

態(tài)度原創(chuàng)

手機
親子
旅游
公開課
軍事航空

手機要聞

華為6.39英寸闊直板機再曝:搭載9系旗艦芯、比例接近16:10

親子要聞

孩子咳喘總反復,根源或是咳喘共患病

旅游要聞

湖南岳陽縣:“影旅融合”激活古村民俗游

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普威脅伊朗不要向美國船開火

無障礙瀏覽 進入關(guān)懷版