国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

GAIR 2025 「數(shù)據(jù)&一腦多形」分論壇,激辯 AI 演進(jìn)路徑

0
分享至



過去十年,AI的核心突破是從專用走向通用的語言理解;未來十年的關(guān)鍵戰(zhàn)役,或許就是將這種通用性,從語言世界拓展到物理世界。

作者丨吳彤 劉欣 齊鋮湧 梁丙鑒

編輯丨林覺民 馬曉寧


在12月13日舉行的第八屆GAIR全球人工智能與機(jī)器人大會“數(shù)據(jù)&一腦多形”分論壇上,兩個(gè)看似獨(dú)立卻緊密交織的技術(shù)前沿——數(shù)據(jù)的價(jià)值重構(gòu)與一腦多形(One Brain, Many Forms)的架構(gòu)革命,成為探索下一代智能系統(tǒng)的核心焦點(diǎn)。

一方面,數(shù)據(jù)正從傳統(tǒng)的“資源”角色,向更本質(zhì)的“認(rèn)知基礎(chǔ)”與“價(jià)值載體”演進(jìn)。

隨著多模態(tài)大模型的爆發(fā),高質(zhì)量、結(jié)構(gòu)化、富有邏輯鏈的數(shù)據(jù)已不再是模型的“養(yǎng)料”那么簡單,它正演化為定義模型認(rèn)知邊界與價(jià)值對齊的核心框架。

本次論壇深入探討了如何在數(shù)據(jù)洪流中構(gòu)建更具解釋性、可信度與進(jìn)化能力的知識體系,以及如何通過數(shù)據(jù)流動(dòng)重塑產(chǎn)業(yè)智能化的閉環(huán)。數(shù)據(jù)不再僅僅是起點(diǎn),更是驅(qū)動(dòng)智能持續(xù)進(jìn)化、與人和社會和諧共生的核心紐帶。

另一方面,“一腦多形”的范式正在重新定義智能的構(gòu)建方式。

它超越了單一模型解決特定任務(wù)的局限,指向一個(gè)更具適應(yīng)性與擴(kuò)展性的未來:一個(gè)統(tǒng)一的底層認(rèn)知核心(“一腦”),能夠動(dòng)態(tài)衍生出適應(yīng)不同場景、模態(tài)與任務(wù)的多種形態(tài)。這不僅是架構(gòu)效率的革命,更是智能向通用性與自主性邁進(jìn)的關(guān)鍵一步。

論壇聚焦于如何讓同一個(gè)“大腦”理解語言、解析視覺、操控實(shí)體,并在不同形態(tài)間共享知識、遷移能力,最終實(shí)現(xiàn)從“專用智能”到“統(tǒng)一智能”的躍遷。

兩者的融合,恰恰勾勒出通往更高級人工智能的路徑:以革新性的數(shù)據(jù)方法論,滋養(yǎng)和約束一個(gè)具有統(tǒng)一認(rèn)知且形態(tài)多樣的智能核心。

這不僅是技術(shù)的耦合,更是對智能本質(zhì)的深度思考——如何讓機(jī)器在理解復(fù)雜世界的同時(shí),也能靈活、可靠地服務(wù)于這個(gè)世界的無限場景。因此,本次分論壇的討論,正是這一宏大征程的重要注腳。

01

新數(shù)據(jù)范式:驅(qū)動(dòng)模型演進(jìn)的核心基礎(chǔ)設(shè)施

諾亦騰機(jī)器人創(chuàng)始人&CEO戴若犁:用動(dòng)作捕捉技術(shù)構(gòu)建具身智能數(shù)據(jù)工廠


在下午的“數(shù)據(jù) & 一腦多形”專場中,首場分享由諾亦騰機(jī)器人(Noitom Robotics)創(chuàng)始人/CEO 戴若犁博士帶來,主題為《用動(dòng)作捕捉技術(shù)構(gòu)建具身智能數(shù)據(jù)工廠》。

深耕動(dòng)作捕捉與運(yùn)動(dòng)相關(guān)技術(shù)研究十余年,戴若犁博士在分享中回顧了自己對技術(shù)路徑與產(chǎn)業(yè)方向的長期思考,并指出,人形機(jī)器人所代表的具身智能,正在成為一個(gè)天花板足夠高、且對高質(zhì)量數(shù)據(jù)有強(qiáng)烈需求的新賽道。

他提到,隨著人形機(jī)器人和具身智能研究逐步進(jìn)入工程化階段,行業(yè)對高質(zhì)量、大規(guī)模數(shù)據(jù)的關(guān)注度顯著提升,越來越多的企業(yè)開始系統(tǒng)性地思考數(shù)據(jù)規(guī)模、數(shù)據(jù)質(zhì)量與模型能力之間的關(guān)系。

在談到數(shù)據(jù)商業(yè)模式時(shí),戴若犁博士強(qiáng)調(diào),不同領(lǐng)域的數(shù)據(jù)生產(chǎn)邏輯存在本質(zhì)差異。具身智能對數(shù)據(jù)的獲取方式、結(jié)構(gòu)形式以及可遷移性提出了更高要求,這也決定了如果甲方獲取生數(shù)據(jù)的能力和乙方平權(quán),那這個(gè)領(lǐng)域的毛利天花板注定是可觀的。

在案例分享環(huán)節(jié),他介紹了與西湖機(jī)器人在全身遙操作(whole-body teleoperation)方向上的合作實(shí)踐,戴博團(tuán)隊(duì)提供的動(dòng)作捕捉設(shè)備為相關(guān)研究提供了技術(shù)支持,貢獻(xiàn)了一份自己的力量。

同時(shí),戴若犁博士也從工程實(shí)踐出發(fā),客觀分析了遙操作作為數(shù)據(jù)獲取手段所面臨的三大結(jié)構(gòu)性挑戰(zhàn)(“原罪”),包括:

  • 成本效率:昂貴而緩慢,成功率很低。

  • 能力局限性:比如靈巧性高的手內(nèi)的操作(in-hand manipulation)、高精度依賴力觸覺的雙手協(xié)同、非視覺引導(dǎo)操作(vision non-guided manipulation)無法執(zhí)行,只有pick and place最成熟。

  • 以及跨本體泛化能力等問題。

這些現(xiàn)實(shí)痛點(diǎn),正推動(dòng)行業(yè)進(jìn)一步探索更加通用、可擴(kuò)展的數(shù)據(jù)獲取范式。24年7月份,全球包括戴博團(tuán)隊(duì)在內(nèi)的五個(gè)組都開始探索“如何讓數(shù)據(jù)能夠跨本體”。

正是在這樣的背景下,行業(yè)開始將視角逐步拓展至以人為中心(human-centric)的數(shù)據(jù)路徑,嘗試構(gòu)建不與單一機(jī)器人本體強(qiáng)綁定的數(shù)據(jù)體系,從而提升數(shù)據(jù)在不同形態(tài)、不同平臺之間的復(fù)用價(jià)值。

圍繞這一思路,戴若犁博士介紹了諾亦騰機(jī)器人(Noitom Robotics)建設(shè)具身智能數(shù)據(jù)工廠的實(shí)踐經(jīng)驗(yàn)。相關(guān)數(shù)據(jù)采集工作覆蓋標(biāo)準(zhǔn)化采集與真實(shí)場景采集等多種形式,并在持續(xù)迭代中不斷優(yōu)化數(shù)據(jù)結(jié)構(gòu)與生產(chǎn)流程。

分享中,他還展示了具身智能數(shù)據(jù)的“數(shù)據(jù)金字塔”框架,并提出:在設(shè)計(jì)不同層級的數(shù)據(jù)獲取方案時(shí),理解每一層數(shù)據(jù)的“第一性問題”至關(guān)重要,只有明確數(shù)據(jù)的核心價(jià)值,才能在工程和商業(yè)層面形成可持續(xù)的路徑。

演講最后,戴若犁博士引用Sergey Levine的學(xué)界作結(jié),以形象的“勺叉”比喻強(qiáng)調(diào)技術(shù)與產(chǎn)品取舍的重要性:與其追求“什么都能做”,不如聚焦于真正關(guān)鍵、能夠解決核心問題的能力,從而在復(fù)雜系統(tǒng)中構(gòu)建清晰而有效的價(jià)值?!叭绻阆覃湲?dāng)勞里的勺叉,不僅在喝湯的時(shí)候會漏,還叉不起來雞塊。既要又要的結(jié)果就是個(gè)勺叉,咱不當(dāng)勺叉,咱們當(dāng)一個(gè)好用的叉子就行?!?/p>

極數(shù)迭代CEO,深圳AIRS訪問研究員佟顯喬:具身智能的數(shù)據(jù)工程解決方案思考


接下來分享的是極數(shù)迭代 CEO、深圳 AIRS 訪問研究員佟顯喬,他的分享主題是《具身智能的數(shù)據(jù)工程解決方案思考》。在該領(lǐng)域,佟顯喬積累了大量一線經(jīng)驗(yàn)。

一開場,他率先拋出觀點(diǎn):無論具身模型如何演進(jìn),數(shù)據(jù)始終是基石。他預(yù)測,未來幾年具身數(shù)據(jù)體量將爆發(fā)式增長,“具身數(shù)據(jù)服務(wù)”會成為機(jī)器人賽道里下一個(gè)“Scale AI”級別的確定性機(jī)會。

結(jié)合過往實(shí)踐,佟顯喬梳理出當(dāng)前幾大數(shù)據(jù)瓶頸:機(jī)器人泛化能力差,與數(shù)據(jù)量呈冪律關(guān)系——現(xiàn)有數(shù)據(jù)遠(yuǎn)不能達(dá)到較高成功率;大規(guī)模、高質(zhì)量數(shù)據(jù)采集成本極高,真機(jī)與動(dòng)作捕捉投入巨大,難以負(fù)擔(dān);模型能力難以跨本體遷移,數(shù)據(jù)孤島化且缺乏統(tǒng)一評估標(biāo)準(zhǔn)……這些底層采集方案與數(shù)據(jù)標(biāo)準(zhǔn)設(shè)計(jì)上的挑戰(zhàn),恰恰意味著行業(yè)新機(jī)會。

隨后,他梳理出當(dāng)下主流技術(shù)路線:大腦(system 2)負(fù)責(zé)理解物理世界常識與人類指令,分解復(fù)雜任務(wù);小腦負(fù)責(zé)技能,如抓取、按壓等,需人類示教與標(biāo)注數(shù)據(jù)。二者需端到端融合訓(xùn)練。不同流派都需要大量異構(gòu)數(shù)據(jù)、人工參與,以及跨場景、跨任務(wù)的泛化能力。

佟顯喬把數(shù)據(jù)采集現(xiàn)狀歸納為兩條路徑:

真機(jī)端:以末端執(zhí)行器動(dòng)捕、人類視覺示教、同構(gòu)遙操及“光慣混合操作”為主;

仿真端:圍繞軌跡合成、資產(chǎn)合成、預(yù)測生成與決策生成等維度展開。

作為極數(shù)迭代聯(lián)合創(chuàng)始人兼 CEO、機(jī)器人與自動(dòng)駕駛領(lǐng)域?qū)<?,佟顯喬曾在百度美研、蘋果、英偉達(dá)等公司深耕多年。接著,他分享了具身智能數(shù)據(jù)平臺的設(shè)計(jì)思路。

一方面,平臺化可針對場景做系統(tǒng)化設(shè)計(jì),在高效與可靠之間取得平衡,鎖定數(shù)據(jù)標(biāo)準(zhǔn),提升真機(jī)與仿真采集效率,并優(yōu)化部署對接;另一方面,通過兼容性設(shè)計(jì)與低代碼接口降低使用門檻。

他還提出真機(jī)數(shù)據(jù)的“萬物皆可達(dá)”、仿真數(shù)據(jù)的“萬物皆可生”兩大系統(tǒng),并引入 AI Agent 概念,借助大模型完成自動(dòng)標(biāo)注、資源管理與模型評測,構(gòu)建完整數(shù)據(jù)工具鏈。實(shí)測下來,真實(shí)世界數(shù)據(jù)集構(gòu)建速度提升 30×,仿真數(shù)據(jù)生成提升 3.5×,以數(shù)據(jù)飛輪方式加速模型迭代。

分享結(jié)尾,佟顯喬給出判斷數(shù)據(jù)好壞的經(jīng)典洞察:“從最終模型反推——能讓模型表現(xiàn)優(yōu)異的數(shù)據(jù),就是好數(shù)據(jù)?!?/p>

圓桌論壇:具身數(shù)據(jù)如何塑造行業(yè)未來?


數(shù)據(jù)專場的最后環(huán)節(jié),以具身數(shù)據(jù)為主題的圓桌論壇在王建明的主持下正式開始。王建明、戴若犁、佟顯喬、丁琰四位嘉賓圍繞具身數(shù)據(jù)采集、數(shù)據(jù)飛輪等議題展開了深度對話。

對機(jī)器人而言,什么是好的數(shù)據(jù)?王建明以數(shù)據(jù)質(zhì)量切入,幾位嘉賓就“以終為始”達(dá)成了共識,最終的模型性能、訓(xùn)練中機(jī)器人的受益程度反映著數(shù)據(jù)的質(zhì)量。丁琰進(jìn)一步指出,采集成本和各種數(shù)采方式對于不同場景和硬件的適配與否,都是決定數(shù)據(jù)質(zhì)量的關(guān)鍵環(huán)節(jié)。

未來的數(shù)據(jù)采集方式或?qū)⒆呦蚨嘣?。作為一家有?shù)據(jù)能力的創(chuàng)業(yè)公司,丁琰表示,鹿明機(jī)器人正在籌建自己的數(shù)采廠。出于成本考慮,現(xiàn)階段采用UMI方式進(jìn)行數(shù)據(jù)采集,但未來仍可能引進(jìn)更多方案。“遙操作、UMI(Universal Manipulation Interface)、動(dòng)捕、仿真數(shù)據(jù),存在即合理。”丁琰強(qiáng)調(diào)。

戴若犁就In-the-wild的數(shù)據(jù)采集方式發(fā)出了提醒,他指出這是一種高度考驗(yàn)技術(shù)水平的方案,其落地需要先后克服軟硬件易用性、組織管理能力兩道難關(guān),而在當(dāng)前的時(shí)間節(jié)點(diǎn),邁過前者的技術(shù)門檻無疑更為重要。

具體而言,在采集階段需要低摩擦、高精度、多模態(tài)的數(shù)采設(shè)備,野采數(shù)據(jù)的利用,還需要從稀疏原始數(shù)據(jù)中得到稠密信息的技術(shù)方案。戴若犁認(rèn)為,一條可行的鏈路是通過世界模型進(jìn)行先驗(yàn)估計(jì)。相較之下,遠(yuǎn)未到比拼人力組織能力的時(shí)間。

佟顯喬認(rèn)為,數(shù)據(jù)采集行業(yè)仍處于早期階段,數(shù)據(jù)、本體、模型公司仍在相互磨合。不同的模型公司提出了不同的需求,這意味著數(shù)據(jù)采集公司不能停留于堆人力的體力活階段,而是要懂模型、給建議?!澳P凸疽残枰愕膋nowledge”,佟顯喬強(qiáng)調(diào),“一個(gè)個(gè)批次之后,大家才能一起做得更好。”

02

AI的“大腦”革命:一腦,何以多形?

過去兩年,具身智能的火熱源于一個(gè)共同期待:大語言模型的出色能力有目共睹,若將其接入機(jī)器人,有望賦予機(jī)器人更聰明的大腦,從而為行業(yè)打開新空間。

然而熱鬧兩年后,具身智能仍沒有標(biāo)準(zhǔn)答案。在眾多技術(shù)路線中,“一腦多形”被提及得最多——同一套智能系統(tǒng),可適配人形、車形等不同形態(tài),只要場景需要,外形可變,核心大腦不變。

接下來登場的嘉賓們,對“一腦多形”帶來了不同方向的詮釋和分享。

微分智飛創(chuàng)始人高飛教授:智能飛行機(jī)器人研究進(jìn)展及產(chǎn)業(yè)應(yīng)用


率先登場的,是微分智飛創(chuàng)始人高飛教授,他帶來的分享主題是《智能飛行機(jī)器

人研究進(jìn)展及產(chǎn)業(yè)應(yīng)用》。

高飛的演講風(fēng)格極具畫面感:他用《普羅米修斯》的無人機(jī)編隊(duì)鏡頭引出“分布式集群”終極形態(tài),又用《流浪地球》的混亂場景對比“去中心化”的重要性。

一開場,他拋出判斷:通用飛行智能正處于爆發(fā)前夜。

隨后列出行業(yè)“老大難”問題:氣流擾動(dòng)大,擦碰即墜機(jī);機(jī)載算力弱,傳感器廉價(jià);數(shù)據(jù)稀缺,采集比車輛/行人困難得多。

高飛認(rèn)為,這些行業(yè)難題是困難,也是機(jī)會,目前他們團(tuán)隊(duì)正逐步攻克這些難關(guān),也因此會形成自己的技術(shù)護(hù)城河。

在接下來的演講里,他從五個(gè)方面展示了團(tuán)隊(duì)的技術(shù)突破。

首先是敏捷輕量的多任務(wù)小腦,高飛教授現(xiàn)場展示了一鏡到底的實(shí)飛視頻,畫面里無人機(jī)的飛行能力非??犰琶艚?,可以穿越各種狹窄縫隙,比專業(yè)的飛手操作更熟練。

為了更形象說明這一點(diǎn),他展示了一場長鏈路動(dòng)作下飛手和機(jī)器人的人機(jī)對抗,其中包含連續(xù)倒轉(zhuǎn)穿過六個(gè)框的特技飛行等動(dòng)作。實(shí)驗(yàn)表明,相比高水平飛手,算法完成的軌跡質(zhì)量有明顯提升。

這里他還提到一個(gè)細(xì)節(jié),他們團(tuán)隊(duì)最小的端到端神經(jīng)網(wǎng)絡(luò)可以運(yùn)行在 自重僅50 克左右的無人機(jī)上,其機(jī)載算力低于 1 Tops。借助團(tuán)隊(duì)研發(fā)的自動(dòng)化數(shù)據(jù)采集系統(tǒng)和合成數(shù)據(jù)生成管線,有效數(shù)據(jù)采集成本大大降低,

大腦方面,高飛老師認(rèn)為跨本體和跨場景非常重要。

他展示了一個(gè)飛行器在無GPS和人為操作的環(huán)境下走迷宮,還展示了復(fù)雜地下空間場景中飛行器的自主決策和自主導(dǎo)航過程。

他突出了集群系統(tǒng)和分布式群腦飛行,展示了多個(gè)一鏡到底的 demo :無人機(jī)集群穿越復(fù)雜稠密竹林的自主導(dǎo)航,以及五臺飛行機(jī)器人協(xié)同搬運(yùn)載荷。

最后,高飛教授還放了一個(gè)彩蛋。

在家庭空間里,飛行操作一體化的飛行機(jī)器人可以幫人拿飲料、拿物品,高飛教授表示,他們已經(jīng)可以做到通過單電機(jī)線驅(qū)動(dòng)機(jī)構(gòu)實(shí)現(xiàn)飛行機(jī)械手的多自由度形變,使其在穩(wěn)定飛行同時(shí)展現(xiàn)出指尖捏取和掌心抓握等交互操作能力。這種新構(gòu)型飛行器雖然操作自由度不高,但可實(shí)現(xiàn)抓了就跑,充分發(fā)揮本體移動(dòng)性優(yōu)勢,未來有望應(yīng)用于短途物品運(yùn)送,還可作為人手的空間延伸,通過端側(cè)輔助駕駛完成復(fù)雜任務(wù)。

這些技術(shù)的展示充滿了對技術(shù)落地應(yīng)用的想象力。

最后高飛對研發(fā)成果的潛在應(yīng)用也做了總結(jié),憑借“小腦-大腦-群腦”三位一體方案,飛行具身智能體目前已經(jīng)可以代替人進(jìn)入高危環(huán)境完成信息采集,也正在推進(jìn)在安防巡檢、物流運(yùn)輸?shù)葓鼍暗穆涞貞?yīng)用。

寧波東方理工大學(xué)的助理教授金鑫:空間智能技術(shù)在自動(dòng)駕駛及具身機(jī)器人中的初步探索與應(yīng)用


寧波東方理工大學(xué)的助理教授金鑫,做了題為《空間智能技術(shù)在自動(dòng)駕駛及具身機(jī)器人中的初步探索與應(yīng)用》的分享。

金鑫表示,其團(tuán)隊(duì)圍繞空間智能在自動(dòng)駕駛與機(jī)器人領(lǐng)域的應(yīng)用進(jìn)行了初步探索。他將空間智能分為三個(gè)層級:基礎(chǔ)的空間感知(構(gòu)建3D世界)、進(jìn)階的空間交互(支持智能體與環(huán)境的互動(dòng))以及最終的空間理解與生成(基于對世界的理解創(chuàng)造數(shù)據(jù))。

團(tuán)隊(duì)將工作細(xì)分為空間構(gòu)建與智能體訓(xùn)練兩部分,并形成了“建模-訓(xùn)練-迭代優(yōu)化”的閉環(huán)研發(fā)飛輪。

在自動(dòng)駕駛領(lǐng)域,針對真實(shí)數(shù)據(jù)采集難以覆蓋極端場景的痛點(diǎn),團(tuán)隊(duì)提出了以“占據(jù)柵格”(Occupancy)為中心的生成方案UniScene(CVPR25)。金鑫指出,Occupancy是連接場景理解與多模態(tài)生成的理想橋梁,它兼顧了必要的語義和幾何信息。

基于此,團(tuán)隊(duì)開發(fā)了兩階段生成流程:先由鳥瞰圖布局生成語義Occupancy,再以此衍生出激光雷達(dá)點(diǎn)云與多視角視頻。該方案的迭代版本(UniScene V2)新增了深度與語義分割模態(tài),并支持按傳感器位置生成數(shù)據(jù),目前已與理想汽車合作測試其在復(fù)雜場景下的泛化能力。

更進(jìn)一步,團(tuán)隊(duì)在近期的工作OmniNWM中,引入了“規(guī)劃-生成”的閉環(huán)機(jī)制。

金鑫解釋道,該模型能將規(guī)劃的軌跡作為條件輸入,預(yù)測未來場景變化,并在世界模型內(nèi)部通過計(jì)算Occupancy的物理指標(biāo)(如碰撞、速度)實(shí)現(xiàn)獎(jiǎng)勵(lì)反饋與閉環(huán)優(yōu)化,從而構(gòu)建“萬能駕駛導(dǎo)航世界模型”。

在機(jī)器人領(lǐng)域,團(tuán)隊(duì)將相同方法論遷移,用于生成機(jī)器人訓(xùn)練數(shù)據(jù),提出ORV框架。

針對第一人稱視角數(shù)據(jù)稀缺的問題,團(tuán)隊(duì)構(gòu)建了InterVLA數(shù)據(jù)集,通過學(xué)生模擬機(jī)器人并佩戴GoPro,配合動(dòng)捕設(shè)備,采集了包含語言指令、多視角視頻與動(dòng)作軌跡的數(shù)據(jù)。同時(shí),團(tuán)隊(duì)與北京銀河通用合作研發(fā)的DreamVLA模型,其核心思想是將大語言模型的“思維鏈”思想引入視覺-語言-動(dòng)作模型,讓模型在輸出最終動(dòng)作前,先在潛在空間中推理出“世界知識”(如哪些物體需移動(dòng)、深度估計(jì)等),從而提升決策的可解釋性與泛化能力。

此外,針對機(jī)器人方位感知弱的問題,團(tuán)隊(duì)還提出了模塊化的“方位基礎(chǔ)模型”,使其能像人一樣抓取物體的合適部位(如瓶身而非瓶蓋)。最后,金鑫介紹了將“解耦學(xué)習(xí)”嵌入世界模型的工作(DisWM,ICCV25),旨在從仿真環(huán)境的視覺輸入中分離出與任務(wù)無關(guān)的干擾因素(如光照、紋理),使智能體能更專注于關(guān)鍵信息,從而提升訓(xùn)練效率與在真實(shí)世界的魯棒性。

他表示,上述技術(shù)正逐漸嘗試走出實(shí)驗(yàn)室,探索產(chǎn)業(yè)化可能。

上海人工智能實(shí)驗(yàn)室青年科學(xué)家王靖博:人形機(jī)器人,從“盲動(dòng)”走向“感知驅(qū)動(dòng)”


隨后,上海人工智能實(shí)驗(yàn)室青年科學(xué)家王靖博帶來了主題演講《從虛擬走向現(xiàn)實(shí),構(gòu)建通用人形機(jī)器人控制與交互策略》。

長期以來,人形機(jī)器人的研究是否必要一直存在著爭議。演講伊始,王靖博博士就對此做出了回應(yīng)。他指出,由人類搭建的真實(shí)生活環(huán)境,也面向人類的各種需求,這決定了人形必然是一種相對通用的方案。在數(shù)據(jù)維度,互聯(lián)網(wǎng)上有大量來源于人類日常生活的第一人稱及第三人稱數(shù)據(jù),其中包含的運(yùn)動(dòng)邏輯和操作邏輯,對于模型訓(xùn)練來說都是可用資源。在應(yīng)用層,人形機(jī)器人的交互邏輯、安全性等研究,最終也會回饋到人自身。

而人形機(jī)器人現(xiàn)階段研究的核心問題之一,就是如何在仿真中訓(xùn)練機(jī)器人,并使其在真實(shí)世界中實(shí)現(xiàn)穩(wěn)定、可泛化的運(yùn)動(dòng)與控制。由于仿真環(huán)境與真實(shí)物理世界之間存在的差異,人形機(jī)器人的技能訓(xùn)練與部署長期面臨著Sim2Real的鴻溝。對此,王靖博博士介紹了其團(tuán)隊(duì)的最新成果,通過對日常生活環(huán)境的集成性構(gòu)造,以及創(chuàng)新的感知和表示方案,顯著提升了復(fù)雜地形下運(yùn)動(dòng)策略的遷移成功率。其核心在于用體素化的點(diǎn)云表示壓縮環(huán)境信息,并在仿真中引入機(jī)器人本體的激光雷達(dá)自掃描,以更好地對齊仿真與真實(shí)的傳感器數(shù)據(jù)分布,從而使機(jī)器人能提前感知地形變化,如臺階、吊頂,并預(yù)先規(guī)劃動(dòng)作,而非依賴碰撞后的力反饋。

此外,王靖博博士在演講中提到了構(gòu)建統(tǒng)一的動(dòng)作技能表征,作為基礎(chǔ)的人形機(jī)器人運(yùn)動(dòng)控制模型,可以進(jìn)一步拓展在有效的可遷移的人形機(jī)器人感知方案下的動(dòng)作與技能選擇,使得人形機(jī)器人可以在基礎(chǔ)的運(yùn)動(dòng)之外完成和場景的交互已經(jīng)多種球類運(yùn)動(dòng)。

在演講中,王靖博博士進(jìn)一步指出,人形機(jī)器人的控制策略正從“盲走盲動(dòng)”轉(zhuǎn)向“感知驅(qū)動(dòng)”,融合視覺、激光雷達(dá)等環(huán)境感知,以實(shí)現(xiàn)機(jī)器人在復(fù)雜、非結(jié)構(gòu)化環(huán)境中的自主導(dǎo)航與交互是必然趨勢。關(guān)于人形機(jī)器人的未來,王靖博博士認(rèn)為,當(dāng)前的模型參數(shù)量和學(xué)習(xí)方式限制了技能容量和更多元控制形式的探索。長遠(yuǎn)來看,構(gòu)建容量更大,更高效利用數(shù)據(jù)的方案,例如離線的監(jiān)督學(xué)習(xí),是提升機(jī)器人技能通用性和長程控制能力的可行路徑。

一腦多形圓桌論壇:探索?落地?未來


演講過后,一場關(guān)于“一腦多形”的圓桌論壇,將整個(gè)會場氣氛推向高潮。在英諾天使基金ED王建明的主持下,浙江大學(xué)控制學(xué)院副教授,微分智飛創(chuàng)始人高飛,寧波東方理工大學(xué)助理教授金鑫,上海人工智能實(shí)驗(yàn)室青年科學(xué)家王靖博三位嘉賓圍繞著具身智能、世界模型等話題進(jìn)行了熱烈討論。

首先,王建明拋出一個(gè)共性問題,邀請三位嘉賓用簡短的話語,概括近兩年具身智能在學(xué)術(shù)與產(chǎn)業(yè)領(lǐng)域的發(fā)展進(jìn)展。

對此,高飛直言:“現(xiàn)在還沒到技術(shù)路線收斂的時(shí)候,行業(yè)仍處于探索階段。這一波技術(shù)浪潮的本質(zhì),是 AI 與機(jī)器人本體結(jié)合后,帶來的智能性與泛化性飛躍。” 他同時(shí)強(qiáng)調(diào),從業(yè)者要時(shí)刻牢記做具身智能的初心。金鑫對此表示認(rèn)同,并補(bǔ)充道:“這兩年高校在具身智能領(lǐng)域的機(jī)會,相較于產(chǎn)業(yè)界其實(shí)要少一些。未來不妨將核心關(guān)鍵問題交由高校攻關(guān),產(chǎn)業(yè)界則專注于技術(shù)落地轉(zhuǎn)化。”

王靖博也分享了自己的觀察:“人形機(jī)器人其實(shí)十年前就有波士頓動(dòng)力在做運(yùn)動(dòng)能力的展示,但一直沒能真正走進(jìn)大眾的應(yīng)用場景。而當(dāng)軟硬件的code design的理念出現(xiàn)后,整個(gè)領(lǐng)域的發(fā)展節(jié)奏明顯加快了?!?/p>

隨后,王建明針對各個(gè)嘉賓的研究方向分別提出了不同的問題。首先向高飛的demo提出稱贊,高飛認(rèn)為自己相對來講,是無人機(jī)比較懂AI的,是AI里比較懂無人機(jī)的。無人機(jī)的技術(shù)范式會往端到端的方向傾斜,端到端則是指:進(jìn)來的是圖像等傳感器數(shù)據(jù),輸出的是電機(jī)控制指令。最后,高飛表示,端到端是一種范式,強(qiáng)化學(xué)習(xí)是一種解法,黑箱是一種模式,三者是不一樣的概念,不宜直接畫等號。

后面,又對世界模型進(jìn)行了探討,現(xiàn)在世界模型的定義都沒有達(dá)成共識,金鑫認(rèn)為,自動(dòng)駕駛和機(jī)器人這兩個(gè)任務(wù)對世界模型的要求和技術(shù)范式都是有很大的區(qū)別的,世界模型是一個(gè)非常大的概念。而在自動(dòng)駕駛中,視頻生成比較主流一些,因?yàn)樯婕暗桨踩缘膯栴}。

金鑫還指出,世界模型與 VLA 模型并非對立關(guān)系,二者完全可以結(jié)合應(yīng)用。他提到,他與清華、科大合作的一篇survey前一天剛上線,文章專門探討了這一問題,要么先建世界模型再做policy learning,要么兩個(gè)一起做。

當(dāng)被問及 “何時(shí)能實(shí)現(xiàn)性能優(yōu)異的通用控制器” 時(shí),王靖博從仿真與現(xiàn)實(shí)兩個(gè)維度給出答案:如果是在仿真器里面,不去做例舉的限制,實(shí)現(xiàn)一個(gè)還不錯(cuò)的控制器還可以,只是要精度和平衡性之間找到最優(yōu)解。如果是在真實(shí)世界上,這個(gè)就得看算法和硬件了。他以自己實(shí)驗(yàn)室的實(shí)踐舉例,相同的算法在不同的人形機(jī)器人上運(yùn)行,會得出截然不同的結(jié)果,最終得由硬件性能來決定。

論壇尾聲,嘉賓們將話題拉回到技術(shù)落地這一核心議題。高飛暢想:未來說不定我們會在生活中看到各種各樣的無人機(jī),這也是他的夢想,他還調(diào)侃道,如果未來沒有各種無人機(jī)高空作業(yè)或者送人送貨的活,這是他們這幫學(xué)者、創(chuàng)業(yè)者的失敗。

金鑫對于具身智能的落地則表示,不想回到工業(yè)自動(dòng)化的階段,但現(xiàn)在工業(yè)自動(dòng)化那邊的需求很著急,希望趕緊把機(jī)器人用起來。這是一個(gè)很大的gap,創(chuàng)業(yè)者腦海中的想法和實(shí)際情況有差距,上級會讓你快讀落地,投資人在其中扮演的角色是既讓技術(shù)人員很著急,又讓需求方不能那么著急,將這種困境概括成一句話就是——“既要星辰大海,也要趕緊賺錢?!?/p>

王靖博則基于自身的觀察給出了審慎的判斷:落地還比較遙遠(yuǎn),但今年已經(jīng)給大家看到了很多希望,至少我們在現(xiàn)實(shí)生活中,已經(jīng)能見到相關(guān)技術(shù)的落地應(yīng)用,而不再是像看波士頓動(dòng)力的 Atlas 機(jī)器人那樣,如同觀看科幻大片。

伴隨著對未來的暢想與探討,數(shù)據(jù)&一腦多形分論壇圓滿落幕。

未經(jīng)「AI科技評論」授權(quán),嚴(yán)禁以任何方式在網(wǎng)頁、論壇、社區(qū)進(jìn)行轉(zhuǎn)載!

公眾號轉(zhuǎn)載請先在「AI科技評論」后臺留言取得授權(quán),轉(zhuǎn)載時(shí)需標(biāo)注來源并插入本公眾號名片。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
5連勝廣東傳來2好3壞消息!胡明軒傷情正式確認(rèn),新的隱患出現(xiàn)

5連勝廣東傳來2好3壞消息!胡明軒傷情正式確認(rèn),新的隱患出現(xiàn)

后仰大風(fēng)車
2025-12-24 07:15:06
競聘四天24人報(bào)名,孔令輝鄧亞萍成熱門,31日揭曉結(jié)果

競聘四天24人報(bào)名,孔令輝鄧亞萍成熱門,31日揭曉結(jié)果

最美的開始
2025-12-24 19:28:33
鄭麗文韓國瑜聯(lián)手清黨渣,侯友宜盧秀燕跪地求饒,國民黨終于姓鄭

鄭麗文韓國瑜聯(lián)手清黨渣,侯友宜盧秀燕跪地求饒,國民黨終于姓鄭

徐徐道史
2025-12-24 11:09:24
對華合約全部撕毀!中國又一伙伴背后捅刀子,騙走了20億倒向美國

對華合約全部撕毀!中國又一伙伴背后捅刀子,騙走了20億倒向美國

嘆知
2025-12-23 17:58:52
2026年開始,財(cái)神已經(jīng)提前敲門的三個(gè)星座,擋都擋不住

2026年開始,財(cái)神已經(jīng)提前敲門的三個(gè)星座,擋都擋不住

小晴星座說
2025-12-22 20:58:19
孩子父親真相大白一月后,奚美娟低調(diào)露面,手足無措,落寞呆坐

孩子父親真相大白一月后,奚美娟低調(diào)露面,手足無措,落寞呆坐

孫镴北漂拍客
2025-12-24 12:54:58
這次,朱孝天將阿信給他保留的體面撕得粉碎,楊天真的話有人信了

這次,朱孝天將阿信給他保留的體面撕得粉碎,楊天真的話有人信了

叨嘮
2025-12-24 07:00:09
日本將向?yàn)蹩颂m提供60億美元的財(cái)政援助,以支持其對俄的自衛(wèi)

日本將向?yàn)蹩颂m提供60億美元的財(cái)政援助,以支持其對俄的自衛(wèi)

桂系007
2025-12-22 01:56:32
中央批準(zhǔn):C9常務(wù)副書記,出任985大學(xué)黨委書記(副部長級)

中央批準(zhǔn):C9常務(wù)副書記,出任985大學(xué)黨委書記(副部長級)

雙一流高校
2025-12-24 18:59:14
祖巴茨才是快船最大毒瘤!傷停后倫納德科林斯齊爆,防守也變好了

祖巴茨才是快船最大毒瘤!傷停后倫納德科林斯齊爆,防守也變好了

籃球資訊達(dá)人
2025-12-24 16:14:39
黃金,突發(fā)!

黃金,突發(fā)!

證券時(shí)報(bào)e公司
2025-12-24 12:23:14
你聽過最勁爆的瓜是啥?網(wǎng)友:被大八歲的補(bǔ)習(xí)班老師表白了

你聽過最勁爆的瓜是啥?網(wǎng)友:被大八歲的補(bǔ)習(xí)班老師表白了

帶你感受人間冷暖
2025-11-26 00:10:06
A股:做好心理預(yù)期,明天(12月25日),行情很可能會重演歷史了

A股:做好心理預(yù)期,明天(12月25日),行情很可能會重演歷史了

財(cái)經(jīng)大拿
2025-12-24 14:02:33
就在剛剛!CBA首位主帥正式下課!接替者是遼籍名帥!曾帶隊(duì)奪冠

就在剛剛!CBA首位主帥正式下課!接替者是遼籍名帥!曾帶隊(duì)奪冠

老吳說體育
2025-12-24 15:56:54
導(dǎo)演翟俊杰去世

導(dǎo)演翟俊杰去世

新京報(bào)
2025-12-24 16:04:03
曝小米汽車預(yù)研市面上所有智駕路線,智駕團(tuán)隊(duì)超1800人

曝小米汽車預(yù)研市面上所有智駕路線,智駕團(tuán)隊(duì)超1800人

IT之家
2025-12-24 11:24:14
媽媽吐槽16歲兒子特意讓煮紅糖姜茶帶學(xué)校,也沒敢問,評論區(qū)炸鍋

媽媽吐槽16歲兒子特意讓煮紅糖姜茶帶學(xué)校,也沒敢問,評論區(qū)炸鍋

觀察鑒娛
2025-12-24 09:09:51
張學(xué)良晚年吐真言:西安事變我只是名義上的,真正的主角是他!楊虎城后人上門,他為何閉口不談?

張學(xué)良晚年吐真言:西安事變我只是名義上的,真正的主角是他!楊虎城后人上門,他為何閉口不談?

歷史回憶室
2025-12-16 14:26:14
-5℃!雨夾雪、雪!今夜抵達(dá)浙江

-5℃!雨夾雪、雪!今夜抵達(dá)浙江

魯中晨報(bào)
2025-12-24 20:13:04
一次扣12分+罰款1000元!上海警方通報(bào):多車被重罰,涉這項(xiàng)違法行為!

一次扣12分+罰款1000元!上海警方通報(bào):多車被重罰,涉這項(xiàng)違法行為!

新浪財(cái)經(jīng)
2025-12-24 14:51:31
2025-12-24 22:32:49
AI科技評論 incentive-icons
AI科技評論
點(diǎn)評學(xué)術(shù),服務(wù)AI
7022文章數(shù) 20717關(guān)注度
往期回顧 全部

科技要聞

智譜和MiniMax拿出了“血淋淋”的賬本

頭條要聞

韓國財(cái)閥千金在柬埔寨被捕 被指涉嫌參與性交易和販毒

頭條要聞

韓國財(cái)閥千金在柬埔寨被捕 被指涉嫌參與性交易和販毒

體育要聞

26歲廣西球王,在質(zhì)疑聲中成為本土得分王

娛樂要聞

懷孕增重30斤!闞清子驚傳誕一女夭折?

財(cái)經(jīng)要聞

北京進(jìn)一步放松限購 滬深是否會跟進(jìn)?

汽車要聞

“運(yùn)動(dòng)版庫里南”一月份亮相???或命名極氪9S

態(tài)度原創(chuàng)

家居
藝術(shù)
親子
數(shù)碼
軍事航空

家居要聞

法式大平層 智能家居添彩

藝術(shù)要聞

2026第一福!孫曉云親筆“福”字出爐

親子要聞

52歲王小騫淚談早產(chǎn)經(jīng)歷,孕8個(gè)月羊水早破,住院保胎10天剖宮產(chǎn)

數(shù)碼要聞

手機(jī)太小,平板太大?華為MatePad Mini給出年終出行最優(yōu)解

軍事要聞

"九三"受閱女民兵:96米需踢出128個(gè)正步 每步75厘米

無障礙瀏覽 進(jìn)入關(guān)懷版