国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

對話自變量CTO王昊:在具身智能的“無人區(qū)” 探索端到端大模型的終極形態(tài)|連線創(chuàng)始人

0
分享至

編者按:他們創(chuàng)辦的公司或已是獨角獸,或剛啟動種子輪,或已家喻戶曉,或長期身居幕后,或正起于微末,但他們都是中國新經(jīng)濟的微觀脈搏,是這輪產(chǎn)業(yè)和技術(shù)升級的微觀主導(dǎo)者和實踐者,不同行業(yè)成千成萬的他們的身影匯聚,投射變革的洪流。

由財聯(lián)社和《科創(chuàng)板日報》聯(lián)合發(fā)起的 “連線創(chuàng)始人/CEO”欄目,主要關(guān)注創(chuàng)新創(chuàng)業(yè)型企業(yè),以企業(yè)創(chuàng)始人/CEO的訪談為一手信源,讓成長中的創(chuàng)業(yè)公司走入公眾和市場視野,并發(fā)掘最新技術(shù)和產(chǎn)業(yè)趨勢。

《科創(chuàng)板日報》4月10日訊(記者 李明明)2026年開年,國內(nèi)具身智能賽道已是獨角獸林立——自變量機器人、眾擎機器人、星動紀元、千尋智能等企業(yè)估值相繼突破百億大關(guān),加之宇樹科技、智元機器人等已有的百億陣營,行業(yè)百億估值公司至少已達10家,正式邁入頭部獨角獸集群發(fā)展的新階段。

在這波密集的資本浪潮中,自變量機器人的爆發(fā)力尤為典型。據(jù)《科創(chuàng)板日報》記者此前獨家獲悉,繼今年1月官宣獲得由字節(jié)跳動、紅杉中國等機構(gòu)參與的十億元級別融資后,該公司在2月份短期內(nèi)又迅速完成了數(shù)億元的新一輪融資。

近期,《科創(chuàng)板日報》記者采訪了自變量聯(lián)合創(chuàng)始人、CTO王昊,圍繞自變量的技術(shù)路線迭代、開源進展、場景落地戰(zhàn)略,以及對具身智能行業(yè)的核心判斷,展開了全面且深度的分享。

王昊對《科創(chuàng)板日報》記者勾勒出一幅清晰的技術(shù)藍圖:端到端大模型是底座,世界模型與VLA的融合是突破口,人機協(xié)作的數(shù)據(jù)閉環(huán)是燃料,家庭場景是終極試煉場。這是一條與"分段式""垂類小模型"截然不同的路徑,也是一條需要長期投入、承受不確定性的"無人區(qū)"探索。

當(dāng)前具身智能行業(yè)深陷“虛假繁榮”的癥結(jié):技術(shù)驗證長期困于仿真“溫室”——完美參數(shù)下表現(xiàn)優(yōu)異,卻難以跨越重力、摩擦、光線變化等真實物理世界的“鴻溝”,導(dǎo)致模型泛化能力弱、長期穩(wěn)定性差、成本居高不下,產(chǎn)業(yè)化落地舉步維艱。

自變量與深圳市人工智能行業(yè)協(xié)會等聯(lián)合舉辦的全球首屆具身智能開發(fā)者大會(EAIDC 2026),正是對這一行業(yè)痛點的正面回應(yīng)。其意義在于徹底撕掉Demo濾鏡,將競賽全面推向"真實荒野":通過全球最大規(guī)模真機實戰(zhàn),讓上百條機械臂在真實場地同步作業(yè),直面物理世界的所有變量,拒絕"紙上談兵"。這不僅為技術(shù)成熟度提供了在真實物理環(huán)境中檢驗的平臺,更以標(biāo)準落地、產(chǎn)業(yè)鏈閉環(huán)推動產(chǎn)業(yè)化拐點的真正到來。


開發(fā)者大會啟示:具身智能需要"動手"的文化

作為全球首屆具身智能開發(fā)者大會的核心環(huán)節(jié),"具亮計劃"決賽采用了極具挑戰(zhàn)性的賽制:參賽團隊在三天內(nèi),于現(xiàn)場完成數(shù)據(jù)采集、模型訓(xùn)練和測試。王昊對《科創(chuàng)板日報》記者表示,這種賽制設(shè)計 deliberately 模擬了具身智能的真實開發(fā)環(huán)境。

"我們提供所有硬件,沒有力覺傳感器,"王昊舉例說,"但在限速柔性操作、需要處理力信息時,有的隊伍嘗試密集捕獲機械臂關(guān)節(jié)的電流信號。雖然沒有那么準確,但把關(guān)節(jié)電流信號加入模型,可以部分彌補力感受的缺失——這是很有意思的想法。"

更令他印象深刻的是團隊間的分化:"第一天下午開源,到晚上有的選手還在調(diào)試環(huán)境,有的已經(jīng)有成績了。后來我們發(fā)現(xiàn),頻繁評測、仔細觀察數(shù)據(jù)和硬件的團隊,比不動手的成長得快得多。"

王昊從中提煉出一個關(guān)鍵認知:具身智能是交互學(xué)習(xí),讓機器在測試和人的觀察中找到問題,越有可能找到物理世界復(fù)雜性的解法。 "這和一般的編程比賽差別很大——一般編程比賽沒有硬件,沒有數(shù)據(jù)。在具身智能黑客松中,愛動手、愛評測的團隊更容易突出。"

談及舉辦比賽的初衷,王昊表示核心目標(biāo)是降低開源項目的使用門檻,建立通用和標(biāo)準的接口。"把所有人放在同一套硬件、相同賽制下,大家會嘗試怎么盡可能快把代碼用起來、用好。同時,我們也想尋找同路人,挖掘優(yōu)秀選手,支持和鼓勵大家一起加入具身智能大潮。"

從WALL-OSS到世界模型與VLA的融合框架

開發(fā)者大會見證了開源社區(qū)的蓬勃活力,而技術(shù)的最終落地還要看模型產(chǎn)品的真實迭代。距離 WALL-OSS 開源過去整整半年,王昊在接受《科創(chuàng)板日報》記者專訪時,揭曉了這段時間的關(guān)鍵突破——世界模型與VLA(Vision-Language-Action)的聯(lián)合建模。

"現(xiàn)在業(yè)界的世界模型大多是分段式做法:先訓(xùn)練一個視頻生成模型,再用動作生成模型,兩段式拼接完成從視覺到動作的映射。"王昊解釋道,"但我們的聯(lián)合框架中,動作和視覺是聯(lián)合建模的。這樣做的好處是,動作預(yù)測可以更好地尊重未來的預(yù)測,而未來預(yù)測又可以更好地遵循物理規(guī)律。通過聯(lián)合建模,我們希望突破世界模型很難遵循物理規(guī)律的限制。"

這一技術(shù)路線的差異化在于對"物理規(guī)律"的強調(diào)。當(dāng)前視頻生成模型雖然能夠預(yù)測像素級的變化,但在具身智能場景下,模型需要理解的是物理世界的因果關(guān)系——物體如何受力、操作如何改變環(huán)境狀態(tài)。王昊指出,短期來看,自變量將引入更多多模態(tài)輸出架構(gòu)以減少誤差累積;中長期目標(biāo)則是在基模上實現(xiàn)"絕對意義上通用場景的泛化"。

當(dāng)被問及"多模態(tài)"的具體所指時,王昊明確回應(yīng):"以前是輸出有限模態(tài),現(xiàn)在在端到端模型上更多考慮動作、語言、視覺的融合。"這意味著自變量的新一代架構(gòu)將不再局限于傳統(tǒng)的"視覺編碼器+大語言模型+動作輸出"的流水線,而是探索更原生的多模態(tài)對齊方式。

"我們越來越傾向于做原生的多模態(tài),在很早的時候就讓語言和動作對齊。"王昊表示,"以前的方式往往會犧牲視覺能力——語言描述的信息很宏觀,但具身操作需要厘米級甚至毫米級的空間精度,時間尺度在秒級別。如果能讓動作、語言、視覺在同一個水平下進行思維鏈推理,模型就能同時在宏觀和微觀上都有清晰表現(xiàn)。"

數(shù)據(jù)戰(zhàn)略:真機、Ego-Centric與穿戴式的金字塔配比

盡管WALL-OSS在數(shù)據(jù)驅(qū)動下取得了長足進步,但王昊也坦言,數(shù)據(jù)采集依然是橫亙在具身智能行業(yè)面前的壁壘之一。面對近期大熱的Ego-Centric(第一人稱視角)和Human-Centric(以人為中心)數(shù)采路線,王昊明確表態(tài):自變量的核心路線不會偏移,但數(shù)據(jù)策略將發(fā)生重大調(diào)整。

自變量一直堅持真實世界的數(shù)據(jù)采集,過往主要來自機器人真機,這個不會停。所有交互式學(xué)習(xí)和強化學(xué)習(xí),最重要的數(shù)據(jù)都來自于真機。王昊強調(diào),"但2026年會有很大變化——我們會越來越依賴人的穿戴式或Ego-Centric方式采集數(shù)據(jù),這是大趨勢。"

王昊特別區(qū)分了Human-Centric與Ego-Centric的概念差異:"Human-Centric意味著機器人的通用數(shù)據(jù)形態(tài),它一定有末端執(zhí)行器,可以是靈巧手的某種設(shè)備,自由度和機器人的自由度之間取折中。而Ego-Centric的數(shù)據(jù)完全和人的自由度一致,手持式、穿戴設(shè)備則介于兩者之間。"

這一數(shù)據(jù)戰(zhàn)略的底層邏輯是人機協(xié)作的閉環(huán)進化。"盡早用人機協(xié)作的方式讓閉環(huán)跑起來,"王昊說,"先用高質(zhì)量數(shù)據(jù)、大規(guī)模訓(xùn)練構(gòu)建基礎(chǔ)模型,然后放到真實環(huán)境中。它有做不好的地方,人就接管,幫它從錯誤中恢復(fù)。這樣的數(shù)據(jù)會成為非常寶貴的來源,幫助模型提升。評測、訓(xùn)練和數(shù)據(jù)采集要在同一個過程中完成,而不是分開的。"

自變量從成立第一天起就選擇了"大小腦統(tǒng)一的端到端大模型"路線。王昊對《科創(chuàng)板日報》記者坦誠分析了這一路線的核心挑戰(zhàn)。

"端到端相比于分層或小模型,訓(xùn)練更復(fù)雜,需要的規(guī)模更大。如果沒有這兩個條件,端到端的效果不一定比分層模型好。"他指出,"端到端意味著必須有規(guī)模效應(yīng)——數(shù)據(jù)量、模型參數(shù)量要上去。這兩點達不到,訓(xùn)練很難起效。"

第二個挑戰(zhàn)在于Infra。"對端到端大模型的Infra要求和以往小模型不同。如果在Infra上沒有突破,訓(xùn)練效率會很低。"王昊補充道。

第三個挑戰(zhàn)更為根本:評測的復(fù)雜性。"語言大模型可以看loss曲線,但具身智能不是這樣。Loss不能反映真實世界的表現(xiàn),因為真實世界是閉環(huán)系統(tǒng)——環(huán)境怎么變化,模型怎么應(yīng)對,更考驗?zāi)P偷奶幚砟芰Α?

面對"數(shù)據(jù)壁壘"的經(jīng)典難題——模型不夠好就做不了復(fù)雜任務(wù),采集不到高質(zhì)量數(shù)據(jù),沒有數(shù)據(jù)又訓(xùn)練不好模型——王昊的解決方案是盡早建立人機協(xié)作的閉環(huán),讓評測、訓(xùn)練和數(shù)據(jù)采集在同一個過程中完成。

家庭場景:直面"具身智能的圣杯"

上個月,自變量機器人攜手58集團旗下58到家平臺,在深圳正式推出了一項全新的智能保潔家庭服務(wù)——機器人保潔員正式“上崗”,與保潔阿姨協(xié)同作業(yè)完成家庭清潔服務(wù)。自變量與58同城合作進軍家庭服務(wù)場景,這一選擇在外界看來頗為激進——家庭場景比工業(yè)場景標(biāo)準化程度更低,難度更大。王昊卻認為這是必由之路。

"家庭確實是具身智能的圣杯,因為它代表最廣泛、最開放的環(huán)境,以及最廣泛的任務(wù)。解決了家庭任務(wù),就代表模型可以實現(xiàn)完全的泛化,基本上實現(xiàn)保姆級別的通用機器人。"他強調(diào),"這個最終目標(biāo)不是先做簡單場景、最后達到,而是一開始就要直面最復(fù)雜、最開放的場景,才能讓模型智能水平提升到可以解決豐富場景的能力。越早開始越好。"

進入家庭場景需要攻克兩大難題。首先是零樣本泛化能力。"進入家庭一開始沒有多少機會訓(xùn)練模型,需要激發(fā)模型的推理能力,讓它在家庭場景通過推理探索成功,之后才能結(jié)合人機協(xié)作讓訓(xùn)練越來越好。"其次是長程任務(wù)的精細度問題。"現(xiàn)在基模進入家庭,在很多任務(wù)上有完成的趨勢或動作意圖——比如對任何物體都有伸過去抓的趨勢,但精細度不夠,導(dǎo)致完成復(fù)雜長程任務(wù)時錯誤累積、最終失敗。"

王昊提出兩點解決思路:一是激發(fā)模型的推理能力,通過語言、視覺、動作在同一水平下的思維鏈,讓模型自己規(guī)劃和反思;二是在大規(guī)模真機基礎(chǔ)上探索強化學(xué)習(xí),"保持在基模標(biāo)準下更高的空間精度"。

對于商業(yè)化時間表,王昊對《科創(chuàng)板日報》記者給出了相對務(wù)實的判斷:"普通清潔、收納這類任務(wù),1-2年時間可以實現(xiàn)完全自主。但在所有家庭任務(wù)中實現(xiàn)閉環(huán),時間可能要更長。"他區(qū)分了"大規(guī)模進入家庭"和"機器人被大規(guī)模應(yīng)用"兩個概念,強調(diào)前者是逐步迭代的過程。

專訪最后,面對"具身智能是否會重走大模型卷算力、高資本投入老路"的提問,王昊給出了冷靜的判斷。

"做基礎(chǔ)模型的投入一直很高。我們從公司成立第一天起,在數(shù)據(jù)、算力、基礎(chǔ)設(shè)施上的投入都很大。"他承認,"但一旦建立規(guī)?;?yīng),當(dāng)你投入10倍資源取得領(lǐng)先時,資源聚集效應(yīng)會越來越明顯。你會以數(shù)量級的優(yōu)勢在速度上超越別人,后來者要追上需要花數(shù)倍資源的增加。越早開始越有優(yōu)勢,越晚開始越難做成。"

這是否意味著需要千億級投入?"大家可以看自動駕駛的投入,每年幾百億。如果完全靠純資本投入很難,這是一個逐步發(fā)展的過程。"王昊強調(diào),"很難在一年內(nèi)把模型做到完全通用。要協(xié)作發(fā)展、階段式發(fā)展——不停提升基模能力,不斷迭代,反饋回來做更強的基模。模型越來越強,和商業(yè)競爭形成互補,研發(fā)投入才會越來越大,最后形成完全閉環(huán)。"

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

就一點
2025-11-22 10:36:39
新冠后遺癥對人體的最大影響,很多人深受其害,有些人還不自知

新冠后遺癥對人體的最大影響,很多人深受其害,有些人還不自知

呼吸科大夫胡洋
2026-02-22 11:39:12
查爾斯開出見面條件:梅根得先發(fā)誓不賣果醬

查爾斯開出見面條件:梅根得先發(fā)誓不賣果醬

娛圈觀察員
2026-04-10 08:02:39
644準備官宣離婚了?黃景瑜王玉雯戀情?張靚穎養(yǎng)小男友?李純被算計?姨太問答

644準備官宣離婚了?黃景瑜王玉雯戀情?張靚穎養(yǎng)小男友?李純被算計?姨太問答

毒舌扒姨太
2026-04-10 22:39:19
一年虧損四千萬,全國陷“關(guān)停潮”,曾經(jīng)的金飯碗如今正慘遭拋棄

一年虧損四千萬,全國陷“關(guān)停潮”,曾經(jīng)的金飯碗如今正慘遭拋棄

忠于法紀
2026-04-06 15:10:31
打破越南歷史慣例,蘇林時代權(quán)力格局已定,對中國意味著什么?

打破越南歷史慣例,蘇林時代權(quán)力格局已定,對中國意味著什么?

湘評中外
2026-04-10 17:16:52
賺了6.5萬!美伊大消息!A股要炸了!

賺了6.5萬!美伊大消息!A股要炸了!

龍行天下虎
2026-04-11 00:10:50
毛主席從不批評劉伯承和徐向前,一個是不忍批評,另一個無需批評

毛主席從不批評劉伯承和徐向前,一個是不忍批評,另一個無需批評

鶴羽說個事
2026-04-08 22:21:11
“以軍疑從樓頂扔下巴勒斯坦兒童”,李在明:若為真,可有措施?

“以軍疑從樓頂扔下巴勒斯坦兒童”,李在明:若為真,可有措施?

觀察者網(wǎng)
2026-04-10 12:08:12
中國“撿錢”時代將要來臨:若手中只有10萬,試下死啃這兩條線

中國“撿錢”時代將要來臨:若手中只有10萬,試下死啃這兩條線

混沌錄
2026-04-03 17:28:23
走進人民大會堂前,鄭麗文團中現(xiàn)“特殊人物”,臺當(dāng)局撒彌天大謊

走進人民大會堂前,鄭麗文團中現(xiàn)“特殊人物”,臺當(dāng)局撒彌天大謊

影孖看世界
2026-04-10 15:38:51
公安部新規(guī)落地!70歲駕照免年審真相,這件事不做駕照直接注銷

公安部新規(guī)落地!70歲駕照免年審真相,這件事不做駕照直接注銷

復(fù)轉(zhuǎn)這些年
2026-04-10 12:01:32
東風(fēng)導(dǎo)彈泄密案!間諜郭萬鈞一家三口,全部被處以死刑

東風(fēng)導(dǎo)彈泄密案!間諜郭萬鈞一家三口,全部被處以死刑

番外行
2026-03-31 08:28:28
神壇徹底崩塌!李莉被中情局盯上的謊言,該徹底戳穿了

神壇徹底崩塌!李莉被中情局盯上的謊言,該徹底戳穿了

老馬拉車莫少裝
2026-03-01 17:23:52
河南女孩被清華大學(xué)錄取,4年后畢業(yè)懵了,清華:系統(tǒng)里沒有你

河南女孩被清華大學(xué)錄取,4年后畢業(yè)懵了,清華:系統(tǒng)里沒有你

第四思維
2025-08-28 09:32:02
研究表明:性生活越頻繁,射精和勃起問題越少!

研究表明:性生活越頻繁,射精和勃起問題越少!

黯泉
2026-04-05 20:40:12
3500億!鄭麗文獲勝,盧秀燕宴席,徹底劃清界限

3500億!鄭麗文獲勝,盧秀燕宴席,徹底劃清界限

可樂愛微笑
2026-03-07 00:47:11
伊朗內(nèi)部分歧,前往巴基斯坦與美國談判的人并不掌握權(quán)力

伊朗內(nèi)部分歧,前往巴基斯坦與美國談判的人并不掌握權(quán)力

山河路口
2026-04-10 23:59:10
高市不演了,東京降級對華關(guān)系,向全球告狀,稱中國欠日本兩筆賬

高市不演了,東京降級對華關(guān)系,向全球告狀,稱中國欠日本兩筆賬

素顏為誰傾城人
2026-04-11 02:43:18
煙再次被關(guān)注?醫(yī)生研究發(fā)現(xiàn):吸得越多,壽命或越長?告訴你真相

煙再次被關(guān)注?醫(yī)生研究發(fā)現(xiàn):吸得越多,壽命或越長?告訴你真相

王醫(yī)生健康講壇
2026-04-09 20:10:08
2026-04-11 03:59:00
財聯(lián)社 incentive-icons
財聯(lián)社
以“準確、快速、權(quán)威、專業(yè)”為新聞準則,為投資者提供專業(yè)的投資資訊。
706461文章數(shù) 1019875關(guān)注度
往期回顧 全部

科技要聞

馬斯克狂發(fā)大火箭也養(yǎng)不起AI 年虧50億美元

頭條要聞

特朗普:美軍艦已裝最先進武器 未來24小時成關(guān)鍵窗口

頭條要聞

特朗普:美軍艦已裝最先進武器 未來24小時成關(guān)鍵窗口

體育要聞

17歲賺了一百萬美元,25歲被CBA裁員

娛樂要聞

黃景瑜王玉雯否認戀情!聚會細節(jié)被扒

財經(jīng)要聞

李強主持召開經(jīng)濟形勢專家和企業(yè)家座談會

汽車要聞

搭載第二代刀片電池及閃充技術(shù) 騰勢N8L閃充版預(yù)售35萬起

態(tài)度原創(chuàng)

藝術(shù)
旅游
房產(chǎn)
本地
公開課

藝術(shù)要聞

深圳頂級海景地段,為啥留下一排“幽靈別墅群”?真相成謎!

旅游要聞

周末來這里!足不出滬體驗首爾韓屋風(fēng)情

房產(chǎn)要聞

28條新規(guī)落地!好房子,終于有了“廣州標(biāo)準”!

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版