国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

對(duì)話技術(shù)明星丁琰:具身智能融資超500億,UMI技術(shù)為何突然爆紅

0
分享至


鹿明機(jī)器人聯(lián)席CTO丁琰

具身領(lǐng)域里,恐怕沒人比丁琰更能感受到行業(yè)的巨震和瘋狂。

9月30日,他任職的一星機(jī)器人,因?yàn)榧麘?zhàn)略收縮,成立不到半年意外解散。時(shí)任CTO的丁琰在隨后短暫的33天里,罕見地完成了別人可能需要數(shù)年完成的人生軌跡,失業(yè)、創(chuàng)業(yè)、融資、被收編。

一直到11月2日,丁琰以聯(lián)席CTO的身份加入明星初創(chuàng)公司鹿明機(jī)器人,他帶著昔日的10余名骨干終于安定下來。他形容這段經(jīng)歷,每天的信息都在爆炸,人生幾乎以10倍速度快進(jìn)。

去年他留學(xué)歸國(guó),意外站在具身行業(yè)最炙熱的前沿,在市場(chǎng)上大受青睞。他是最早將GPT-2模型融入機(jī)器人的研究員,博士期間發(fā)表論文有上千引用,回國(guó)后又all in UMI技術(shù)(一種數(shù)據(jù)采集技術(shù),相比當(dāng)下的遙操作方式,采集效率提升3~5倍,成本降低近90%),成為國(guó)內(nèi)最大的UMI玩家。時(shí)代的機(jī)遇放大個(gè)人的際遇,推著他往前跳躍。

丁琰 加入鹿明不久,UMI技術(shù)因?yàn)槊绹?guó)具身公司Genralist、Sunday Robotics火爆,在國(guó)內(nèi)也意外走紅。

丁琰再次被推到時(shí)代前列。市場(chǎng)放量增長(zhǎng),鹿明機(jī)器人的UMI數(shù)據(jù)采集工廠也在同步擴(kuò)增。同時(shí),鹿明機(jī)器人也剛完成來自鼎暉投資、南京創(chuàng)投等多家機(jī)構(gòu)的數(shù)億融資,這也預(yù)示著已經(jīng)發(fā)布四款機(jī)器人產(chǎn)品的鹿明機(jī)器人,從數(shù)據(jù)入口、模型到本體實(shí)現(xiàn)全棧自研,真正步入具身賽道的曠野。

在這次訪談中,丁琰不僅首次分享了離開一星加入鹿明這一階段的瘋狂和割裂,也系統(tǒng)性復(fù)盤了UMI數(shù)據(jù)采集與模型訓(xùn)練中不斷精進(jìn)的認(rèn)知。

今年具身智能融資超過500億,僅11月公開宣布的融資案例就超過35起,臨近年末,具身行業(yè)依然表現(xiàn)出火熱的勁頭。丁琰說,第二梯隊(duì)公司也成長(zhǎng)起來了,“FOMO”(擔(dān)心錯(cuò)過)的投資機(jī)構(gòu)在加速上車。

以下是《白鯨實(shí)驗(yàn)室》和他的對(duì)話,為了文本閱讀方便,我們做了精簡(jiǎn)處理。

01

以10倍加速的33天

白鯨實(shí)驗(yàn)室:最近多家具身智能公司,包括鹿明機(jī)器人在內(nèi),紛紛宣布獲得數(shù)億融資,在當(dāng)前商業(yè)落地仍不明確時(shí),行業(yè)還在加速?

丁琰:我個(gè)人感受是,從資本以及帶動(dòng)人才的涌入來看,確實(shí)是一個(gè)加速過程。

現(xiàn)在具身智能行業(yè)梯隊(duì)已經(jīng)分明,第一梯隊(duì)公司估值動(dòng)輒上百億,對(duì)投資人而言價(jià)格太貴了,而且普遍營(yíng)收低迷,能不能上市、 帶來回報(bào),充滿不確定性。第二梯隊(duì)公司也成長(zhǎng)起來了,還未入局的投資人有一種普遍的憂慮——擔(dān)心錯(cuò)過上車的機(jī)會(huì),所以會(huì)涌入第二梯隊(duì)里有潛力的公司。

白鯨實(shí)驗(yàn)室:你的經(jīng)歷非常有意思,去年博士畢業(yè)后去上海AI Lab,一家實(shí)驗(yàn)室,今年先后去了吉利的一星機(jī)器人(由于吉利戰(zhàn)略收縮,成立半年自動(dòng)解散),目前在鹿明機(jī)器人公司擔(dān)任聯(lián)席CTO,經(jīng)歷身份的巨變,有沒有更加堅(jiān)定的信仰?

丁琰:這個(gè)問題挺好的,我的經(jīng)歷確實(shí)挺壓縮的,在極短時(shí)間里,瘋狂地經(jīng)歷各種起伏。我就職的這幾家風(fēng)格也完全不同,上海AI Lab屬于國(guó)家級(jí)實(shí)驗(yàn)室,更多偏向?qū)W術(shù)研究,可能只有20%偏向工業(yè)。一星機(jī)器人屬于大公司(吉利)孵化的一個(gè),有自己的場(chǎng)景和業(yè)務(wù)線,只需要服務(wù)好自有的業(yè)務(wù)線,而鹿明屬于明星初創(chuàng)公司,商業(yè)化落地和技術(shù)研究一樣都很重要。

過去幾年,我見證了具身智能從少有人問津到火熱的過程,越來越意識(shí)到具身智能絕對(duì)是未來,唯一的問題是商業(yè)化落地,這相當(dāng)于是一個(gè)戰(zhàn)場(chǎng)。這么多玩家入局,想要生存,必須把所有戰(zhàn)略資源、研究重點(diǎn)集中起來,準(zhǔn)備好在未來6-8年打一場(chǎng)硬仗。這也是行業(yè)重塑的過程。

這一點(diǎn)我非常堅(jiān)定,在上海AI Lab或者一星時(shí),可能都沒那么堅(jiān)定。

白鯨實(shí)驗(yàn)室:為什么?

丁琰:可能因?yàn)槁姑麟x這個(gè)戰(zhàn)場(chǎng)的核心地帶更近。

白鯨實(shí)驗(yàn)室:一星不近嗎?

丁琰:一星相當(dāng)于大公司的后花園,有一個(gè)大家長(zhǎng)把你保護(hù)起來,離前線還是稍微遠(yuǎn)一些。而鹿明這樣的初創(chuàng)公司,離炮火更近,可以近距離看到戰(zhàn)爭(zhēng)的全貌。

白鯨實(shí)驗(yàn)室:離得更近,不會(huì)覺得商業(yè)化更難,現(xiàn)實(shí)更骨感嗎?

丁琰:換家公司我可能都會(huì)很擔(dān)心。有些公司瘋狂融錢,只畫餅,在商業(yè)化上沒有任何落地,沒有閉環(huán),會(huì)讓人覺得害怕。而鹿明屬于另一種,一直在做商業(yè)閉環(huán)。

白鯨實(shí)驗(yàn)室:有沒有逐漸祛魅的想法?

丁琰:基本上沒有。

白鯨實(shí)驗(yàn)室:今年10月一星解散,到11月初加入鹿明,時(shí)間很短,很多人向你投來橄欖枝。

丁琰:我從美國(guó)留學(xué)歸國(guó)后,對(duì)時(shí)間確實(shí)有非常明顯的體感差異。我在美國(guó)讀了五年博士,感覺時(shí)間過得很漫長(zhǎng),回國(guó)后,每天感覺都是加速狀態(tài)。在上海AI Lab,可以看作2倍在加速,在一星相當(dāng)于3到5倍在加速。離開一星后的過渡期,我覺得是10倍加速,手機(jī)上的信息非常爆炸,每天都逼著你做決定。

從9月30號(hào)知道一星解散的消息,到11月2號(hào)加入鹿明。這期間,我們還籌備了一家公司,做各種路演,都融到資了,有一家投資公司已經(jīng)給TS(投資意向書),還有兩家準(zhǔn)備投。其中一家準(zhǔn)備打錢的前一天,我決定不干了,還去一家企業(yè)待了三天,發(fā)現(xiàn)不對(duì)勁,后來選定了鹿明。

白鯨實(shí)驗(yàn)室:你說當(dāng)時(shí)手機(jī)都爆掉了,有多少家具身智能公司邀約你?

丁琰:沒有30家,也得有20來家,工作機(jī)會(huì)非常多。

白鯨實(shí)驗(yàn)室:怎么就確定是鹿明了呢?

丁琰:鹿明的CEO是創(chuàng)業(yè)者行列里最懂技術(shù)的那一批,同時(shí)也懂商業(yè),這是一個(gè)非常少見的組合。

白鯨實(shí)驗(yàn)室:具身智能行業(yè)里的創(chuàng)業(yè)者,純技術(shù)出身的還挺多。

丁琰:不太一樣。具身智能行業(yè)里純技術(shù)出身的創(chuàng)業(yè)者,有些是做大模型出身的,有些是做自動(dòng)駕駛出身的,我更偏向于選擇機(jī)器人出身的團(tuán)隊(duì)。

白鯨實(shí)驗(yàn)室:會(huì)有什么不同嗎?市場(chǎng)上有不少聲音認(rèn)為,自動(dòng)駕駛技術(shù)離具身智能很近。

丁琰:我從來不覺得這兩者貼近,反而認(rèn)為區(qū)別非常大。舉個(gè)例子,做自動(dòng)駕駛的人,是不需要考慮車是怎么造的,硬件已經(jīng)很成熟了。而具身智能需要去造機(jī)器人,還有不同形態(tài)的機(jī)器人,算法和數(shù)據(jù)都沒有完全實(shí)現(xiàn)跨本體遷移。

比如數(shù)據(jù),作為預(yù)訓(xùn)練是可以用的,但是在精細(xì)化操作時(shí),完全不能使用。如果可以使用,UMI技術(shù)也不會(huì)這么熱鬧了。

白鯨實(shí)驗(yàn)室:你經(jīng)歷的大起大落,似乎是中國(guó)具身智能行業(yè)今年火熱的一個(gè)縮影,很有代表性。當(dāng)時(shí)為什么沒有自己創(chuàng)業(yè)?

丁琰:創(chuàng)業(yè)對(duì)于創(chuàng)始人的心力要求很高,說實(shí)話,我覺得自己hold不住。這里面最大的問題是人的管理。鹿明的團(tuán)隊(duì)有很強(qiáng)的資源整合能力,原有的硬件業(yè)務(wù)和我們數(shù)據(jù)業(yè)務(wù)也很互補(bǔ)。

02

UMI技術(shù)不只是數(shù)采,而是類似基建的系統(tǒng)

白鯨實(shí)驗(yàn)室:你從加入上海AI Lab,到現(xiàn)在一直研究UMI技術(shù),有沒有始料未及的問題?

丁琰:其實(shí)沒有什么始料未及的問題,我很堅(jiān)信自己的技術(shù)直覺。

我在上海AI Lab還是挺幸運(yùn)的,當(dāng)時(shí)只是一位研究員,實(shí)驗(yàn)室leader對(duì)我們很寬容,允許我們all in 一個(gè)當(dāng)時(shí)還不明確的方向。其實(shí)最大的難題是如何說服其他12位PHD(博士)和碩士一起做UMI技術(shù)研究,這是非常難的,一旦出現(xiàn)一點(diǎn)問題,這事就黃了。事后回顧,如果重新來一遍,能不能成功我都沒有把握。

白鯨實(shí)驗(yàn)室:你是如何說服他們的?

丁琰:我一直覺得UMI不單單是一個(gè)數(shù)采技術(shù),而是一套體系,有點(diǎn)像基建。在這個(gè)基礎(chǔ)上,你可以起萬丈高樓。我當(dāng)時(shí)就這樣告訴大家,很多人也是有這個(gè)信仰的,也一直在研究這個(gè)領(lǐng)域。

我當(dāng)時(shí)寫過這樣一句話,硬件、數(shù)據(jù)、算法和系統(tǒng)是很難分開的。我們不僅要實(shí)現(xiàn)硬件的自給自足,算法也要根據(jù)硬件和數(shù)據(jù)特征開發(fā),系統(tǒng)適配前三者,讓這四塊形成內(nèi)循環(huán),大力氣搞infra,才能走得更穩(wěn)健。

白鯨實(shí)驗(yàn)室:國(guó)內(nèi)今年多地流行建數(shù)據(jù)采集工廠,為什么普遍都采用遙操作的方式,而不是UMI技術(shù)?

丁琰:數(shù)采廠可以消耗掉一大批機(jī)器人本體,相當(dāng)于幫助具身智能公司賣機(jī)器人設(shè)備了。如果站在數(shù)據(jù)的通用和資產(chǎn)化的第一性原理來看,UMI數(shù)據(jù)是最正確的選擇。

白鯨實(shí)驗(yàn)室:一個(gè)百萬級(jí)的數(shù)采廠需要多少機(jī)器人?

丁琰:百萬級(jí)都不行,得千萬級(jí)。我覺得數(shù)采廠,至少7成的錢都花在硬件上。數(shù)采廠普遍管理成本很高,尤其對(duì)數(shù)采員的管理,因?yàn)檫@個(gè)工作非??菰?,重復(fù)性勞動(dòng),通常又是外包,大家并不會(huì)很用心,導(dǎo)致采集到的數(shù)據(jù)質(zhì)量不會(huì)很高。

比如一個(gè)關(guān)門的動(dòng)作,常規(guī)情況需要機(jī)器人的爪子拿著門把手一推,但實(shí)際上采到的數(shù)據(jù)里,可能一些數(shù)采員直接用手推開的,軌跡數(shù)據(jù)完全不能用。后續(xù)數(shù)據(jù)清洗時(shí),工作量會(huì)很大,合格率估計(jì)很低。

鹿明在數(shù)據(jù)質(zhì)量管控方面采取了極為嚴(yán)格的標(biāo)準(zhǔn),創(chuàng)新性地構(gòu)建了六道數(shù)據(jù)檢測(cè)與校驗(yàn)流程,從采集、處理到交付進(jìn)行全鏈路質(zhì)量把控,最大程度保障交付給用戶的數(shù)據(jù)具備高一致性與高可信度,能夠穩(wěn)定支撐模型訓(xùn)練與性能提升。

白鯨實(shí)驗(yàn)室:國(guó)內(nèi)流行的數(shù)采方式是遙操作,和你們的UMI技術(shù)的主要區(qū)別是什么?

丁琰:完全是兩個(gè)流派。遙操作是人實(shí)時(shí)控制機(jī)器人執(zhí)行任務(wù),要依賴機(jī)器人本體采集數(shù)據(jù),而UMI不依賴機(jī)器人硬件或本體,通過獨(dú)立的采集設(shè)備,如手持裝置、頭戴裝備等,記錄人類的操作過程,這可以遷移到不同的機(jī)器人身上。

如果不考慮效率、成本和硬件適配,遙操作機(jī)器人采集的數(shù)據(jù)信息量比較多,模型好訓(xùn),不需要處理。而UMI技術(shù)采集的數(shù)據(jù)最大的優(yōu)勢(shì)是效率高、成本低和異構(gòu)本體適配,不過對(duì)數(shù)據(jù)后處理要求很高,這正是行業(yè)的門檻。

白鯨實(shí)驗(yàn)室:最近比較火的兩家美國(guó)具身智能公司Generalist、Sunday Robotics,采用的也是UMI技術(shù),會(huì)影響國(guó)內(nèi)數(shù)采方式嗎?

丁琰:已經(jīng)影響了,至少觀點(diǎn)刷新了一波,我相信這就是未來,國(guó)內(nèi)公司的數(shù)采也一定會(huì)follow這一路線。

白鯨實(shí)驗(yàn)室:如果follow的話,是不是意味著早期建的數(shù)采工廠是一種資源的浪費(fèi)?

丁琰:對(duì),但是UMI是一場(chǎng)革命,它必然發(fā)生。目前國(guó)內(nèi)全棧跑完UMI整套流程,擁有商用數(shù)采設(shè)備、數(shù)據(jù)處理、數(shù)采工廠和模型驗(yàn)證的,只有鹿明機(jī)器人一家。目前市場(chǎng)對(duì)鹿明FastUMI的數(shù)采方案需求量非常大,我相信FastUMI會(huì)成為未來數(shù)據(jù)采集的標(biāo)準(zhǔn),會(huì)替代一大部分早期的數(shù)采工廠方案。

白鯨實(shí)驗(yàn)室:綜合考慮來看,這兩種數(shù)據(jù)采集方式是互補(bǔ)的?

丁琰:我的理解,完全不是互補(bǔ),而是互為取代。

白鯨實(shí)驗(yàn)室:你在一星時(shí),包括現(xiàn)在的鹿明,也有自己的數(shù)采工廠,UMI技術(shù)獲得數(shù)據(jù)還對(duì)外出售,商業(yè)模式上算跑出來了嗎?

丁琰:苗頭已經(jīng)很明顯,目前勢(shì)頭很好。

白鯨實(shí)驗(yàn)室:難點(diǎn)是什么?

丁琰:整個(gè)商業(yè)模式現(xiàn)在處于大混戰(zhàn)中。每家具身智能公司都覺得數(shù)據(jù)是彈藥倉(cāng)庫(kù),都要自己建,哪怕利潤(rùn)很低。可能過一段時(shí)間,形勢(shì)會(huì)更明朗。大家會(huì)發(fā)現(xiàn)數(shù)采廠特別難搞。投入和產(chǎn)出也不成正比,如果管理不當(dāng),或者技術(shù)不夠優(yōu)秀,實(shí)際上是虧錢的狀態(tài)。

這個(gè)時(shí)候,三方的數(shù)據(jù)服務(wù)商的價(jià)值就會(huì)凸顯,這也是鹿明正在快速深挖的領(lǐng)域。我們已經(jīng)算是這個(gè)市場(chǎng)里做UMI數(shù)據(jù)的Top1選手。

白鯨實(shí)驗(yàn)室:你們現(xiàn)在收入情況如何?

丁琰:具體數(shù)字暫時(shí)不好說,不過我們有真金白銀進(jìn)賬,整體還是不錯(cuò)的,國(guó)內(nèi)外的具身公司基本上都有找我們采買過設(shè)備和數(shù)據(jù),目前數(shù)據(jù)采集與交付能力已接近滿載。

03

黎明前夜

白鯨實(shí)驗(yàn)室:模型適用scaling law法則(數(shù)據(jù)越多,訓(xùn)練的模型性能越好),現(xiàn)在的數(shù)據(jù)集對(duì)模型而言處于什么狀態(tài)?

丁琰:還是一個(gè)黎明前夜,大家都知道scaling law,但數(shù)據(jù)規(guī)模還遠(yuǎn)遠(yuǎn)不夠。

白鯨實(shí)驗(yàn)室:現(xiàn)在訓(xùn)練一個(gè)模型,能吃透的數(shù)據(jù)集是多少?

丁琰:不好判斷。但我們自己比較堅(jiān)持FastUMI路線,提供最高質(zhì)量的UMI數(shù)據(jù)。

白鯨實(shí)驗(yàn)室:你們是如何突破數(shù)據(jù)采集規(guī)模的?

丁琰:建數(shù)采廠,增加產(chǎn)能,也只有這一條路。對(duì)初創(chuàng)公司而言,需要很大的決心。剛開始我們計(jì)劃建一兩個(gè)數(shù)采廠,沒想到UMI的需求這么大。現(xiàn)在預(yù)期加大,準(zhǔn)備增建兩三個(gè),一步步往前推。

白鯨實(shí)驗(yàn)室:建數(shù)采廠的成本不大嗎?

丁琰:和傳統(tǒng)遙操作數(shù)采廠相比,投入的成本會(huì)便宜很多,不需要買機(jī)器人,就會(huì)節(jié)省很多成本。

白鯨實(shí)驗(yàn)室:能便宜多少?

丁琰:具體數(shù)字暫不透露,但價(jià)值不僅在于便宜,而在于跨本體適配,才能形成真正的數(shù)據(jù)市場(chǎng)。

白鯨實(shí)驗(yàn)室:行業(yè)里有人說過,如果現(xiàn)在一個(gè)剛剛起步的具身玩家,一比一復(fù)刻Generalist的數(shù)采方式和規(guī)模,大概需要至少要超過半年甚至一年的時(shí)間,不包括數(shù)據(jù)基建的過程。

丁琰:那太樂觀了??赡馨肽?、一年都完全達(dá)不到。舉個(gè)例子,光造抓夾硬件,可能需要四到六個(gè)月。采集27萬小時(shí)需要多久呢?至少也需要1000人,馬不停蹄的采集大半年,甚至小一年才能達(dá)到。

怎么可能半年就復(fù)制出Generalist的規(guī)模?除了像我們團(tuán)隊(duì)這樣有硬件、軟件基礎(chǔ),又有資源整合能力的,我覺得中國(guó)其他團(tuán)隊(duì),在一年內(nèi)是不可能有人復(fù)制出這種規(guī)模。

白鯨實(shí)驗(yàn)室:Generalist現(xiàn)在以每周1萬小時(shí)的速度增長(zhǎng),鹿明是在過去一個(gè)月時(shí)間里,積累了1萬小時(shí)真機(jī)數(shù)據(jù),這個(gè)時(shí)長(zhǎng)和美國(guó)Generalist相比,是什么水平?

丁琰:我們剛剛起步,但我們未來一定比他們快,要相信我們的組織能力和調(diào)動(dòng)資源的能力。

04

低估機(jī)器人的復(fù)雜性

白鯨實(shí)驗(yàn)室:今年大家討論的概念太多了,像VLA是今年Figure帶火的,你覺得為什么它就成了主流?

丁琰:VLA一直是比較熱的話題。以前沒有大語(yǔ)言模型,更多是一個(gè)視頻輸入、動(dòng)作輸出。大語(yǔ)言模型火了后,加入進(jìn)來,是很自然的過程。語(yǔ)言模態(tài)加入,參數(shù)量變多,模型能記住更多動(dòng)作,也能更好地完成任務(wù)。

白鯨實(shí)驗(yàn)室:你曾說VLA還處于非常早期階段,目前它只能解決機(jī)器人不到10%的問題,它不擅長(zhǎng)解決的是什么任務(wù)?擅長(zhǎng)的是什么任務(wù)?

丁琰:這個(gè)問題非常有意思。首先機(jī)器人有不同的派別,以前的傳統(tǒng)機(jī)器人,通過加一堆特定規(guī)則,把專項(xiàng)任務(wù)能解決得非常漂亮,效率高、成功率高,問題在于沒法泛化。VLA這種范式,相當(dāng)于用通用的方式,只需要把不同任務(wù)的數(shù)據(jù)輸入進(jìn)去,就可以做得很漂亮。

這似乎是一種趨勢(shì),目標(biāo)很美好,現(xiàn)實(shí)是輸入的數(shù)據(jù)完全不夠用,導(dǎo)致輸出成功率可能只有百分之三四十,完全達(dá)不到傳統(tǒng)機(jī)器人99%的目標(biāo)。甚至還得花好多精力微調(diào),一旦環(huán)境有一點(diǎn)變化,成功率又下降。解決問題的效率也跟不上,整個(gè)解決方案也不怎么順滑優(yōu)美。

VLA肯定是未來,但還有很長(zhǎng)的路,現(xiàn)在許多任務(wù)它都解決不了。像顛勺做菜這類看起來簡(jiǎn)單的任務(wù),即使是世界上最牛的VLA模型成功率也不會(huì)很高。

白鯨實(shí)驗(yàn)室:VLA的問題是因?yàn)閿?shù)據(jù)規(guī)模太小,影響它的泛化能力嗎?

丁琰:一方面是數(shù)據(jù)的問題,目前真機(jī)數(shù)據(jù)規(guī)模太小。

另一方面也是模型架構(gòu)問題,現(xiàn)在有一種趨勢(shì),總覺得一個(gè)模型能解決機(jī)器人的所有問題,這低估了問題的復(fù)雜性。比如躲避障礙物,效率,遇到一些日常意外怎么解決,模型實(shí)際落地中會(huì)冒出很多問題。如果腦子里只有一個(gè)VLA或者其他什么模型,我覺得這是有問題的。

白鯨實(shí)驗(yàn)室:關(guān)于VLA和世界模型的定義分歧很多。有人覺得世界模型是方向,還有人覺得VLA才是核心,世界模型只是VLA的虛擬環(huán)境,通過世界模型生成的虛擬數(shù)據(jù),可以反過來提升模型的效率性能。你怎么看?

丁琰:VLA是一個(gè)很寬泛的定義,只要有一個(gè)vison和language輸入,然后生成一個(gè)動(dòng)作行為,我認(rèn)為就是VLA。另外,部分VLA模型中間某個(gè)模塊依靠一個(gè)世界模型來完成,如果按照這種定義的話,我覺得VLA是包含世界模型的。

白鯨實(shí)驗(yàn)室:模型訓(xùn)練時(shí),吃透數(shù)據(jù)是不是一個(gè)難題。

丁琰:需要很多耐心和試驗(yàn),我總覺得機(jī)器人是一個(gè)經(jīng)驗(yàn)性工程。你得瘋狂的去做試驗(yàn)、試錯(cuò),才能得到一些insight和know-how(這兩個(gè)英文單詞都強(qiáng)調(diào),真正下場(chǎng)踩過坑,才能獲得的經(jīng)驗(yàn))。怎么吃數(shù)據(jù)其實(shí)也是在不斷試錯(cuò)中調(diào)整的。

白鯨實(shí)驗(yàn)室:這個(gè)吃透數(shù)據(jù)過程進(jìn)展到什么程度了?

丁琰:不斷去探索數(shù)據(jù)的邊界。我們覺得數(shù)據(jù)就像寶藏,現(xiàn)在探索的可能才十分之一。什么樣的數(shù)據(jù)算好,什么樣的不好,為什么不好,怎么采好數(shù)據(jù),這數(shù)據(jù)需要多少模態(tài),每個(gè)模態(tài)之間怎么影響,這都是非常大的問題,但對(duì)完成任務(wù)是很有價(jià)值的。這些我們一直在探索,也需要很長(zhǎng)的時(shí)間。

白鯨實(shí)驗(yàn)室:目前你們能看到數(shù)據(jù)的局部邊界嗎?

丁琰:沒有,我們自己反正沒找到,我覺得這個(gè)邊界還挺遠(yuǎn)的,我們才探索了一部分。

白鯨實(shí)驗(yàn)室:你怎么看仿真數(shù)據(jù)和真機(jī)數(shù)據(jù)?

丁琰:我覺得這是不同的流派。我不是很相信仿真,甚至覺得兩者的差距有點(diǎn)大。但是仿真肯定是有用的,只是說這個(gè)用處多大,我沒有探索,也不好評(píng)價(jià)它的邊界。

我一直有個(gè)比方,如果你想把真機(jī)數(shù)據(jù)跟仿真數(shù)據(jù)混在一起,有點(diǎn)像做菜,把一個(gè)冬瓜跟苦瓜混在一起,能不能做好,是可以的。絕對(duì)比單獨(dú)做一個(gè)冬瓜或一個(gè)苦瓜要難的,多少比例,什么時(shí)候加入什么樣的數(shù)據(jù),這個(gè)工作量會(huì)很大。

人的精力和資源都是有限的,我只能all in到一條線上去,不能再分散精力去探索仿真數(shù)據(jù)的邊界。

白鯨實(shí)驗(yàn)室:你們目前模型的訓(xùn)練,百分之百都是真機(jī)數(shù)據(jù)嗎?

丁琰:對(duì),百分之百都是真機(jī)數(shù)據(jù)。

白鯨實(shí)驗(yàn)室:最近有一家具身智能公司極佳世界,剛發(fā)布了一個(gè)具身的世界模型,其中仿真數(shù)據(jù)占比達(dá)到了90%,在具體的泛化維度上實(shí)現(xiàn)了三倍的性能提升。

丁琰:它們屬于另一個(gè)流派,對(duì)算力的要求很高,這兩個(gè)流派的隔閡很大,我無法評(píng)價(jià)。

白鯨實(shí)驗(yàn)室:業(yè)內(nèi)也在探索真機(jī)數(shù)據(jù)和仿真數(shù)據(jù)的比例,比如9:1,你會(huì)擔(dān)心多種數(shù)據(jù)的結(jié)構(gòu),會(huì)在模型訓(xùn)練時(shí)取得更好效果嗎?

丁琰:不會(huì)擔(dān)心,目前來看,數(shù)據(jù)問題的邊界還遠(yuǎn)沒有探索出來,不好評(píng)價(jià)。

白鯨實(shí)驗(yàn)室:像中國(guó)的這些數(shù)采廠,消耗不了的數(shù)據(jù),完全可以出海?

丁琰:對(duì),很多人都在做了。

05

具身行業(yè)也需要像OpenAI一樣的領(lǐng)頭羊

白鯨實(shí)驗(yàn)室:最近你在認(rèn)知上最大的變化是什么?

丁琰:我覺得可能是我不只考慮技術(shù)了,在商業(yè)化上更成熟,我們CEO的商業(yè)思維非常好,對(duì)我影響很大。設(shè)計(jì)一款產(chǎn)品時(shí),有些因素我沒考慮到,他就會(huì)從商業(yè)化,或者供應(yīng)鏈的角度上提供分析。比如數(shù)采廠,我們一下擴(kuò)增3個(gè),我擔(dān)心吃不下,他會(huì)給出具體的分析,說3個(gè)剛剛好,目前來看他的判斷是很準(zhǔn)確的。

白鯨實(shí)驗(yàn)室:你來鹿明后,會(huì)做一些技術(shù)上的折中和妥協(xié)嗎?

丁琰:折中是有的。具體怎么折中的話,比如說對(duì)資源的利用,人員的配比上,更偏向一些懂商業(yè)的人,而不是一個(gè)純技術(shù)公司引導(dǎo)的模式。

我覺得不能叫妥協(xié),妥協(xié)的隱含意好像心有不甘。經(jīng)歷過一星的事情后,我的想法變了很多,讓大家活下來更重要,不能一味滿足技術(shù)追求,這是很不負(fù)責(zé)的表現(xiàn)。

白鯨實(shí)驗(yàn)室:你覺得一星在商業(yè)或者技術(shù)上有沒有激進(jìn)的地方?

丁琰:一星倒不是激進(jìn),這種判斷對(duì)一星很不公平。一星已經(jīng)非常自由,也沒有對(duì)不起人,這個(gè)事兒(解散)不是一星能決定的,是吉利集團(tuán)決定的。

白鯨實(shí)驗(yàn)室:大家可能沒有批判一星,而是批判吉利。

丁琰:商業(yè)是很復(fù)雜的一個(gè)行為。人需要妥協(xié),需要考慮更全局的東西,不能太自我,這在商業(yè)世界里是忌諱。

白鯨實(shí)驗(yàn)室:你之前有提到在一星未做完的事情,要在鹿明繼續(xù)做,這個(gè)指什么?

丁琰:其實(shí)就是把整個(gè)FastUMI系統(tǒng)搭建好,這個(gè)思路一直沒有變。我的目標(biāo)就是希望一年之內(nèi)能運(yùn)轉(zhuǎn)起來,形成閉環(huán),如果能完成,就已經(jīng)很牛了。

白鯨實(shí)驗(yàn)室:Generalist的目標(biāo)很明確,就是要做什么事情都能做的機(jī)器人,鹿明呢?

丁琰做成具身領(lǐng)域基礎(chǔ)設(shè)施,數(shù)據(jù)平臺(tái)和硬件平臺(tái)構(gòu)建好。

白鯨實(shí)驗(yàn)室:目前鹿明內(nèi)部最可能率先閉環(huán)的是UMI系統(tǒng),是不是?

丁琰:UMI系統(tǒng)的確閉環(huán)挺快的,現(xiàn)在已經(jīng)看到閉環(huán)的苗頭了。(笑)

白鯨實(shí)驗(yàn)室:現(xiàn)在機(jī)器人的基座模型還沒有達(dá)到GPT3的水平。GPT從2.0到3.5版本,參數(shù)量有上百倍的增長(zhǎng),反觀具身智能賽道,從數(shù)據(jù)上看還沒有形成這么大規(guī)模吧?

丁琰:是這樣的,具身世界也需要一個(gè)領(lǐng)頭羊,這個(gè)領(lǐng)頭羊是誰我不知道,可能是Generalist。他確實(shí)證明了某種成功。但是問題在于,他選擇的路線很獨(dú)特,沒有像OpenAI產(chǎn)生很大的價(jià)值,可以重塑一個(gè)商業(yè)模式,通過付費(fèi)形成收入閉環(huán)。

Generalist的價(jià)值閉環(huán)目前沒找到,現(xiàn)在只是發(fā)布一個(gè)會(huì)疊樂高、疊衣服的demo,這種場(chǎng)景的商業(yè)化落地在哪里?大家怎么跟,投入多少,我覺得都會(huì)影響從GPT2到GPT3的進(jìn)展。比如說像宇樹、智元等行業(yè)第一梯隊(duì)的具身公司都跟進(jìn)嘗試的話,是不是GPT3才會(huì)來?

白鯨實(shí)驗(yàn)室:有一位行業(yè)人,把今年的具身智能比作2015年的自動(dòng)駕駛。

丁琰:我覺得這種比較沒意義,這完全是兩個(gè)賽道。自動(dòng)駕駛可以一家獨(dú)大的,只需要在車?yán)锩娲钶d個(gè)系統(tǒng),最后牌桌上剩幾個(gè)玩家。但是機(jī)器人最后不可能只剩下三個(gè)玩家。機(jī)器人市場(chǎng)很分散,因?yàn)閳?chǎng)景太多了,至少相當(dāng)一段時(shí)間,不可能一家公司的模型把所有的場(chǎng)景全吃掉。

白鯨實(shí)驗(yàn)室:我之前有看到一位具身智能行業(yè)里的人,說大廠的成本很抽象,買幾千張顯卡審批很容易,但是采購(gòu)上百臺(tái)這個(gè)機(jī)器人卻很難,對(duì)現(xiàn)在剛畢業(yè)的具身行業(yè)的年輕人,你會(huì)建議他們先去大廠還是初創(chuàng)公司?

丁琰:這個(gè)事兒其實(shí)也挺難說,因人而異吧。在創(chuàng)業(yè)公司,有一種共同做事業(yè)的感覺。在大廠就有點(diǎn)像領(lǐng)工資那種狀態(tài),沒有自由,但更穩(wěn)定一些。就是看你想要以什么樣的心態(tài)去做事。

大廠的戰(zhàn)略目標(biāo),可能會(huì)更加細(xì)致具體,對(duì)于下面的員工而言就是要堅(jiān)決執(zhí)行。初創(chuàng)公司可能有一點(diǎn)好處,它的打法和戰(zhàn)略調(diào)整非???,每個(gè)人做的事情也更有靈活性。

撰寫|劉培

編輯|八尺

「白鯨實(shí)驗(yàn)室」原創(chuàng)文章

轉(zhuǎn)載、交流、合作請(qǐng)?zhí)砑游⑿牛簂iujiaquan2025

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
19.9元“江浙滬一日游”!上海警方出手:8人歸案,涉案金額3000萬元

19.9元“江浙滬一日游”!上海警方出手:8人歸案,涉案金額3000萬元

新民晚報(bào)
2026-03-13 14:42:33
手感不算特別理想,但快船后場(chǎng)新星在防守端的表現(xiàn)非常驚艷?

手感不算特別理想,但快船后場(chǎng)新星在防守端的表現(xiàn)非常驚艷?

稻谷與小麥
2026-03-14 01:24:23
果然,加拿大對(duì)中國(guó)改口了,禁止協(xié)定簽署,65萬噸油菜籽白買了?

果然,加拿大對(duì)中國(guó)改口了,禁止協(xié)定簽署,65萬噸油菜籽白買了?

百科密碼
2026-02-02 18:09:58
奉勸所有中國(guó)人,大家一定要有心理準(zhǔn)備,央視已經(jīng)點(diǎn)出了核心問題

奉勸所有中國(guó)人,大家一定要有心理準(zhǔn)備,央視已經(jīng)點(diǎn)出了核心問題

安安說
2026-01-27 11:07:23
阿拉伯、伊斯蘭、穆斯林有什么聯(lián)系與區(qū)別,究竟屬于怎樣的關(guān)系?

阿拉伯、伊斯蘭、穆斯林有什么聯(lián)系與區(qū)別,究竟屬于怎樣的關(guān)系?

長(zhǎng)風(fēng)文史
2026-03-11 19:08:09
騎士消息:裁判報(bào)告出爐,悍將復(fù)出時(shí)間曝光,戰(zhàn)獨(dú)行俠出場(chǎng)更新

騎士消息:裁判報(bào)告出爐,悍將復(fù)出時(shí)間曝光,戰(zhàn)獨(dú)行俠出場(chǎng)更新

冷月小風(fēng)風(fēng)
2026-03-13 10:18:18
高校集體官宣:嚴(yán)禁安裝OpenClaw!

高校集體官宣:嚴(yán)禁安裝OpenClaw!

新浪財(cái)經(jīng)
2026-03-12 13:55:22
伊朗發(fā)布最高領(lǐng)袖活動(dòng)照片,結(jié)果被查出AI水印

伊朗發(fā)布最高領(lǐng)袖活動(dòng)照片,結(jié)果被查出AI水印

桂系007
2026-03-13 09:01:12
國(guó)家醫(yī)保局第7號(hào)令:4月1日全國(guó)統(tǒng)一,看病報(bào)銷新規(guī)矩

國(guó)家醫(yī)保局第7號(hào)令:4月1日全國(guó)統(tǒng)一,看病報(bào)銷新規(guī)矩

混沌錄
2026-03-12 20:54:07
2026年補(bǔ)貼標(biāo)準(zhǔn),退休人員年滿70-75歲,能獲得什么待遇?了解下

2026年補(bǔ)貼標(biāo)準(zhǔn),退休人員年滿70-75歲,能獲得什么待遇?了解下

云鵬敘事
2026-02-21 15:34:41
山東今夜風(fēng)雨雪齊上陣,周末出行需注意

山東今夜風(fēng)雨雪齊上陣,周末出行需注意

山東經(jīng)濟(jì)廣播
2026-03-13 16:41:33
“茶幾”正在退出中國(guó)家庭,學(xué)廣東人這樣做,實(shí)用性讓人大開眼界

“茶幾”正在退出中國(guó)家庭,學(xué)廣東人這樣做,實(shí)用性讓人大開眼界

室內(nèi)設(shè)計(jì)師有料兒
2026-02-19 11:17:18
猶太財(cái)團(tuán)全面崩潰,控制中國(guó)純屬白日做夢(mèng)

猶太財(cái)團(tuán)全面崩潰,控制中國(guó)純屬白日做夢(mèng)

生活新鮮市
2026-03-13 15:06:24
兩大跡象出現(xiàn),美伊戰(zhàn)爭(zhēng)進(jìn)入最危險(xiǎn)階段!伊朗:戰(zhàn)斗至最后一刻

兩大跡象出現(xiàn),美伊戰(zhàn)爭(zhēng)進(jìn)入最危險(xiǎn)階段!伊朗:戰(zhàn)斗至最后一刻

時(shí)光在作祟
2026-03-12 03:53:17
長(zhǎng)期不住的房子,物業(yè)費(fèi)能少交嗎?民法典早說了,別再交冤枉錢!

長(zhǎng)期不住的房子,物業(yè)費(fèi)能少交嗎?民法典早說了,別再交冤枉錢!

老特有話說
2026-03-11 14:47:30
緊急叫停!吃瑞舒伐他汀的中老年朋友,出現(xiàn)5種情況,立刻停藥!

緊急叫停!吃瑞舒伐他汀的中老年朋友,出現(xiàn)5種情況,立刻停藥!

今日養(yǎng)生之道
2026-03-13 20:26:39
突發(fā):伊朗首都德黑蘭遭大規(guī)模打擊

突發(fā):伊朗首都德黑蘭遭大規(guī)模打擊

新浪財(cái)經(jīng)
2026-03-14 02:04:45
全紅嬋代言一晚市值暴漲30億,李寧眼睜睜看著機(jī)會(huì)溜走怪誰?

全紅嬋代言一晚市值暴漲30億,李寧眼睜睜看著機(jī)會(huì)溜走怪誰?

情感大頭說說
2026-03-13 21:02:56
星瑞又賣爆了:2月13152輛、2.0T+8AT,家用空間大還省心

星瑞又賣爆了:2月13152輛、2.0T+8AT,家用空間大還省心

Ai愛車
2026-03-13 22:16:06
不是特朗普不想打,而是五角大樓公布的真實(shí)傷亡,真的輸不起了

不是特朗普不想打,而是五角大樓公布的真實(shí)傷亡,真的輸不起了

趣生活
2026-03-13 20:57:25
2026-03-14 03:52:49
白鯨實(shí)驗(yàn)室one incentive-icons
白鯨實(shí)驗(yàn)室one
記錄 AI改變世界的瞬間
102文章數(shù) 14關(guān)注度
往期回顧 全部

財(cái)經(jīng)要聞

“十五五”規(guī)劃綱要,全文來了!

頭條要聞

穆杰塔巴"亮相"沒講話 伊朗學(xué)者:其處境可能非常危險(xiǎn)

頭條要聞

穆杰塔巴"亮相"沒講話 伊朗學(xué)者:其處境可能非常危險(xiǎn)

體育要聞

叕戰(zhàn)奧運(yùn),張雨霏要做回“小將”

娛樂要聞

廣電總局公布演員將用姓氏筆畫定番位

科技要聞

龍蝦熱卷到AI硬件 “無腦”硬件或被淘汰

汽車要聞

置換補(bǔ)貼價(jià)8.68萬 五菱繽果S 525km旗艦款上市

態(tài)度原創(chuàng)

時(shí)尚
數(shù)碼
健康
公開課
軍事航空

扎十一惹:像鳥飛往她的山

數(shù)碼要聞

惠普被指利用固件封鎖翻新墨盒 違反最新全球可持續(xù)標(biāo)準(zhǔn)

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗稱襲擊"林肯"號(hào)航母致其撤走

無障礙瀏覽 進(jìn)入關(guān)懷版