国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

「破殼機(jī)器人」許華哲:兩年內(nèi),中國(guó)將出現(xiàn)可用的家庭機(jī)器人

0
分享至

文|邱曉芬

編輯|蘇建勛

2026年,全球的具身智能機(jī)器人創(chuàng)業(yè)者不約而同將目光方向調(diào)轉(zhuǎn)向深水區(qū):家庭。

點(diǎn)燃這份熱情的,是近期行業(yè)里閃爍著的一絲絲Scaling Law苗頭——

先是硅谷具身智能公司Generalist AI在GEN-1模型上驗(yàn)證了確定性,當(dāng)他們給機(jī)器人喂進(jìn)海量數(shù)據(jù)后,精細(xì)操作任務(wù)成功率竟從64%提升到了驚人的99%;

隨后,硅谷當(dāng)紅的具身智能獨(dú)角獸公司Sunday Robotics也試圖解決家庭場(chǎng)景數(shù)據(jù)難關(guān),不僅推出Umi手套數(shù)據(jù)采集方案,還直接將機(jī)器人Memo送進(jìn)家庭做家務(wù)(收拾餐做、沖咖啡、疊衣服),因此吸引了大量的資本押注。

在大洋彼岸的中國(guó),近期闖入家庭機(jī)器人領(lǐng)域的創(chuàng)業(yè)者中,還有一個(gè)熟悉的身影——許華哲。

“兩年內(nèi),中國(guó)將會(huì)出現(xiàn)可用的家庭機(jī)器人”,他對(duì)于行業(yè)的判斷,同樣樂(lè)觀且激進(jìn)。

作為“伯克利歸國(guó)四子之一”、清華大學(xué)交叉信息研究院助理教授,2023年,許華哲曾加入「星海圖」任前首席科學(xué)家兼聯(lián)合創(chuàng)始人,一起將這家公司打造成中國(guó)具身智能領(lǐng)域的明星公司。

不過(guò),在這家公司估值沖破200億、融資近30億的巔峰時(shí)刻,許華哲又選擇“單飛”并創(chuàng)辦了全新的具身智能公司「破殼機(jī)器人」。

此次重新出發(fā),他想做的是能在家庭場(chǎng)景干活的、真正有泛化性的具身智能機(jī)器人。


△ 許華哲

其實(shí),想做一個(gè)家庭機(jī)器人公司并不是近期偶然的想法。初高中時(shí)的他讀完《喬布斯傳》后,內(nèi)心便萌生創(chuàng)辦一家偉大To C公司的種子。此后,在清華、伯克利、斯坦福的一路升學(xué)中,他一直深耕機(jī)器人強(qiáng)化學(xué)習(xí)方向,夢(mèng)想便是把機(jī)器人送入千萬(wàn)家庭。

他理想中的家庭機(jī)器人,雖然不是無(wú)所不能,卻能完成上一代機(jī)器人(比如掃地機(jī)、洗地機(jī))無(wú)法完成的復(fù)雜任務(wù),比如能進(jìn)行更精細(xì)的清潔工作、有條理的完成諸如洗衣收納的長(zhǎng)序列、多步驟任務(wù)串聯(lián)。

在他看來(lái),這種創(chuàng)業(yè)方向的選擇,也帶有強(qiáng)烈的審美潔癖。許華哲直言,泛化性的本質(zhì)是一種“美與影響力”——用最簡(jiǎn)潔優(yōu)雅的模型,解決人類復(fù)雜的生活問(wèn)題,并真正將AI轉(zhuǎn)化為生產(chǎn)力,而非僅僅替代低端勞動(dòng)力。

從更理性的層面,切入To C家庭場(chǎng)景也包含著許華哲的商業(yè)判斷。在他看來(lái),當(dāng)前大量機(jī)器人廠商將人形機(jī)器人送進(jìn)工廠,完成傳統(tǒng)機(jī)械臂就能完成的上下料、搬運(yùn)箱的工作,本質(zhì)上只是在用新的人性在做舊時(shí)代的事情,機(jī)器人沒有發(fā)揮出真正的通用性。

他認(rèn)為,真正的AGI應(yīng)該在家庭場(chǎng)景中誕生、運(yùn)用,因?yàn)榧彝?chǎng)景任務(wù)比工廠場(chǎng)景更混亂隨機(jī),且數(shù)據(jù)豐富,恰恰是訓(xùn)練通用模型的最佳土壤。

因此,為了追趕時(shí)機(jī),在創(chuàng)業(yè)的短短一個(gè)月內(nèi),新公司「破殼機(jī)器人」已經(jīng)完成了融資、核心團(tuán)隊(duì)組建、具身模型的訓(xùn)練、以及硬件迭代工作。

《智能涌現(xiàn)》獨(dú)家獲悉,破殼機(jī)器人近期完成數(shù)千萬(wàn)美元天使輪融資,由云啟資本領(lǐng)投,并獲得順為資本、弘暉基金等一線美元基金,小米戰(zhàn)投、星海圖等知名產(chǎn)業(yè)方,以及BV百度風(fēng)投、英諾天使基金、水木清華校友種子基金、東方嘉富等一線市場(chǎng)化基金的支持。

快速得到資本押注,也因?yàn)樵S華哲在關(guān)鍵技術(shù)路線上有一些不同的選擇。

為了實(shí)現(xiàn)泛化,在關(guān)鍵技術(shù)路線方面,他的選擇也略顯反常識(shí)。他完全放棄了行業(yè)主流的VLA(視覺-語(yǔ)言-動(dòng)作)基座模型方案,轉(zhuǎn)而構(gòu)建一種能直接輸入和輸出“視頻-動(dòng)作”的世界模型。

在模型結(jié)構(gòu)上,他也提出了獨(dú)特的“UAG架構(gòu)”,用并聯(lián)式預(yù)訓(xùn)練替代過(guò)去的瀑布式級(jí)聯(lián),并將強(qiáng)化學(xué)習(xí)貫穿預(yù)訓(xùn)練與部署全過(guò)程,實(shí)現(xiàn)了訓(xùn)練效率的五倍提升。

打好模型基礎(chǔ)之余,在數(shù)據(jù)與硬件層面,他也通過(guò)UMI、外骨骼和第一人稱視角三層方案采集高質(zhì)量數(shù)據(jù),形成從任務(wù)定義到數(shù)據(jù)、模型、本體的閉環(huán)迭代。

據(jù)許華哲透露,「破殼機(jī)器人」第一代32B參數(shù)規(guī)模的具身世界模型已完成首輪訓(xùn)練,正處于數(shù)據(jù)迭代的關(guān)鍵爬坡期。在硬件層面,「破殼機(jī)器人」為數(shù)據(jù)采集量身定制的手套硬件已迭代了五六個(gè)版本。

近期,《智能涌現(xiàn)》與許華哲聊了聊,以下是交流實(shí)錄(略經(jīng)摘編)

為何出走「星海圖」?

《智能涌現(xiàn)》:為什么選擇離開星海圖,創(chuàng)立一家新的機(jī)器人公司?

許華哲:這個(gè)想法其實(shí)醞釀了很久。在2023年8、9月份,我就開始和高繼揚(yáng)聊,加入星海圖。但經(jīng)過(guò)了兩年,到去年11、12月份,我已經(jīng)基本決定要離開了,真正辦完手續(xù)是在今年,創(chuàng)立「破殼機(jī)器人」是最近一個(gè)月的事情。

離開的原因主要是因?yàn)槲覂?nèi)心一直想做一些To C的、真正泛化的通用機(jī)器人。

《智能涌現(xiàn)》:既然一直想做To C,為什么一開始不直接做To C方向機(jī)器人的創(chuàng)業(yè)呢?

許華哲:原因是多方面的。2023年我加入星海圖時(shí),也考慮過(guò)要不要自己創(chuàng)業(yè),但那時(shí)我剛從美國(guó)讀完書回來(lái),在叉院工作才一年左右,要自己開公司lead一攤事,還要兼顧教職,挑戰(zhàn)很大。

那時(shí)星海圖和其他一些具身智能公司也邀請(qǐng)我加入,我覺得先加入一個(gè)優(yōu)秀的團(tuán)隊(duì)做聯(lián)創(chuàng),是一個(gè)更穩(wěn)妥的選擇,而且當(dāng)時(shí)星海圖的宣傳里也提到大概是“讓機(jī)器人服務(wù)千萬(wàn)人類”的話語(yǔ),這和我的一部分想法是吻合的。

《智能涌現(xiàn)》:您現(xiàn)在新公司雖然只成立一個(gè)月,都有哪些進(jìn)展?

許華哲:團(tuán)隊(duì)方面,目前有20人左右,AI側(cè)有一些天才少年,硬件側(cè)有很多做過(guò)To C量產(chǎn)交付的工程師。我們還在火熱招聘中。

在技術(shù)上,我們的AI模型在“動(dòng)得快”、“泛化強(qiáng)”、“成功率高”三個(gè)維度都有較好的前期積累,能讓機(jī)器人完成某些復(fù)雜任務(wù)時(shí)達(dá)到接近100%的成功率。

我們第一代32B的模型已經(jīng)完成了第一次訓(xùn)練,但還需要數(shù)據(jù)量的迭代才能展現(xiàn)出更好能力。我們的硬件手套也已經(jīng)迭代了五六個(gè)版本。

第一個(gè)月要處理公司注冊(cè)、選址、裝修等各種事務(wù)。能跑出這個(gè)速度,我覺得還是比較快的。

《智能涌現(xiàn)》:您這次創(chuàng)業(yè),和第一次創(chuàng)業(yè)時(shí)心態(tài)有什么不同?

許華哲:最大的不同是心態(tài)上更踏實(shí)、也更敢了。第一次創(chuàng)業(yè)前,我會(huì)擔(dān)心,我沒上過(guò)班怎么給別人“班”上?我沒做過(guò)生意怎么辦,沒跟投資人、政府打過(guò)交道怎么辦?

在星海圖的兩年,我接觸過(guò)這些事,“沒打過(guò)就硬打,沒上過(guò)就硬來(lái)”,其實(shí)最終結(jié)果也挺順利的,太多的顧慮沒必要,出來(lái)混最重要是先出來(lái)。這次心理上更從容。

《智能涌現(xiàn)》:在2023年和2026年兩個(gè)節(jié)點(diǎn)創(chuàng)業(yè)做家庭機(jī)器人這件事,區(qū)別大嗎?

許華哲:區(qū)別挺大的。首先是硬件本體,這三年中國(guó)的硬件供應(yīng)鏈打磨得更好了,有了更多能用的機(jī)器人,2023年時(shí)可能只能用工業(yè)臂;

第二是數(shù)據(jù),2023年時(shí)機(jī)器人的數(shù)據(jù)幾乎是0,現(xiàn)在網(wǎng)上開源數(shù)據(jù)就有幾十萬(wàn)小時(shí),還出現(xiàn)了大量的數(shù)據(jù)供應(yīng)商,雖然數(shù)據(jù)質(zhì)量和跨本體適配還是問(wèn)題,但豐富度已經(jīng)不可同日而語(yǔ)。

第三是融資和市場(chǎng)認(rèn)知,2023年要做To C機(jī)器人可能很難融資,大家給的時(shí)間緩沖也更少。今天起步比2023年更好。

AGI應(yīng)用于家庭,工廠是上一代技術(shù)的領(lǐng)地

《智能涌現(xiàn)》:一直想做To C的機(jī)器人,背后的觸發(fā)點(diǎn)是什么?

許華哲:首先,一個(gè)核心思考是,我們做機(jī)器人到底在做什么?機(jī)器人是人類自古以來(lái)的追求,我們?cè)诤5讚?、酒店、工廠都見過(guò)機(jī)器人,但如果我們只是用人形的外殼去工廠擰螺絲、搬箱子,那本質(zhì)上還是在做舊時(shí)代的事情。

這一代機(jī)器人最核心的不同在于它的通用性。通用性該用在越混亂、越需要通用能力的地方。那答案就是家庭,或者廣義的服務(wù)場(chǎng)景。我認(rèn)為,通用的AGI(通用人工智能)應(yīng)該用在家里。

第二,從個(gè)人偏好來(lái)說(shuō),做有品牌的事情是可以做得足夠大、有夢(mèng)想的。偉大的公司很多是To C的,比如蘋果、小米。

第三,從數(shù)據(jù)角度看,通用性需要有豐富的數(shù)據(jù),混亂的家庭場(chǎng)景恰恰能提供豐富的數(shù)據(jù)。如果你的數(shù)據(jù)源頭錯(cuò)了,就得不到正確的模型。

基于這三點(diǎn),我覺得做To C機(jī)器人是一件正確的事,我自己也特別感興趣。

《智能涌現(xiàn)》:您認(rèn)為AI模型什么時(shí)候可以支撐做家庭To C機(jī)器人?

許華哲:我的預(yù)測(cè)比較樂(lè)觀激進(jìn),我認(rèn)為兩年內(nèi)會(huì)出現(xiàn)可以用起來(lái)的機(jī)器人。它不是萬(wàn)能的,但會(huì)是一個(gè)有完善產(chǎn)品定義、能做相當(dāng)多通用事情的機(jī)器人,但它會(huì)有一些明確不做的事,比如抱嬰兒、燒熱水。

《智能涌現(xiàn)》:機(jī)器人進(jìn)家庭能做的事情都包括哪些?能否舉一些例子?

許華哲:分兩類。一類是本身很難的任務(wù),比如更精細(xì)的清潔,比如清潔墻角霉點(diǎn)、擦掉干涸的飯湯、剝橘子、剝蝦等等。

另一類是長(zhǎng)序列、多步驟任務(wù)的串聯(lián)。舉個(gè)例子,一個(gè)完整的洗衣流程是——把臟衣服放進(jìn)洗衣機(jī)、倒洗衣液、啟動(dòng),然后機(jī)器人可以去做別的事,它會(huì)在監(jiān)聽到“洗完了”的聲音后,把衣服拿出來(lái)放進(jìn)烘干機(jī),啟動(dòng)烘干,最后再把衣服拿出來(lái)疊好放進(jìn)衣柜。

現(xiàn)在的機(jī)器人能做任何一個(gè)單一步驟,但沒有機(jī)器人能像人一樣,從頭到尾,帶著這些“任務(wù)間的縫隙”把它完成,我認(rèn)為兩年后的機(jī)器人能有這個(gè)能力。

《智能涌現(xiàn)》:家庭和工廠場(chǎng)景,最大的區(qū)別是什么?

許華哲:家庭和工廠某種程度上都是“混亂”的,但是本質(zhì)上不同。工廠的混亂更多是“管理混亂”,比如東西亂扔、人走來(lái)走去,但它具體干的活,比如上下料、裝配是高度確定性的。

家里的混亂是任務(wù)本身的混亂,比如衣服是團(tuán)成一團(tuán)的,杯盤狼藉需要收拾,這種混亂是需要通過(guò)工作去恢復(fù)秩序的。工廠的很多混亂并不需要去恢復(fù)。所以,這是兩種完全不同性質(zhì)的“混亂”。

《智能涌現(xiàn)》:您認(rèn)為當(dāng)前做家庭To C機(jī)器人,最大挑戰(zhàn)是什么?

許華哲:機(jī)器人進(jìn)家庭的邏輯和落地To B不同。To B的賬很難算,因?yàn)楣S給人形機(jī)器人干的活價(jià)值很低,一臺(tái)二三十萬(wàn)的機(jī)器人可能相當(dāng)于一個(gè)人三四年的工資,還要考慮可靠性、維護(hù),很難回本。再加上工廠里采集的數(shù)據(jù)可能過(guò)于?;?。

To C的賬不是簡(jiǎn)單的“替代人力”計(jì)算。它更像科技潮品+家庭助手+管家的復(fù)合體。用戶買它,是購(gòu)買一種先鋒的生活方式、極致的便利,就像二十年前大家買車一樣。我們考慮的是,當(dāng)用戶有一筆預(yù)算時(shí),是買輛車還是買個(gè)能改變生活的機(jī)器人。

所以,關(guān)鍵是產(chǎn)品體驗(yàn)要足夠好,價(jià)值感知要足夠強(qiáng)。價(jià)格區(qū)間我們內(nèi)部還在討論,但肯定會(huì)是五位數(shù)起步。

追求泛化,也是追求美和影響力

《智能涌現(xiàn)》:所以To C并不是您離開星海圖后才有的想法,而是一貫的想法?

許華哲:是的。我從小就想做To C,想創(chuàng)業(yè)。初高中的時(shí)候讀《喬布斯傳》、《迪士尼傳》,讀完了就很想創(chuàng)業(yè),做一個(gè)像谷歌一樣的公司,后來(lái)選電子系也是想要做IT,大學(xué)還修了管理學(xué)雙學(xué)位,就是為了創(chuàng)業(yè)做鋪墊。

后面去了伯克利、斯坦福,也是一直在做強(qiáng)化學(xué)習(xí)和機(jī)器人,后來(lái)還做了一些觸覺相關(guān)的研究,也是在機(jī)器人大類里。

我博士畢業(yè)時(shí)(2021年),主要就是找教職還有找投資人聊,看看有沒有創(chuàng)業(yè)機(jī)會(huì),當(dāng)時(shí)普遍觀感是,下一代技術(shù)還遠(yuǎn),這一代技術(shù)就是做掃地機(jī)、餐館機(jī)器人,但是和AI關(guān)系不大,沒看到特別匹配我專業(yè)技能的創(chuàng)業(yè)機(jī)會(huì)。

《智能涌現(xiàn)》:你判斷一件事情做與不做,或者談?wù)撃銓?duì)某件事是否感興趣時(shí),你的標(biāo)準(zhǔn)是什么?

許華哲:一個(gè)是美,這件事要能給我?guī)?lái)好的審美體驗(yàn)。另一個(gè)是影響力,我們學(xué)術(shù)圈有一個(gè)詞叫impact追問(wèn)。

美,更多是個(gè)人體驗(yàn),我做這件事創(chuàng)造出來(lái)的東西是優(yōu)雅、簡(jiǎn)潔的,就像簡(jiǎn)單的公式能描述復(fù)雜的現(xiàn)象,泛化性的本質(zhì)也是美;影響力意味著,我做的這件事要能對(duì)世界產(chǎn)生足夠大的影響,改變?nèi)藗兊纳罘绞健?/p>

現(xiàn)在我們被迫用巨大的參數(shù)量來(lái)描述世界,是因?yàn)槲覀冞€沒找到AI領(lǐng)域的牛頓定律,我相信大模型只是一個(gè)中間狀態(tài)。我的博士生涯是帶著“AI一定存在一個(gè)優(yōu)美理論”的心理開始的,但后來(lái)發(fā)現(xiàn)理論越來(lái)越解釋不了AI,這是一個(gè)痛苦但必須接受的過(guò)程。

所以現(xiàn)在我的使命是追求簡(jiǎn)潔和影響力,如果有另一個(gè)公式(而不是AI模型)能描述機(jī)器人與世界的所有交互,我會(huì)覺得它更好。

《智能涌現(xiàn)》:這次創(chuàng)業(yè)你希望找到什么樣的合作伙伴?你會(huì)更欣賞什么樣的公司文化?

許華哲:我對(duì)合作伙伴和團(tuán)隊(duì)文化有三個(gè)核心要求——

極致:我很喜歡戴密斯·哈薩比斯那本傳記里的描述,里面說(shuō),一個(gè)人做事要做到什么程度,就像跑馬拉松撞線后,有個(gè)救護(hù)車把你拉走了,但是你最后沒死。雖然有點(diǎn)夸張,但是我覺得做事極致投入,永遠(yuǎn)想更進(jìn)一步,是很重要的。

坦誠(chéng):對(duì)自己、對(duì)同事、對(duì)事情絕對(duì)坦誠(chéng)。不會(huì)因?yàn)椴粫?huì)而裝會(huì),搞砸了就承認(rèn),不要為了面子影響效率。

利他:公司里有很多“縫隙”,如果每個(gè)人都只盯著自己的KPI,這些縫就沒人填。對(duì)于初創(chuàng)公司,需要每個(gè)人在有余力時(shí)主動(dòng)填縫,這種利他性長(zhǎng)期看對(duì)個(gè)人和團(tuán)隊(duì)成長(zhǎng)都有益。

(作者注:戴密斯·哈薩比斯(Demis Hassabis)是英國(guó)著名人工智能科學(xué)家、Google DeepMind 聯(lián)合創(chuàng)始人兼CEO、神經(jīng)科學(xué)家,被譽(yù)為“AlphaGo之父”。)

我很欣賞段永平的“本分文化”,也欣賞前段時(shí)間一篇報(bào)道中提到的,Kimi“沒有部門墻”的協(xié)作模式,我傾向于彈性、扁平的組織,很贊同黃仁勛、亞馬遜那種鼓勵(lì)一線員工直接向老板直接發(fā)郵件反饋問(wèn)題的文化。

做全新物種的家庭機(jī)器人

《智能涌現(xiàn)》:很多To C的機(jī)器人是曲線救國(guó),先從陪伴場(chǎng)景切入,但是感覺你們的您的產(chǎn)品路徑和其他家很不一樣。

許華哲:完全不一樣。他們做的是陪伴,核心能力是大模型提供的對(duì)話能力和娛樂(lè)。我們追求的核心是物理世界的通用交互和干活能力。

我們的機(jī)器人是“家庭助理”,要能實(shí)際處理家務(wù),所以在技術(shù)上,我們需要非常強(qiáng)的模型能力來(lái)保證通用性,但是很多家庭陪伴機(jī)器人是沒做基礎(chǔ)模型的。本質(zhì)上,我們和他們是兩個(gè)不同的品類。

《智能涌現(xiàn)》:你們最主要的技術(shù)的差異點(diǎn)是在模型側(cè)嗎?

許華哲:我們的一大亮點(diǎn)我們的模型能用好強(qiáng)化學(xué)習(xí)。過(guò)去機(jī)器人對(duì)強(qiáng)化學(xué)習(xí)的使用一般停留在單機(jī)的后訓(xùn)練上,但是其實(shí)強(qiáng)化學(xué)習(xí)上有很多自己獨(dú)特的東西。

第一個(gè)就是價(jià)值函數(shù)(value function)。價(jià)值函數(shù)可以對(duì)數(shù)據(jù)質(zhì)量進(jìn)行評(píng)估,讓模型知道哪些數(shù)據(jù)好、哪些次優(yōu)、哪些失敗。數(shù)據(jù)帶著權(quán)重,去讓模型學(xué)習(xí)。

它帶來(lái)的好處有兩個(gè),一是可以讓模型學(xué)得更精準(zhǔn),二是可以理解失敗的邊界,這樣模型就能夠知道緊鄰著成功的失敗長(zhǎng)什么樣,讓強(qiáng)化學(xué)習(xí)去把這些失敗因素排除掉;

第二是,強(qiáng)化學(xué)習(xí)能同時(shí)在多個(gè)任務(wù)上保持高成功率高速度,而不過(guò)度擬合到單一任務(wù)。

第三是,強(qiáng)化學(xué)習(xí)也可以突破人類數(shù)據(jù)上限。以前我們用人采集的數(shù)據(jù)去做某件事,數(shù)據(jù)是什么樣的,機(jī)器人就能做到怎么樣的,甚至?xí)?,因?yàn)闄C(jī)器人是跟著數(shù)據(jù)學(xué)習(xí)的。但是強(qiáng)化學(xué)習(xí)就是根據(jù)數(shù)據(jù)以及后續(xù)的自我改進(jìn),持續(xù)突破自己的上限,最終可能做出比人類示范數(shù)據(jù)更好的表現(xiàn),上限更高。

《智能涌現(xiàn)》:你們的強(qiáng)化學(xué)習(xí)只用在后訓(xùn)練上嗎?

許華哲:我們的預(yù)訓(xùn)練也會(huì)用離線的強(qiáng)化學(xué)習(xí)。預(yù)訓(xùn)練現(xiàn)在還是有一些卡點(diǎn)的,比如說(shuō)模型的選擇上有很多種,市面上有用VLA+VLM的,也有世界模型的,還有VLWAM,就是VLM后面再內(nèi)嵌一個(gè)世界模型。

《智能涌現(xiàn)》:那你們還是用VLA的路線嗎?

許華哲:現(xiàn)在模型的路線還遠(yuǎn)遠(yuǎn)沒有收斂,我們的選擇是世界模型結(jié)合原生的機(jī)器人模型,不是用VLA的路線。

《智能涌現(xiàn)》:現(xiàn)在的世界模型有很多派別,有的人用的是偏3D視頻的方向,有的又是偏向于世界仿真,你們對(duì)世界模型的理解方式是什么?

許華哲:我們輸入的是視頻和動(dòng)作,在訓(xùn)練和推理的時(shí)候,輸出的也是視頻和動(dòng)作。這些視頻和動(dòng)作里面是遵循物理規(guī)律的真實(shí)世界的數(shù)據(jù)。

《智能涌現(xiàn)》:你們做這些事情的過(guò)程中,遇到的最大的挑戰(zhàn)是什么?

許華哲:要訓(xùn)練大模型所需的Infra(基礎(chǔ)設(shè)施)是一個(gè)挺大的卡點(diǎn),因?yàn)槲覀兿胱鲆粋€(gè)32B的大模型,要支撐比較大的數(shù)據(jù)量,GPU集群的并行效率、數(shù)據(jù)吞吐都是一個(gè)很大的挑戰(zhàn)和壁壘。

《智能涌現(xiàn)》:在模型側(cè)你們提到了一項(xiàng)“UAG”架構(gòu),這個(gè)怎么理解?

許華哲:UAG(Unconditioned Action Guidance)是我們的一種模型訓(xùn)練架構(gòu)。

相對(duì)于傳統(tǒng)的瀑布式級(jí)聯(lián)的模型訓(xùn)練方式,我們采用的是一種并聯(lián)的方式,核心思想是先對(duì)動(dòng)作進(jìn)行預(yù)訓(xùn)練,然后再對(duì)所有的動(dòng)作做整體聯(lián)合的訓(xùn)練,做一個(gè)動(dòng)作預(yù)測(cè)器,然后再將動(dòng)作預(yù)測(cè)器和視覺模型一起進(jìn)行聯(lián)合訓(xùn)練。

背后的原理是,一個(gè)小時(shí)的圖片、視頻是巨大的,但是一個(gè)小時(shí)的動(dòng)作很少,可能就是一系列關(guān)節(jié)的運(yùn)動(dòng),也就是一堆小的浮點(diǎn)數(shù)。這種方式可以最大程度保留基礎(chǔ)模型的泛化能力,同時(shí)大幅提升訓(xùn)練效率,估計(jì)至少5倍以上。

《智能涌現(xiàn)》:數(shù)據(jù)也是你們新公司的亮點(diǎn),你們大概有哪些方案?

許華哲:我們的數(shù)據(jù)方案主要分三層——

①外骨骼數(shù)據(jù)采集:提著機(jī)器人手臂直接操作,精度高,反饋更直接;

②UMI方案:讓人戴一個(gè)和機(jī)器人手部構(gòu)型完全一樣的“硬手套”進(jìn)行操作,好處是沒有機(jī)械臂的負(fù)擔(dān),采集效率高,數(shù)據(jù)量大。手套做硬是為了保持和機(jī)器人手的一致性,確保人能做的動(dòng)作機(jī)器人都能做;

③第一人稱視角人類數(shù)據(jù):在頭上戴一個(gè)攝像頭,記錄人日常干活的視頻。這是從人的視角(Ego-centric)采集海量自然行為數(shù)據(jù)。

《智能涌現(xiàn)》:這些采集方式其他家也在探索,你們最大的不同點(diǎn)在哪?

許華哲:采集的數(shù)據(jù),表層方法可能相似,但內(nèi)核有本質(zhì)不同。比如umi手套是否打磨得足夠好,足夠通用?采集的數(shù)據(jù)質(zhì)量如何保證?以及如何清洗和處理這些數(shù)據(jù),提升數(shù)據(jù)質(zhì)量?

我們一個(gè)很大的不同是,我們會(huì)大量使用評(píng)估數(shù)據(jù),就是機(jī)器人自己做測(cè)試和探索的時(shí)候,自己在動(dòng)的數(shù)據(jù)。這樣的數(shù)據(jù)某種意義上是更“差”的數(shù)據(jù),因?yàn)槔锩鏁?huì)有失敗、會(huì)有次優(yōu)。但是這種“差”其實(shí)也是“好”,會(huì)讓模型更知道任務(wù)的目標(biāo)是什么。

另外,手套的設(shè)計(jì)細(xì)節(jié),比如攝像頭位置、佩戴舒適度、是否適應(yīng)不同手型等等,都需要針對(duì)家庭任務(wù)精心打磨,我們手套的構(gòu)型設(shè)計(jì)是面向家庭任務(wù),追求通用性的。我們會(huì)在8月末左右給大家看到我們和現(xiàn)在所有的形態(tài)都不一樣的數(shù)采系統(tǒng)。

《智能涌現(xiàn)》:但是現(xiàn)在出來(lái)創(chuàng)業(yè)會(huì)不會(huì)太晚了?現(xiàn)在具身智能行業(yè)的融資環(huán)境怎么樣?

許華哲:市場(chǎng)熱度還可以,投資人還是比較有熱情的。和之前比,投資人更懂了,大家被市場(chǎng)教育過(guò)一輪,所以會(huì)問(wèn)得更細(xì)。

關(guān)于創(chuàng)業(yè)出來(lái)是否太晚,我認(rèn)為——在技術(shù)沒有收斂的今天,仍然有巨大的機(jī)會(huì)。同時(shí),因?yàn)槲覀兏?,所以我們的時(shí)間壓力更小、負(fù)擔(dān)更小,但是各種基礎(chǔ)設(shè)施比如本體等也更加成熟了。另一方面,走向通用家庭機(jī)器人,其實(shí)才剛上半場(chǎng)。雖然后發(fā),但是誰(shuí)能先至,也未可知。

封面來(lái)源|企業(yè)官方

end

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
高中生,提高成績(jī)最好的方法就是:多睡覺、多睡覺、多睡覺!

高中生,提高成績(jī)最好的方法就是:多睡覺、多睡覺、多睡覺!

好爸育兒
2026-04-23 08:54:10
飛得到處都是!最近深圳街頭大量出現(xiàn),有網(wǎng)友一家三口遭殃!這些人快遠(yuǎn)離

飛得到處都是!最近深圳街頭大量出現(xiàn),有網(wǎng)友一家三口遭殃!這些人快遠(yuǎn)離

南方都市報(bào)
2026-04-26 23:57:15
我堂哥到巴基斯坦打工睡了當(dāng)?shù)毓媚?,結(jié)果就被姑娘家人抓起來(lái)。

我堂哥到巴基斯坦打工睡了當(dāng)?shù)毓媚?,結(jié)果就被姑娘家人抓起來(lái)。

糖逗在娛樂(lè)
2026-04-26 18:19:03
白宮記者晚宴發(fā)生槍擊后!特朗普再提宴會(huì)廳建設(shè)

白宮記者晚宴發(fā)生槍擊后!特朗普再提宴會(huì)廳建設(shè)

看看新聞Knews
2026-04-26 23:40:06
多國(guó)封殺后首露面!坎耶帶小 17 歲妻子現(xiàn)身酒店,造型依舊辣眼

多國(guó)封殺后首露面!坎耶帶小 17 歲妻子現(xiàn)身酒店,造型依舊辣眼

橙星文娛
2026-04-26 09:51:15
難怪民進(jìn)黨氣得跳腳也不敢抓鄭麗文,她背后的保護(hù)傘,讓綠營(yíng)絕望

難怪民進(jìn)黨氣得跳腳也不敢抓鄭麗文,她背后的保護(hù)傘,讓綠營(yíng)絕望

傲傲講歷史
2026-04-27 10:37:26
今年,很多公司,已經(jīng)發(fā)不下來(lái)工資了

今年,很多公司,已經(jīng)發(fā)不下來(lái)工資了

細(xì)說(shuō)職場(chǎng)
2026-04-25 18:12:10
震驚!齊魯超濟(jì)南賽區(qū)“夏雨荷方陣”走紅,網(wǎng)友:立多爾袞雕像吧

震驚!齊魯超濟(jì)南賽區(qū)“夏雨荷方陣”走紅,網(wǎng)友:立多爾袞雕像吧

火山詩(shī)話
2026-04-27 09:31:32
千年難遇的美人,太漂亮了,沒有一點(diǎn)毛病,太完美了

千年難遇的美人,太漂亮了,沒有一點(diǎn)毛病,太完美了

情感大頭說(shuō)說(shuō)
2026-04-24 12:46:24
特斯拉客服回應(yīng)“FSD將于5月1日在中國(guó)上線”:不實(shí)

特斯拉客服回應(yīng)“FSD將于5月1日在中國(guó)上線”:不實(shí)

IT之家
2026-04-25 11:29:10
追覓俞浩炮轟小紅書價(jià)值觀非常爛,把自己和友軍也誤傷了

追覓俞浩炮轟小紅書價(jià)值觀非常爛,把自己和友軍也誤傷了

ZAKER新聞
2026-04-27 10:13:36
一提婚檢女方炸毛!怕“暴露”拿分手威脅男方,背后真相扎心了!

一提婚檢女方炸毛!怕“暴露”拿分手威脅男方,背后真相扎心了!

新時(shí)代的兩性情感
2026-04-27 07:56:21
從1-4慘敗到主帥癱坐教練席!泰山換帥選誰(shuí)?答案就在這幾個(gè)人里

從1-4慘敗到主帥癱坐教練席!泰山換帥選誰(shuí)?答案就在這幾個(gè)人里

曹老師評(píng)球
2026-04-26 20:05:54
保姆偷拿了家里2瓶茅臺(tái)去賣,我沒揭穿只辭退了她,臨走時(shí)她指了指舊皮鞋,我一看瞬間癱坐在地

保姆偷拿了家里2瓶茅臺(tái)去賣,我沒揭穿只辭退了她,臨走時(shí)她指了指舊皮鞋,我一看瞬間癱坐在地

今夜有個(gè)好故事
2026-03-11 17:26:56
“多走多動(dòng)”是錯(cuò)的?醫(yī)生告誡:過(guò)了65歲,走時(shí)盡量要做到這6點(diǎn)

“多走多動(dòng)”是錯(cuò)的?醫(yī)生告誡:過(guò)了65歲,走時(shí)盡量要做到這6點(diǎn)

芹姐說(shuō)生活
2026-04-24 20:41:41
印度退役將軍:新德里應(yīng)重拾中方方案,放棄對(duì)阿克賽欽的主權(quán)聲索

印度退役將軍:新德里應(yīng)重拾中方方案,放棄對(duì)阿克賽欽的主權(quán)聲索

老范談史
2026-04-27 00:04:35
55歲退休后跑遍大江南北,我才懂:退休旅游,其實(shí)沒多大意義

55歲退休后跑遍大江南北,我才懂:退休旅游,其實(shí)沒多大意義

蟬吟槐蕊
2026-03-28 00:05:01
男孩cos弗利薩,媽媽用乳膠漆化妝,洗不掉成“永久皮膚”

男孩cos弗利薩,媽媽用乳膠漆化妝,洗不掉成“永久皮膚”

國(guó)創(chuàng)漫話
2026-04-19 15:57:41
新冠后遺癥的長(zhǎng)期侵襲,無(wú)數(shù)人在不知不覺中深陷困境

新冠后遺癥的長(zhǎng)期侵襲,無(wú)數(shù)人在不知不覺中深陷困境

律法刑道
2026-04-01 10:15:47
沒出過(guò)門,只會(huì)傻笑,才藝惹人嫌,他上《五哈6》干啥

沒出過(guò)門,只會(huì)傻笑,才藝惹人嫌,他上《五哈6》干啥

樂(lè)天閑聊
2026-04-26 13:53:56
2026-04-27 11:15:00
36氪 incentive-icons
36氪
讓一部分人先看到未來(lái)
151239文章數(shù) 2848748關(guān)注度
往期回顧 全部

科技要聞

打1折!DeepSeek輸入緩存降價(jià)

頭條要聞

伊朗外長(zhǎng)折返伊斯蘭堡內(nèi)情披露:阿曼提出重要提議

頭條要聞

伊朗外長(zhǎng)折返伊斯蘭堡內(nèi)情披露:阿曼提出重要提議

體育要聞

最抽象的天才,正在改變瓜迪奧拉

娛樂(lè)要聞

《奔跑吧14》剛播就把一手好牌打稀爛

財(cái)經(jīng)要聞

DeepSeek融資、字節(jié)加碼 AI開始真燒錢了

汽車要聞

限量630臺(tái) 蘭博基尼Urus SE特別版官圖發(fā)布

態(tài)度原創(chuàng)

旅游
健康
教育
房產(chǎn)
軍事航空

旅游要聞

五一“趕黃河大集·獅子劉好時(shí)節(jié)”盛宴啟幕!

干細(xì)胞如何讓燒燙傷皮膚"再生"?

教育要聞

秋·思辨課首發(fā)!算法時(shí)代孩子最需要提升的思維元能力(含報(bào)名優(yōu)惠、課程大綱)

房產(chǎn)要聞

新一輪教育大爆發(fā)來(lái)了!???,開始瘋狂建學(xué)校!

軍事要聞

伊朗總統(tǒng):不會(huì)在壓力、威脅下進(jìn)行談判

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版