国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

對(duì)話大曉機(jī)器人王曉剛:從數(shù)字世界到物理世界,探索機(jī)器人新范式

0
分享至



十一年前,王曉剛和湯曉鷗一起,讓計(jì)算機(jī)視覺(jué)的識(shí)別率第一次超越了人類肉眼。那是 2014 年,人工智能 1.0 時(shí)代的開(kāi)端,視覺(jué)技術(shù)從實(shí)驗(yàn)室走向了安防、手機(jī)和汽車。

十一年后,當(dāng)所有人都還在為大語(yǔ)言模型狂歡,或者忙著在發(fā)布會(huì)上展示機(jī)器人“疊衣服”、“做咖啡”的 Demo 時(shí),王曉剛嗅到了一絲危險(xiǎn)的氣息?;ヂ?lián)網(wǎng)上的語(yǔ)料快被榨干了,純粹的數(shù)字世界正在逼近天花板。


2025 年,具身智能被視為繼大語(yǔ)言模型后的下一塊人工智能高地,玩家們都在賭誰(shuí)能先造出通用的“機(jī)器管家”。但現(xiàn)實(shí)是殘酷的:大多數(shù)機(jī)器人依然只能在視頻里閃爍高光,一旦走進(jìn)真實(shí)的雜亂環(huán)境,就會(huì)因?yàn)槿狈ΤWR(shí)而寸步難行。


圖|大曉機(jī)器人核心科學(xué)家團(tuán)隊(duì)(來(lái)源:大曉機(jī)器人)

在 12 月 18 日舉行的新品發(fā)布會(huì)前夕,我們與王曉剛進(jìn)行了一場(chǎng)深度對(duì)話。此時(shí)此刻,具身智能賽道正處于一種“冰火兩重天”的狀態(tài):一方面是資本的狂熱追捧,另一方面是技術(shù)落地中遭遇的“數(shù)據(jù)荒”與“物理幻覺(jué)”瓶頸。

現(xiàn)有的機(jī)器人研究范式是否走錯(cuò)了方向?為什么說(shuō)互聯(lián)網(wǎng)語(yǔ)料快被“榨干”了?Sora 等生成式模型在物理世界中存在什么致命缺陷?以及,為什么要在這個(gè)時(shí)間點(diǎn)選擇開(kāi)源,并押注國(guó)產(chǎn)芯片生態(tài)?

在這個(gè)時(shí)間節(jié)點(diǎn),大曉機(jī)器人不僅要發(fā)布一個(gè)新的世界模型,更要開(kāi)源一套全新的生存法則?!艾F(xiàn)在的研究范式走錯(cuò)了,”王曉剛直言不諱。他拋出了一個(gè)判斷:如果繼續(xù)以“機(jī)器”為中心去訓(xùn)練大腦,具身智能將永遠(yuǎn)困在 Demo 里;唯有回到以“人”為中心,用世界模型重構(gòu)物理規(guī)律,才能撞開(kāi) AI 3.0 的大門。


圖|大曉機(jī)器人首席科學(xué)家陶大程(來(lái)源:大曉機(jī)器人)

以下是對(duì)話全文。

AI2.0 到 AI3.0:從數(shù)字世界到物理世界

“互聯(lián)網(wǎng)語(yǔ)料快被榨干了,我們必須打破數(shù)字與物理的墻”

DeepTech:你現(xiàn)在的新身份是大曉機(jī)器人董事長(zhǎng)。和之前在商湯負(fù)責(zé)研發(fā)、汽車、芯片等業(yè)務(wù)的角色相比,現(xiàn)在側(cè)重的目標(biāo)有什么不同?

王曉剛:其實(shí)我在商湯是從 2014 年開(kāi)始的,當(dāng)時(shí)和湯老師一起創(chuàng)立商湯。那時(shí)候我們是第一個(gè)做到人臉識(shí)別超越肉眼識(shí)別率的。在過(guò)去十年里,我在商湯負(fù)責(zé)過(guò)研發(fā),也包括手機(jī)、互聯(lián)網(wǎng)、汽車、芯片等很多不同的業(yè)務(wù)方向。今天我們面臨的,是從人工智能 1.0 到 3.0 的躍遷。

所謂人工智能 1.0 時(shí)代,就是 2014 年那個(gè)時(shí)候。我們有了視覺(jué)技術(shù),靠的是大量人工標(biāo)注和小模型來(lái)實(shí)現(xiàn)人工智能的應(yīng)用。到了 2.0 時(shí)代,也就是大模型,特別是大語(yǔ)言模型帶來(lái)的通用化能力。因?yàn)槿祟悮v史上幾千年積累了海量的語(yǔ)言文字?jǐn)?shù)據(jù),記錄了人類的行為,大模型把這些沉淀的智能提取出來(lái),賦能各個(gè)行業(yè)。

DeepTech:所謂的 3.0 是什么?

王曉剛:今天我們也看到,大語(yǔ)言模型依賴的這些互聯(lián)網(wǎng)語(yǔ)料、數(shù)字世界的沉淀和積累,也到了一個(gè)瓶頸。未來(lái)兩三年,這些語(yǔ)料的價(jià)值也會(huì)逐漸被“榨干”。

所以人們想打破數(shù)字世界和物理世界的限制,通過(guò)具身智能,通過(guò)跟物理世界的交互去產(chǎn)生新的智能,這就是我們說(shuō)的人工智能 3.0 時(shí)代。

這里面一個(gè)很重要的任務(wù),就是通過(guò)技術(shù)的創(chuàng)新,讓商湯從原來(lái)的 2.0 時(shí)代進(jìn)入 3.0 時(shí)代。

DeepTech:大曉機(jī)器人和商湯是什么關(guān)系?

王曉剛:大曉在商湯“1+X”戰(zhàn)略布局。我們希望完成一個(gè)軟硬結(jié)合的產(chǎn)業(yè)鏈垂直整合。之前商湯做得比較多的是軟件和 ToB 的賦能角色,但在具身智能這個(gè)領(lǐng)域,我們有機(jī)會(huì)做軟硬一體,把業(yè)務(wù)做得更大。

所以我這邊的目標(biāo)總結(jié)下來(lái)就是三點(diǎn):第一,實(shí)現(xiàn)從 AI 2.0 到 3.0 的跨越;第二,把商湯歷史上積累的經(jīng)驗(yàn)沉淀帶到物理世界;第三,完成軟硬結(jié)合的垂直整合。

DeepTech:既然是生態(tài)企業(yè),大曉和商湯具體怎么分工?哪些是共享的,哪些是大曉獨(dú)立研發(fā)的?

王曉剛:這是一種非常緊密的合作關(guān)系。大曉提供具身智能的軟件平臺(tái)和硬件平臺(tái)。但機(jī)器人要進(jìn)入千行百業(yè),需要了解行業(yè)的痛點(diǎn)和渠道,這正是商湯過(guò)往積累的優(yōu)勢(shì)。

商湯的業(yè)務(wù)團(tuán)隊(duì)可以基于大曉提供的軟硬件具身平臺(tái),去開(kāi)發(fā)具體的行業(yè)應(yīng)用,解決具體的痛點(diǎn)。這能解決目前具身智能落地的一個(gè)大問(wèn)題——很多公司演示的 Demo 很好,但對(duì)場(chǎng)景理解不深,難以落地。

舉個(gè)例子,我們會(huì)推出一個(gè)“具身超級(jí)大腦模組 A1”。現(xiàn)在這個(gè)模組加裝在四足機(jī)器人(機(jī)器狗)上,有了它,機(jī)器狗就能在室外不依賴高精度地圖實(shí)現(xiàn)點(diǎn)到點(diǎn)的自主導(dǎo)航。

這個(gè)過(guò)程中,機(jī)器狗采集到的視頻數(shù)據(jù),會(huì)跟商湯后臺(tái)的“方舟平臺(tái)”打通。方舟平臺(tái)上有超過(guò) 150 個(gè) AI 相關(guān)的應(yīng)用。通過(guò)這種結(jié)合,機(jī)器人的應(yīng)用價(jià)值就被極大地放大了。

范式革命:以人為中心的具身智能

“以機(jī)器為中心的范式走不通,必須轉(zhuǎn)向以人為中心”

DeepTech:2025 年是你所說(shuō)的 AI 3.0 時(shí)代的一個(gè)關(guān)鍵節(jié)點(diǎn)嗎?會(huì)有什么標(biāo)志性事件?

王曉剛:我覺(jué)得 2025 年一個(gè)非常重要的代表性突破,或者說(shuō)改變,是研究范式的改變。

大家對(duì)具身智能的期待源自于互聯(lián)網(wǎng)時(shí)代的經(jīng)驗(yàn)。在 2.0 時(shí)代,大模型讓我們以為,只要有一個(gè)強(qiáng)大的大模型,機(jī)器人就能在物理世界里通用了。但在過(guò)去兩年里,大家在執(zhí)行過(guò)程中遇到了巨大的阻力。

DeepTech:阻力具體體現(xiàn)在哪里?

王曉剛:之前大家的做法是:先有了各種不同形態(tài)的機(jī)器人,結(jié)構(gòu)各不相同。人們通過(guò)遙操作(Teleoperation)控制這些機(jī)器人去采集數(shù)據(jù),然后把數(shù)據(jù)聚合在一起,試圖訓(xùn)練一個(gè)通用的機(jī)器人大腦。

但大家發(fā)現(xiàn),這種模式是不成功的。

首先,訓(xùn)練出來(lái)的所謂“大腦”很難用到不同的本體上,數(shù)據(jù)不能共享。其次,通過(guò)人操作機(jī)器采集數(shù)據(jù)的效率非常低,而且往往不是在真實(shí)的生產(chǎn)生活環(huán)境中采集的。

我們把這種舊的研究范式叫做 Machine-centric(以機(jī)器為中心)。它的核心邏輯是 VLA(Vision-Language-Action),通過(guò)視覺(jué)和語(yǔ)言指令,直接讓機(jī)器去完成特定任務(wù)。這種范式訓(xùn)練出來(lái)的大腦不需要理解物理世界到底是什么樣,只是為了完成任務(wù)。

DeepTech:2025 年的新范式是什么?

王曉剛:2025 年一個(gè)非常大的轉(zhuǎn)變,就是從 Machine-centric 轉(zhuǎn)變?yōu)?Human-centric(以人為中心)。

這個(gè)起點(diǎn)大概在 2025 年年初。當(dāng)時(shí)我們團(tuán)隊(duì)在南洋理工大學(xué)的劉子緯教授帶領(lǐng)下,提出了“環(huán)境式采集”。

所謂環(huán)境式采集,就是利用第一視角的眼鏡、穿戴式設(shè)備,以及第三視角的傳感器,在人真實(shí)的生產(chǎn)生活環(huán)境中去記錄人的行為。通過(guò)這些記錄,訓(xùn)練出一個(gè)“世界模型”。這個(gè)世界模型要理解人跟物理世界交互的規(guī)律是什么,因果關(guān)系是什么。

今年,劉子緯教授發(fā)布了 Egolife,記錄了 300 小時(shí)人類行為時(shí),像 Meta 的 Yann LeCun 團(tuán)隊(duì)就基于這個(gè)數(shù)據(jù)集完成了具身世界模型的訓(xùn)練。到了 8、9 月份,特斯拉和 Figure AI 也宣布轉(zhuǎn)向視覺(jué)路線,通過(guò)攝像頭記錄人的行為來(lái)快速積累數(shù)據(jù)。

DeepTech:這種新范式帶來(lái)的最直接的好處是什么?

王曉剛:數(shù)據(jù)量級(jí)的躍升。

在以機(jī)器為中心的時(shí)代,大家積累的數(shù)據(jù)大概是十萬(wàn)小時(shí)這個(gè)量級(jí)。要知道,特斯拉 FSD 做自動(dòng)駕駛用到了大概 400 萬(wàn)小時(shí)的高質(zhì)量數(shù)據(jù)。具身智能的場(chǎng)景復(fù)雜度更高,需要的數(shù)據(jù)更多。

通過(guò)以人為中心的研究范式,我們能積累的數(shù)據(jù)可以達(dá)到千萬(wàn)小時(shí)這個(gè)級(jí)別。這才是讓具身智能具備通用化能力、擁有強(qiáng)大大腦的正確路徑。

所以,2025 年發(fā)生了非常重要的變化,給具身智能的發(fā)展打開(kāi)了一條新的思路。

解密:環(huán)境式采集與數(shù)據(jù)壁壘

“一天采集效率提升 100 倍,解決上萬(wàn)種物品的抓取難題”

DeepTech:你提到的“環(huán)境式采集”技術(shù)聽(tīng)起來(lái)很有意思,在實(shí)際落地中具體是怎么做的?一天能產(chǎn)出多少數(shù)據(jù)?

王曉剛:我們這套采集方案,需要人佩戴第一視角的攝像頭,同時(shí)還會(huì)帶上全景相機(jī),這樣能看到人周圍的環(huán)境和自己的身體。手上和胸口也會(huì)帶攝像頭,特別是手上會(huì)帶一些觸覺(jué)傳感器,能感受到接觸物品時(shí)的材質(zhì)和力。周圍環(huán)境里也會(huì)部署深度攝像頭等。

所有的設(shè)備都是同步的。人不需要操作機(jī)器人,只需要正常做工作,數(shù)據(jù)自然就被采集下來(lái)了。

DeepTech:可以舉一個(gè)具體的落地場(chǎng)景嗎?

王曉剛:比如我們?cè)诤贾莸囊粋€(gè)閃購(gòu)倉(cāng)(前置倉(cāng))試點(diǎn)。

現(xiàn)在的零售行業(yè),大家在網(wǎng)上下單,城市里有很多這樣的前置倉(cāng)。倉(cāng)庫(kù)里有大量貨品,需要工作人員進(jìn)行分揀、打包,交給外賣小哥。這個(gè)工作需要 7x24 小時(shí)進(jìn)行。

這個(gè)場(chǎng)景最難的地方在于,物品類別特別多,有上萬(wàn)個(gè) SKU。以前大家做具身智能,用真機(jī)采集數(shù)據(jù),基本只能覆蓋幾十個(gè)或者上百個(gè)類別。面對(duì)上萬(wàn)個(gè)類別,真機(jī)采集根本做不過(guò)來(lái)。

DeepTech:用環(huán)境式采集能解決這個(gè)問(wèn)題嗎?

王曉剛:對(duì)。有了這套設(shè)備,工作人員可以一邊工作,一邊采集數(shù)據(jù)。

一個(gè)人一天工作 10 個(gè)小時(shí),就能采集 10 個(gè)小時(shí)的數(shù)據(jù)。而且因?yàn)槿耸值撵`活度遠(yuǎn)高于遙操作機(jī)器人,單一采集效率可能有 10 倍的增長(zhǎng)。

更重要的是部署方便。以前得在實(shí)驗(yàn)室里雇人操作機(jī)器人,現(xiàn)在我可以有幾百人、上千人都帶著這些設(shè)備,在正常工作中采集。這樣數(shù)據(jù)積累的速度可能是原來(lái)的 100 倍,也就是兩個(gè)數(shù)量級(jí)的增加。成本更低,效率更高。

DeepTech:采集上來(lái)的數(shù)據(jù)質(zhì)量如何把控?有沒(méi)有具體的標(biāo)準(zhǔn)?

王曉剛:我們有一套自動(dòng)化的流程來(lái)提取關(guān)鍵信息。

比如人的肢體 3D 姿態(tài)、手部的 3D 手勢(shì)、接觸物品的種類和姿態(tài)、物品的 3D 形狀等。還會(huì)提取人與環(huán)境交互的信息,比如我坐在椅子上、趴在桌子上、爬梯子,這些 3D 交互關(guān)系都會(huì)被建模。

還有材質(zhì)信息,比如一個(gè)瓶子,人通常抓哪里?抓的時(shí)候摩擦力如何?受力情況如何?這些都會(huì)通過(guò)自動(dòng)化流程提取出來(lái)。

核心:開(kāi)悟 3.0 世界模型

“解決‘水倒進(jìn)槽里杯子卻滿了’的物理幻覺(jué)”

DeepTech:采集了數(shù)據(jù)之后,如何解決跨本體復(fù)用的問(wèn)題?畢竟人的手和機(jī)器人的手不一樣。

王曉剛:這就體現(xiàn)了世界模型的重要性。

我們把采集的數(shù)據(jù)輸入到世界模型里。世界模型有三個(gè)部分:第一是多模態(tài)理解,理解世界是什么樣子;第二是生成,大腦可以想象場(chǎng)景;第三是預(yù)測(cè),預(yù)測(cè)動(dòng)作和結(jié)果。

我們即將發(fā)布的“開(kāi)悟 3.0”世界模型平臺(tái),既包含了人類數(shù)據(jù),也包含了一些不同類型機(jī)器人的本體數(shù)據(jù)。

在平臺(tái)上,你可以選擇場(chǎng)景和任務(wù),然后選擇機(jī)器人本體(比如宇樹、智元等)。因?yàn)槲覀冇羞@些機(jī)器人的物理參數(shù),世界模型就會(huì)根據(jù)任務(wù)生成針對(duì)該本體的視頻和 3D 軌跡數(shù)據(jù),用來(lái)訓(xùn)練這個(gè)本體。

這就是我們說(shuō)的“一腦多形”——一個(gè)世界模型大腦,適配不同的機(jī)器人形態(tài)。

DeepTech:“開(kāi)悟 3.0”和市面上其他的世界模型(比如 Sora、Gen-2 等)有什么技術(shù)上的不同?

王曉剛:市面上的模型,比如李飛飛團(tuán)隊(duì)的 World Labs,很多只能生成靜態(tài)的世界,做漫游,無(wú)法把物體和環(huán)境分離開(kāi)。

我們的模型可以做到物體與環(huán)境的解耦。比如桌子上的電腦、水杯,我可以把它們分離開(kāi),甚至進(jìn)行編輯——把桌子換個(gè)形狀,把電腦換個(gè)牌子,把房型換掉。這極大地拓展了數(shù)據(jù)的泛化性。

另一點(diǎn)非常重要的是對(duì)物理規(guī)律的表達(dá)。

DeepTech:物理規(guī)律是現(xiàn)在生成式視頻的一個(gè)大痛點(diǎn)。

王曉剛:對(duì)。像 Sora、Gemini、Cosmos 這些模型,本質(zhì)上是生成式網(wǎng)絡(luò),缺乏對(duì)多模態(tài)世界的深刻理解和物理預(yù)測(cè)。

舉個(gè)例子,我們讓機(jī)器人拿杯子去水龍頭接水。這需要符合流體力學(xué)。但在 Sora 生成的視頻里,有時(shí)候你會(huì)發(fā)現(xiàn),水明明倒在了水槽里,杯子里的水卻莫名其妙漲起來(lái)了;或者水倒進(jìn)杯子,周圍水槽卻有水濺出來(lái)。這都是不符合物理規(guī)律的。

如果不解決這個(gè)問(wèn)題,機(jī)器人就會(huì)學(xué)到錯(cuò)誤的邏輯。我們?cè)跇?gòu)建世界模型時(shí),底層加入了很多物理常識(shí)和規(guī)律的約束。

DeepTech:你們內(nèi)部怎么量化這個(gè)“物理規(guī)律”的準(zhǔn)確性?

王曉剛:我們有一個(gè)指標(biāo)叫“成片率”。

生成視頻后,我們會(huì)檢查它是否符合物理規(guī)律。早期可能 100 個(gè)視頻里只有個(gè)位數(shù)是可用的,現(xiàn)在我們的成片率已經(jīng)越來(lái)越高,能達(dá)到 50% 以上。

更精細(xì)的度量還包括相機(jī)位姿的反推準(zhǔn)確性、生成圖像與真實(shí)圖像的差異等。

戰(zhàn)略:開(kāi)源與國(guó)產(chǎn)芯片適配

“在具身智能領(lǐng)域,我們希望成為開(kāi)源的標(biāo)桿”

DeepTech:我聽(tīng)說(shuō)大曉這次會(huì)開(kāi)源開(kāi)悟 3.0,具體會(huì)開(kāi)源到什么程度?

王曉剛:我們的模型、工具鏈、以及部署方法都會(huì)開(kāi)源。

特別值得一提的是,這次我們把開(kāi)源模型適配到了國(guó)產(chǎn)芯片上,包括沐曦、海光、壁仞等。


在國(guó)產(chǎn)芯片時(shí)代,模型需要和芯片做深度適配,我們做完軟硬協(xié)同優(yōu)化后,極大提升了芯片性能,能達(dá)到 A 卡(英偉達(dá))的效果。有了模型和算力基礎(chǔ),我們就能構(gòu)建物理世界的“DeepSeek 時(shí)刻”,實(shí)現(xiàn)“算力—模型—應(yīng)用”的全方位迭代。

DeepTech:開(kāi)源對(duì)大曉的商業(yè)化有什么影響?

王曉剛: 開(kāi)源和平臺(tái)是相輔相成的。開(kāi)源能讓大家熟悉我們的模型。同時(shí),世界模型的訓(xùn)練和推理需要大量算力,我們把 API 部署在云上(商湯大裝置、騰訊云等)。用戶使用云服務(wù)時(shí),我們和云廠商都能獲得收益。

DeepTech:從長(zhǎng)期看,開(kāi)源對(duì)初創(chuàng)公司的護(hù)城河有什么意義?

王曉剛:在大模型領(lǐng)域,DeepSeek 是一個(gè)很好的例子。它通過(guò)開(kāi)源產(chǎn)生了巨大的行業(yè)影響力。

我們希望在物理世界、在具身智能領(lǐng)域,讓“開(kāi)悟 3.0”成為對(duì)標(biāo) DeepSeek 的存在。這個(gè)行業(yè)需要先發(fā)優(yōu)勢(shì)。當(dāng)我們先把高質(zhì)量的開(kāi)源項(xiàng)目做出來(lái),用的人多了,就會(huì)形成聚集效應(yīng)。芯片公司也會(huì)主動(dòng)來(lái)適配我們,生態(tài)就建立起來(lái)了。

落地:產(chǎn)品與未來(lái)

“機(jī)器狗,前置倉(cāng),到家庭機(jī)器人”

DeepTech:這次發(fā)布會(huì)有哪些交付形態(tài)的產(chǎn)品?

王曉剛:我們會(huì)發(fā)布幾樣?xùn)|西:ACE 研發(fā)范式:環(huán)境式采集(Ambient Capture Engine);開(kāi)悟 3.0 平臺(tái),并且開(kāi)源;以及具身超級(jí)大腦模組 A1,這是一個(gè)軟硬結(jié)合的產(chǎn)品,目前最先搭載在四足機(jī)器人上。

有了這個(gè)模組,機(jī)器狗在戶外就具備了自主空間能力,不需要人遙控,可以通過(guò)語(yǔ)音控制它去目的地執(zhí)行任務(wù)。我們的機(jī)管平臺(tái)還和商湯的方舟平臺(tái)打通,直接調(diào)用 150 多種 AI 應(yīng)用。

此外,我們?cè)谀=M硬件上也有創(chuàng)新,引入了 Insta360 的全景相機(jī)?,F(xiàn)有的機(jī)器人攝像頭視野窄、不穩(wěn)。全景相機(jī)能做到 360 度無(wú)死角,畫質(zhì)和穩(wěn)定性大幅提升,這對(duì)夜間作業(yè)和 AI 識(shí)別非常有幫助。

DeepTech:大曉目前最優(yōu)先落地的場(chǎng)景是哪些?

王曉剛:我們有近期、中期、遠(yuǎn)期的規(guī)劃。

近期(現(xiàn)在),重點(diǎn)是戶外四足機(jī)器人。雖然提供情緒價(jià)值(表演)的市場(chǎng)比較成熟,但規(guī)模有限。我們看重的是生產(chǎn)力提升,比如電力巡檢、文旅、智慧城市。加上我們的模組,機(jī)器狗就能具備空間自主能力,實(shí)現(xiàn)規(guī)?;瘧?yīng)用。

中期(2 年左右),我們希望把前置倉(cāng)(閃購(gòu)倉(cāng))這個(gè)場(chǎng)景做下來(lái)。明年大概會(huì)有十幾萬(wàn)個(gè)這樣的倉(cāng)庫(kù),場(chǎng)景非常類似。一旦做好,規(guī)模化落地速度會(huì)很快。

遠(yuǎn)期(5 年后),就是家庭場(chǎng)景。這目前還屬于預(yù)研性質(zhì),也是像 Figure AI 這樣的公司的長(zhǎng)遠(yuǎn)目標(biāo)。

DeepTech:最后一個(gè)我比較好奇的問(wèn)題,“大曉”這個(gè)名字是怎么來(lái)的?是你和大程(商湯聯(lián)合創(chuàng)始人)老師的名字合在一起的嗎?

王曉剛:(笑)是這樣。我和大曉機(jī)器人首席科學(xué)家陶大程是中科大的師兄弟,在湯老師那邊讀碩士時(shí)還是寢室室友,關(guān)系非常好,有很深的信任。在具身智能這個(gè)機(jī)會(huì)點(diǎn)上,我們覺(jué)得能一起合作做些事情。

但“大曉”這個(gè)名字還有衍生的含義。我們?cè)诎l(fā)布會(huì)上給出的解釋是:“大千世界,曉識(shí)萬(wàn)象”。

“大千世界”講的是我們的世界模型,要理解這個(gè)世界;“曉識(shí)萬(wàn)象”講的是我們的環(huán)境式采集,通過(guò)感知去理解人和環(huán)境的交互。這正好契合了我們未來(lái)具身智能的兩個(gè)核心方向。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
六十年難遇的特殊冬至,今年我們?cè)撎崆皽?zhǔn)備了嗎?

六十年難遇的特殊冬至,今年我們?cè)撎崆皽?zhǔn)備了嗎?

眼界看視野
2025-12-18 21:27:28
俄軍胃口越打越大,澤連斯基不簽城下之盟,就等著丟掉第五個(gè)州?

俄軍胃口越打越大,澤連斯基不簽城下之盟,就等著丟掉第五個(gè)州?

興史興談
2025-12-20 04:20:03
60分鐘狂轟63分!正負(fù)值+64!文班亞馬創(chuàng)神級(jí)紀(jì)錄,馬刺該起飛了

60分鐘狂轟63分!正負(fù)值+64!文班亞馬創(chuàng)神級(jí)紀(jì)錄,馬刺該起飛了

世界體育圈
2025-12-20 11:42:34
托卡耶夫訪問(wèn)日本,犯了大忌:中日紛爭(zhēng)之際,他參拜了明治神宮!

托卡耶夫訪問(wèn)日本,犯了大忌:中日紛爭(zhēng)之際,他參拜了明治神宮!

潮鹿逐夢(mèng)
2025-12-20 19:58:13
愛(ài)潑斯坦案新文件公布,克林頓被“大量提及”

愛(ài)潑斯坦案新文件公布,克林頓被“大量提及”

界面新聞
2025-12-20 15:51:53
華子復(fù)出26+12送制勝三分森林狼掀翻雷霆,亞歷山大35+5+7

華子復(fù)出26+12送制勝三分森林狼掀翻雷霆,亞歷山大35+5+7

湖人崛起
2025-12-20 13:19:03
演員王東近況曝光!一家5口擠小房子21歲大兒子有病生活不能自理

演員王東近況曝光!一家5口擠小房子21歲大兒子有病生活不能自理

曹幺妹的小廚房
2025-12-20 14:38:20
走紅不到一周,烤雞少年"翻車",食藥部門介入,知情人曝行業(yè)內(nèi)幕

走紅不到一周,烤雞少年"翻車",食藥部門介入,知情人曝行業(yè)內(nèi)幕

千言?shī)蕵?lè)記
2025-12-20 19:05:54
俄體操冠軍卡巴耶娃:與普京傳17年緋聞,三孩生父成謎

俄體操冠軍卡巴耶娃:與普京傳17年緋聞,三孩生父成謎

孫縭北漂拍客
2025-12-20 19:16:21
國(guó)手連續(xù)3場(chǎng)0分0板!球迷說(shuō)憑啥進(jìn)國(guó)家隊(duì),他場(chǎng)均27分卻進(jìn)不去

國(guó)手連續(xù)3場(chǎng)0分0板!球迷說(shuō)憑啥進(jìn)國(guó)家隊(duì),他場(chǎng)均27分卻進(jìn)不去

老吳說(shuō)體育
2025-12-20 13:59:48
俄羅斯國(guó)防部終止與保加利亞、德國(guó)、波蘭、丹麥、挪威、英國(guó)、荷蘭、克羅地亞、比利時(shí)、捷克合作協(xié)議!普京最新表態(tài)

俄羅斯國(guó)防部終止與保加利亞、德國(guó)、波蘭、丹麥、挪威、英國(guó)、荷蘭、克羅地亞、比利時(shí)、捷克合作協(xié)議!普京最新表態(tài)

每日經(jīng)濟(jì)新聞
2025-12-20 07:43:13
實(shí)探廣州玩具城:李嘉誠(chéng)15億投資,如今荒涼像“鬼城”

實(shí)探廣州玩具城:李嘉誠(chéng)15億投資,如今荒涼像“鬼城”

樓市滅霸
2025-12-19 19:11:22
剎車失靈狂奔490公里 司機(jī)希望退款或換車,網(wǎng)友質(zhì)疑“自導(dǎo)自演”

剎車失靈狂奔490公里 司機(jī)希望退款或換車,網(wǎng)友質(zhì)疑“自導(dǎo)自演”

半島晨報(bào)
2025-12-20 14:45:12
賴昌星發(fā)妻曾明娜現(xiàn)狀:逃亡10年后回國(guó),守著3000平老宅安靜養(yǎng)老

賴昌星發(fā)妻曾明娜現(xiàn)狀:逃亡10年后回國(guó),守著3000平老宅安靜養(yǎng)老

古書記史
2025-12-12 11:21:38
33歲厄瓜多爾國(guó)腳在肉店被槍殺:跪地求饒?jiān)饩?3個(gè)月5名球員被殺

33歲厄瓜多爾國(guó)腳在肉店被槍殺:跪地求饒?jiān)饩?3個(gè)月5名球員被殺

風(fēng)過(guò)鄉(xiāng)
2025-12-20 16:43:14
狼狽的2-1?利物浦11打9仍險(xiǎn)被熱刺絕平!4人傷退+1.4億標(biāo)王重傷

狼狽的2-1?利物浦11打9仍險(xiǎn)被熱刺絕平!4人傷退+1.4億標(biāo)王重傷

我愛(ài)英超
2025-12-21 04:21:53
委內(nèi)瑞拉油輪剛出海,中國(guó)軍艦緊隨其后,特朗普的算盤又打錯(cuò)了

委內(nèi)瑞拉油輪剛出海,中國(guó)軍艦緊隨其后,特朗普的算盤又打錯(cuò)了

觸摸史跡
2025-12-20 11:27:41
加拿大反水,狂拋567億美債,白宮夢(mèng)碎,中國(guó)持倉(cāng)一夜回到17年前

加拿大反水,狂拋567億美債,白宮夢(mèng)碎,中國(guó)持倉(cāng)一夜回到17年前

時(shí)尚的弄潮
2025-12-20 15:49:12
烏軍成功奪回庫(kù)皮揚(yáng)斯克,俄軍慘遭全殲。

烏軍成功奪回庫(kù)皮揚(yáng)斯克,俄軍慘遭全殲。

世界探索者探索
2025-12-15 23:02:13
五常表態(tài)讓高市絕望,日右翼:若中國(guó)用核武,沒(méi)死的日本人將反擊

五常表態(tài)讓高市絕望,日右翼:若中國(guó)用核武,沒(méi)死的日本人將反擊

杰絲聊古今
2025-12-21 05:45:28
2025-12-21 06:36:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評(píng)論獨(dú)家合作
16018文章數(shù) 514416關(guān)注度
往期回顧 全部

科技要聞

許四清:具身智能的"ChatGPT時(shí)刻"還未到來(lái)

頭條要聞

高市早苗擔(dān)心被邊緣化 要趕在特朗普訪華前行動(dòng)

頭條要聞

高市早苗擔(dān)心被邊緣化 要趕在特朗普訪華前行動(dòng)

體育要聞

我開(kāi)了20年大巴,現(xiàn)在是一名西甲主帥

娛樂(lè)要聞

2026央視跨年晚會(huì)陣容曝光,豪華陣仗

財(cái)經(jīng)要聞

求解“地方財(cái)政困難”

汽車要聞

嵐圖推進(jìn)L3量產(chǎn)測(cè)試 已完成11萬(wàn)公里實(shí)際道路驗(yàn)證

態(tài)度原創(chuàng)

房產(chǎn)
數(shù)碼
旅游
公開(kāi)課
軍事航空

房產(chǎn)要聞

廣州有態(tài)度,一座國(guó)際化社區(qū)給出的城市答案

數(shù)碼要聞

一屏多用:華為Mate X7 / XTs折疊屏手機(jī)“變身”智能手卡

旅游要聞

不止紅墻白雪!故宮淡季爆火,藏著中國(guó)文旅升級(jí)的大信號(hào)

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

澤連斯基:前線局勢(shì)愈發(fā)艱難

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版