国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

獨(dú)家對話前華為天才少年李元慶:首款規(guī)?;呱碇悄墚a(chǎn)品中國造!多機(jī)異構(gòu)是未來方向

0
分享至


作者 | 蔡芳芳、華衛(wèi)

剛剛,AI 前線獲悉,前華為天才少年、原華為云具身智能核心負(fù)責(zé)人李元慶已正式加入樂享科技,后續(xù)將重點(diǎn)負(fù)責(zé)樂享科技的創(chuàng)新業(yè)務(wù)戰(zhàn)略規(guī)劃與核心技術(shù)攻關(guān)。

2024 年,李元慶出任華為云具身智能主要負(fù)責(zé)人及 ROBO_AGENT 負(fù)責(zé)人,牽頭完成多款具身智能機(jī)器人核心方案開發(fā),其中由他主導(dǎo)的 2024 年華為 HDC 大會明星具身智能項(xiàng)目成功落地并引爆網(wǎng)絡(luò),成為具身智能技術(shù)走向大眾視野的標(biāo)志性案例,也讓他成為行業(yè)內(nèi)具身智能領(lǐng)域的頂尖人才之一。

據(jù)了解,此次李元慶選擇加入樂享科技,核心原因在于雙方在具身智能賽道的技術(shù)理念高度契合。

近期,我們對李元慶進(jìn)行了獨(dú)家專訪。透過 2025 年具身智能領(lǐng)域在技術(shù)及落地表現(xiàn)上的各類突破性進(jìn)展,他道出了這一年來具身智能技術(shù)棧的核心演變。在與我們的對話中,李元慶也直言不諱地指出當(dāng)下制約具身智能大規(guī)模落地應(yīng)用的同質(zhì)化難題,以及他對此的技術(shù)路線選擇與思考。

“世界上第一款能大面積鋪開的具身智能落地產(chǎn)品,很可能會在中國出現(xiàn)。多機(jī)異構(gòu)技術(shù)路線是具身智能未來的發(fā)展方向?!崩钤獞c稱。

在他看來,這個時代下具身智能領(lǐng)域最該抓住的就是兩件事:落地和數(shù)據(jù)。而他接下來的核心發(fā)力點(diǎn)是,打造一款面向家庭用戶的功能性產(chǎn)品。

以下是完整對話內(nèi)容,以饗讀者。

1 機(jī)器人更“抗造”了,關(guān)鍵技術(shù)突破多點(diǎn)爆發(fā)

Q:我們觀察到,2025 年無論是科技巨頭還是初創(chuàng)公司,都顯著加大了對具身智能的投入,還有許多新投身進(jìn)來的創(chuàng)業(yè)者,順利拿到大額融資的亦不少。在您看來,這股熱潮背后的核心驅(qū)動因素是什么?技術(shù)成熟度的變化還是市場應(yīng)用預(yù)期?

李元慶:機(jī)器人企業(yè)大多能順利拿到投融資,這已經(jīng)成為一種普遍現(xiàn)象。當(dāng)下,機(jī)器人領(lǐng)域依然是值得入局成立公司的賽道,這一點(diǎn)我是確信的。資本市場看待這個領(lǐng)域遵循的是長期邏輯,大家已經(jīng)明確看到了未來的發(fā)展結(jié)果。一款優(yōu)質(zhì)的硬件產(chǎn)品需要花費(fèi)數(shù)年時間去梳理供應(yīng)鏈、等待技術(shù)逐步成熟,整個產(chǎn)業(yè)發(fā)展也需要一個漫長的周期。所以在我看來,當(dāng)前機(jī)器人領(lǐng)域的熱潮,本質(zhì)上是由未來的確定性倒推而來的結(jié)果。

這波熱潮有個特別典型的特征,就是一二級市場的聯(lián)動?,F(xiàn)在二級市場的頭部上市企業(yè),之所以紛紛布局機(jī)器人領(lǐng)域,有幾方面的原因。首先是出于公司市值管理的需求,很多上市公司會對外釋放信號,如 “今年我們要切入人形機(jī)器人賽道”,并且會把這項(xiàng)技術(shù)整合到自身的應(yīng)用產(chǎn)品線中,這相當(dāng)于為公司打造了一條未來的第二增長曲線。

所以,從二級市場的角度來看,布局機(jī)器人領(lǐng)域有幾個核心價值:一是能為傳統(tǒng)制造業(yè)鏈條賦能,讓投入產(chǎn)出比變得更劃算;二是助力市值管理,打造第二增長曲線,用傳統(tǒng)制造業(yè)的資金去撬動機(jī)器人這個高市盈率的新興科技賽道;三是可以盤活現(xiàn)有團(tuán)隊(duì),給員工提供二次賦能的機(jī)會,拓展更多的工作內(nèi)容。而且中國市場本身帶有很強(qiáng)的政策導(dǎo)向性,這也是一二級市場能夠快速聯(lián)動的重要原因。

另一個核心原因是技術(shù)成熟度的突破。我接觸過不少國內(nèi)的人形機(jī)器人項(xiàng)目,最明顯的對比就是去年和今年的差異。和 2024 年相比,現(xiàn)在的機(jī)器人在穩(wěn)定性、可靠性上都有了顯著提升,能明顯感覺到機(jī)器人正從技術(shù)演示階段朝著產(chǎn)品化的方向推進(jìn)。以前這些機(jī)器人還只是實(shí)驗(yàn)室里的 demo,現(xiàn)在已經(jīng)逐漸變成可以推向市場的產(chǎn)品了。

客觀來說,2024 年的人形機(jī)器人穩(wěn)定性很差,輕輕推一下基本就會倒;要是突然給它加一個額外的大力矩,或者地面稍微打滑、不平整,它都會很容易倒地。但 2025 年在各類展會上,像宇樹等企業(yè)的機(jī)器人已經(jīng)有了明顯進(jìn)步,現(xiàn)在的機(jī)器人越來越 “抗造”,踢一腳不會倒,摔一下也不會倒,腳打滑了也能穩(wěn)住,動作還變得更流暢,甚至能完成跳舞、打武術(shù)這類復(fù)雜動作。這些表現(xiàn),都是機(jī)器人軟硬件在局部運(yùn)動控制層面成熟度的直觀體現(xiàn)。這種技術(shù)層面的突破,給了整個行業(yè)和資本市場很大的信心。

Q:2025 年具身智能領(lǐng)域有哪些突破性進(jìn)展讓您印象深刻,包括技術(shù)、產(chǎn)業(yè)化和生態(tài)建設(shè)上?這些進(jìn)展是否已經(jīng)為具身智能從實(shí)驗(yàn)室走向特定場景的“初步普及”奠定了基礎(chǔ)?

李元慶:有不少值得關(guān)注的突破,尤其是學(xué)術(shù)界跟進(jìn)得比較緊密。第一是 LocoFormer 技術(shù),能讓機(jī)器人實(shí)現(xiàn)跨本體的局部運(yùn)動控制,這個突破的價值非常大。第二是 AnyTracker 相關(guān)的應(yīng)用,能讓機(jī)器人像人的 “身外化身” 一樣,緊緊跟著人做動作,遠(yuǎn)程操作時機(jī)器人也能精準(zhǔn)復(fù)刻動作,時延和穩(wěn)定性都做得很好,而且全程不會摔倒,這也是一項(xiàng)很突出的成果。

除此之外,還有一些明顯的進(jìn)展集中在局部運(yùn)動控制領(lǐng)域,機(jī)器人的軟硬件打磨得越來越成熟,也越來越產(chǎn)品化,開始能在更多場景中落地應(yīng)用了。以前操作機(jī)器人需要大量工程師全程跟進(jìn),現(xiàn)在不一樣了,就算不是專業(yè)工程師,只要會敲代碼、甚至用遙控器就能操控機(jī)器人,讓它完成各種動作。

核心是夯實(shí)了軟硬件整體的魯棒性。以前的機(jī)器人說白了就是個演示 demo,稍微一動就會倒,還很容易出現(xiàn)故障、損壞?,F(xiàn)在的機(jī)器人安全性和可靠性都上來了,就算在人員密集的場景里活動,也不用擔(dān)心它突然摔倒砸到人,風(fēng)險大大降低。以前大家都得用圍欄把機(jī)器人隔離開來,現(xiàn)在人們已經(jīng)能更近距離地接觸它了。而且從產(chǎn)業(yè)化角度看,以前機(jī)器人基本沒有實(shí)際交付的案例,現(xiàn)在交付市場規(guī)模越來越大,已經(jīng)能買到商用機(jī)器人了,成本也變得更加可控。

Q:大模型的快速發(fā)展,為具身智能的“智能”部分帶來了哪些質(zhì)變?

李元慶:2025 年的實(shí)質(zhì)性進(jìn)展不算特別多,但有一個突破非常關(guān)鍵:機(jī)器人已經(jīng)具備了一些簡單任務(wù) 100% 完成的能力。以前就算是簡單任務(wù),成功率頂多也就 60% 到 90%,現(xiàn)在能做到 100% 了。同時,其他復(fù)雜任務(wù)的成功率也在穩(wěn)步提升。這些變化特別讓人震驚,之前我們一直覺得 AI 很難真正落地,現(xiàn)在證明了具身智能是有機(jī)會走向?qū)嶋H應(yīng)用的。

Q:具身智能的核心技術(shù)棧正在如何演變?2025 年有哪些值得關(guān)注的新范式或共識?

李元慶:首先,機(jī)器人的局部運(yùn)動控制技術(shù)已經(jīng)越來越成熟,也就是機(jī)器人如何行走這件事,基本朝著產(chǎn)品化落地的方向推進(jìn)了,并且發(fā)展速度快得讓人驚訝。另外,VLN(視覺語言導(dǎo)航) 策略也在慢慢收斂。現(xiàn)在一個很關(guān)鍵的突破是,機(jī)器人開始能理解規(guī)則、知道該往哪里走了。舉個例子,以前讓機(jī)器人從 A 點(diǎn)到 B 點(diǎn),它只會徑直走過去,但現(xiàn)在你告訴它中間有草坪不能踩,它就能繞開草坪走。這些沒辦法靠人窮盡編寫的規(guī)則,現(xiàn)在可以通過大模型灌輸給機(jī)器人,這是 VLN 技術(shù)棧越來越完善的一個重要體現(xiàn)。

再說說操作控制,這個領(lǐng)域的技術(shù)路徑目前還沒有收斂,大家都在做各種嘗試,但有兩個特別棒的進(jìn)展:一是單點(diǎn)任務(wù)的成功率實(shí)現(xiàn)了突破,以前這類任務(wù)成功率最多也就 60%-90%,現(xiàn)在已經(jīng)能做到 100%;二是多任務(wù)的成功率也在穩(wěn)步提升。從這兩點(diǎn)就能判斷,機(jī)器人接下來是能夠可靠、穩(wěn)定落地的,具身智能也具備了這樣的可靠性。

再說說其他的新范式和共識。世界模型算是一個新范式,但說實(shí)話還沒有形成行業(yè)共識。技術(shù)架構(gòu)方面也有新變化,以前大家基本都用 transformer 架構(gòu),現(xiàn)在慢慢出現(xiàn)了更多新的技術(shù)路徑,比如 VG-EPA、VG-1/2,關(guān)注和探索這些新路徑的科研人員也越來越多了。還有一個核心的技術(shù)范式變化,大家開始把 VLA 與 RL 結(jié)合起來用。以前大家更多關(guān)注 VLA,相對輕視 RL 路徑,現(xiàn)在兩者結(jié)合后,機(jī)器人能完成更復(fù)雜的任務(wù)了。比如在星海圖、Dyna Robotics、字節(jié)等企業(yè)的實(shí)踐中,機(jī)器人已經(jīng)能完成穿鞋帶、榨橙汁這類難度很高的任務(wù),而且像榨橙汁的成功率在論文展示的場景里已經(jīng)接近 100%,這些進(jìn)展才真正讓大家對具身智能的落地更有信心。

最后說說新的共識。之前我問過 Physical Intelligence 的 CEO,他對具身智能的探索有一個評價,簡單來說就是“走一步看一步”。大家都不會去預(yù)測它最終的形態(tài),但現(xiàn)在確實(shí)能看到越來越多落地的可能性,這算是對當(dāng)前行業(yè)狀態(tài)很真實(shí)的描述和評價。

2 基礎(chǔ)模型困局:世界模型成破局關(guān)鍵?

Q:世界模型被寄予厚望,被認(rèn)為是實(shí)現(xiàn)高級推理和規(guī)劃的關(guān)鍵?,F(xiàn)階段來看,它對機(jī)器人實(shí)際能力的提升體現(xiàn)在何處?之后還有哪些方面的潛力?

李元慶:按照“數(shù)據(jù)金字塔” 的邏輯來看,第一層是視頻數(shù)據(jù)、網(wǎng)絡(luò)數(shù)據(jù);第二層是各類強(qiáng)化學(xué)習(xí)相關(guān)的策略應(yīng)用;第三層才是真實(shí)機(jī)器人的實(shí)際部署。目前世界模型最核心的作用是,能極快、極大規(guī)模地生成金字塔第一層的有效數(shù)據(jù),幫助構(gòu)建大量有效的數(shù)據(jù)資產(chǎn)庫,比如生成視頻大模型、3D 高斯建模、3D 世界構(gòu)建、視頻生成等都在補(bǔ)充這一層的數(shù)據(jù)。核心原因是,現(xiàn)在具身智能模型往往需要百萬級小時的視頻數(shù)據(jù),而這些數(shù)據(jù)如果靠實(shí)際采集獲取,不僅成本高、性價比低,收集速度還很慢。世界模型或視頻生成模型有機(jī)會把這部分?jǐn)?shù)據(jù)構(gòu)建工作做得更高效、成本更低,這是它們現(xiàn)階段最實(shí)際的價值。

至于第二層,世界模型也有替代部分現(xiàn)有技術(shù)的潛力,比如替代一些物理仿真引擎,去模擬摩擦力學(xué)、動力學(xué)以及機(jī)器人的機(jī)械結(jié)構(gòu)等?,F(xiàn)有仿真引擎存在明顯缺陷,在仿真環(huán)境里表現(xiàn)很好,可部署到真實(shí)機(jī)器人上時,雖然移動控制(Locomotion)問題能解決,但操作控制(Manipulation)的問題還沒做好。目前這一層的效果還沒完全顯現(xiàn),但世界模型讓我看到了解決這個問題的希望。另外,世界模型對于構(gòu)建基礎(chǔ)模型非常重要。要補(bǔ)充的是,實(shí)驗(yàn)室里的數(shù)據(jù)和技術(shù)要走進(jìn)所有人的家里,所以我更關(guān)注的是后續(xù)的落地。

Q:幾乎所有專家都指出,高質(zhì)量、大規(guī)模的物理交互數(shù)據(jù)稀缺是當(dāng)前最大瓶頸。面對真實(shí)數(shù)據(jù)采集成本高昂的困境,仿真合成數(shù)據(jù)、人類視頻數(shù)據(jù)等替代方案能走多遠(yuǎn)?“數(shù)據(jù)工廠”是可行的解決方案嗎?

李元慶:首先,仿真合成數(shù)據(jù)這套方案肯定是有意義的。數(shù)據(jù)的核心價值在于多樣性,模型學(xué)習(xí)過程中需要大量種類豐富的數(shù)據(jù),但靠實(shí)地采集、真人采集或者真機(jī)采集,很多時候根本拿不到這么多元化的數(shù)據(jù)。仿真合成數(shù)據(jù)的意義就在于補(bǔ)充這種多樣性,哪怕為此稍微犧牲一點(diǎn)精度也值得。這一點(diǎn)在數(shù)據(jù)金字塔的第一層尤其重要,我們用這些數(shù)據(jù)來訓(xùn)練基礎(chǔ)模型,比如世界模型生成的視頻數(shù)據(jù)、3D 相關(guān)數(shù)據(jù)等,都是為了構(gòu)建基礎(chǔ)模型所需的數(shù)據(jù)資產(chǎn)庫。有了仿真合成數(shù)據(jù),后續(xù)的技術(shù)探索才能推進(jìn);要是沒有它,很多方向的探索可能都不成立,我們現(xiàn)在確實(shí)迫切需要這部分?jǐn)?shù)據(jù)。到了第二層,仿真合成數(shù)據(jù)的意義會稍微弱一些,但依然有價值,它能幫助大家快速拿到測試結(jié)果、實(shí)現(xiàn)模型收斂。

數(shù)據(jù)工廠的核心是聚焦真機(jī)數(shù)據(jù),主要服務(wù)于數(shù)據(jù)金字塔的第二層和第三層。核心原因是,很多非平穩(wěn)振動相關(guān)的場景,仿真擬合是不準(zhǔn)確的,這時就需要真機(jī)數(shù)據(jù)來補(bǔ)位。所以說,仿真合成數(shù)據(jù)和數(shù)據(jù)工廠這兩套方案都有存在的意義,只是解決的問題不同:前者更多是為了支撐基礎(chǔ)模型的訓(xùn)練,后者則是服務(wù)于后期的模仿學(xué)習(xí)等場景。要是想讓數(shù)字人或者人形機(jī)器人的動作更像真人,往往還是需要在數(shù)據(jù)工廠里采集真人的動作數(shù)據(jù)。先拿真人內(nèi)容做動畫,再讓數(shù)字人去模擬擬合,才能得到核心數(shù)據(jù)。所以現(xiàn)在動捕數(shù)據(jù)采集依然有很大的市場空間,這些工作也都是有實(shí)際意義的。

對于技術(shù)落地,行業(yè)里有不同的思路:有人堅(jiān)信一個大模型就能解決所有問題,也有人覺得可以通過模仿學(xué)習(xí)來推進(jìn)落地。而數(shù)據(jù)工廠,就是后一種思路下的解決方案。這些不同的技術(shù)路線其實(shí)都有其合理性,最終能走多遠(yuǎn),關(guān)鍵要看我們什么時候能探索到基礎(chǔ)模型的能力上限。

現(xiàn)在行業(yè)里的核心困境就是缺少優(yōu)質(zhì)的基礎(chǔ)模型,而好的基礎(chǔ)模型又離不開海量數(shù)據(jù)的支撐。仿真合成數(shù)據(jù)和人類視頻數(shù)據(jù)能不能在這個環(huán)節(jié)發(fā)揮作用?我可以負(fù)責(zé)任地說,完全可以。至于能走多遠(yuǎn),說實(shí)話,現(xiàn)在只能走一步看一步。因?yàn)橛?xùn)練基礎(chǔ)模型的過程中,模型架構(gòu)可能需要不斷調(diào)整,數(shù)據(jù)配比也會持續(xù)優(yōu)化,數(shù)據(jù)質(zhì)量同樣在逐步提升。目前,這項(xiàng)技術(shù)還遠(yuǎn)遠(yuǎn)沒到能滿足規(guī)?;瘧?yīng)用需求的狀態(tài)。

3 硬核拆解:機(jī)器人當(dāng)下的多種落地難題

Q:當(dāng)前的硬件如靈巧手、關(guān)節(jié)驅(qū)動、傳感器等,在哪些方面最能滿足機(jī)器人的技術(shù)需求?又在哪些方面構(gòu)成了發(fā)展的主要制約?

李元慶:我分享幾個觀點(diǎn),可能和大家平時聽到的不太一樣。首先,我認(rèn)為球形關(guān)節(jié)是明確需要重點(diǎn)發(fā)展的方向;其次,耐磨材料、抗蠕變材料的研發(fā)也亟待突破;還有一個關(guān)鍵點(diǎn),是非永磁體的高密度電機(jī)。大家可能更關(guān)注靈巧手、關(guān)節(jié)驅(qū)動和傳感器,我們可以拆解開來看。

先說說靈巧手,目前學(xué)術(shù)界主要有六種技術(shù)路徑,分別是腱繩傳動、連桿傳動、齒輪傳動、軟體驅(qū)動,還有傳統(tǒng)驅(qū)動結(jié)合 AI 增強(qiáng)的混合方案。再說到關(guān)節(jié)驅(qū)動,現(xiàn)在行業(yè)里的普遍做法是用多個電機(jī)去模擬球形關(guān)節(jié)的功能,比如手腕部位經(jīng)常需要用三個電機(jī)來替代一個球形關(guān)節(jié),以此實(shí)現(xiàn)類似人類手腕的靈活度。傳感器目前存在的核心問題是噪聲、蠕變和熱穩(wěn)定性,在受熱之后,傳感器會出現(xiàn)各種不穩(wěn)定的反應(yīng),這些都是機(jī)器人領(lǐng)域需要攻克的技術(shù)難題。

球形關(guān)節(jié)的優(yōu)勢很明顯,用一個球形關(guān)節(jié)就能替代過去的三個電機(jī),既能讓機(jī)器人實(shí)現(xiàn)輕量化,還能大幅縮小整機(jī)尺寸,理論上也能顯著降低成本??谷渥儾牧蟿t是腱繩控制技術(shù)路線里的剛需,像 Optimus Gen 3 就采用了腱繩傳動的方案,這類技術(shù)路線對抗蠕變材料的性能要求很高,而目前相關(guān)材料的發(fā)展還需要時間。

非永磁體的高密度電機(jī)的核心痛點(diǎn)是電機(jī)發(fā)熱和熱衰減,在今年的機(jī)器人馬拉松大會,現(xiàn)場很多機(jī)器人都需要頻繁噴霧降溫。傳統(tǒng)永磁體電機(jī)存在一個致命問題,磁鐵在高溫環(huán)境下磁性會減弱。這類電機(jī)的轉(zhuǎn)子帶有磁鐵,一旦溫度超過 70 度,就會出現(xiàn)明顯的熱衰減,磁性下降直接導(dǎo)致扭矩傳導(dǎo)失效,電機(jī)就會 “沒力氣”。現(xiàn)在行業(yè)里也在探索一些新的技術(shù)路線,如軸向磁通電機(jī)、中向磁通電機(jī),但這類電機(jī)的發(fā)展同樣受制于幾個核心指標(biāo):高能量密度、小尺寸,這些都是目前亟待突破的瓶頸。

回到傳感器,我接觸過很多傳感器相關(guān)的研發(fā)。現(xiàn)狀是,能達(dá)到精度要求的傳感器已經(jīng)有了,但成本降不下來,產(chǎn)量也沒能實(shí)現(xiàn)規(guī)模化爬坡,還需要一段時間去完善。而且傳感器還得面對電機(jī)發(fā)熱帶來的熱干擾問題,這也是一個繞不開的挑戰(zhàn)??偟膩碚f,我對這個領(lǐng)域的思考主要集中在新材料研發(fā)和新型關(guān)節(jié)技術(shù)突破這幾個維度。另外說到靈巧手,我個人更看好三指靈巧手的方案,像 SharpaWave、Wuji Hand 這些產(chǎn)品。還有一個很有意思的現(xiàn)象,不少手機(jī)廠商也在布局相關(guān)領(lǐng)域,但大家都面臨同一個難題:小尺寸、高能量密度的產(chǎn)品,必然會伴隨電機(jī)發(fā)熱嚴(yán)重的問題。

Q:這些算得上是行業(yè)內(nèi)的難題嗎?現(xiàn)在優(yōu)化的難度高嗎?

李元慶:這幾個方向目前都是行業(yè)難題。首先是材料和結(jié)構(gòu)層面,現(xiàn)在既沒有性能出色的耐磨材料、抗蠕變材料,也沒有能提供足夠扭矩的球形關(guān)節(jié)。就拿抗蠕變材料來說,現(xiàn)在大家嘗試過鎢絲繩、聚乙烯和一些復(fù)合新材料,但都存在明顯短板,鎢絲繩的成本太高,一米就要 100 塊錢;聚乙烯雖然便宜,可反復(fù)牽拉之后很容易被拉長變形,所以這部分還需要在材料選型和結(jié)構(gòu)設(shè)計(jì)上做更多創(chuàng)新。不過,高密度高能量電機(jī)領(lǐng)域已經(jīng)有了突破,軸向磁通的電機(jī)慢慢成熟了,正在逐步爬坡。傳感器方面,精度和成本和產(chǎn)量正在逐年提升。總的來說,這些難題都在逐步推進(jìn)解決的過程中。

Q:目前為止,制約具身智能大規(guī)模落地應(yīng)用難題還有哪些?

李元慶:首先是成本問題,這是個特別大的阻礙。現(xiàn)在很多技術(shù)其實(shí)已經(jīng)越來越穩(wěn)定可靠了,但核心部件的價格居高不下,比如一臺高性能的工控電腦要幾萬塊,一款優(yōu)質(zhì)的靈巧手基本也要上萬、甚至三到五萬的都有。成本降不下來,就沒有場景愿意去接受和應(yīng)用。第二個問題,是場景化的產(chǎn)品定義不清晰,這是個系統(tǒng)性的問題。就拿工廠場景來說,人形機(jī)器人的投入產(chǎn)出比、執(zhí)行速度、精度以及最終的工作效率,都還沒有算過賬,很難體現(xiàn)出優(yōu)勢。現(xiàn)在市面上有一些陪伴類的玩具機(jī)器人,算是一種產(chǎn)品方向,但這類產(chǎn)品同樣存在成本偏高的問題,沒能給用戶建立起清晰的產(chǎn)品價值感知。

還有一點(diǎn),軟硬件技術(shù)路徑的結(jié)合沒有完全收斂,不過現(xiàn)在已經(jīng)慢慢能看到一些成果了。另外,模型架構(gòu)和數(shù)據(jù)的飛輪迭代設(shè)計(jì)也沒有做好整合, 有人在單獨(dú)解決數(shù)據(jù)問題,有人在單獨(dú)攻克模型問題,但大家既沒有明確到底該用什么樣的數(shù)據(jù),也沒有確定哪種模型架構(gòu)是最優(yōu)的。這又會引發(fā)供應(yīng)鏈的問題,技術(shù)路線不清晰的情況下,供應(yīng)鏈根本沒辦法做針對性的配套。比如電機(jī),有人需要小尺寸的,有人需要大扭矩的,有人追求高能量密度,有人看重高性價比,需求五花八門,供應(yīng)鏈很難去適配。

最后,產(chǎn)品完整生命周期的市場和運(yùn)維體系沒有建立起來。現(xiàn)在用戶對機(jī)器人的價值感知本就模糊,既覺得機(jī)器人價格昂貴,又不知道買回去能具體做什么。就算買回去了,機(jī)器人還容易出故障,后續(xù)也沒有完善的維修服務(wù)。這些都是制約機(jī)器人大規(guī)模落地的典型問題。

4 把家庭當(dāng)工廠,打造“多機(jī)異構(gòu)”功能性產(chǎn)品?

Q:面對這樣的機(jī)遇與挑戰(zhàn),您們在接下來這一年的戰(zhàn)略重點(diǎn)和核心發(fā)力方向是什么?

李元慶:我們團(tuán)隊(duì)現(xiàn)在的發(fā)展勢頭不錯,雖說還沒到最頭部的位置,但絕對是賽道里即將沖出來的一匹黑馬。我們的核心方向可以舉個例子來理解,假如你跟家里的機(jī)器人保姆說 “幫我拿一杯水過來”,它可能會追問你 “水放在哪兒?這里有可樂、雪碧、芬達(dá),你想喝哪一個?要放到你常用的位置嗎?要不要倒進(jìn)杯子里?”,本質(zhì)上是因?yàn)榧彝キh(huán)境的信息化程度不夠。理想的狀態(tài)是,機(jī)器人第一天可能需要問這些問題,但第二天就該記住。比如知道你是病人,會在固定時間提醒你吃藥、遞藥,知道你喝水的習(xí)慣并主動提醒。這些功能的實(shí)現(xiàn),都離不開家庭信息化的構(gòu)建。

我們的思路是,把每個家庭都當(dāng)成工廠來對待。這是一個倒推的邏輯:以前工廠實(shí)現(xiàn)智能化的前提,都是先完成信息化、再推進(jìn)自動化,最后才是智能化。我們要做的是,先用先進(jìn)的空間感知技術(shù),分層、分段地搭建家庭的信息化體系,再結(jié)合成熟的自動化控制理論,把操作控制和導(dǎo)航技術(shù)整合進(jìn)去,實(shí)現(xiàn)家庭場景的信息化和自動化。之后,再通過友好的人機(jī)交互接口來過渡到智能化。在機(jī)器人還不夠智能的階段,我們可以通過和它對話、給它投喂更多數(shù)據(jù),讓它逐步優(yōu)化;同時借助情感交互的設(shè)計(jì),讓用戶對機(jī)器人的 “不完美” 更有容忍度。

最終的目標(biāo)是,打造一款面向家庭用戶的功能性產(chǎn)品,這是我們接下來的核心發(fā)力點(diǎn)。我們判斷,這個時代下具身智能領(lǐng)域最該抓住的就是兩件事:落地和數(shù)據(jù)。只有做出真正的產(chǎn)品,才能實(shí)現(xiàn)技術(shù)落地,同時把數(shù)據(jù)低成本地回收、形成閉環(huán)。

Q:具身智能的未來,會是一個“通用智能體”統(tǒng)一天下,還是由大量“專用智能體”組成的生態(tài)系統(tǒng)?兩種路徑各自的支持邏輯是什么?

李元慶:說實(shí)話,這兩種觀點(diǎn)我其實(shí)都不太認(rèn)同。先說說通用智能體統(tǒng)一天下這件事,現(xiàn)在 NLP 的 scaling law 上限大家其實(shí)已經(jīng)看到了。在目前的技術(shù)架構(gòu)下,模型存在兩個天然的本質(zhì)問題 :坍塌和遺忘。舉個坍塌的例子,語料里有錯誤信息,模型很容易就會混亂,不知道哪個才是正確的。再就是遺忘,模型可能擅長數(shù)學(xué)時,語文能力就變差了;擅長英語時,語文又會退步。目前來看,這種上限是很典型的,所以很難出現(xiàn)一個什么都精通的 “天才” 通用智能體,至少在當(dāng)下的軟件架構(gòu)里,這件事還存在很大問題。

專用智能體像以前的家電或者 IoT 設(shè)備,其實(shí)根本不需要所謂的 “智能”,比如掃地機(jī)器人,用狀態(tài)機(jī)或者簡單的環(huán)境模型就足夠了。我更傾向的未來形態(tài),有點(diǎn)像《機(jī)器人總動員》里的場景:不是一個無所不能的通用智能體,而是多個機(jī)器人協(xié)作的模式,比如瓦力、伊娃和那些小機(jī)器人。每個機(jī)器人都有自己擅長的領(lǐng)域,能把一件事做到極致,同時又具備一定的泛化性和多余自由度的機(jī)械結(jié)構(gòu)特性,還擁有一些基礎(chǔ)的智能,能夠和其他機(jī)器人配合完成高動態(tài)、復(fù)雜場景下的任務(wù)。

支撐這個觀點(diǎn)的邏輯,可以從自然和人類社會的規(guī)律來推論。從自然角度看,生態(tài)系統(tǒng)里從來不是只有某一種生物,而是有各種各樣的動植物,體型有大有小,功能各有不同,這樣才能構(gòu)成穩(wěn)定的生態(tài)。再看人類群體,有擅長力量的、擅長耐力的、擅長敏捷的,每個人的體型結(jié)構(gòu)、肌肉分布都不一樣,擅長的事情也不同。就像一個辦公室里,不同工種的人思維邏輯、能力特長都有差異,就連 MBTI 人格都能分成 16 種。還有一個很有意思的推論角度:未來是靠一個人解決所有事,還是靠一群不同的人協(xié)作解決所有事?答案肯定是后者。我們做事的時候,往往都是找不同專長的人分工合作,才能完成更復(fù)雜的任務(wù)。

我相信多機(jī)異構(gòu)技術(shù)路線才是具身智能未來的發(fā)展方向,核心就是多個不同類型的機(jī)器人協(xié)同工作。

5 “全球首款規(guī)模具身智能落地產(chǎn)品,在中國誕生”

Q:除了直接銷售機(jī)器人整機(jī),具身智能未來的商業(yè)模式可能有哪些創(chuàng)新?

李元慶:其實(shí)現(xiàn)在已經(jīng)能看到一些新的模式了,并且都已經(jīng)在逐步落地且都形成了清晰的小閉環(huán)。

最典型的是 RAAS(Robot as a Service,機(jī)器人即服務(wù)),這種模式是把機(jī)器人硬件當(dāng)成服務(wù)的一部分,按使用次數(shù)或者完成的任務(wù)量收費(fèi)。比如在工廠場景,按機(jī)器人完成的工序次數(shù)計(jì)費(fèi);中央廚房里面,按穿串、加工食材的任務(wù)量收費(fèi);機(jī)器狗、無人機(jī)按送貨次數(shù)或者演出場次收費(fèi),這些都是很成熟的落地形式。

還有租賃模式,很多人會按天、按月或者按年租賃機(jī)器人。舉個例子,科研實(shí)驗(yàn)室的機(jī)器人,周六日或者放假的時候基本閑置,但這段時間恰恰是商場需要機(jī)器人跳舞表演的高峰期,就可以通過租賃的方式盤活這些閑置設(shè)備,現(xiàn)在閑魚上其實(shí)已經(jīng)能看到這類服務(wù)了。

另外還有一種模式,是軟件費(fèi)加服務(wù)費(fèi)的組合。不少公司會把機(jī)器人整機(jī)以極低的成本價出售,整機(jī)相當(dāng)于 “低價入口”,核心利潤來自軟件授權(quán)和后續(xù)的服務(wù)費(fèi),通過 OTA 升級軟件包的方式持續(xù)收費(fèi)。Tech 1x 就是這么做的,它以 2 萬美金的價格讓人形機(jī)器人進(jìn)入家庭。雖然現(xiàn)階段機(jī)器人的智能化還不夠完善,但可以先讓用戶建立產(chǎn)品感知,同時借助低價勞動力遠(yuǎn)程操控機(jī)器人完成家務(wù)。更重要的是,還能通過這種方式回收家庭場景的數(shù)據(jù),用于模型訓(xùn)練,相當(dāng)于用低價換取市場和數(shù)據(jù),形成商業(yè)閉環(huán)。

Q:2026 年,全球具身智能公司的競爭情況將如何變化?中國公司與國際巨頭各自的優(yōu)勢和賽點(diǎn)分別會在哪里?

李元慶:首先可以參考兩個行業(yè)共識:山姆·奧特曼(Sam Altman)認(rèn)為 AI 的決定性因素按優(yōu)先級排序是人才、場景、數(shù)據(jù)、算力、模型;黃仁勛則提出人工智能 “五層蛋糕理論”,包括能源、芯片、基礎(chǔ)設(shè)施建設(shè)、模型和應(yīng)用。結(jié)合這些維度來看,全球競爭的格局其實(shí)很清晰。國際巨頭的優(yōu)勢很突出,在算力、芯片以及模型的軟件算法研究上比中國有一定領(lǐng)先,能虹吸全球人才、人才密度更高,初創(chuàng)公司的融資規(guī)模和金額也比國內(nèi)大很多倍。

而中國的優(yōu)勢則集中在能源、硬件制造和市場活力上。更核心的是,中國是世界上最強(qiáng)大的 “建造者”,擁有極強(qiáng)的落地和工程能力,制造業(yè)鏈條完備,能快速把技術(shù)轉(zhuǎn)化為產(chǎn)品,這是我們長期以來的核心競爭力。

2026 年的競爭中,雙方的賽點(diǎn)各有側(cè)重。對中國公司來說,核心賽點(diǎn)在于產(chǎn)品落地與數(shù)據(jù)閉環(huán)。模型的優(yōu)化離不開數(shù)據(jù),而產(chǎn)品是最快拿到大量真實(shí)且低成本數(shù)據(jù)的方式,不是靠花錢買數(shù)據(jù),而是讓產(chǎn)品走進(jìn)用戶場景,通過實(shí)際使用沉淀數(shù)據(jù),再反哺模型迭代。雖然目前中國在資金鏈條和人才密度上不如北美,但我們的傳統(tǒng)優(yōu)勢就是先讓產(chǎn)品落地、搶占場景、實(shí)現(xiàn)數(shù)據(jù)回流。就像互聯(lián)網(wǎng)時代那樣,正是因?yàn)橛辛顺墒斓穆涞貓鼍?、?shù)據(jù)閉環(huán)和現(xiàn)金流,才能吸引海外人才回流。所以早期階段,盡快推動產(chǎn)品和場景落地是關(guān)鍵。

到了后期,中國的優(yōu)勢會更明顯:我們的基礎(chǔ)設(shè)施建設(shè)和能源建設(shè)在全球都是獨(dú)一份的強(qiáng)。當(dāng)下這個階段,除了加速落地,還要盡量減少人才流失和資源錯配,集中力量推進(jìn)。我相信,世界上第一款能大面積鋪開的具身智能落地產(chǎn)品,很可能會在中國出現(xiàn)。

Q:對于投身于具身智能領(lǐng)域的創(chuàng)業(yè)者和年輕科研人員,您會給他們什么建議,以在這個快速變化且資源密集的領(lǐng)域中找到自己的立足之地?

李元慶:我想先說一句話:快速變化的時代永遠(yuǎn)都是好事。這個時代雖然充滿了風(fēng)險,但更多的是機(jī)會,這是我的真實(shí)感受。現(xiàn)在整個具身智能賽道正處在蓬勃發(fā)展的成長期,不管是產(chǎn)品定義、用戶感知的構(gòu)建,還是軟硬件技術(shù)路徑、模型架構(gòu)與數(shù)據(jù)飛輪的迭代設(shè)計(jì),目前都還沒有明確的答案。技術(shù)路線不清晰,供應(yīng)鏈自然也很難配套部署。同時,產(chǎn)品完整生命周期的市場和運(yùn)維體系也還沒搭建起來。這些復(fù)雜的系統(tǒng)問題,既帶來了很多風(fēng)險,也蘊(yùn)藏著大量的機(jī)會。

所以如果有人想加入具身智能領(lǐng)域創(chuàng)業(yè)或者從事相關(guān)的工作、科研,現(xiàn)在絕對是最好的時機(jī),這是一個能夠改變未來的賽道。而且現(xiàn)在大家基本都還在同一條起跑線上,彼此的差距并沒有拉開太多。我想給的建議就是,找到自己真正熱愛的方向,大膽去嘗試,用極高的執(zhí)行速度快速迭代。分享一句強(qiáng)化學(xué)習(xí)里大家常用的策略:test early,fail fast,learn faster(盡早測試、快速試錯、更快學(xué)習(xí))。在充滿不確定性的賽道里,這樣做往往能找到最優(yōu)解,至少也是局部最優(yōu)解。

總而言之,大膽嘗試、快速執(zhí)行,哪怕失敗也沒關(guān)系,關(guān)鍵是要基于失敗的經(jīng)驗(yàn)快速調(diào)整。這個領(lǐng)域里,處處都是機(jī)會。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
尺寸超越勞斯萊斯庫里南!全新ES9申報(bào):蔚來迄今最大新車

尺寸超越勞斯萊斯庫里南!全新ES9申報(bào):蔚來迄今最大新車

快科技
2026-01-08 23:34:07
600028,開盤漲停,1分鐘內(nèi)股價跳水!

600028,開盤漲停,1分鐘內(nèi)股價跳水!

數(shù)據(jù)寶
2026-01-09 10:14:03
古巴雇傭兵遭遇美軍特種兵:死戰(zhàn)到底打光最后一人,32人集體陣亡

古巴雇傭兵遭遇美軍特種兵:死戰(zhàn)到底打光最后一人,32人集體陣亡

趣生活
2026-01-05 21:20:12
難怪美軍長驅(qū)直入,中俄雷達(dá)全都停止搜索,委內(nèi)瑞拉把好牌打爛

難怪美軍長驅(qū)直入,中俄雷達(dá)全都停止搜索,委內(nèi)瑞拉把好牌打爛

詩意世界
2026-01-05 19:54:53
女孩當(dāng)小姐,一晚要提供4到5次上門服務(wù),2015年被親人點(diǎn)到不赴約

女孩當(dāng)小姐,一晚要提供4到5次上門服務(wù),2015年被親人點(diǎn)到不赴約

漢史趣聞
2025-11-08 09:27:32
美刊:052D型驅(qū)逐艦總數(shù)可能突破50艘,距世界第一僅差幾艘

美刊:052D型驅(qū)逐艦總數(shù)可能突破50艘,距世界第一僅差幾艘

陶慕劍地球觀察
2026-01-05 20:45:32
萬億央企蛀蟲終于揪出來了!離職七年難逃法網(wǎng),25年腐化史現(xiàn)真容

萬億央企蛀蟲終于揪出來了!離職七年難逃法網(wǎng),25年腐化史現(xiàn)真容

墨蘭史書
2026-01-06 11:30:03
哭窮炫富,“知三當(dāng)三”,裝了10年的吉克雋逸,還是“自食惡果”

哭窮炫富,“知三當(dāng)三”,裝了10年的吉克雋逸,還是“自食惡果”

顧史
2025-12-12 14:59:24
26年央視春晚導(dǎo)演官宣彩排!小品領(lǐng)軍人物確認(rèn)回歸,終于等到這天

26年央視春晚導(dǎo)演官宣彩排!小品領(lǐng)軍人物確認(rèn)回歸,終于等到這天

瓜汁橘長Dr
2026-01-08 10:51:52
兩次拒絕黎明,無視鐘漢良示愛,被折磨20年后55歲的她憔悴成大媽

兩次拒絕黎明,無視鐘漢良示愛,被折磨20年后55歲的她憔悴成大媽

青史樓蘭
2025-12-29 10:12:14
美媒:中國洲際隱身轟炸機(jī)高清照首次亮相。遠(yuǎn)超B21

美媒:中國洲際隱身轟炸機(jī)高清照首次亮相。遠(yuǎn)超B21

世家寶
2026-01-07 11:59:10
美專家挺震驚:中國塔里木盆地藏萬億噸碳,堪比10個五大湖地下海

美專家挺震驚:中國塔里木盆地藏萬億噸碳,堪比10個五大湖地下海

蜉蝣說
2025-12-02 10:50:50
特朗普 再次就騷亂事件對伊朗 發(fā)出威脅

特朗普 再次就騷亂事件對伊朗 發(fā)出威脅

每日經(jīng)濟(jì)新聞
2026-01-09 10:26:13
湖人慘敗馬刺,東契奇空砍38+10+10!一戰(zhàn)看清5個現(xiàn)實(shí):3人該交易

湖人慘敗馬刺,東契奇空砍38+10+10!一戰(zhàn)看清5個現(xiàn)實(shí):3人該交易

毒舌NBA
2026-01-08 13:13:52
阿迪達(dá)斯變中迪達(dá)斯,“這離譜老外審美到底誰愛穿”

阿迪達(dá)斯變中迪達(dá)斯,“這離譜老外審美到底誰愛穿”

新周刊
2026-01-08 16:14:32
回顧許家印被抓捕現(xiàn)場,奮力反抗,怒吼不已,被抓捕人員抬出去

回顧許家印被抓捕現(xiàn)場,奮力反抗,怒吼不已,被抓捕人員抬出去

干史人
2026-01-08 22:47:00
微軟Windows 11首次!26H1今年一季度發(fā)布

微軟Windows 11首次!26H1今年一季度發(fā)布

快科技
2026-01-08 19:08:04
4位同學(xué)退休3年病倒兩個后,我發(fā)現(xiàn):沒特殊經(jīng)濟(jì)困難,還是躺平好

4位同學(xué)退休3年病倒兩個后,我發(fā)現(xiàn):沒特殊經(jīng)濟(jì)困難,還是躺平好

小馬達(dá)情感故事
2026-01-01 14:30:03
富得流油的新四軍第七師,每人每月三條香煙,開著汽艇向日軍收稅

富得流油的新四軍第七師,每人每月三條香煙,開著汽艇向日軍收稅

別人都叫我阿腈
2026-01-07 09:00:02
伊朗局勢變天進(jìn)入倒計(jì)時....

伊朗局勢變天進(jìn)入倒計(jì)時....

戰(zhàn)爭研究所
2026-01-08 00:04:30
2026-01-09 12:56:49
InfoQ incentive-icons
InfoQ
有內(nèi)容的技術(shù)社區(qū)媒體
11916文章數(shù) 51688關(guān)注度
往期回顧 全部

財(cái)經(jīng)要聞

郁亮的萬科35年:從"寶萬之爭"到"活下去"

頭條要聞

男子開車撞死1家3口獲死緩 14秒速度從0飆至129km/h

頭條要聞

男子開車撞死1家3口獲死緩 14秒速度從0飆至129km/h

體育要聞

世乒賽銀牌得主,說自己夢里都是孫穎莎

娛樂要聞

檀健次戀愛風(fēng)波越演越烈 上學(xué)經(jīng)歷被扒

科技要聞

市場偏愛MiniMax:開盤漲42%,市值超700億

汽車要聞

更智能更豪華 樂道L90加配置會貴多少?

態(tài)度原創(chuàng)

藝術(shù)
本地
時尚
教育
健康

藝術(shù)要聞

Sean Yoro:街頭藝術(shù)界的“沖浪高手”

本地新聞

云游內(nèi)蒙|“包”你再來?一座在硬核里釀出詩意的城

60+女性穿搭指南來了:4招告別“大媽感”,解鎖冬日優(yōu)雅氣質(zhì)

教育要聞

上海幼教專家團(tuán)在祖國最東地“把脈”

這些新療法,讓化療不再那么痛苦

無障礙瀏覽 進(jìn)入關(guān)懷版