国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

具身覺(jué)醒:AI 從感知到行動(dòng)的能力躍遷

0
分享至


本文摘自《云棲戰(zhàn)略參考》,這本刊物由阿里云與鈦媒體聯(lián)合策劃。目的是為了把各個(gè)行業(yè)先行者的技術(shù)探索、業(yè)務(wù)實(shí)踐呈現(xiàn)出來(lái),與思考同樣問(wèn)題的“數(shù)智先行者”共同探討、碰撞,希望這些內(nèi)容能讓你有所啟發(fā)。

具身智能,正成為 AI 革命的核心共識(shí)與下一站錨點(diǎn)。當(dāng) AI 技術(shù)從數(shù)字世界邁向物理世界,硬件恰是這場(chǎng)躍遷中智能體與物理環(huán)境交互的關(guān)鍵載體。這一趨勢(shì),正沿著三條核心賽道加速落地,并呈現(xiàn)出技術(shù)復(fù)雜度和成熟度的差異。

智能硬件以智能手機(jī)、PC、AI 眼鏡為代表,從設(shè)備工具升級(jí)為場(chǎng)景伙伴,依托成熟的端云協(xié)同架構(gòu)、實(shí)時(shí)數(shù)據(jù)處理能力與輕量化模型部署,實(shí)現(xiàn)多模態(tài)智能交互并 提供更多場(chǎng)景化服務(wù),正邁向規(guī)?;涞仉A段;智能駕駛系統(tǒng),在端到端大模型驅(qū)動(dòng)下正逐步實(shí)現(xiàn)局部自主決策,并開(kāi)始展現(xiàn)出超越預(yù)設(shè)規(guī)則的自主應(yīng)變能力,但模型泛化性與安全性仍需持續(xù)優(yōu)化,對(duì)高彈性算力集群與多源異構(gòu)數(shù)據(jù)融合也提出更高要求;機(jī)器人技術(shù)突破門(mén)檻最高,算力層面需構(gòu)建云邊端深度協(xié)同的架構(gòu),數(shù)據(jù)層面需解決多模態(tài)真實(shí)場(chǎng)景數(shù)據(jù)的采集、合成與處理的問(wèn)題,模型層面則要同時(shí)兼顧復(fù)雜推理與運(yùn)動(dòng)控制,當(dāng)前核心是突破從實(shí)驗(yàn)室原型到產(chǎn)業(yè)落地的關(guān)鍵跨越。

盡管當(dāng)前三大領(lǐng)域技術(shù)收斂節(jié)奏不同,業(yè)界在路線(xiàn)選擇與細(xì)節(jié)落地中仍存在分歧,但一個(gè)共識(shí)已然形成,三條賽道最終將指向同一個(gè)未來(lái):AI 將不再局限于屏幕內(nèi),而是在真實(shí)物理空間中完成“感知 - 決策 - 行動(dòng)”的完整閉環(huán),進(jìn)化為可在現(xiàn)實(shí)世界自主行動(dòng)的智能體,而支撐這一閉環(huán)的,則是一套由算力、數(shù)據(jù)、模型深度協(xié)同融合構(gòu)成的下一代全棧 AI 技術(shù)體系。

作為全棧人工智能服務(wù)商,阿里云正致力于為這場(chǎng)革命構(gòu)建一個(gè)統(tǒng)一的能力支柱,其全棧 AI 服務(wù)體系不僅提供澎湃算力,更整合數(shù)據(jù)平臺(tái)與持續(xù)進(jìn)化的基礎(chǔ)模型能力,實(shí)現(xiàn)從底層算力調(diào)度到上層場(chǎng)景化智能輸出的全維度支撐。在 2025 云棲大會(huì)的系列分論壇中,來(lái)自 AI 硬件、汽車(chē)、機(jī)器人領(lǐng)域的實(shí)踐分享,共同勾勒出具身智能的清晰未來(lái):一場(chǎng)由 AI 硬件打破交互邊界、智能駕駛重塑移動(dòng)空間、機(jī)器人賦能千行百業(yè)的具身智能大幕,已然開(kāi)啟。

AI 硬件:從功能設(shè)備到智能伙伴

在具身智能的框架下,最貼近用戶(hù)的智能硬件正經(jīng)歷一場(chǎng)本質(zhì)性的身份轉(zhuǎn)變。算力、模型、開(kāi)發(fā)平臺(tái)一體化的智能底座,為這些新物種提供了體驗(yàn)的想象力。這也標(biāo)志著智能硬件不再是一個(gè)個(gè)獨(dú)立的設(shè)備,而會(huì)在不久的未來(lái)融入一個(gè)能夠自我進(jìn)化、跨端協(xié)作的“超級(jí)生命體”。

2025 年,AI 硬件無(wú)疑是廠商押注、資本涌入的核心戰(zhàn)場(chǎng)。洛圖科技(RUNTO)此前曾預(yù)測(cè),中國(guó) AI 硬件(不含 AI 手機(jī)、AI 汽車(chē))市場(chǎng)規(guī)模今年將首次突破萬(wàn)億元,五年內(nèi)將繼續(xù)保持高速增長(zhǎng)。與之前的 AI 硬件熱潮相比,這次的趨勢(shì)清晰可見(jiàn):終端設(shè)備從功能執(zhí)行者向智能伙伴的躍遷。

這場(chǎng)變革的核心,是設(shè)備從被動(dòng)響應(yīng)走向主動(dòng)服務(wù)。榮耀 MagicOS AI 首席戰(zhàn)略官王皚用一個(gè)生動(dòng)的場(chǎng)景描繪了這種變化:“昨晚我在杭州看書(shū),覺(jué)得燈光太暗,只需對(duì)手機(jī)說(shuō)‘幫我處理一下’,它就能自動(dòng)調(diào)整到護(hù)眼模式、夜景模式,整個(gè)過(guò)程無(wú)需任何手動(dòng)操作。這種‘一語(yǔ)解千愁,萬(wàn)事找 YOYO’的體驗(yàn),標(biāo)志著硬件正從需要用戶(hù)學(xué)習(xí)的復(fù)雜工具,轉(zhuǎn)變?yōu)槔斫庥脩?hù)意圖的智能伙伴?!?/p>

在教育硬件領(lǐng)域,這種變革尤為明顯。AI 學(xué)習(xí)機(jī)之所以 能在大模型時(shí)代迎來(lái)新的爆發(fā),關(guān)鍵在于它精準(zhǔn)切中了傳統(tǒng)學(xué)習(xí)機(jī)未能滿(mǎn)足的深層需求。視源股份消費(fèi)者 BG 總裁邱澈分享了一個(gè)典型案例:“低齡兒童的學(xué)習(xí)機(jī)過(guò)去很難做,因?yàn)楹⒆記](méi)有固定的成長(zhǎng)路徑?,F(xiàn)在通過(guò)大模型,我們可以基于孩子的信息和學(xué)習(xí)訴求,動(dòng)態(tài)編排學(xué)習(xí)計(jì)劃?!边@種個(gè)性化能力的實(shí)現(xiàn),讓硬件從標(biāo)準(zhǔn)化工具變成了懂用戶(hù)的學(xué)習(xí)伙伴。

智能手機(jī)作為 AI To C 的第一入口,正在經(jīng)歷從功能疊加到體驗(yàn)重構(gòu)的深層 AI 化變革。在全球排名 Top10 的手機(jī)廠商中,包括傳音、OPPO、vivo、榮耀等在內(nèi)的 9 家廠商都與通義大模型展開(kāi)了深度合作,這絕不是一種巧合。

隨著 AI 技術(shù)和 Agent 發(fā)展,手機(jī)會(huì)成為具備自我進(jìn)化能力、更懂用戶(hù)的智能體手機(jī)。除了硬件和生態(tài)能力之外,廠商還推動(dòng)操作系統(tǒng)向智能化演進(jìn),以系統(tǒng)級(jí) AI 讓操作系統(tǒng)能夠成為一個(gè)超級(jí)入口,通過(guò)智能體感知及理解用戶(hù)的意圖、周?chē)h(huán)境,讓操作系統(tǒng)能通過(guò) AI 內(nèi)核能力來(lái)對(duì)硬件、軟件、應(yīng)用及服務(wù)按需索取,恰如其分地為用戶(hù)調(diào)用和協(xié)同智能體。

在百花齊放的硬件形態(tài)中,AI 眼鏡無(wú)疑是最引人注目 的新品類(lèi)之一。它正在試圖重新定義“下一代人機(jī)交互的入口”。在這個(gè)競(jìng)爭(zhēng)激烈的賽道里,雷鳥(niǎo)創(chuàng)新等品牌正通過(guò)差異化的產(chǎn)品邏輯卡位市場(chǎng)。雷鳥(niǎo)深度使用了阿里通義系列的多模態(tài)大模型,視覺(jué)理解和問(wèn)答準(zhǔn)確率達(dá) 98%,同時(shí)通過(guò)系統(tǒng)級(jí)優(yōu)化,從意圖理解到信息返回,所需時(shí)間控制在僅 1.3 秒內(nèi)。這種技術(shù)突破讓 AI 眼鏡開(kāi)始從新奇邁向?qū)嵱?,在?dǎo)航、即時(shí)翻譯、智能提醒等高頻剛需場(chǎng)景中驗(yàn)證其價(jià)值。

支撐這些智能終端進(jìn)化的,是全棧 AI 云服務(wù)提供的強(qiáng)大技術(shù)生態(tài)。通義大模型與阿里云全棧 AI 云服務(wù)共同帶來(lái)的“模型 + 基礎(chǔ)設(shè)施”協(xié)同優(yōu)勢(shì),能夠讓智能助理更精準(zhǔn)地理解意圖、更流暢地實(shí)現(xiàn)多模態(tài)交互、更可靠地執(zhí)行場(chǎng)景化服務(wù)。

36 氪研究院院長(zhǎng)鄒萍表示,通過(guò)整合云端大模型和端側(cè)大模型,AI 可以根據(jù)場(chǎng)景需求靈活調(diào)用算力資源,簡(jiǎn)單實(shí)時(shí)、隱私性要求高的任務(wù)在端側(cè)完成,復(fù)雜任務(wù)則交給云端。這種架構(gòu)既保證了響應(yīng)速度,又兼顧了計(jì)算能力,為智能終端的體驗(yàn)升級(jí)提供了堅(jiān)實(shí)的技術(shù)底座。

AI 硬件憑借云、模型和端側(cè)優(yōu)化等技術(shù)從功能執(zhí)行者向智能伙伴躍遷的過(guò)程中不可忽視的一個(gè)關(guān)鍵詞是生態(tài)。如今,AI 硬件廠商新的競(jìng)爭(zhēng)焦點(diǎn),就是構(gòu)建以硬件為入口的生態(tài)體系,通過(guò)整合內(nèi)容、數(shù)據(jù)與服務(wù),進(jìn)一步拓展智能終端的場(chǎng)景邊界與用戶(hù)黏性。不只是 AI 教育廠商,構(gòu)建 AI 生態(tài)已經(jīng)成為很多智能硬件領(lǐng)域的共同選擇。做 AI 生態(tài)不僅是在推動(dòng)硬件功能升級(jí),也從底層重構(gòu)了智能設(shè)備的價(jià)值邏輯——從單一執(zhí)行走向系統(tǒng)協(xié)同,從工具屬性轉(zhuǎn)向場(chǎng)景服務(wù)。

然而,AI 硬件的發(fā)展仍面臨挑戰(zhàn)。在硬件堆疊、續(xù)航 功耗、成本控制等方面,行業(yè)仍在尋找最佳平衡點(diǎn)。論壇上提到了“不可能三角”的困境——在有限的空間內(nèi),功能、功耗和成本難以兼顧。大模型的小型化和隱私保護(hù)是需要持續(xù)突破的技術(shù)方向。

在阿里云的推動(dòng)下,智能硬件的技術(shù)邊界也在逐漸清晰:不再追求“全能”,而是在產(chǎn)品創(chuàng)新中分化和深化場(chǎng)景。先讓 AI 在硬件中變得實(shí)用和不可或缺,再讓這些會(huì)思考、會(huì)執(zhí)行的智能體與云端大腦協(xié)同進(jìn)化,無(wú)聲無(wú)感地融入生活,成為我們每個(gè)人的全能“智能助理”。

最好的技術(shù)隱于共生,最好的體驗(yàn)只會(huì)悄悄浮出水面。

關(guān)于未來(lái)入口的形態(tài),會(huì)上提出了“軟入口”的概念:未來(lái) AI 的入口可能沒(méi)有具體形態(tài),而是像流水一樣滲透在吃、穿、住、行中。通用硬件和專(zhuān)用硬件將協(xié)同發(fā)展,共同構(gòu)成未來(lái)的智能生態(tài)。

智能駕駛:從規(guī)則編碼走向能力涌現(xiàn)

當(dāng)具身智能的理念進(jìn)入移動(dòng)出行領(lǐng)域,便催生了智能駕駛技術(shù)范式的根本性遷移。傳統(tǒng)的功能堆砌和規(guī)則編碼方式,在面對(duì)無(wú)窮無(wú)盡的現(xiàn)實(shí)長(zhǎng)尾場(chǎng)景時(shí)顯得力不從心。如今,以視覺(jué) - 語(yǔ)言 - 動(dòng)作大模型(Vision- Language-Action,簡(jiǎn)稱(chēng)“VLA”)為代表的數(shù)據(jù)驅(qū)動(dòng)路徑,正讓智能駕駛系統(tǒng)像人類(lèi)一樣,獲得在面對(duì)未知場(chǎng)景時(shí)舉一反三的涌現(xiàn)能力,從一輛精密的機(jī)器,向一個(gè)擁有駕駛常識(shí)的智能體進(jìn)化。

在 2025 云棲大會(huì)汽車(chē)行業(yè)峰會(huì)上,來(lái)自廣汽與理想汽車(chē)等企業(yè)的專(zhuān)家不約而同地指出,傳統(tǒng)智能駕駛系統(tǒng)雖然能在已知場(chǎng)景中穩(wěn)定運(yùn)行,但在面對(duì)未曾見(jiàn)過(guò)的陌生路況時(shí),往往顯得力不從心。端到端系統(tǒng)像是一位靠題海戰(zhàn)術(shù)培養(yǎng)出來(lái)的學(xué)生,見(jiàn)過(guò)的題目都會(huì)做,但遇到新題就容易卡殼。而現(xiàn)實(shí)道路上的新題,恰恰是層出不窮的施工路段、潮汐車(chē)道、特種車(chē)輛通行等非標(biāo)準(zhǔn)化場(chǎng)景。

那么,如何讓智能駕駛系統(tǒng)具備真正的應(yīng)變能力?答案指向了以 VLA 為代表的大模型技術(shù)路線(xiàn)。VLA 模型的核心優(yōu)勢(shì)在于,它通過(guò)預(yù)訓(xùn)練注入了常識(shí)與推理能力,使其在面對(duì)未訓(xùn)練過(guò)的場(chǎng)景時(shí),仍能作出合理判斷。

來(lái)自業(yè)內(nèi)的一個(gè)真實(shí)案例顯示:在某次測(cè)試中,搭載 VLA 系統(tǒng)的車(chē)輛在連續(xù)繞過(guò)多個(gè)未預(yù)設(shè)路障時(shí),展現(xiàn)出了接近人類(lèi)駕駛員的決策連貫性——這不是靠預(yù)設(shè)規(guī)則實(shí)現(xiàn)的,而是模型能力的自然涌現(xiàn)。

這一變化,標(biāo)志著智能駕駛研發(fā)從“人工寫(xiě)規(guī)則”邁入“系統(tǒng)自進(jìn)化”的新階段。阿里云智能集團(tuán)的相關(guān)專(zhuān)家在會(huì)議中指出,VLA 結(jié)合強(qiáng)化學(xué)習(xí)的閉環(huán)訓(xùn)練體系,正成為下一代智能駕駛系統(tǒng)的技術(shù)基座。在仿真環(huán)境中,系統(tǒng)可以實(shí)現(xiàn)光速迭代,在虛擬城市中無(wú)限試錯(cuò)、持續(xù)優(yōu)化,從而突破實(shí)車(chē)路測(cè)的數(shù)據(jù)瓶頸。有觀點(diǎn)預(yù)測(cè),未來(lái)一年內(nèi),VLA 技術(shù)將帶來(lái)智能駕駛體驗(yàn)的十倍級(jí)提升。

不過(guò),當(dāng)前 VLA 技術(shù)路線(xiàn)中,關(guān)于“L”(Language) 的必要性其實(shí)還有一些爭(zhēng)議。理想 CTO 謝炎在云棲大會(huì)主論壇圓桌對(duì)話(huà)中分享,語(yǔ)言是人類(lèi)做泛化的基礎(chǔ),理想在 VLA 路線(xiàn)中做“L”的兩個(gè)原因,從技術(shù)層面來(lái)看是因?yàn)檎Z(yǔ)言具備長(zhǎng)鏈路的推理能力,需要語(yǔ)言的 token 輸入輸出是次要的;非技術(shù)原因是更容易實(shí)現(xiàn)價(jià)值觀對(duì)齊。他認(rèn)為極端情況很難靠數(shù)據(jù)或模型解決,而需要具備類(lèi)似人的推理能力才能實(shí)現(xiàn)。

在謝炎看來(lái),隨著語(yǔ)言模型越大、思考鏈路越長(zhǎng),消耗的 tokens 就越多,結(jié)果就越好,因此車(chē)端就需要越來(lái)越強(qiáng)的算力,而且這個(gè)算力需求的增長(zhǎng)軌跡可能不是線(xiàn)性的,而是指數(shù)級(jí)的。

事實(shí)上,無(wú)論是車(chē)端推理還是云端訓(xùn)練,對(duì)計(jì)算資源的需求都呈指數(shù)級(jí)增長(zhǎng)。正如業(yè)內(nèi)所見(jiàn),能夠構(gòu)建萬(wàn)卡級(jí)算力集群的企業(yè)在全球范圍內(nèi)屈指可數(shù),而具備研發(fā)基礎(chǔ)大模型能力的科技公司更是鳳毛麟角。算力規(guī)模,已成為參與高階智能駕駛競(jìng)爭(zhēng)的入場(chǎng)券。數(shù)據(jù)顯示,美國(guó)頭部企業(yè)已投入數(shù)萬(wàn)張 GPU 卡用于模型訓(xùn)練,而國(guó)內(nèi)車(chē)企與方案商也在積極跟進(jìn)。

與此同時(shí),AI 也在重構(gòu)汽車(chē)產(chǎn)業(yè)的成本結(jié)構(gòu)。高固定成本、低邊際成本的研發(fā)模式,使得軟件與 AI 在未來(lái)整車(chē)成本中的占比持續(xù)攀升。有分析指出,在部分廉價(jià)車(chē)型中,軟件與 AI 成本甚至可能占據(jù)整車(chē)成本的半壁江山。這一變化不僅影響產(chǎn)品定價(jià)策略,更在重塑企業(yè)的市場(chǎng)競(jìng)爭(zhēng)邏輯。

值得注意的是,智能駕駛的能力涌現(xiàn)并不完全依賴(lài)于車(chē)端算力的堆砌。端云協(xié)同已成為技術(shù)演進(jìn)的主流方向。在車(chē)端,算力需求正從百 TOPS 向千 TOPS 邁進(jìn),芯片架構(gòu)也需高度適配大模型推理;在云端,訓(xùn)練與仿真所需的算力規(guī)模持續(xù)擴(kuò)大,國(guó)產(chǎn)化替代與能效優(yōu)化成為關(guān)鍵議題。阿里云發(fā)布的“全模態(tài)數(shù)據(jù)管理 + 多引擎一體化”平臺(tái),正是為了支持從數(shù)據(jù)采集、自動(dòng)標(biāo)注到模型訓(xùn)練與仿真的全流程閉環(huán)。

在這場(chǎng)技術(shù)變革中,車(chē)企的角色也在悄然轉(zhuǎn)變。他們不再僅僅是硬件的制造者,更是軟件能力的構(gòu)建者、數(shù)據(jù)驅(qū)動(dòng)的運(yùn)營(yíng)者。

例如,中國(guó)一汽從大模型中得到啟發(fā),把所有數(shù)據(jù)轉(zhuǎn)換為 Token,這樣就可以把不同模態(tài)的內(nèi)容映射到同一套 Token 空間里。這樣,企業(yè)運(yùn)行中的上下文就能變得豐富很多,管理企業(yè)的模型有了長(zhǎng)文本的支持,自然也就更聰明了。

未來(lái),隨著 L4/L5 級(jí)智能駕駛的逐步實(shí)現(xiàn),汽車(chē)將徹底從移動(dòng)工具轉(zhuǎn)變?yōu)橹悄芸臻g。用戶(hù)可在車(chē)內(nèi)辦公、娛樂(lè)、 社交,汽車(chē)成為家、辦公室、咖啡廳的延伸。而支撐這一愿景的,正是智能駕駛系統(tǒng)從功能堆砌到能力涌現(xiàn)的持續(xù)進(jìn)化。

機(jī)器人:從虛擬走向?qū)嶓w的關(guān)鍵跨越

機(jī)器人,未來(lái)將會(huì)是具身智能理念最純粹、最完整的載體,也是 AI 真正融入物理世界的終極挑戰(zhàn)。它要求智能體不僅要會(huì)思考,還要能動(dòng)手,更能在不確定的現(xiàn)實(shí)環(huán)境中完成復(fù)雜的任務(wù)。當(dāng)前,機(jī)器人領(lǐng)域正處在技術(shù)路徑激辯與早期商業(yè)化探索的關(guān)鍵期,其核心議題是如何彌合數(shù)字智能與物理實(shí)體之間的最后一公里鴻溝。

阿里云智能集團(tuán)公共云事業(yè)部副總裁、華北大區(qū)總經(jīng)理高飛在云棲大會(huì)的具身智能論壇上點(diǎn)明了這一趨勢(shì)的核心:具身智能已成為繼大語(yǔ)言模型之后最受關(guān)注的賽道,是 AI 從數(shù)字世界突圍進(jìn)入物理世界的必由之路。他指出,這不僅是算法的升級(jí),更是算法、模型、運(yùn)動(dòng)控制、制造與供應(yīng)鏈等多方面能力的深度融合。

然而,這條突圍之路并非坦途。高飛將行業(yè)面臨的挑戰(zhàn)歸納為四類(lèi):如何實(shí)現(xiàn)從單一任務(wù)到通用智能的智能涌現(xiàn);如何界定軟硬結(jié)合的邊界;如何讓機(jī)器人理解“炒 一盤(pán)菜”這樣的長(zhǎng)程復(fù)雜任務(wù);以及如何實(shí)現(xiàn)視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)等多模態(tài)的高效融合。這些問(wèn)題,恰恰勾勒出機(jī)器人從虛擬智能走向?qū)嶓w智能所必須翻越的山丘。

在翻越這些山丘的技術(shù)路徑上,行業(yè)出現(xiàn)了有趣的分化。最為激烈的爭(zhēng)論之一,集中在機(jī)器人的大腦該如何構(gòu)建。自變量機(jī)器人創(chuàng)始人 &CEO 王潛的觀點(diǎn)主張端到端統(tǒng)一模型,即構(gòu)建一個(gè)單一的、強(qiáng)大的模型來(lái)同時(shí)處理感知、推理與控制。這種觀點(diǎn)認(rèn)為,分層架構(gòu)在復(fù)雜操作中容易因誤差累積導(dǎo)致失敗,而統(tǒng)一模型能更好地理解物理規(guī)律。

另一邊,清華大學(xué)助理教授、星海圖首席科學(xué)家趙行則傾向于分層模型架構(gòu)。最初選擇分層架構(gòu),趙行更多考慮的是現(xiàn)實(shí)部署約束,因?yàn)樵诙藗?cè)實(shí)時(shí)跑大模型受限于端側(cè)芯片的迭代速度。通過(guò)大小腦分層、分別部署在邊緣側(cè)和端側(cè)的設(shè)計(jì),機(jī)器人更容易落地。此外,他認(rèn)為分層架構(gòu)更符合生物進(jìn)化規(guī)律,畢竟人腦不同分區(qū)各司其職同樣工作得很好。針對(duì)不同層之間能力無(wú)法互通、梯度無(wú)法回傳的質(zhì)疑,趙行表示這不是本質(zhì)問(wèn)題,可通過(guò)強(qiáng)化學(xué)習(xí)等技術(shù)解決。

同樣深刻的分歧也存在于機(jī)器人學(xué)習(xí)的“食糧”——數(shù)據(jù)來(lái)源上。面對(duì)數(shù)據(jù)稀缺這一行業(yè)共識(shí),形成了“真機(jī)派” 與“仿真合成派”兩大陣營(yíng)。真機(jī)派堅(jiān)持以遙操或者互聯(lián)網(wǎng)的形式獲取數(shù)據(jù),基于 VLA 做模仿學(xué)習(xí);仿真派則相信合成數(shù)據(jù)可行性,在仿真環(huán)境中合成數(shù)據(jù),用作模型訓(xùn)練,并大量使用強(qiáng)化學(xué)習(xí)。雙方都有充足的理由堅(jiān)持自己的路線(xiàn)。

后者堅(jiān)信仿真環(huán)境的重要性:“沒(méi)有仿真,我認(rèn)為我們 幾十年內(nèi)都無(wú)法制造出能在現(xiàn)實(shí)世界中發(fā)揮作用的機(jī)器人?!盢VIDIA 機(jī)器人與邊緣 AI 副總裁 Deepu Talla 在現(xiàn)場(chǎng)說(shuō)道。仿真數(shù)據(jù)以其低成本、高效率和安全性,被視為規(guī)?;?xùn)練的基石。

然而,仿真數(shù)據(jù)的局限性同樣明顯。比如在涉及靈巧操作的任務(wù)中,仿真與真實(shí)數(shù)據(jù)之間可能存在幾個(gè)數(shù)量級(jí)的效率差距。物理接觸的復(fù)雜性,如形變、滑動(dòng)、摩擦等,難以在仿真中精準(zhǔn)建模。
銀河通用選擇的路線(xiàn)是:先通過(guò)大規(guī)模仿真合成數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,構(gòu)建通用基座大模型,再利用少量高精度的真實(shí)數(shù)據(jù)進(jìn)行后訓(xùn)練。通過(guò)這種方式,他們實(shí)現(xiàn)了良好的泛化性能,并且把真實(shí)數(shù)據(jù)后訓(xùn)練的樣本效率提高到了 Optimus 的 1000 倍,大大降低了落地的邊際成本。

千尋智能聯(lián)席首席科學(xué)家解浚源的觀點(diǎn)更為尖銳,只有真機(jī)數(shù)據(jù)實(shí)際去訓(xùn)練,才能訓(xùn)練出世界領(lǐng)先的模型。作為“真機(jī)派”的代表,解浚源甚至對(duì)“真機(jī)數(shù)據(jù)昂貴”的共識(shí)發(fā)起了挑戰(zhàn)。“在國(guó)內(nèi)供應(yīng)鏈的支持下,把單個(gè)機(jī)器人成本打到 10 萬(wàn)以下是很容易的”,他將此與大模型廠商的萬(wàn)卡集群投入對(duì)比,認(rèn)為將采集數(shù)據(jù)的機(jī)器人規(guī)模擴(kuò)展到上千臺(tái),“絕非不可想象的成本”。

盡管技術(shù)路徑存在分歧,但機(jī)器人技術(shù)在商業(yè)世界的落地已悄然加速,展現(xiàn)了從虛擬走向?qū)嶓w的初步成果。機(jī)器人在智慧零售場(chǎng)景中已能實(shí)現(xiàn)接單、揀貨、打包的全流程自動(dòng)化。在制造業(yè)中機(jī)器人在復(fù)雜工業(yè)環(huán)境中也已能夠進(jìn)行巡檢、分揀和裝配等操作。

當(dāng)討論從“如何造出一個(gè)機(jī)器人”切換到“如何量產(chǎn)千萬(wàn)臺(tái)機(jī)器人”時(shí),一個(gè)關(guān)鍵角色浮出水面——云廠商。高飛建議:“具身智能公司從第一天起就要做好云架構(gòu)、AI Infra 的規(guī)劃?!彼床斓?,一旦行業(yè)迎來(lái)數(shù)據(jù)量的指數(shù)級(jí)增長(zhǎng),大多數(shù)源自科研背景的機(jī)器人團(tuán)隊(duì)將面臨巨大的工程化挑戰(zhàn)。

阿里云智能集團(tuán)公共云事業(yè)部具身智能解決方案負(fù)責(zé)人王旭文進(jìn)一步提到,阿里云最初誕生就定位為“以數(shù)據(jù)為中心的云計(jì)算”,之后深度入局的智能駕駛、AI 也都是數(shù)據(jù)密集型行業(yè),如今大量具身智能數(shù)據(jù)涌來(lái),他們已經(jīng)有足夠強(qiáng)大的基礎(chǔ)設(shè)施和經(jīng)驗(yàn)來(lái)從容應(yīng)對(duì)。

回顧機(jī)器人的這場(chǎng)實(shí)體化跨越,我們看到的是一幅充滿(mǎn)非共識(shí)卻又充滿(mǎn)希望的圖景。這很像四五年前的智能駕駛,在特斯拉 FSD V12 推出后,技術(shù)路線(xiàn)迅速收斂。而機(jī)器人領(lǐng)域也會(huì)經(jīng)歷類(lèi)似的過(guò)程,迎來(lái)屬于它的“FSD V12 時(shí)刻”。

結(jié)語(yǔ)

未來(lái)的競(jìng)爭(zhēng),不再是單一產(chǎn)品的競(jìng)爭(zhēng),而是“終端 - 實(shí)體 - 空間”三位一體生態(tài)的競(jìng)爭(zhēng)。

AI 目前正以硬件、汽車(chē)與機(jī)器人等形態(tài)為載體,推動(dòng)智能從虛擬走向現(xiàn)實(shí)、從被動(dòng)走向主動(dòng)、從孤立走向協(xié)同。 AI 硬件正從功能設(shè)備進(jìn)化為懂用戶(hù)的場(chǎng)景伙伴,智能駕駛系統(tǒng)借助大模型實(shí)現(xiàn)從規(guī)則編碼到能力涌現(xiàn)的跨越,而機(jī)器人則通過(guò)多模態(tài)融合與軟硬一體化的探索,逐步突破物理世界的最后一公里。這三條路徑共同勾勒出一幅未來(lái)智能生態(tài)圖景。

在這一進(jìn)程中,技術(shù)突破、數(shù)據(jù)閉環(huán)與場(chǎng)景落地將成為關(guān)鍵驅(qū)動(dòng)力,而誰(shuí)能率先構(gòu)建算法、硬件與生態(tài)深度融合的體系,誰(shuí)就將在 AI 賦能的實(shí)體化浪潮中,定義下一個(gè)智能時(shí)代的基本形態(tài)。

本文摘自《云棲戰(zhàn)略參考》總第20期

掃碼查看最新雜志


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
出場(chǎng)時(shí)間最多,把渡邊防到7中1,球迷:男籃防守端最不能缺的人

出場(chǎng)時(shí)間最多,把渡邊防到7中1,球迷:男籃防守端最不能缺的人

弄月公子
2026-02-27 10:48:27
日本真是一個(gè)淫亂變態(tài)的國(guó)家啊!不以為恥,反以為榮。 2月21日晚

日本真是一個(gè)淫亂變態(tài)的國(guó)家啊!不以為恥,反以為榮。 2月21日晚

網(wǎng)絡(luò)易不易
2026-02-26 12:43:38
機(jī)場(chǎng)安檢時(shí),筆記本電腦為啥要單獨(dú)拿出來(lái)掃描?不是多此一舉嗎?

機(jī)場(chǎng)安檢時(shí),筆記本電腦為啥要單獨(dú)拿出來(lái)掃描?不是多此一舉嗎?

向航說(shuō)
2026-02-23 00:50:03
中國(guó)第一巨人鮑喜順,不顧醫(yī)生勸告非要生子,現(xiàn)在兒子長(zhǎng)到多高?

中國(guó)第一巨人鮑喜順,不顧醫(yī)生勸告非要生子,現(xiàn)在兒子長(zhǎng)到多高?

她時(shí)尚丫
2026-02-26 22:01:22
向太不再隱瞞!坦言劉德華和朱麗倩的真實(shí)狀況,原來(lái)我們都被騙了

向太不再隱瞞!坦言劉德華和朱麗倩的真實(shí)狀況,原來(lái)我們都被騙了

春風(fēng)笑語(yǔ)
2026-02-26 22:52:44
事實(shí)證明,34歲結(jié)婚六年仍無(wú)子女的康天庥,已經(jīng)走上另一條道路

事實(shí)證明,34歲結(jié)婚六年仍無(wú)子女的康天庥,已經(jīng)走上另一條道路

阿訊說(shuō)天下
2026-02-26 15:22:25
黃海險(xiǎn)些變戰(zhàn)場(chǎng),美行動(dòng)敗露,司令緊急低頭求和,韓才知大難臨頭

黃海險(xiǎn)些變戰(zhàn)場(chǎng),美行動(dòng)敗露,司令緊急低頭求和,韓才知大難臨頭

通鑒史智
2026-02-26 20:08:34
南京雙胞胎決裂內(nèi)情曝光:生父讓哥哥把賬號(hào)給弟弟,說(shuō)弟弟更聰明

南京雙胞胎決裂內(nèi)情曝光:生父讓哥哥把賬號(hào)給弟弟,說(shuō)弟弟更聰明

江山揮筆
2026-02-27 11:19:49
河南大二學(xué)生攢4萬(wàn)為爺爺80歲大壽請(qǐng)戲班連唱三天!自己也登臺(tái)開(kāi)唱:平時(shí)自學(xué),把豫劇帶到新疆校園內(nèi)

河南大二學(xué)生攢4萬(wàn)為爺爺80歲大壽請(qǐng)戲班連唱三天!自己也登臺(tái)開(kāi)唱:平時(shí)自學(xué),把豫劇帶到新疆校園內(nèi)

大象新聞
2026-02-27 12:45:04
“投資開(kāi)始過(guò)山海關(guān)”,許昆林主政下的遼寧發(fā)生了什么?

“投資開(kāi)始過(guò)山海關(guān)”,許昆林主政下的遼寧發(fā)生了什么?

忠哥說(shuō)天下
2026-02-03 18:50:16
為了俘獲巔峰期的帕托,米蘭公主芭芭拉究竟付出了多大的代價(jià)?

為了俘獲巔峰期的帕托,米蘭公主芭芭拉究竟付出了多大的代價(jià)?

羅氏八卦
2026-02-26 18:10:03
行刑前,監(jiān)獄看守對(duì)2名地下黨透露:我能救你們一人出去,救誰(shuí)?

行刑前,監(jiān)獄看守對(duì)2名地下黨透露:我能救你們一人出去,救誰(shuí)?

談古論今歷史有道
2026-01-17 09:30:03
這就是為什么不要欺負(fù)底層員工的原因!網(wǎng)友:1600萬(wàn)結(jié)款直接報(bào)廢

這就是為什么不要欺負(fù)底層員工的原因!網(wǎng)友:1600萬(wàn)結(jié)款直接報(bào)廢

另子維愛(ài)讀史
2026-02-01 20:32:25
荷蘭徹底傻眼!中方正式宣布:更換國(guó)內(nèi)供應(yīng)商,從此不再合作

荷蘭徹底傻眼!中方正式宣布:更換國(guó)內(nèi)供應(yīng)商,從此不再合作

古史青云啊
2026-02-27 12:06:21
每年報(bào)廢百萬(wàn)噸!舊鐵軌為啥不回收重鑄,而是用土埋掉?

每年報(bào)廢百萬(wàn)噸!舊鐵軌為啥不回收重鑄,而是用土埋掉?

心中的麥田
2026-01-28 20:56:41
8歲高考760分,智商230超過(guò)愛(ài)因斯坦,神童陶哲軒如今怎么樣了?

8歲高考760分,智商230超過(guò)愛(ài)因斯坦,神童陶哲軒如今怎么樣了?

戶(hù)外阿毽
2026-02-26 06:16:12
WTT大滿(mǎn)貫!男單4強(qiáng)賽對(duì)陣出爐,國(guó)乒名將0-3出局林詩(shī)棟肩負(fù)重任

WTT大滿(mǎn)貫!男單4強(qiáng)賽對(duì)陣出爐,國(guó)乒名將0-3出局林詩(shī)棟肩負(fù)重任

運(yùn)動(dòng)探索
2026-02-27 10:46:40
最高法院裁定特許無(wú)效,巴拿馬接管長(zhǎng)和30年碼頭,馬士基與MSC托管引發(fā)風(fēng)險(xiǎn)爭(zhēng)議

最高法院裁定特許無(wú)效,巴拿馬接管長(zhǎng)和30年碼頭,馬士基與MSC托管引發(fā)風(fēng)險(xiǎn)爭(zhēng)議

今日搞笑分享
2026-02-27 10:04:12
與太平軍同住一城,是什么樣的體驗(yàn)?

與太平軍同住一城,是什么樣的體驗(yàn)?

無(wú)心鏡
2026-02-25 08:05:08
德國(guó)總理帶隊(duì)參觀宇樹(shù)科技 多名德企高管現(xiàn)場(chǎng)與機(jī)器人握手互動(dòng):別弄壞了,很貴的?。萍加^察

德國(guó)總理帶隊(duì)參觀宇樹(shù)科技 多名德企高管現(xiàn)場(chǎng)與機(jī)器人握手互動(dòng):別弄壞了,很貴的!|科技觀察

封面新聞
2026-02-27 11:21:03
2026-02-27 13:20:49
鈦媒體APP incentive-icons
鈦媒體APP
獨(dú)立財(cái)經(jīng)科技媒體
129896文章數(shù) 861820關(guān)注度
往期回顧 全部

科技要聞

英偉達(dá)業(yè)績(jī)亮眼仍跌5% 兩大因素成核心隱憂(yōu)

頭條要聞

86歲暢銷(xiāo)書(shū)作家楊本芬就“抄襲”道歉 曾獲谷雨文學(xué)獎(jiǎng)

頭條要聞

86歲暢銷(xiāo)書(shū)作家楊本芬就“抄襲”道歉 曾獲谷雨文學(xué)獎(jiǎng)

體育要聞

一場(chǎng)必須要贏的比賽,男籃何止擊敗了裁判

娛樂(lè)要聞

繼網(wǎng)暴谷愛(ài)凌后 美國(guó)欲沒(méi)收其全部收入

財(cái)經(jīng)要聞

魅族手機(jī),終成棄子?

汽車(chē)要聞

寶馬X5傳承版發(fā)布:給經(jīng)典G05的一場(chǎng)體面謝幕?

態(tài)度原創(chuàng)

時(shí)尚
手機(jī)
游戲
數(shù)碼
軍事航空

今年春天最美搭配:西裝+半裙,怎么穿都好看!

手機(jī)要聞

太牛了!蘋(píng)果iPhone/iPad獲準(zhǔn)處理北約機(jī)密,安全等級(jí)堪比軍工級(jí)

《生化危機(jī):安魂曲》已現(xiàn)速通記錄 2小時(shí)39分鐘!

數(shù)碼要聞

從議價(jià)到被動(dòng)接受:蘋(píng)果被迫接受三星內(nèi)存漲價(jià)100%背后的供應(yīng)鏈變局

軍事要聞

美國(guó)11架F-22隱形戰(zhàn)機(jī)抵達(dá)以色列

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版