国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

空間智能來勢洶洶!從實驗室到消費(fèi)級剛需,如何重塑AI具身時代?

0
分享至



機(jī)器之心發(fā)布

明天,一年一度的 CES 即將在美國拉斯維加斯璀璨開幕。作為全球科技產(chǎn)業(yè)最重要的風(fēng)向標(biāo)之一,筆者在超前探訪之后欣喜發(fā)現(xiàn),在今年機(jī)器人「后廚翻炒」與 AI 眼鏡「同聲傳譯」的熱鬧之外,行業(yè)終于開始直面核心命題:無法理解三維空間的 AI,終究只是缺乏行動力的 「語言巨人」。

如何解題?空間智能(Spatial Intelligence),這一被李飛飛定義為 「AI 下一個十年」 的關(guān)鍵賽道,正在本屆 CES 上完成從學(xué)術(shù)概念到產(chǎn)業(yè)實踐的突破性跨越。從巨頭的算力競賽到中國初創(chuàng)企業(yè)的端側(cè)破局,一場關(guān)于 「空間智商」 的全球競速已悄然開幕,讓我們一探究竟 ——

今年 CES 2026 展館,具身智能(Embodied AI)仍舊是各大廠商的展示重點(diǎn),但在這背后一種冷靜的共識正在行業(yè)底層悄然凝聚:如果 AI 不能像生物一樣理解三維空間,那么它將永遠(yuǎn)被困在屏幕或昂貴的遙控器里。

今年,當(dāng)大眾還在討論大語言模型(LLM)的邏輯能力時,一批專注于「空間智能」的公司已經(jīng)開始在端側(cè)重構(gòu) AI 的感知邊界。

感知困局:萬億參數(shù)為何敵不過一只蒼蠅的空間直覺?

CES 2026 的展臺前,一個矛盾現(xiàn)象引發(fā)行業(yè)深思:一邊是參數(shù)規(guī)模突破萬億、邏輯推理能力逼近人類的大語言模型(LLM);另一邊是依賴激光雷達(dá)或人工遠(yuǎn)程操控才能勉強(qiáng)運(yùn)行的智能設(shè)備。多數(shù) AI 眼鏡仍停留在 「2D 提詞器」 的初級階段,而號稱 「自主決策」 的機(jī)器人,在復(fù)雜物理環(huán)境中甚至難以完成簡單的避障動作。

「一只蒼蠅沒有萬億級參數(shù),卻能在雜亂空間中極速避障、精準(zhǔn)著陸?!?一位資深 AI 投資人的感嘆,點(diǎn)出了當(dāng)前具身智能的核心痛點(diǎn)。

正如 OpenAI 前首席科學(xué)家 Ilya Sutskever 與 Meta AI 負(fù)責(zé)人 Yann LeCun 共同指出的:物理世界的常識無法通過文字完全習(xí)得。貓與蒼蠅不識字,卻憑借與生俱來的空間直覺,在 3D 環(huán)境中展現(xiàn)出遠(yuǎn)超超級計算機(jī)的感知與決策能力。

這種「語言強(qiáng)、手腳笨」的困境,本質(zhì)上便是「空間智能」的缺失。

李飛飛曾定義「空間智能」為 AI 的下一個十年:若 AI 無法理解物體的深度、距離、遮擋與重力,就永遠(yuǎn)無法真正 「具身」。在語言智能趨于飽和的今天,AI 行業(yè)的競爭焦點(diǎn)正從 「參數(shù)競賽」 轉(zhuǎn)向 「感知革命」—— 誰能以更低成本實現(xiàn)更快的空間直覺,誰就掌握了下一輪技術(shù)浪潮的主動權(quán)。

空間智能:AI 理解世界的「認(rèn)知革命」

為何整個行業(yè)將破解具身困境的希望押注于「空間智能」?其根本原因在于,這并非一次尋常的技術(shù)迭代,而是一場讓 AI 獲得「人類理解世界」底層能力的認(rèn)知革命。

李飛飛在其論述中深刻指出,空間智能是人類認(rèn)知的「腳手架」。從嬰兒通過抓握與爬行來探索環(huán)境,到消防員在濃煙中憑借直覺判斷建筑坍塌的風(fēng)險,我們無時無刻不依賴著對深度、距離、遮擋和物理關(guān)系的瞬間理解。這種能力在文字誕生之前便已存在,它根植于進(jìn)化之中,是連接感知與行動、驅(qū)動智能涌現(xiàn)的核心循環(huán)。

然而,當(dāng)前最被人熟知的 AI 工具卻似乎尚未具備這種思維方式。它們能處理海量文本與圖像,卻在理解物體間空間關(guān)系、預(yù)測物理動態(tài)等根本任務(wù)上表現(xiàn)薄弱,與它們所試圖交互的物理現(xiàn)實嚴(yán)重脫節(jié)。

要彌合這一鴻溝,李飛飛提出需要為 AI 構(gòu)建全新的認(rèn)知基礎(chǔ) —— 即能夠理解、推理并與復(fù)雜世界交互的「世界模型」。這要求模型具備三種核心能力:生成性,能創(chuàng)造在視覺、幾何與物理層面皆一致的世界;多模態(tài)性,可融合處理文本、圖像、動作等多種信號;交互性,能預(yù)測動作對世界狀態(tài)的影響。這遠(yuǎn)超越了對語言序列的建模,是對高維、動態(tài)物理規(guī)律的統(tǒng)一表征,其挑戰(zhàn)規(guī)??涨?。

一旦攻克空間智能,意味著 AI 將首次獲得類似生物的空間直覺與物理常識。

這將不再是讓機(jī)器「看到」更多像素,而是讓其「理解」場景中物體為何存在、如何關(guān)聯(lián),以及將如何變化。由此,AI 才能從被動的信息處理器,蛻變?yōu)槟茉谡鎸嵤澜缰兄鲃右?guī)劃、安全交互的智能體。

這場認(rèn)知革命的產(chǎn)業(yè)價值不言而喻。一旦 AI 掌握了空間智能,自動駕駛將擁有媲美人類的場景理解與預(yù)判能力;機(jī)器人能在復(fù)雜環(huán)境中實現(xiàn)真正自主的導(dǎo)航與靈巧操作;智能制造、醫(yī)療手術(shù)輔助等領(lǐng)域也將獲得顛覆性的可靠「伙伴」。

這不僅是技術(shù)的升級,更是 AI 融入并賦能物理世界的「通行證」。



全球競速:「世界生成」與「空間決策」技術(shù)路徑分野

當(dāng)前,空間智能的技術(shù)革命催生了兩大核心路徑的分化:世界生成派與空間決策派。

一條致力于構(gòu)建與生成逼真的 3D 世界,為 AI 提供學(xué)習(xí)和訓(xùn)練的無限場景;另一條則專注于在現(xiàn)實環(huán)境中實現(xiàn)實時的空間理解與動作決策,讓 AI 能真正「動手操作」、像人一樣融入真實物理世界。

本屆 CES 清晰地展現(xiàn)了這兩種路徑的平行競賽與互補(bǔ)可能。

路徑一:世界生成 —— 創(chuàng)造 AI 的「無限模擬場」

該路徑的核心在于,通過生成式模型構(gòu)建高保真、可交互的虛擬環(huán)境,為機(jī)器人訓(xùn)練、游戲娛樂、影視創(chuàng)作等提供「數(shù)字孿生」基礎(chǔ)。

META 憑借 SAM 3 (3D)項目,致力于為物理世界中的萬物進(jìn)行 3D 標(biāo)記與重建,旨在建立最龐大的視覺詞典。由李飛飛領(lǐng)銜的 World Labs 則走得更遠(yuǎn),其「Marble」模型不僅能夠理解 3D 場景,更能像造物主一樣生成并與之交互,是目前空間建模的「科研天花板」。來自中國的 GIGA 同樣聚焦于此,專注于利用神經(jīng)渲染等技術(shù),從 2D 圖像或視頻中高效生成高質(zhì)量的 3D 場景資產(chǎn)。

這條路徑的價值在于,它能為缺乏真實交互數(shù)據(jù)的機(jī)器人訓(xùn)練,以及需要大量 3D 內(nèi)容的創(chuàng)意產(chǎn)業(yè),提供一個成本可控、規(guī)模無限的「練兵場」和「素材庫」。

路徑二:空間決策 —— 賦予機(jī)器「實時行動力」

與「造世界」的宏大敘事并行,另一批公司正攻堅更具即時挑戰(zhàn)的命題:如何讓機(jī)器基于當(dāng)下的視覺輸入,在毫秒間理解空間關(guān)系并做出安全、精準(zhǔn)的決策。

NVIDIA 的 NitroGen 項目通過建立視覺到動作的端到端模型,減少傳統(tǒng)規(guī)劃環(huán)節(jié)的延遲。自動駕駛領(lǐng)域的小鵬汽車等其城市級智能駕駛系統(tǒng)本質(zhì)上是在復(fù)雜開放的世界中完成持續(xù)的空間決策。銀河通用(Galbot) 研發(fā)的 VLA 模型,試圖將視覺感知、語言指令與動作生成緊密耦合,讓機(jī)器人「看到即思考,思考即行動」。聯(lián)匯科技 OmAI 則更側(cè)重于通過普通 RGB 攝像頭和有限的端側(cè)算力下,實現(xiàn)極高精度的 3D 開放空間感知,為無人裝備和可穿戴設(shè)備提供視覺決策核心。

這條路徑的競爭,圍繞著實時性、精度、功耗與成本展開,直接決定了具身智能能否走出實驗室,走進(jìn)動態(tài)變化的真實生活與普通消費(fèi)場景。

當(dāng)然,兩條路徑并非割裂,而是共同構(gòu)成空間智能的完整閉環(huán)。

「世界生成」為「空間決策」提供了海量、安全的訓(xùn)練與仿真環(huán)境;而「空間決策」中帶來的真實數(shù)據(jù)與挑戰(zhàn),又不斷反哺和修正「世界生成」的模型,使其更貼近物理規(guī)律。

這場競速的本質(zhì),是 AI 在「虛擬」與「現(xiàn)實」之間構(gòu)建雙向通道的能力比拼,其終點(diǎn)則是創(chuàng)造出真正具備空間常識、能與人類世界無縫交互的智能體。

行業(yè)拐點(diǎn):當(dāng)空間感知進(jìn)入「百元時代」

但比終點(diǎn)更早來臨的將是行業(yè)「拐點(diǎn)」。

不論何種技術(shù)路徑的演進(jìn),都將指向一個清晰的產(chǎn)業(yè)目標(biāo):將曾經(jīng)成本高昂的空間感知能力變成一項可大規(guī)模普及的基礎(chǔ)服務(wù)。

在本屆 CES 現(xiàn)場,我們還看到了關(guān)于純視覺路徑打破空間感知 「昂貴魔咒」的更多可能。

長期以來,3D 空間感知被昂貴的硬件設(shè)備所壟斷:多攝像頭 BEV 架構(gòu)或數(shù)千美元的激光雷達(dá),讓具身智能只能局限于高端實驗室和工業(yè)場景。但在 2026 年的展臺上,一種 「視覺優(yōu)先」 的技術(shù)路徑正在改寫游戲規(guī)則。

美國 AI 頂級大廠率先吹響了范式轉(zhuǎn)型的號角 ——

  • META SAM 3 (3D):試圖把全世界的物體在 3D 空間中「標(biāo)記」出來,為 AI 提供最全的視覺詞典。
  • META 謝賽寧 (SuperSensing):追求超越像素的物理洞察力,讓 AI 能「看透」運(yùn)動物體的物理慣性。
  • NVIDIA NitroGen:建立 Vision-Action(視覺-動作)的直連通路,讓機(jī)器人不再通過語言大腦轉(zhuǎn)譯,而是憑視覺直覺直接做出反應(yīng)。

頂級廠商不計成本地利用算力優(yōu)勢打造的「大」模型,對端側(cè)的硬件也有極高的要求,「堆料」成為主流美式機(jī)器人廠商和可穿戴設(shè)備廠商的唯一選擇。

不過,筆者也在 CES 現(xiàn)場看到了另一類產(chǎn)業(yè)化技術(shù)破局者 —— 著名的消費(fèi)電子品牌韶音(Shokz)與 AI 空間智能廠商聯(lián)匯科技(OmAI)聯(lián)合推出的 AI 眼鏡,它展示了一種極具破局性思路的技術(shù)路徑。

這款搭載了聯(lián)匯科技 OmAI 核心空間智能技術(shù)的 AI 眼鏡:徹底拋棄了昂貴的傳感器,僅通過普通的 RGB 攝像頭 + 端側(cè)的 OmModel 模型,即實現(xiàn)了實時的 3D 開放空間感知。對于用戶而言,這副輕便的眼鏡能將物理世界即時轉(zhuǎn)化為清晰的避障指令;而對于行業(yè)而言,可輕便搭載的高性能低成本的空間感知能力,意味著:模型優(yōu)勢可以將 3D 空間感知的成本降到單目攝像頭的水平。



過去,實現(xiàn)可靠的 3D 感知往往意味著高昂的硬件成本 —— 多攝像頭 BEV(鳥瞰圖)架構(gòu)或者是數(shù)千美元的激光雷達(dá)。這使得具身智能被禁錮在昂貴的工業(yè)場景或高端實驗室中。

如今,算法重構(gòu)讓高精度空間感知能力得以嵌入低功耗端側(cè)芯片 ——

其一,脫離激光雷達(dá)的純視覺方案,讓 AI 眼鏡、家用機(jī)器人等設(shè)備真正進(jìn)入消費(fèi)級價格區(qū)間;

其二,端側(cè)實時處理能力,為盲人導(dǎo)航、具身機(jī)器人等場景筑牢安全底線;

其三,從 「看到物體」 到 「理解空間」 的跨越,讓具身智能完成了從感知到?jīng)Q策的關(guān)鍵進(jìn)化。

當(dāng)?shù)讓铀惴ㄖ貥?gòu)取代了硬件堆砌,具身智能也將迎來走出實驗室的可能。

投資人觀察:尋找具身智能領(lǐng)域的「Intel Inside」

在提前看展的過程中,一位同行的硅谷投資人坦言:「過去我們看參數(shù)規(guī)模,現(xiàn)在我們看空間智能的落地效率。誰能讓 AI 在物理世界中實現(xiàn)‘仿生靈動’,誰就贏得了下一個十年?!?/p>

具身智能和可穿戴設(shè)備的「iPhone 時刻」,或許將始于這次 CES 展釋放的空間感知成本革命信號 ——

從「實驗室」到「消費(fèi)級」:當(dāng) 3D 空間感知的成本從數(shù)萬元(激光雷達(dá)方案)降至數(shù)百元(純視覺算法方案)時,市場容量將發(fā)生指數(shù)級擴(kuò)張。不僅是盲人眼鏡,掃地機(jī)器人、低空無人機(jī)乃至消費(fèi)級具身機(jī)器人的大規(guī)模落地將不再受困于硬件整機(jī)成本門檻。

數(shù)據(jù)的入口效應(yīng):誰能讓 AI 在各類復(fù)雜室內(nèi)外場景中實現(xiàn)「視覺閉環(huán)」,誰就掌握了物理世界最真實的數(shù)據(jù)流。這種數(shù)據(jù)的護(hù)城河,遠(yuǎn)比單純的文本爬取深得多。

投資人的集體共識指向了一個清晰趨勢:未來 3-5 年,具備端側(cè)、實時、高精度 3D 空間感知與決策能力的企業(yè),將成為具身智能生態(tài)中不可或缺的 「視覺芯片級」 供應(yīng)商,其行業(yè)地位也將堪比 PC 時代的 Intel、移動時代的 ARM,因為這些廠商會讓具身智能和可穿戴設(shè)備真正走入千家萬戶,成為新的消費(fèi)級市場。



結(jié)語

從 CES 2026 的現(xiàn)場來看,這場從「語言智能」到「空間智能」的躍進(jìn)已經(jīng)不可逆轉(zhuǎn)。而這場革命的想象力遠(yuǎn)不止于此:在消費(fèi)端,百元級 3D 感知方案將催生智能穿戴、智能家居的新品類爆發(fā),讓 AI 設(shè)備成為像手機(jī)一樣的生活必需品。在工業(yè)端,低成本空間智能將推動智能制造、物流倉儲的效率革命,為企業(yè)降本增效提供核心動力。在社會價值層面,它將為殘障人士、老年人等各類剛需群體帶來更便捷的生活方式,加速 AI 普惠。

如果說過去兩年,LLM 以「博學(xué)」令人震撼。那么,未來三年,AI 將以其在物理世界中的「仿生靈動」與「自主」重新定義智能邊界,而我們正在見證 AI 從「語言智能」向「空間智能」的范式躍進(jìn)。在這場全球競速中,技術(shù)范式的重構(gòu)、成本門檻的突破、應(yīng)用場景的落地,正共同推動具身智能迎來真正的「iPhone 時刻」。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
50歲安吉麗娜·朱莉出售洛杉磯2450萬美元豪宅,被曝計劃移居,“或為擺脫與前夫布拉德·皮特的糾葛”

50歲安吉麗娜·朱莉出售洛杉磯2450萬美元豪宅,被曝計劃移居,“或為擺脫與前夫布拉德·皮特的糾葛”

魯中晨報
2026-01-07 15:57:25
委內(nèi)瑞拉贏麻了

委內(nèi)瑞拉贏麻了

沉思的野獸
2026-01-06 13:33:37
廣西一精神小妹結(jié)婚,身上多處紋身新郎小她10歲,網(wǎng)友:相當(dāng)炸裂

廣西一精神小妹結(jié)婚,身上多處紋身新郎小她10歲,網(wǎng)友:相當(dāng)炸裂

唐小糖說情感
2026-01-07 16:37:28
四川一對夫妻同時失業(yè),剛貸款買房4個月:人算不如天算啊

四川一對夫妻同時失業(yè),剛貸款買房4個月:人算不如天算啊

唐小糖說情感
2026-01-07 16:28:02
中方是否計劃采取行動幫助馬杜羅夫婦獲釋?外交部回應(yīng)

中方是否計劃采取行動幫助馬杜羅夫婦獲釋?外交部回應(yīng)

新京報政事兒
2026-01-07 15:41:25
太子集團(tuán)創(chuàng)始人陳志,被遣送回中國,接受有關(guān)部門調(diào)查

太子集團(tuán)創(chuàng)始人陳志,被遣送回中國,接受有關(guān)部門調(diào)查

新京報政事兒
2026-01-07 20:35:03
1955年,一名身體強(qiáng)壯的日本女人赤裸上身背著黑色編織袋站在海邊

1955年,一名身體強(qiáng)壯的日本女人赤裸上身背著黑色編織袋站在海邊

忠于法紀(jì)
2026-01-07 17:46:09
塌房的一級演員閆學(xué)晶,做錯了兩件事

塌房的一級演員閆學(xué)晶,做錯了兩件事

李月亮
2026-01-07 19:31:56
追了18天,美國宣布:已在北大西洋扣押俄潛艇護(hù)航的油輪,該油輪原計劃在委內(nèi)瑞拉裝載石油

追了18天,美國宣布:已在北大西洋扣押俄潛艇護(hù)航的油輪,該油輪原計劃在委內(nèi)瑞拉裝載石油

每日經(jīng)濟(jì)新聞
2026-01-07 23:12:02
河南一大爺實拍“素顏巴黎”照片火遍全網(wǎng),埃菲爾鐵塔被調(diào)侃像“電線塔

河南一大爺實拍“素顏巴黎”照片火遍全網(wǎng),埃菲爾鐵塔被調(diào)侃像“電線塔

大象新聞
2026-01-07 19:53:19
韓國總統(tǒng)李在明稱“限韓令”問題將有序、緩和地解決!

韓國總統(tǒng)李在明稱“限韓令”問題將有序、緩和地解決!

奮斗在韓國
2026-01-07 19:42:09
華為Mate80突然官降:1月7日,驚喜大反轉(zhuǎn)

華為Mate80突然官降:1月7日,驚喜大反轉(zhuǎn)

科技堡壘
2026-01-07 12:46:59
瘋傳!王石的瓜,好狗血!

瘋傳!王石的瓜,好狗血!

財經(jīng)要參
2026-01-05 22:13:08
南京“一混凝土攪拌車撞電動兩輪車致3死1傷”事故,調(diào)查報告公布

南京“一混凝土攪拌車撞電動兩輪車致3死1傷”事故,調(diào)查報告公布

澎湃新聞
2026-01-07 16:30:26
科學(xué)家讓一對情侶在核磁共振里實戰(zhàn),才發(fā)現(xiàn)人體驚人真相!

科學(xué)家讓一對情侶在核磁共振里實戰(zhàn),才發(fā)現(xiàn)人體驚人真相!

徐德文科學(xué)頻道
2026-01-06 19:51:55
針對我國對日本斷供稀土等,日本輿論炸鍋,日本當(dāng)局回應(yīng)讓人氣憤

針對我國對日本斷供稀土等,日本輿論炸鍋,日本當(dāng)局回應(yīng)讓人氣憤

時時有聊
2026-01-07 09:58:43
和平已無望?馬斯克預(yù)言大戰(zhàn)時間,美政府已簽字:提到臺灣省8次

和平已無望?馬斯克預(yù)言大戰(zhàn)時間,美政府已簽字:提到臺灣省8次

興史興談
2026-01-07 06:19:46
中國研究人員發(fā)現(xiàn),清理霧霾的行動或?qū)е掳拇罄麃啔夂蜃兊酶鼰岣稍?>
    </a>
        <h3>
      <a href=風(fēng)向觀察
2026-01-07 16:03:01
新華時評丨一場非法荒唐的“審判”

新華時評丨一場非法荒唐的“審判”

新華社
2026-01-07 22:03:04
世界真是草臺班子,小米官方表示新款 SU7 標(biāo)錯了價格!

世界真是草臺班子,小米官方表示新款 SU7 標(biāo)錯了價格!

XCiOS俱樂部
2026-01-07 19:38:42
2026-01-08 06:16:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12075文章數(shù) 142531關(guān)注度
往期回顧 全部

科技要聞

精華!黃仁勛CES記者會:揭秘新款大殺器

頭條要聞

美軍扣押俄潛艇護(hù)航的油輪 俄羅斯外交部回應(yīng)

頭條要聞

美軍扣押俄潛艇護(hù)航的油輪 俄羅斯外交部回應(yīng)

體育要聞

賣水果、搬磚的小伙,與哈蘭德爭英超金靴

娛樂要聞

《馬背搖籃》首播,革命的樂觀主義故事

財經(jīng)要聞

農(nóng)大教授科普:無需過度擔(dān)憂蔬菜農(nóng)殘

汽車要聞

燃油駕趣+智能電感雙Buff 試駕全新奧迪Q5L

態(tài)度原創(chuàng)

游戲
親子
時尚
健康
數(shù)碼

《GTA6》地圖規(guī)模再引熱議:這次真要"大到離譜"了?

親子要聞

雀巢召回多國嬰兒配方奶粉,涉及中國市場71個批次

李夢系穿搭,就這么養(yǎng)成了

這些新療法,讓化療不再那么痛苦

數(shù)碼要聞

技嘉Z890主板適配英特爾新處理器,還展示256GB內(nèi)存!

無障礙瀏覽 進(jìn)入關(guān)懷版