国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

首發(fā) | 鵬城實驗室出品,一座“世界模型”融資數(shù)億元

0
分享至

在如今的人工智能競賽里,扎克伯格和他的Meta可能是最“激進”的玩家,沒有之一。

在過去一年時間里,扎克伯格豪擲千金、四處搖人,試圖組建世界上最強大的AI產(chǎn)品團隊,動輒就為那些有過OpenAI、Anthropic等頭部公司工作經(jīng)歷的人才開出1億美元的“跳槽獎金”。其中最大一筆開支用在了汪濤身上——為了讓這位天才少年順利地加入Meta,帶隊人工智能團隊,扎克伯格豪擲148億美元直接收購了汪濤創(chuàng)辦的Scale AI,直接整體打包帶走。

除此而外,扎克伯格SSI的首席執(zhí)行官、前Y Combinator合伙人丹尼爾·格羅斯(Daniel Gross)旗下的風(fēng)險投資基金NFDG,并順勢邀請NFDG的兩位合伙人——丹尼爾·格羅斯與前GitHub首席執(zhí)行官、著名科技播客“Hacker Medley”的主理人納特·弗里德曼(Nat Friedman)加入Meta,準備組建Meta自成立以來的首只產(chǎn)業(yè)基金(CVC)。

更重要的是小扎手中還有一張王牌,那就是Meta的首席科學(xué)家楊立昆(Yann LeCun)。

楊立昆是誰?他是計算機學(xué)界最高榮譽圖靈獎的獲得者、是AI之父辛頓(Geoffrey Hinton)的親傳弟子、是OpenAI前首席科學(xué)家伊利亞(Ilya Sutskever)的同門師兄,是神經(jīng)網(wǎng)絡(luò)反向傳播學(xué)習(xí)算法的提出者??梢哉f,假如人工智能有江湖,那么楊立昆就是那位足夠幫Meta開宗立派的宗師。

然而就在刀槍入庫、準備大干一場的時候,這張王牌卻給了所有人一個意外:楊立昆宣布自己將于年底離開Meta,成立一家屬于自己的公司。因為在他看來“目前的大語言模型比貓還笨,對物理世界的理解能力很差”,聲稱接下來是“死路一條”——如果要做出真正的“通用人工智能(AGI)”,就需要專注另一條技術(shù)路線:“世界模型”(world models)。

這條消息一經(jīng)發(fā)布,迅速引爆了全球科技圈,“世界模型”迅速成為熱詞。無數(shù)人都在討論“到底什么是世界模型”?“世界模型和我們已經(jīng)熟知的大語言模型,差異點到底是什么?”

而在中國,也有一群科學(xué)家們在思考相同的問題,并且不拘泥于楊立昆的理論框架,嘗試給出屬于自己的解決方案。據(jù)投中網(wǎng)獲悉,近日,由鵬城實驗室孵化、專注“物理空間智能模型”研發(fā)的「拓元智慧」宣布完成數(shù)億元Pre-A輪系列融資,引入上市公司東方精工、星宸科技、金牌家居關(guān)聯(lián)基金德韜資本、石溪資本等多家戰(zhàn)略及產(chǎn)業(yè)投資方,粵科創(chuàng)業(yè)等重量級國資投資平臺,鵬城愿景、紅鳥啟航基金等科研機構(gòu)基金。深藍資本擔(dān)任長期獨家財務(wù)顧問。

據(jù)悉,本輪融資資金將主要用于物理空間智能模型的研發(fā)投入、賦能模型的物理推理及跨場景遷移能力、構(gòu)建具身生態(tài)并加速相關(guān)產(chǎn)品的商業(yè)化落地。

什么是“世界模型”?

為什么大語言模型是一條死胡同?研究了一輩子人類大腦的楊立昆認為,人類之所以能夠進行推理和規(guī)劃,是因為人們能夠記憶事物、擁有直覺、具備常識,而大語言模型的工作原理其實是推理的是下一個最符合邏輯的詞元,圖像/視頻模型推理的是下一個最符合邏輯的像素。

換句話說,雖然這些模型已經(jīng)表現(xiàn)出了相當出色的推理能力,但是也僅僅是局限在“詞元”“像素”的維度上,并沒有真正理解三維世界。以一個簡單的真實場景為例:給定“門寬80cm、桌子50cm、人的肩寬55cm”的描述,當前的語言模型往往會逐項比較數(shù)字并認為“都比門窄,因此可以一起通過”,完全忽略兩者并排時的組合寬度、旋轉(zhuǎn)帶來的投影變化、姿態(tài)調(diào)整的約束以及物體之間的不可穿透性等基本物理規(guī)律。這樣的錯誤不只是知識缺失,而是缺乏真正的物理空間理解能力,凸顯了當前AI無法成為可靠的物理世界參與者的根本原因。

如果談得再務(wù)實一點,大語言模型雖然在文本推理與知識處理上取得突破,但在理解真實物理空間、進行連續(xù)動作規(guī)劃以及與環(huán)境實時交互方面仍然存在根本性缺陷。這類缺陷不僅讓AGI的實現(xiàn)遙遙無期,更直接限制了人工智能技術(shù)向具身智能等更實際應(yīng)用場景的拓展。

例如,由于模型無法準確理解空間結(jié)構(gòu)與幾何關(guān)系,機器人往往在執(zhí)行簡單任務(wù)時也會出現(xiàn)“對不準、抓不到、繞不開、走不直”等失敗模式。例如,在抓取任務(wù)中,機械臂可能因為誤判目標位置而多次空抓,或在移動時與桌角、墻面發(fā)生輕微碰撞,體現(xiàn)出對距離、可達性和避障條件的誤估。在更復(fù)雜場景中,模型甚至?xí)蛇`反物理規(guī)律的行為規(guī)劃,比如要求機械臂穿過障礙物、讓移動平臺駛向不可通行的窄隙、在傾斜平面上輸出不穩(wěn)定的軌跡等。此外,這些系統(tǒng)高度依賴訓(xùn)練場景,當光照變化、物體位置輕微移動或視角發(fā)生偏差時,其性能會顯著下降,出現(xiàn)同一指令在不同場景中的執(zhí)行結(jié)果可能截然不同的狀況。

總之想要讓人工智能真正地具備人類級別的學(xué)習(xí)能力,就需要幫助大模型真正地理解我們的“物理世界”,而這條路線就被稱為“世界模型”。楊立昆說:“世界模型是你對世界運行方式的心理模型。你可以想象一系列你可能會采取的行動,而你的世界模型將使你能夠預(yù)測這一系列行動會對世界產(chǎn)生什么影響。”

持有相同觀點的還有知名華人科學(xué)家李飛飛。李飛飛認為人工智能下一個十年的主要技術(shù)方向,應(yīng)該是具備空間智能的“世界模型”。而判斷是否具備“空間智能”的標準是:能夠生成符合物理定律且空間一致的世界,處理從圖像到動作的多模態(tài)輸入,并預(yù)測這些世界將如何演變或與它們互動。


當然,之所以現(xiàn)在出現(xiàn)了所謂的“路線之爭”,并不是因為其他大模型開發(fā)者并不認同“世界模型”的價值,而是一切都是有難點的。

從數(shù)字世界走到真實世界,一項基本能力是判斷在真實世界執(zhí)行的動作、并與真實世界進行交互,目前主流的大模型架構(gòu),即視覺—語言—動作模型(VLA)內(nèi)部存在著無法回避的兩個缺陷,哪怕引入世界模型也難以徹底解決:

第一,VLA通常將視覺輸入先壓縮到語言token空間,這一過程天然會丟失連續(xù)空間中至關(guān)重要的幾何、拓撲與物理量信息,使模型難以理解精確位置關(guān)系,從而在動作控制上產(chǎn)生偏差,甚至輸出違背物理約束的操作序列;

第二,VLA的泛化能力極為有限。真實世界具有高度復(fù)雜性與多樣性,而具身智能又對視角變化、環(huán)境布局、物體遮擋及動態(tài)條件極度敏感。這些因素耦合在一起,使得VLA模型很容易在訓(xùn)練場景中表現(xiàn)良好,卻無法遷移到新環(huán)境中。一旦背景變化、光照不同或物體位置發(fā)生微小偏移,模型的感知—推理—動作鏈條就可能徹底瓦解。

可以說,這兩個瓶頸存在直接導(dǎo)致AI在物理空間中能力嚴重不足,也讓當前的“通往AGI之路”看上去像是一個無底洞。一個側(cè)面例證是,就在2025年10月——也就是楊立昆官宣離職創(chuàng)業(yè)的一個月之前——扎克伯格曾經(jīng)公開表示,為了保持行業(yè)競爭力,Meta明年的支出成本將超過1000億美元。這個言論直接引發(fā)了人們“大模型燒錢”的焦慮,也嚴重地考驗了投資人們的耐心,10月下旬Meta股價暴跌12.6%,市值蒸發(fā)近2400億美元。

“VWA”,讓“世界模型”更有可能?

那么,我們應(yīng)該如何真實、高效地開發(fā)“世界模型”呢?李飛飛、楊立昆在思考,來自中國的科學(xué)家們也在思考,而拓元智慧就是其中之一。

拓元智慧是鵬城實驗室智算生態(tài)構(gòu)建的首批企業(yè),核心創(chuàng)業(yè)團隊由國內(nèi)外頂尖AI學(xué)者組成,包括AI領(lǐng)域青年領(lǐng)袖科學(xué)家王廣潤博士(華為天才少年計劃最高級別入選者)、國家級青年人才王可澤博士(吳文俊人工智能科學(xué)獎得主)、中大-拓元聯(lián)合實驗室負責(zé)人梁小丹博士(阿里巴巴青橙獎得主)。

他們給出的答案是“VWA”,即Vision-World-Action模型,是一種區(qū)別于VLA模型的全新架構(gòu)。

拓元團隊認為,制約當前大模型能力提升的關(guān)鍵瓶頸,是目前的模型普遍缺乏泛化性。想要打破這個瓶頸,就需要將整體能力解耦為“物理建模”與“空間建?!眱纱竽K。通過這種拆分,模型能夠獲得高度通用、跨環(huán)境穩(wěn)定的物理建模能力;而真正影響泛化性的部分,僅存在于對具體場景的空間建模上。這一機制與人類在操控陌生環(huán)境中的機器人時的行為高度一致:人類并非天然具備“泛化性”,而是依靠在新環(huán)境中快速適應(yīng)空間布局來完成任務(wù)。

VWA正是基于這個思路所設(shè)計。與VLA必須將視覺信息壓縮到語言token空間不同,VWA模型可以直接在物理空間進行推理與決策,在連續(xù)物理空間中進行多步roll-out、預(yù)測未來狀態(tài)變換,從而在規(guī)劃、安全評估與穩(wěn)定控制方面邁出關(guān)鍵一步。

實現(xiàn)VWA模型架構(gòu)的核心,則是拓元開發(fā)的物理自回歸模型(Physical Autoregressive Model, PAR)。PAR模型通過將視頻幀與機器人動作共同編碼為“物理token”,使得模型能夠以自回歸方式逐步預(yù)測下一步視頻與動作,形成“預(yù)測—執(zhí)行—再預(yù)測”的閉環(huán)。尤為關(guān)鍵的是,PAR模型在無需進行動作預(yù)訓(xùn)練的前提下,即可有效學(xué)習(xí)物理世界的動態(tài)規(guī)律,在機器人操作基準ManiSkill的PushCube任務(wù)上實現(xiàn)了100%的成功率,并在多項任務(wù)中媲美需動作預(yù)訓(xùn)練的強基線模型。這一成果顯著推進了從大規(guī)模視頻預(yù)訓(xùn)練模型向真實世界機器人操控能力遷移的技術(shù)路徑,為構(gòu)建具備通用物理常識的具身智能奠定了重要基礎(chǔ)。

其次在底層推理機制上,拓元開發(fā)提出了全新的Tweedie Framework,顯著提升動作控制的準確性;同時引入高效的 Eon 計算機制,大幅增強模型的運行效率與長序列建模能力。兩者結(jié)合,為構(gòu)建更可靠、更智能、更具泛化能力的物理空間智能奠定了堅實基礎(chǔ)。

而在數(shù)據(jù)層面,拓元智慧引入多源且高質(zhì)量的物理數(shù)據(jù),其中主要包括:(1)具備空間信息的真實人類抓取及自然場景數(shù)據(jù):基于真實業(yè)務(wù)場景采集的數(shù)十億級雙目與多目視覺數(shù)據(jù),覆蓋多種真實環(huán)境和多樣化任務(wù)場景,具備高度一致的空間結(jié)構(gòu)信息與自然連續(xù)的人類動作軌跡。相較于現(xiàn)有以仿真或擺拍為主的數(shù)據(jù),這類真實任務(wù)數(shù)據(jù)在規(guī)模、多樣性與真實性上均具有顯著優(yōu)勢,并通過豐富的 3D 空間線索,支持對海量物體進行精細的空間理解與語義解析。(2)訓(xùn)練場仿真數(shù)據(jù):依托虛實孿生的具身智能訓(xùn)練場,通過高保真 3D 物理環(huán)境重建與逼真的物體資產(chǎn)構(gòu)建,生成大規(guī)模物理仿真數(shù)據(jù)與仿真遙操作數(shù)據(jù),為模型提供可控、可擴展、可重復(fù)的訓(xùn)練條件。

依托全新的模型架構(gòu)和海量的真實預(yù)訓(xùn)練數(shù)據(jù),模型開發(fā)的效率被大大提升,適配所需的數(shù)據(jù)極少(甚至只需一條示例數(shù)據(jù)),所涉及的參數(shù)規(guī)模也極?。ɡ缭跀?shù)百億參數(shù)的模型中,僅更新約 4000個參數(shù))。更重要的是模型便能在新環(huán)境中實現(xiàn)在線快速適配。以家庭機器人為例:一個家務(wù)機器人,不再需要漫長的學(xué)習(xí)和適應(yīng)的步驟,只需對新的空間布局進行快速建模,就能立即投入使用。

拓元智慧也在這樣的預(yù)期下,自成立伊始就獲得了資本市場的大量關(guān)注。自2022年成立至今,拓元智慧先后完成了多輪市場化融資,投資方涵蓋卓源資本、源數(shù)資本、紅鳥啟航基金、銀杏谷資本等市場化機構(gòu),以及粵科金融集團、鵬城愿景基金等國資背景的平臺。

而本輪投資方均在其專注領(lǐng)域擁有深厚的資源背景與戰(zhàn)略布局,進一步確認了資本市場對拓元智慧技術(shù)與發(fā)展前景的認可。 例如本次投資方之一東方精工聚焦高端智能裝備制造龍頭企業(yè)。目前,東方精工以“構(gòu)建具身智能機器人全產(chǎn)業(yè)鏈生態(tài)、賦能傳統(tǒng)產(chǎn)業(yè)智能化升級”為核心,前瞻性布局人工智能+具身智能機器人賽道,已形成覆蓋機器人本體制造、多模態(tài)大模型智能大腦端研發(fā)、應(yīng)用場景拓展的全產(chǎn)業(yè)布局。

星宸科技是全球領(lǐng)先的視覺AI SoC芯片設(shè)計企業(yè),視覺AI SoC全球市占率第一(出貨量第一)、機器人視覺AI SoC市占率位居全球第二?;凇耙曈X+AI”的核心框架及“感知+計算+連接”的核心能力,專注為智慧視覺、智慧出行、智能機器人、智能家居、智能辦公、智能工業(yè)等端邊側(cè)設(shè)備提供 AI SoC 解決方案。

德韜資本是金牌家居及建潘集團的產(chǎn)業(yè)投資平臺,圍繞“泛家居產(chǎn)業(yè)互聯(lián)網(wǎng)生態(tài)平臺”布局戰(zhàn)略投資,聚焦泛家居產(chǎn)業(yè)鏈、人工智能、機器人、智能家居、工業(yè)互聯(lián)網(wǎng)等領(lǐng)域,致力深耕產(chǎn)業(yè)提升價值,加強產(chǎn)業(yè)科技孵化、賦能服務(wù)產(chǎn)業(yè)鏈、培育產(chǎn)業(yè)細分龍頭、建設(shè)泛家居產(chǎn)業(yè)生態(tài)、打造泛家居產(chǎn)業(yè)互聯(lián)網(wǎng)。目前管理6只基金,以“資本+產(chǎn)業(yè)+科技+平臺”模式驅(qū)動產(chǎn)業(yè)發(fā)展。

石溪資本由集成電路存儲龍頭企業(yè)與投資團隊發(fā)起設(shè)立,長期聚焦于硬科技等前沿領(lǐng)域的投資,在半導(dǎo)體、人工智能等領(lǐng)域有著廣泛布局,通過產(chǎn)業(yè)資源對接、技術(shù)賦能等方式助力被投企業(yè)成長。石溪資本管理多達十余支基金,目前累計投資項目近60個,其中多家企業(yè)已成功上市。

李飛飛曾經(jīng)在演講中引用過哲學(xué)家路德維?!ぞS特根斯坦的名言“我的語言的局限性就是我的世界的局限性”,說:“至少對于人工智能來說,世界遠不止是文字”。可以想象,通過本輪融資獲得更多產(chǎn)業(yè)方支持、與更多實際生產(chǎn)場景發(fā)生直接關(guān)聯(lián)的拓元能夠進一步驗證VWA的適用性,而VWA也將在不斷地磨合過程中進一步優(yōu)化,最終推動那個遙遠的目標——世界模型——真正完成兌現(xiàn)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
向高市早苗表忠心僅1天,張本被扒底朝天,終是為父母的錯誤買單

向高市早苗表忠心僅1天,張本被扒底朝天,終是為父母的錯誤買單

現(xiàn)代小青青慕慕
2025-12-19 09:21:21
快訊!俄媒:普京稱,俄羅斯軍隊正在沿整條接觸線推進

快訊!俄媒:普京稱,俄羅斯軍隊正在沿整條接觸線推進

環(huán)球網(wǎng)資訊
2025-12-19 17:49:02
中學(xué)生務(wù)工時在公司宿舍被打致死,施暴者無刑責(zé)能力 父母起訴多方索賠144萬,一審判了

中學(xué)生務(wù)工時在公司宿舍被打致死,施暴者無刑責(zé)能力 父母起訴多方索賠144萬,一審判了

紅星新聞
2025-12-19 17:06:17
15歲女孩遭同班14歲男生殺害,案發(fā)后還淡定跟隨家人外出采蘑菇

15歲女孩遭同班14歲男生殺害,案發(fā)后還淡定跟隨家人外出采蘑菇

半島晨報
2025-12-19 09:48:45
臺媒:臺北捷運無差別攻擊案嫌犯墜樓身亡

臺媒:臺北捷運無差別攻擊案嫌犯墜樓身亡

界面新聞
2025-12-19 20:27:10
上海至嘉興南高鐵票需936元?12306客服:系環(huán)線列車,途經(jīng)17個站點,選擇旅游次票只需要61元

上海至嘉興南高鐵票需936元?12306客服:系環(huán)線列車,途經(jīng)17個站點,選擇旅游次票只需要61元

極目新聞
2025-12-19 17:46:43
邢自強:如果房地產(chǎn)不實現(xiàn)止跌回穩(wěn),很難打破消費疲軟等問題

邢自強:如果房地產(chǎn)不實現(xiàn)止跌回穩(wěn),很難打破消費疲軟等問題

新浪財經(jīng)
2025-12-18 15:48:03
TA:告別或許臨近,瓜迪奧拉為英超留下了獨一無二的時代

TA:告別或許臨近,瓜迪奧拉為英超留下了獨一無二的時代

懂球帝
2025-12-19 14:05:11
越南多家銀行調(diào)升6個月定期存款年息至7.5%

越南多家銀行調(diào)升6個月定期存款年息至7.5%

越南語學(xué)習(xí)平臺
2025-12-19 10:35:59
本田將暫停在華工廠生產(chǎn)

本田將暫停在華工廠生產(chǎn)

第一財經(jīng)資訊
2025-12-18 13:51:09
馬未都為龐家后人發(fā)聲,犀利點出關(guān)鍵,揭開南京博物院“遮羞布”

馬未都為龐家后人發(fā)聲,犀利點出關(guān)鍵,揭開南京博物院“遮羞布”

好賢觀史記
2025-12-19 16:40:00
海南封關(guān),新加坡的沉默震耳欲聾!

海南封關(guān),新加坡的沉默震耳欲聾!

環(huán)球策論
2025-12-18 22:39:23
稅務(wù)局回應(yīng)大廳凳子被指形似刑具:大家反饋坐著很舒服,專門定做的,采購經(jīng)過正規(guī)審批,價格比市場便宜

稅務(wù)局回應(yīng)大廳凳子被指形似刑具:大家反饋坐著很舒服,專門定做的,采購經(jīng)過正規(guī)審批,價格比市場便宜

觀威海
2025-12-18 10:18:04
突發(fā)!湛江帥哥何聰宇去世,年僅20歲,常吃雌激素,知情人曝細節(jié)

突發(fā)!湛江帥哥何聰宇去世,年僅20歲,常吃雌激素,知情人曝細節(jié)

裕豐娛間說
2025-12-19 08:45:53
美航母艦隊進戰(zhàn)位,委電話打到北京,救不救馬杜羅?王毅斬釘截鐵

美航母艦隊進戰(zhàn)位,委電話打到北京,救不救馬杜羅?王毅斬釘截鐵

芊芊子吟
2025-12-19 10:40:13
警方查處一涉黃洗浴場,抓獲賣淫嫖娼人員14人,已對涉嫌組織賣淫者立案偵查

警方查處一涉黃洗浴場,抓獲賣淫嫖娼人員14人,已對涉嫌組織賣淫者立案偵查

觀威海
2025-12-19 14:34:18
突發(fā)重磅:歐盟達成協(xié)議,為烏克蘭提供900億歐元援助!

突發(fā)重磅:歐盟達成協(xié)議,為烏克蘭提供900億歐元援助!

近距離
2025-12-19 12:53:57
“南京博物院藏仇英名作現(xiàn)身拍賣市場”追蹤

“南京博物院藏仇英名作現(xiàn)身拍賣市場”追蹤

新華社
2025-12-19 00:20:41
突發(fā)!又一保險公司“人去樓空”,CEO被帶走調(diào)查?

突發(fā)!又一保險公司“人去樓空”,CEO被帶走調(diào)查?

毒sir財經(jīng)
2025-12-18 23:25:25
黑色幽默!電詐園區(qū)辦公室中文標語,簡直是天大的諷刺

黑色幽默!電詐園區(qū)辦公室中文標語,簡直是天大的諷刺

詩意世界
2025-12-19 09:00:03
2025-12-19 20:44:49
投中網(wǎng) incentive-icons
投中網(wǎng)
創(chuàng)新經(jīng)濟的智識與洞見
11959文章數(shù) 15342關(guān)注度
往期回顧 全部

科技要聞

許四清:具身智能的"ChatGPT時刻"還未到來

頭條要聞

美方"國防授權(quán)法案"塞入涉臺錯誤內(nèi)容 國臺辦回應(yīng)

頭條要聞

美方"國防授權(quán)法案"塞入涉臺錯誤內(nèi)容 國臺辦回應(yīng)

體育要聞

“惡龍”埃托奧,正在毀滅喀麥隆足球

娛樂要聞

曲協(xié)表態(tài)僅6天,郭德綱擔(dān)心的事還是發(fā)生

財經(jīng)要聞

日元加息,恐慌來了?貨幣三國殺

汽車要聞

“一體壓鑄”再引熱議 一旦受損真的修不起嗎?

態(tài)度原創(chuàng)

本地
藝術(shù)
游戲
房產(chǎn)
親子

本地新聞

云游安徽|訪黃山云海古村,讀一城山水風(fēng)骨

藝術(shù)要聞

諸樂三的寫意花鳥

POE2新職業(yè)竟能化身為龍!福利狂歡來襲,免費周末殺瘋了!

房產(chǎn)要聞

廣州有態(tài)度,一座國際化社區(qū)給出的城市答案

親子要聞

幼師專業(yè)大幅縮招,去年幼兒園教師減少超24萬

無障礙瀏覽 進入關(guān)懷版