国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

起底機(jī)器人黑馬GEN-0:坐擁27萬小時(shí)真實(shí)數(shù)據(jù),前谷歌DeepMind天團(tuán)神秘亮劍

0
分享至



出品|搜狐科技

作者|常博碩

編輯|楊 錦

近日,AI機(jī)器人公司Generalist發(fā)布了GEN-0,一個(gè)參數(shù)量超過10B的具身基礎(chǔ)模型。作為首個(gè)驗(yàn)證了具身智能規(guī)模定律(Embodied Scaling Law)的機(jī)器人通用基礎(chǔ)模型,GEN-0的發(fā)布也被譽(yù)為機(jī)器人領(lǐng)域的“ChatGPT時(shí)刻”。

模型一經(jīng)發(fā)布便引起了大量討論,更有業(yè)內(nèi)人士認(rèn)為,這標(biāo)志著機(jī)器人行業(yè)的一個(gè)關(guān)鍵轉(zhuǎn)折點(diǎn),行業(yè)正從主要依賴于模擬訓(xùn)練或?qū)iT工程控制的“仿真時(shí)代”,邁向一個(gè)由大規(guī)模真實(shí)世界數(shù)據(jù)驅(qū)動(dòng)的時(shí)代。


海量真實(shí)數(shù)據(jù)

一步踏入Scaling Law

GEN-0是由美國(guó)機(jī)器人公司Generalist AI推出的一類具身基礎(chǔ)模型。它與大語言模型類似,是一個(gè)多模態(tài)模型,但專門針對(duì)機(jī)器人執(zhí)行物理任務(wù)而設(shè)計(jì)。

GEN-0繼承了視覺-語言模型的優(yōu)勢(shì),同時(shí)原生支持感知與動(dòng)作輸出,可以捕捉人類級(jí)別的反射行為和物理常識(shí)。在官方演示中,機(jī)器人能自主完成從拿取托盤、清潔、取放零件、封裝的長(zhǎng)時(shí)序操作,整個(gè)過程無需人工分步指令,一氣呵成。


在訓(xùn)練上,GEN-0的預(yù)訓(xùn)練直接使用的是真實(shí)世界的高保真物理交互數(shù)據(jù),而不依賴仿真環(huán)境或人類示范視頻去做訓(xùn)練。

目前,Generalist已經(jīng)構(gòu)建了一個(gè)前所未有的真實(shí)世界操作數(shù)據(jù)集,總時(shí)長(zhǎng)超過27萬小時(shí),每周新增數(shù)據(jù)超過1萬小時(shí)。對(duì)27萬小時(shí)數(shù)據(jù)量沒有概念的話,可以參考這張官方發(fā)布的對(duì)比圖,對(duì)比了和目前國(guó)外一些公司訓(xùn)練數(shù)據(jù)規(guī)模的差異。


不僅如此,這個(gè)數(shù)據(jù)集涵蓋了數(shù)千種任務(wù)與場(chǎng)景,從家庭廚房的削土豆,到工廠車間的擰螺絲、包裝組裝,從商店架上的拿取物品,到快餐店的操作,每種任務(wù)都有海量真實(shí)軌跡記錄。

這樣的訓(xùn)練數(shù)據(jù),使得模型學(xué)到的不是理想狀態(tài)下的動(dòng)作,而是如何在滑動(dòng)、遮擋、光照變化等擾動(dòng)下完成任務(wù)。官方表示,他們發(fā)現(xiàn)數(shù)據(jù)質(zhì)量和多樣性比絕對(duì)數(shù)量更關(guān)鍵,混合不同任務(wù)和環(huán)境的數(shù)據(jù)能讓模型學(xué)到更有用的技能。

同時(shí)據(jù)官方稱,這種高數(shù)據(jù)量已經(jīng)揭示了兩個(gè)迄今為止業(yè)界一直未能發(fā)現(xiàn)的關(guān)鍵結(jié)論。

目前,機(jī)器人領(lǐng)域的基礎(chǔ)模型其實(shí)主要基于視覺-語言預(yù)訓(xùn)練,這樣也就意味著可以將現(xiàn)有的多模態(tài)模型的語義泛化優(yōu)勢(shì)遷移過來。但是,機(jī)器人模型Scaling Law問題一直是業(yè)界難題,也就是說目前還沒有一種很好的方式或者研究可以證明機(jī)器人的智能確實(shí)能隨著算力和數(shù)據(jù)的增加而持續(xù)提升。

但是Generalist在這方面取得了突破,這也是行業(yè)對(duì)其贊不絕口的重要原因之一。

第一是GEN-0首次在機(jī)器人領(lǐng)域?qū)嶒?yàn)證明了規(guī)模定律(Scaling Law)的適用性,即隨著模型和數(shù)據(jù)規(guī)模的增加,性能遵循可預(yù)測(cè)的冪律關(guān)系持續(xù)提升。

研究團(tuán)隊(duì)從不同規(guī)模的預(yù)訓(xùn)練模型出發(fā),對(duì)語言條件下的16個(gè)任務(wù)集進(jìn)行微調(diào),結(jié)果顯示更多預(yù)訓(xùn)練數(shù)據(jù)始終帶來更低的后訓(xùn)練誤差。這種可量化的關(guān)系也讓人們能夠估算要達(dá)到特定性能水平需要多少數(shù)據(jù)和算力,為機(jī)器人研發(fā)提供了明確路線。

北京大學(xué)人工智能研究院陳寶權(quán)教授在朋友圈感嘆:“這個(gè)Generalist‘通才’具身基礎(chǔ)大模型相當(dāng)重磅! 如此,scaling law繼續(xù)高歌猛進(jìn)!”

除此之外,GEN-0的研究團(tuán)隊(duì)發(fā)現(xiàn),機(jī)器人智能存在清晰的“相變閾值”。當(dāng)模型規(guī)模不足時(shí),即使增加數(shù)據(jù),性能也會(huì)停滯不前,但一旦超過閾值,性能則開始呈指數(shù)級(jí)提升。下圖直觀地展示了這一現(xiàn)象:1B參數(shù)(藍(lán)線)模型在訓(xùn)練初期便出現(xiàn)固化(誤差不再下降),而6B(綠)和7B(黃)模型隨著算力和數(shù)據(jù)的增加持續(xù)改進(jìn)。


官方表明,7B參數(shù)是這一閾值的關(guān)鍵點(diǎn),低于7B的模型難以消化海量物理交互數(shù)據(jù),表現(xiàn)出學(xué)習(xí)停滯,超過7B后,模型能有效內(nèi)化更多經(jīng)驗(yàn),并只需極少的后訓(xùn)練就能適應(yīng)新任務(wù)。

Generalist 的實(shí)驗(yàn)表明,物理世界中的智能在算力方面可能有一個(gè)更高的激活閾值。這一發(fā)現(xiàn)也印證了莫拉維克悖論,很多人類看來輕而易舉的感知和操作,反而需要更高的計(jì)算復(fù)雜度。

GEN-0還有一個(gè)核心架構(gòu)創(chuàng)新,叫作和諧推理(Harmonic Reasoning)。傳統(tǒng)機(jī)器人通常會(huì)將規(guī)劃與執(zhí)行拆分為兩個(gè)階段,但放在實(shí)時(shí)物理環(huán)境中,這種操作存在一個(gè)根本性問題:物理世界不會(huì)暫停等待決策。

對(duì)于語言模型來說,在回應(yīng)前花更多時(shí)間思考是可以接受的,但對(duì)于在現(xiàn)實(shí)世界中行動(dòng)的機(jī)器人而言,一個(gè)思考時(shí)間過長(zhǎng)的機(jī)器人就顯得尤為奇怪了。

為此,GEN-0采用了一種很新穎的訓(xùn)練方法,使模型能夠在連續(xù)的時(shí)間流中同時(shí)處理感知輸入和動(dòng)作輸出??梢岳斫鉃?,模型還在觀察的同時(shí)就開始規(guī)劃動(dòng)作,這種設(shè)計(jì)為機(jī)器人創(chuàng)造了感知和執(zhí)行之間一種比較和諧的互動(dòng)。

通過這種方式,GEN-0無需依賴常見的“系統(tǒng)1-系統(tǒng)2”架構(gòu)或預(yù)先規(guī)劃模塊,就可以擴(kuò)展到非常大的規(guī)模,支持復(fù)雜物理場(chǎng)景中的實(shí)時(shí)決策,也讓機(jī)器人能夠更接近人類的反應(yīng)方式,顯著提高了在動(dòng)態(tài)環(huán)境中的魯棒性。


神秘的具身獨(dú)角獸

這家神秘的公司Generalist AI,是美國(guó)硅谷一家機(jī)器人初創(chuàng)公司,官網(wǎng)表示公司愿景是做通用機(jī)器人和具身基礎(chǔ)模型。

Generalist AI首次闖入人們的視野其實(shí)是在今年3月召開的英偉達(dá)GTC的一個(gè)小組討論會(huì)上。當(dāng)時(shí),谷歌 DeepMind 高級(jí)研究科學(xué)家、RT-2的作者皮特·弗洛倫斯(Pete Florence)以 Generalist AI聯(lián)合創(chuàng)始人兼首席執(zhí)行官的身份出席了該會(huì)議。

今年六月,皮特在社交媒體上公開表示,自己去年春天離開了谷歌DeepMind,之后一直與一支新的出色團(tuán)隊(duì)埋頭苦干。


Pete本科就讀于普林斯頓大學(xué)攻讀化學(xué)專業(yè),畢業(yè)后并未延續(xù)化學(xué)方向,而是轉(zhuǎn)向劍橋大學(xué),攻讀物理碩士,并于2013年獲得學(xué)位,但化學(xué)與物理并未成為他的研究終點(diǎn)。

2014年,Pete加入MIT的計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL),在Russ Tedrake教授領(lǐng)導(dǎo)的Robot Locomotion實(shí)驗(yàn)室攻讀博士。

在創(chuàng)業(yè)之前前,Pete曾在Google DeepMind擔(dān)任高級(jí)研究科學(xué)家,參與了大部分具身與大模型相關(guān)的大型項(xiàng)目,其中包括谷歌于2023年發(fā)布的多模態(tài)具身視覺語言模型PaLM-E以及全球首個(gè)視覺-語言-動(dòng)作模型RT-2。

Andy Barry是Generalist AI的聯(lián)合創(chuàng)始人兼CTO。他本科畢業(yè)于富蘭克林·W·奧林工程學(xué)院,此后便在MIT計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)直博,獲得機(jī)器人學(xué)博士學(xué)位。

Andy和Pete其實(shí)是同門師兄弟,兩人都是Russ教授的得意門生,也因此結(jié)緣。在Generalist AI之前,兩人還曾一起創(chuàng)立過一家教育工坊(workshop)“STAGE ONE EDUCATION”,專門用以通俗易懂的方式教小孩子最基礎(chǔ)的計(jì)算機(jī)知識(shí)。

在加入Generalist AI之前,Andy曾在波士頓動(dòng)力公司擔(dān)任高級(jí)機(jī)器人科學(xué)家,期間還參與了Spot機(jī)器狗的機(jī)械臂項(xiàng)目研發(fā)。

另一位聯(lián)合創(chuàng)始人兼首席科學(xué)家是Andy Zeng,曾任Google DeepMind的研究科學(xué)家及技術(shù)負(fù)責(zé)人,具身智能領(lǐng)域頗有建樹的華人代表。

Andy本科以數(shù)學(xué)與計(jì)算機(jī)雙學(xué)位畢業(yè)于加州大學(xué)伯克利分校。隨后,他前往普林斯頓大學(xué)攻讀計(jì)算機(jī)科學(xué)博士,研究方向集中于機(jī)器人操作、機(jī)器學(xué)習(xí)與計(jì)算機(jī)視覺的交叉融合。

他與創(chuàng)始人Pete Florence相識(shí)于谷歌。Andy早在2018年就進(jìn)入Google實(shí)習(xí),兩人至今已聯(lián)合發(fā)表超過17篇論文。

就領(lǐng)英和推特信息來看,Generalist AI核心團(tuán)隊(duì)的其他成員絕大多數(shù)都畢業(yè)于頂尖高校并極具行業(yè)經(jīng)驗(yàn),不少人曾在OpenAI、Google DeepMind、波士頓動(dòng)力、特斯拉等機(jī)構(gòu)擔(dān)任關(guān)鍵角色,研究背景涵蓋從大模型訓(xùn)練、強(qiáng)化學(xué)習(xí)研究到機(jī)器人控制系統(tǒng)開發(fā)等。

創(chuàng)始人Pete Florence曾說:“我們的目標(biāo)非常堅(jiān)定,就是要造出能夠做任何事情的機(jī)器人?!庇袠I(yè)內(nèi)從業(yè)者對(duì)搜狐科技表示,在他看來Generalist AI極具野心,未來很有可能涉足機(jī)器人硬件和本體。

至此,具身賽道又迎來了一位野心勃勃的新玩家。



運(yùn)營(yíng)編輯 |曹倩審核|孟莎莎




特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
哈登34+6,快船三連勝!大洛9記三分,一戰(zhàn)看清三位球星真實(shí)發(fā)揮

哈登34+6,快船三連勝!大洛9記三分,一戰(zhàn)看清三位球星真實(shí)發(fā)揮

老梁體育漫談
2025-12-27 13:40:40
73歲普京高調(diào)認(rèn)愛,這就是相差41歲的“一見鐘情”

73歲普京高調(diào)認(rèn)愛,這就是相差41歲的“一見鐘情”

吃瓜局
2025-12-26 15:30:08
精準(zhǔn)斬首!泰國(guó)無人機(jī)斬首行動(dòng)震驚東南亞!洪森指揮鏈遭團(tuán)滅!

精準(zhǔn)斬首!泰國(guó)無人機(jī)斬首行動(dòng)震驚東南亞!洪森指揮鏈遭團(tuán)滅!

深度報(bào)
2025-12-24 22:47:16
被排隊(duì)斬殺的美國(guó)人為什么不反抗?

被排隊(duì)斬殺的美國(guó)人為什么不反抗?

觀雨大神經(jīng)
2025-12-26 19:55:35
布克30+9+5+末節(jié)12分,湖人退貨中鋒肆虐內(nèi)線,太陽力克鵜鶘

布克30+9+5+末節(jié)12分,湖人退貨中鋒肆虐內(nèi)線,太陽力克鵜鶘

釘釘陌上花開
2025-12-27 11:43:14
多家博物館公告:暫停開放

多家博物館公告:暫停開放

深圳晚報(bào)
2025-12-26 23:58:02
僅維持8天,越南高鐵夢(mèng)碎了,越南首富緊急撤資,中國(guó)幸運(yùn)避坑!

僅維持8天,越南高鐵夢(mèng)碎了,越南首富緊急撤資,中國(guó)幸運(yùn)避坑!

博覽歷史
2025-12-26 19:12:15
“蹭準(zhǔn)毒品擦邊球”?霸王茶姬回應(yīng)高濃度咖啡因爭(zhēng)議

“蹭準(zhǔn)毒品擦邊球”?霸王茶姬回應(yīng)高濃度咖啡因爭(zhēng)議

深圳晚報(bào)
2025-12-26 23:58:38
韓束:旗下所有產(chǎn)品均未添加人表皮生長(zhǎng)因子成分

韓束:旗下所有產(chǎn)品均未添加人表皮生長(zhǎng)因子成分

界面新聞
2025-12-27 13:43:31
關(guān)于在烏克蘭的傷亡,做一道簡(jiǎn)單計(jì)算題:參戰(zhàn)的90萬俄軍去哪兒了

關(guān)于在烏克蘭的傷亡,做一道簡(jiǎn)單計(jì)算題:參戰(zhàn)的90萬俄軍去哪兒了

鷹眼Defence
2025-12-26 18:03:30
越南這場(chǎng)鬧劇,終于還是沒演下去,670億美金的高鐵夢(mèng)徹底碎了!

越南這場(chǎng)鬧劇,終于還是沒演下去,670億美金的高鐵夢(mèng)徹底碎了!

青青子衿
2025-12-27 02:06:04
M豆吳夢(mèng)夢(mèng)接受BBC專訪:我的人生就沒有婚姻這個(gè)選項(xiàng)

M豆吳夢(mèng)夢(mèng)接受BBC專訪:我的人生就沒有婚姻這個(gè)選項(xiàng)

吃瓜黨二號(hào)頭目
2025-12-27 11:23:24
一場(chǎng)1-0!讓曼聯(lián)進(jìn)前5,歐冠近在咫尺:和切爾西同分,3豪門爭(zhēng)四

一場(chǎng)1-0!讓曼聯(lián)進(jìn)前5,歐冠近在咫尺:和切爾西同分,3豪門爭(zhēng)四

體育知多少
2025-12-27 08:15:48
80輛油罐車駛?cè)肜蠐?,疑似向柬埔寨輸送,柬工業(yè)體系究竟有多爛?

80輛油罐車駛?cè)肜蠐?,疑似向柬埔寨輸送,柬工業(yè)體系究竟有多爛?

百科密碼
2025-12-26 14:21:30
大量博物館的閉館通知,元旦假期馬上來了為什么要閉館?

大量博物館的閉館通知,元旦假期馬上來了為什么要閉館?

歷史總在押韻
2025-12-26 21:34:35
太稀罕了!深圳一家公司通知供應(yīng)商趕緊對(duì)賬,12月底結(jié)清所有貨款

太稀罕了!深圳一家公司通知供應(yīng)商趕緊對(duì)賬,12月底結(jié)清所有貨款

火山詩話
2025-12-27 09:04:18
“AI教母”李飛飛最新采訪:K12教育是浪費(fèi)學(xué)生時(shí)間,靠AI都可以做到

“AI教母”李飛飛最新采訪:K12教育是浪費(fèi)學(xué)生時(shí)間,靠AI都可以做到

智車星球
2025-12-24 22:53:38
剛剛,美國(guó)發(fā)出最高預(yù)警:疫情已完全失控!2026年人類面臨大考?

剛剛,美國(guó)發(fā)出最高預(yù)警:疫情已完全失控!2026年人類面臨大考?

徐德文科學(xué)頻道
2025-12-26 20:21:51
爆料!徐湖平添“新案”:借他人收藏品丟失,拿南博明代畫抵償

爆料!徐湖平添“新案”:借他人收藏品丟失,拿南博明代畫抵償

娜烏和西卡
2025-12-27 10:38:23
AI大神吳恩達(dá):很多計(jì)算機(jī)專業(yè)應(yīng)屆生找不到工作,是因?yàn)楦咝Un程嚴(yán)重滯后

AI大神吳恩達(dá):很多計(jì)算機(jī)專業(yè)應(yīng)屆生找不到工作,是因?yàn)楦咝Un程嚴(yán)重滯后

爆角追蹤
2025-12-27 12:33:54
2025-12-27 13:59:00
搜狐科技 incentive-icons
搜狐科技
搜狐科技官方賬號(hào)
4620文章數(shù) 9175關(guān)注度
往期回顧 全部

科技要聞

小米也漲價(jià)了!業(yè)界稱終端再不漲明年必虧

頭條要聞

美國(guó)聯(lián)邦政府終止撥款加州高鐵 美國(guó)加州撤銷相關(guān)訴訟

頭條要聞

美國(guó)聯(lián)邦政府終止撥款加州高鐵 美國(guó)加州撤銷相關(guān)訴訟

體育要聞

NBA教練圈的布朗尼,花了22年證明自己

娛樂要聞

劉宇寧:我的價(jià)值不需要靠番位來證明

財(cái)經(jīng)要聞

注意,開始拉物價(jià)了!

汽車要聞

好音響比大屏更重要?車企開始“聽”用戶的

態(tài)度原創(chuàng)

健康
手機(jī)
旅游
家居
軍事航空

這些新療法,讓化療不再那么痛苦

手機(jī)要聞

聯(lián)發(fā)科34%份額再度登頂Q3全球手機(jī)芯片市場(chǎng),持續(xù)領(lǐng)跑背后的秘訣

旅游要聞

長(zhǎng)白山“云頂天宮”回歸 上演震撼燈光秀

家居要聞

格調(diào)時(shí)尚 智慧品質(zhì)居所

軍事要聞

英法德三國(guó)領(lǐng)導(dǎo)人通話 重申對(duì)烏支持

無障礙瀏覽 進(jìn)入關(guān)懷版