国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

這位“天才少年”野心勃勃,要壟斷全球人形機(jī)器人的“大腦”?

0
分享至

至于人形機(jī)器人“笨”的原因,王興興坦言“如今泛用性的AI還是不太夠?!彼硎?,全球都在等待真正的機(jī)器人“大腦”的誕生。

如今的人形機(jī)器人,個個都“沒頭腦”。

對這些人形機(jī)器人的控制,依賴的是程序員“預(yù)先編好的程序”,向機(jī)器人輸入情況描述以及應(yīng)對方式的規(guī)則,使其在相應(yīng)情況下完成操作。

宇視科技創(chuàng)始人王興興在接受采訪時,曾通俗地解釋:“你能讓他(人形機(jī)器人)倒立、空翻,或者做一些避障,這些都是針對固定任務(wù)做了專門的AI訓(xùn)練”,是單一功能的AI。

譬如,人形機(jī)器人上春晚舞臺跳手絹舞這個復(fù)雜的任務(wù)場景,就可能是根據(jù)“預(yù)先編好的程序”進(jìn)行的訓(xùn)練。

但是,一旦場景和任務(wù)稍微換一下,人形機(jī)器人的成功率就會暴跌。

就像在春晚表演完后,人形機(jī)器人離開舞臺,就需要有人幫助“掐住脖子”。面對劉謙的握手邀請,人形機(jī)器人竟突然下跪癱倒。

甚至于,控制人形機(jī)器人,有時還需要工作人員通過遙控器來操作。

某種程度上,這些人形機(jī)器人就是一個個提線木偶、遙控玩具,稱不上“人”,因?yàn)樗鼈儭皼]頭腦”。

這也是人形機(jī)器人很難快速量產(chǎn)的原因,沒有消費(fèi)者愿意為一個不夠聰明的人形機(jī)器人買單?!氨康啊比诵螜C(jī)器人,又能如何應(yīng)對我們的物理世界千變?nèi)f化的情況?

人形機(jī)器人“大腦”研發(fā),無疑是一個很有意思的賽道。

彭志輝就對這個賽道十分感興趣。

作為曾經(jīng)的華為“天才少年”,彭志輝年薪一度高達(dá)200萬元。他離職創(chuàng)業(yè),自然不同于一般的創(chuàng)業(yè)者。

他有著更高追求,其創(chuàng)立的智元公司沒跟隨同行、將重心放在機(jī)器人軀體上,而是放在機(jī)器人“大腦”上。

近期,智元公司發(fā)布了首個通用具身基座模型——智元啟元大模型Genie Operator-1(GO-1),標(biāo)志著國內(nèi)機(jī)器人從單一功能向多場景泛化的技術(shù)突破。

GO-1看似回答了王興興的“泛用性的AI還是不太夠”的問題,但距真正的機(jī)器人“大腦”還有一段距離。

而彭志輝與智元機(jī)器人的“野心”:希望未來所有機(jī)器人都能共享同一個“大腦”——GO-1,或無法實(shí)現(xiàn)。

并非“首家”

截至目前,人形機(jī)器人“炫耀性”作用遠(yuǎn)大于實(shí)際作用。

人形機(jī)器人從來都不是新鮮事物。

過去幾十年,世界各地都有各種人形機(jī)器人研發(fā)出來。文藝作品也不停地演繹著人形機(jī)器人的“無所不能”,人們對這一形象十分熟悉。

但《刃辛機(jī)器人》了解到,我們生活生產(chǎn)中卻很少有人形機(jī)器人的應(yīng)用。

如今零星“進(jìn)廠打工”的,并非人形機(jī)器人,多為機(jī)械臂等各種形態(tài)的工業(yè)機(jī)器人,而且從事都是重復(fù)性、機(jī)械性的工作。

王興興創(chuàng)辦宇視科技之初,就沒有直接研發(fā)人形機(jī)器人,而是從雙足的機(jī)器狗產(chǎn)品開始。他在2009年就嘗試過做人形機(jī)器人,認(rèn)為太復(fù)雜了,無法駕馭。

直到AI大模型的出現(xiàn),為人形機(jī)器人帶來了新的想象力。

簡單來講,借助大模型,將語義理解能力和推理生成能力引入其中,就相當(dāng)于給人形機(jī)器人裝上了“大腦”,能夠理解世界和人類,真正地為人類服務(wù)。

但,這僅僅存在于“想象”階段,如王興興所言,如今泛用性AI還不夠,即用于人形機(jī)器人的具身智能大模型并不成熟。

ChatGPT、Deepseek等AI大模型,是無法直接用到人形機(jī)器人上,為其充當(dāng)“大腦”的。人形機(jī)器人要通往AGI,需要專門針對具身智能領(lǐng)域的多模態(tài)大模型 —— 具身智能大模型,來提升機(jī)器人在感知、決策、控制、交互等方面的能力。

具身智能大模型是基于AI技術(shù)打造,專門賦能人形機(jī)器人,幫助人形機(jī)器人實(shí)現(xiàn)在通用應(yīng)用場景下的落的專用大模型。

ChatGPT、Deepseek等非具身智能大模型服務(wù)的對象是人類,輸出的內(nèi)容是給人看或者給人讀,更多還是在人機(jī)交互、內(nèi)容生成等方面展現(xiàn)價值。

具身智能大模型的服務(wù)對象是機(jī)器,其輸出的內(nèi)容是需要機(jī)器人能夠理解,并最終要轉(zhuǎn)化為具體可執(zhí)行動作的控制指令,從而與周圍環(huán)境進(jìn)行交互,并做出各種動作。

智元機(jī)器人推出的GO-1,絕非國內(nèi)第一個具身智能大模型。在此之前,國內(nèi)一些機(jī)器人初創(chuàng)企業(yè)已經(jīng)開始推出自己的具身智能大模型。

譬如,有鹿機(jī)器人的Master 2000、若愚科技的九天大模型、千訣科技的千訣.機(jī)器人大模型、穹徹智能的Noematrix Brain、X square(自變量機(jī)器人)的Great Wall系列的WALL-A模型以及千尋智能的具身智能大模型……

GO-1僅僅是國內(nèi)首個通用具身基座模型。

所謂通用具身基座模型,采用模塊化架構(gòu)(如ViLLA框架),整合多模態(tài)大模型(VLM)、隱式規(guī)劃器和動作專家,支持跨本體適配和任務(wù)泛化,其重要的特點(diǎn)是泛用性。

簡而言之,GO-1是“啥都能干,但都不精”。

就像一個廚子,?能看菜譜學(xué)做菜(看人類視頻學(xué)習(xí)),今天炒川菜、明天做西餐(適配不同場景)?,甚至能用新買的廚具(跨本體硬件)。雖然做每道菜不是最頂尖的,但換菜單時不用重新買機(jī)器人(降低成本)。

陷“數(shù)據(jù)荒”

GO-1距離真正的人形機(jī)器人“大腦”有多遠(yuǎn)?

首先,不可否認(rèn)GO-1具有充當(dāng)人形機(jī)器人“大腦”的潛力。

GO-1通過ViLLA架構(gòu)實(shí)現(xiàn)多模態(tài)學(xué)習(xí),可利用人類視頻數(shù)據(jù)提升小樣本泛化能力,支持機(jī)器人從單一任務(wù)到開放場景的靈活切換。

例如,GO-1支持的智元機(jī)器人靈犀X2已能完成騎單車、縫葡萄等復(fù)雜任務(wù),并初步具備自然語言交互能力。

這表明GO-1具備整合感知、決策和執(zhí)行能力,符合“大腦”的核心需求。

GO-1還突破了傳統(tǒng)預(yù)設(shè)程序的限制,可結(jié)合語義推理執(zhí)行動態(tài)指令?。

例如,靈犀X2能通過自然語言指令完成充電協(xié)作、家務(wù)輔助等任務(wù),體現(xiàn)了從“工具”到“智能體”的轉(zhuǎn)變?。

其二,GO-1距離真正的人形機(jī)器人“大腦”還很遠(yuǎn)。從智元公司對這一大模型的訓(xùn)練過程,就可以得出這一結(jié)論。

當(dāng)初,智元公司決定構(gòu)建人形機(jī)器人“大腦”之后,就發(fā)現(xiàn)門檻太高。

眾所周知,大模型的訓(xùn)練是需要大量的數(shù)據(jù)投喂的。

ChatGPT、Deepseek等非具身智能大模型,在訓(xùn)練過程“吃”下去的數(shù)據(jù)可謂不計(jì)其數(shù)。單就ChatGPT,就已消化了全球互聯(lián)網(wǎng)2/3的文本語料。

人形機(jī)器人“大腦”所需“投喂”的數(shù)據(jù),更多的是動作數(shù)據(jù),因?yàn)樗鼈兪切枰袢艘粯舆M(jìn)行各種動作。

文本語料從互聯(lián)網(wǎng)中就可以獲得,但動作數(shù)據(jù)卻非常難找。

智元公司曾試圖尋找行業(yè)內(nèi)的開源數(shù)據(jù)庫,但發(fā)現(xiàn)高質(zhì)量、統(tǒng)一格式的數(shù)據(jù)幾乎不存在。

行業(yè)內(nèi)雖然開源了百萬條由真實(shí)機(jī)器人收集的訓(xùn)練數(shù)據(jù)集,但是這些數(shù)據(jù)實(shí)際上由不同公司、不同型號規(guī)格的機(jī)器人采集,數(shù)據(jù)質(zhì)量較低,達(dá)不到智元公司的要求。

智元公司決定“笨鳥先飛”,采取“笨辦法”,于2023年9月建立了動作數(shù)據(jù)采集工廠。在工廠里一比一地模仿人類生活中的每一個動作,將其采集下來,形成數(shù)據(jù),然后“喂”給大模型。

為此,他們搭建了家居、餐飲、商超、辦公和工業(yè)等五類應(yīng)用場景中。

在不同場景中,數(shù)據(jù)采集員們手持設(shè)備,手把手地控制人形機(jī)器人完成抓、握、放等動作。有時采集員頭戴VR設(shè)備,精準(zhǔn)地讓機(jī)器人模仿學(xué)習(xí)人類動作。

譬如,在臥室中,人形機(jī)器人乖巧地跟著采集員學(xué)習(xí)疊衣服。在餐桌前,機(jī)器人學(xué)著把餐具挨個擺放整齊,還要學(xué)會打餐各式菜肴,并且不會手抖。在商超收銀臺前,機(jī)器人一只手拿掃碼器,另一只手拿著商品掃碼。

人形機(jī)器人每完成一個動作,就能采集一套數(shù)據(jù)。這些數(shù)據(jù)聚集起來,上傳至云端,便被智元團(tuán)隊(duì)喂給大模型,從而讓機(jī)器人真正掌握一項(xiàng)技能,比如沖咖啡、熨衣服等。

笨鳥先飛,談何容易?

僅一個倒水的動作,大模型就需要“吃”下上萬條數(shù)據(jù)才能學(xué)會。而據(jù)36氪前幾個月的報(bào)道,一位采集員每天僅采集約150條數(shù)據(jù),工廠里的近百臺機(jī)器人日均采集條數(shù)據(jù)也才3至5萬條。

雖然僅僅幾個月,智元公司就積累了涉及217個任務(wù)的百萬條高質(zhì)量標(biāo)準(zhǔn)動作軌跡數(shù)據(jù),規(guī)模全球最大。但是,這些動作數(shù)據(jù),與ChatGPT“吃”下的全球互聯(lián)網(wǎng)2/3的文本語料的數(shù)量級相比,可謂少得可憐。

靠這些“少的可憐”的動作數(shù)據(jù),GO-1這樣的具身智能大模型又何時能夠達(dá)到ChatGPT的聰明程度呢?

野心難實(shí)現(xiàn)

AI大語言模型,如ChatGPT,之所以表現(xiàn)得聰明,是因?yàn)樵诓粩唷拔埂逼鋽?shù)據(jù)進(jìn)行訓(xùn)練后,量變引發(fā)質(zhì)變,使其在某個時間點(diǎn),突然出現(xiàn)的、難以預(yù)測的、超越了模型初始設(shè)計(jì)和預(yù)期的智能行為或能力,即“智能涌現(xiàn)”現(xiàn)象。

業(yè)內(nèi)稱此為?尺度定律。即,隨著模型參數(shù)、訓(xùn)練數(shù)據(jù)量和計(jì)算資源的指數(shù)級增長,模型的性能會以可預(yù)測的冪律(Power Law)方式提升?,甚至在某些任務(wù)中表現(xiàn)出“涌現(xiàn)”的智能能力。

具身智能大模型需要獲得ChatGPT這樣的聰明度,必須不斷“喂”動作數(shù)據(jù)。只要“喂”得足夠多,到某一天,具身智能大模型就會突然變得聰明起來,真的像真人“大腦”一樣了。

具身智能大模型需要“喂”多少數(shù)據(jù),才能像真人“大腦”呢?

智元公司采取的采集動作數(shù)據(jù)的“笨辦法”,堪稱龜速。業(yè)內(nèi)人士坦言:“如果只靠我們一個工廠采集數(shù)據(jù),采集1億條需要幾百年?!?/p>

目前,全球機(jī)器人動作數(shù)據(jù)相較于大語言模型的“核爆點(diǎn)”還差3-4個數(shù)量級。

智元公司目前想出的新對策,就是聯(lián)合同行一起采集數(shù)據(jù)。

智元公司首先對自己采集的數(shù)據(jù)開源,“不擔(dān)心因?yàn)閯e人拿走一些數(shù)據(jù)而被超越,另一方面也是希望有更多人成為同道中人?!贝蠹乙黄鸩杉瘮?shù)據(jù)。

GO-1的發(fā)布,就是為了解決數(shù)據(jù)不夠的問題。但是,這也隱藏了智元公司,以及其創(chuàng)始人彭志輝的一個野心,那就是“希望未來所有機(jī)器人都能共享同一個‘大腦’”,而這個大腦就是GO-1。

因?yàn)镚O-1的一大特點(diǎn)是泛化性好,能在不同機(jī)器人本體上部署。大家一起采集的數(shù)據(jù),可以通過GO-1這一通用具身基座模型共享。

GO-1作為首個通用具身基座模型,有著唯一性,若相關(guān)人形機(jī)器人公司沒有專用的具身智能模型,倒是可以共享數(shù)據(jù)。但是,如今很多人形機(jī)器人公司都有各自的具身智能模型,都在進(jìn)行數(shù)據(jù)“投喂”,進(jìn)行艱苦訓(xùn)練,為何要與GO-1共享數(shù)據(jù)?

GO-1要變“聰明”,所需數(shù)據(jù)可不少。智元公司到底聯(lián)合多少家公司一起采集數(shù)據(jù),才能符合?尺度定律,達(dá)到人形機(jī)器人“智能涌現(xiàn)”時刻呢?

僅靠幾家公司,顯然不行。哪怕聯(lián)合所有研發(fā)機(jī)器人“大腦”的公司,恐怕都不夠。

結(jié)語:或可借鑒自動駕駛訓(xùn)練模式

國內(nèi)的智能新能源汽車發(fā)展迅速,L3級自動駕駛汽車開始量產(chǎn)。

汽車能進(jìn)行自動駕駛,也經(jīng)過了大量相關(guān)數(shù)據(jù)“投喂”和訓(xùn)練。僅僅在物理世界采集汽車行駛路測所需的數(shù)據(jù),費(fèi)時費(fèi)力,而且無法完成。

據(jù)美國蘭德公司研究,自動駕駛汽車要保證絕對安全,需要110億英里(177億公里)的里程測試。假設(shè)由100輛車組成車隊(duì),每年365天每天24小時不間歇以28英里每小時的平均速度進(jìn)行測試,大概需要500年。

在激烈競爭中“存活”下來的車企,不可能采取這樣的“笨辦法”。它們的做法是仿真訓(xùn)練,即通過數(shù)學(xué)建模的方式將自動駕駛實(shí)際的應(yīng)用場景進(jìn)行數(shù)字化還原,建立盡可能接近真實(shí)世界的系統(tǒng)模型,從而進(jìn)行訓(xùn)練。

仿真訓(xùn)練的速度是物理世界路測的千倍、萬倍,這才使得自動駕駛發(fā)展如此迅速。

《刃辛機(jī)器人》認(rèn)為,人形機(jī)器人的具身智能大模型,也可借助仿真訓(xùn)練,更快地達(dá)到“智能涌現(xiàn)”時刻。

只是,相較于自動駕駛只需模擬道路及周邊環(huán)境等,具身智能大模型需要的仿真訓(xùn)練設(shè)計(jì)場景則多得多,復(fù)雜得多。(文/刃辛機(jī)器人 陳重山

參考資料

[1]《加緊建廠拼量產(chǎn),上海具身智能“獨(dú)角獸”為何強(qiáng)推這條路》,上觀、文匯報(bào),沈湫莎

[2]《我們?nèi)タ戳酥窃獧C(jī)器人的“數(shù)采廠”,等等!這不是<星球大戰(zhàn)>片場嗎?》,36氪、智能涌現(xiàn),田哲

[3] 《自動駕駛究竟需要什么樣的仿真?》,智車科技官方

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
鄭裕玲:分手時把呂方趕出豪宅,如今的她,印證了周潤發(fā)的那句話

鄭裕玲:分手時把呂方趕出豪宅,如今的她,印證了周潤發(fā)的那句話

君笙的拂兮
2026-01-11 23:46:50
再這么搞下去,中產(chǎn)家長們的崩塌就是早晚的事

再這么搞下去,中產(chǎn)家長們的崩塌就是早晚的事

重遠(yuǎn)投資觀
2026-01-10 20:55:25
伊朗宗教高層:若哈梅內(nèi)伊遭襲,將對美以發(fā)動全球圣戰(zhàn)

伊朗宗教高層:若哈梅內(nèi)伊遭襲,將對美以發(fā)動全球圣戰(zhàn)

桂系007
2026-01-12 00:23:38
馬克西38分76人加時惜敗猛龍 巴恩斯31+6+7故意兩罰一中準(zhǔn)絕殺

馬克西38分76人加時惜敗猛龍 巴恩斯31+6+7故意兩罰一中準(zhǔn)絕殺

醉臥浮生
2026-01-12 10:08:12
78年,我和弟弟去大伯家借10斤大米,回家后母親敞開米袋子哭了

78年,我和弟弟去大伯家借10斤大米,回家后母親敞開米袋子哭了

小月文史
2024-08-30 15:32:41
電視真的被嚴(yán)重低估了!換個思路居然好用到驚呆,簡直是人類之光

電視真的被嚴(yán)重低估了!換個思路居然好用到驚呆,簡直是人類之光

Home范
2026-01-10 14:55:03
特朗普聽取匯報(bào),威脅最快下周打擊伊朗

特朗普聽取匯報(bào),威脅最快下周打擊伊朗

山河路口
2026-01-11 12:14:33
河北青年楊茂之,30歲時娶了毛岸英遺孀劉思齊,他究竟是什么人?

河北青年楊茂之,30歲時娶了毛岸英遺孀劉思齊,他究竟是什么人?

藤星
2026-01-12 11:11:06
中航官宣殲10CE無傷擊落多架戰(zhàn)機(jī),印度無從狡辯,歐美俄哀嚎一片

中航官宣殲10CE無傷擊落多架戰(zhàn)機(jī),印度無從狡辯,歐美俄哀嚎一片

嘯鷹評
2026-01-11 12:48:25
“女性偉哥”,來了

“女性偉哥”,來了

中國新聞周刊
2026-01-09 20:47:07
曹軼歐回憶:1933年,康生親手用斧子劈死了顧順章的家人

曹軼歐回憶:1933年,康生親手用斧子劈死了顧順章的家人

蔣南強(qiáng)讀歷史
2026-01-12 08:20:06
小學(xué)就能看出是不是學(xué)霸,有這五個特征的娃,成績大概率會一直好

小學(xué)就能看出是不是學(xué)霸,有這五個特征的娃,成績大概率會一直好

好爸育兒
2026-01-12 09:40:03
小國占據(jù)大島的無奈:格陵蘭島被發(fā)現(xiàn)上千年,丹麥從未完全控制?

小國占據(jù)大島的無奈:格陵蘭島被發(fā)現(xiàn)上千年,丹麥從未完全控制?

全城探秘
2026-01-11 16:15:03
這條荒唐新聞,引起公憤了!

這條荒唐新聞,引起公憤了!

胖胖說他不胖
2026-01-11 10:00:11
重磅:美國考慮對伊朗進(jìn)行軍事打擊!巴列維計(jì)劃回國

重磅:美國考慮對伊朗進(jìn)行軍事打擊!巴列維計(jì)劃回國

項(xiàng)鵬飛
2026-01-11 19:35:36
斯諾克賽程:決出4席8強(qiáng),趙心童大師賽首秀,中國軍團(tuán)3連勝?

斯諾克賽程:決出4席8強(qiáng),趙心童大師賽首秀,中國軍團(tuán)3連勝?

劉姚堯的文字城堡
2026-01-12 08:08:40
吃飯七分飽被推翻了?醫(yī)生:過了75歲,吃飯盡量要做到這6點(diǎn)

吃飯七分飽被推翻了?醫(yī)生:過了75歲,吃飯盡量要做到這6點(diǎn)

健康科普365
2026-01-12 12:05:08
美國沒想到,俄羅斯先下手為強(qiáng),凌晨不宣而戰(zhàn),西方國家怕什么來什么

美國沒想到,俄羅斯先下手為強(qiáng),凌晨不宣而戰(zhàn),西方國家怕什么來什么

起喜電影
2026-01-12 13:11:13
B費(fèi)社媒連發(fā)“炒掉英力士”“曼聯(lián)爛透了”,俱樂部緊急發(fā)聲明

B費(fèi)社媒連發(fā)“炒掉英力士”“曼聯(lián)爛透了”,俱樂部緊急發(fā)聲明

夜白侃球
2026-01-12 10:13:04
閆學(xué)晶被資方追責(zé)!酸黃瓜牽扯趙家班多人,宋曉峰、趙四都快哭了

閆學(xué)晶被資方追責(zé)!酸黃瓜牽扯趙家班多人,宋曉峰、趙四都快哭了

阿纂看事
2026-01-10 17:28:59
2026-01-12 15:03:00
刃辛機(jī)器人 incentive-icons
刃辛機(jī)器人
關(guān)注人形機(jī)器人等。
41文章數(shù) 3關(guān)注度
往期回顧 全部

科技要聞

小米二手車價大跳水:SU7半年跌5萬元

頭條要聞

德國就"奪島"發(fā)聲:國際法原則適用所有國家 包括美國

頭條要聞

德國就"奪島"發(fā)聲:國際法原則適用所有國家 包括美國

體育要聞

聰明的球員,不是教練教出來的

娛樂要聞

閆學(xué)晶:脫離群眾太久 忘了自己的根

財(cái)經(jīng)要聞

揭秘“穩(wěn)賺不賠”的代工項(xiàng)目騙局

汽車要聞

增配不加價 北京現(xiàn)代 第五代 勝達(dá)2026款上市

態(tài)度原創(chuàng)

本地
藝術(shù)
房產(chǎn)
親子
公開課

本地新聞

云游內(nèi)蒙|“包”你再來?一座在硬核里釀出詩意的城

藝術(shù)要聞

畫完這組畫,他抑郁了,后來自殺了

房產(chǎn)要聞

國家海岸 有鳳來儀|全維實(shí)景示范區(qū)首映海棠

親子要聞

人財(cái)兩空!廣東寶媽梁海燕去世,因羊水栓塞導(dǎo)致,十天花費(fèi)超50萬

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版