国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

機器人是怎么學(xué)會干活的:一部當代簡史

0
分享至


(來源:麻省理工科技評論)

機器人學(xué)家過去的特點是:夢做得很大,東西造得很小。他們滿懷壯志要匹敵甚至超越人體的驚人復(fù)雜度,然后把整個職業(yè)生涯花在給汽車工廠打磨機械臂上;目標是 C-3PO(《星球大戰(zhàn)》里的人形機器人,能說六百多萬種語言,會走路、會社交、有情感反應(yīng),是科幻電影中最經(jīng)典的“像人一樣的機器人”形象),做出來的是掃地機器人 Roomba。

這些研究者中許多人的真正野心,是科幻片里的那種機器人——能在世界中自由移動、適應(yīng)不同環(huán)境、安全而有益地與人互動。對有社會使命感的人來說,這樣的機器可以幫助行動不便的人、緩解孤獨感、承擔(dān)對人類來說太危險的工作。對更看重商業(yè)前景的人來說,它意味著一種取之不盡、不用發(fā)工資的勞動力來源。但不管出發(fā)點是什么,一段漫長的失敗史讓硅谷大多數(shù)人不敢在“有用的機器人”上下注。

這個局面變了。機器還沒造出來,但錢已經(jīng)涌進來了:僅 2025 年一年,企業(yè)和投資者就向人形機器人砸了 61 億美元,是 2024 年投資額的四倍。

發(fā)生了什么?機器學(xué)習(xí)與世界互動的方式經(jīng)歷了一場革命。

設(shè)想你想在家里裝一雙機械臂,只讓它做一件事:疊衣服。它該怎么學(xué)會?你可以先寫規(guī)則:檢查面料,算出它被拉伸到什么程度會撕裂;識別襯衫的領(lǐng)子;把夾爪移到左袖,抬起來,向內(nèi)折疊精確到多少距離;右袖重復(fù)一遍;如果襯衫轉(zhuǎn)了方向,相應(yīng)地調(diào)整方案;如果袖子擰了,糾正它……規(guī)則的數(shù)量很快就會爆炸,但如果真的把每種情況都窮舉了,確實能產(chǎn)出可靠的結(jié)果。這就是機器人學(xué)最初的手藝:預(yù)判一切可能性,提前寫好代碼。

大約 2015 年前后,前沿領(lǐng)域開始換打法:在數(shù)字世界里搭建機械臂和衣服的仿真模型,每次成功疊好就給程序一個獎勵信號,失敗了就扣分。通過反復(fù)試錯、迭代幾百萬次,程序自己摸索出越來越好的技巧——跟 AI 學(xué)下棋用的方法一樣。

2022 年 ChatGPT 的問世引爆了當前這輪熱潮。大語言模型在海量文本上訓(xùn)練,工作原理不是試錯,而是學(xué)會預(yù)測一句話里下一個詞應(yīng)該是什么。類似的模型被移植到機器人領(lǐng)域后,很快就能吃進圖像、傳感器讀數(shù)和機器人關(guān)節(jié)的位置信息,預(yù)測機器接下來該做什么動作,每秒鐘發(fā)出幾十條運動指令。

依賴能吃下大量數(shù)據(jù)的 AI 模型,似乎不管機器人是需要跟人說話、在環(huán)境中移動,還是完成復(fù)雜任務(wù),都管用。而且它還和其他想法結(jié)合在一起,比如即使機器人還不完美也先放出去,讓它在真實工作環(huán)境里繼續(xù)學(xué)習(xí)。今天,硅谷的機器人學(xué)家們又開始做大夢了。



Jibo - Jibo

早在大語言模型時代之前,一臺可以活動的社交機器人就已經(jīng)在和人聊天了。

2014 年,MIT 的機器人學(xué)家辛西婭·布里澤爾(Cynthia Breazeal)向世界介紹了一款沒有手臂、沒有腿、沒有臉的機器人,叫 Jibo。它看上去像一盞臺燈。布里澤爾的目標是為家庭打造一款社交機器人,這個想法通過眾籌拉到了 370 萬美元。早期預(yù)訂價 749 美元。

早期的 Jibo 能做自我介紹,能跳舞逗孩子開心,但也就僅此而已了。它的愿景一直是成為一種有實體的助手,從日程管理、處理郵件到講故事什么都能干。它確實贏得了一批忠實用戶,但公司最終在 2019 年關(guān)閉了。


(來源:麻省理工科技評論)

回頭來看,Jibo 最需要的是更好的語言能力。它當時的競爭對手是蘋果的 Siri 和亞馬遜的 Alexa,而這些技術(shù)在當時都依賴大量的腳本預(yù)設(shè)?;\統(tǒng)來說,當你跟它們說話時,軟件會把你的語音轉(zhuǎn)成文字,分析你想要什么,然后從預(yù)先批準的回復(fù)片段里拼出一個回應(yīng)。這些片段可以很有趣,但也重復(fù)、無聊——用一個詞來說就是“很機械”。對一款定位社交和家庭的機器人來說,這是硬傷。

此后發(fā)生的事情大家都知道了:機器生成語言的方式發(fā)生了一場革命。如今任何一家頭部 AI 公司的語音模式都已經(jīng)做到了引人入勝、令人印象深刻,多家硬件初創(chuàng)公司正在嘗試(但大多失?。┐蛟炖眠@項能力的產(chǎn)品。

但新能力也帶來新風(fēng)險:預(yù)設(shè)腳本的對話不太會跑偏,AI 生成的對話就不一定了。比如一些流行的 AI 玩具就曾跟孩子聊過如何找到火柴和刀。



OpenAI - Dactyl

一只用仿真訓(xùn)練的機器手,嘗試模擬真實世界的不可預(yù)測性和變化。

到 2018 年,所有頂尖機器人實驗室都在努力拋棄舊式的腳本規(guī)則,轉(zhuǎn)而通過試錯來訓(xùn)練機器人。OpenAI 嘗試在虛擬環(huán)境中訓(xùn)練它的機器手 Dactyl——用機器手和手掌大小的立方體的數(shù)字模型。立方體的每個面上有字母和數(shù)字,模型可能設(shè)定一個任務(wù),比如“轉(zhuǎn)動立方體,讓帶有字母 O 的紅色面朝上”。


(來源:麻省理工科技評論)

問題在于:機器手可能在仿真世界里做得非常好,但當你把這個程序拿到現(xiàn)實世界、讓它操作真正的立方體時,兩個世界之間的細微差異就可能導(dǎo)致失靈。顏色可能略有不同,機器人指尖的可變形橡膠可能比仿真里的更有彈性。

解決方案叫做“域隨機化”(domain randomization):你本質(zhì)上是創(chuàng)造出幾百萬個略有差異的仿真世界,每個世界里的摩擦力、光照、顏色都被隨機調(diào)整;接觸了足夠多的變化之后,機器人在真實世界中操控立方體的能力就會更強。這個方法在 Dactyl 上成功了。一年后它用同樣的核心技術(shù)完成了更難的任務(wù):解魔方(盡管成功率只有 60%,面對特別復(fù)雜的打亂時只有 20%)。

不過仿真技術(shù)有其局限性,這種方法在今天扮演的角色已經(jīng)比 2018 年小得多了。OpenAI 在 2021 年關(guān)閉了機器人業(yè)務(wù),但最近重新啟動了這個部門,據(jù)報道正在聚焦人形機器人。



Google DeepMind - RT-2

從互聯(lián)網(wǎng)上的海量圖片中學(xué)習(xí),幫助機器人把語言指令轉(zhuǎn)化為動作。

2022 年前后,Google 的機器人團隊在做一些有點奇怪的事情。他們花了 17 個月,把機器人遙控器交給人類,拍下他們做各種事情的視頻——從拿起薯片袋到開罐頭。團隊最終編錄了 700 種不同的任務(wù)。


(來源:麻省理工科技評論)

Google 的目的是構(gòu)建和測試機器人領(lǐng)域最早的大規(guī)模基礎(chǔ)模型之一。思路和大語言模型類似:把大量文本輸入進去,將其標記化為算法能處理的格式,然后生成輸出。Google 的 RT-1 接收的輸入包括機器人看到的畫面和機械臂各部件的位置信息,然后接受一條指令,將其轉(zhuǎn)化為驅(qū)動機器人運動的指令。對于見過的任務(wù),它的成功率達到 97%;對于沒見過的指令,成功率也有 76%。

第二代 RT-2 在次年發(fā)布,走得更遠。它不再只用機器人專屬的數(shù)據(jù)來訓(xùn)練,而是擴大了范圍:像當時很多研究者在做的視覺-語言模型一樣,它在互聯(lián)網(wǎng)上的通用圖片上訓(xùn)練,這讓機器人能夠理解場景中各種物體在哪里。

“一大堆新能力突然被解鎖了,”Google DeepMind 的機器人學(xué)家卡尼什卡·拉奧(Kanishka Rao)說。他主導(dǎo)了兩代模型的開發(fā)?!拔覀儸F(xiàn)在能執(zhí)行‘把可樂罐放到泰勒·斯威夫特的照片旁邊’這種指令了?!?/p>

2025 年,Google DeepMind 進一步融合了大語言模型和機器人的世界,發(fā)布了 Gemini Robotics 模型,在理解自然語言指令方面有了進一步提升。



Covariant - RFM-1

2017 年,在 OpenAI 關(guān)閉第一支機器人團隊之前,一批工程師從中拆分出來,創(chuàng)辦了一個叫 Covariant 的項目。他們的目標不是造科幻片里的人形機器人,而是造最務(wù)實的那種:一條能在倉庫里拿東西、搬東西的機械臂。Covariant 構(gòu)建了一套類似 Google 基礎(chǔ)模型思路的系統(tǒng),把它部署到 Crate & Barrel 等公司運營的倉庫里,同時把這些倉庫當作數(shù)據(jù)采集管道。

到 2024 年,Covariant 發(fā)布了一款機器人模型 RFM-1,你可以像跟同事說話一樣跟它互動。比如你先給機械臂看一堆筒裝網(wǎng)球,然后讓它把每一筒分別放到不同的區(qū)域。機器人還能做出回應(yīng)——比如預(yù)判自己可能抓不穩(wěn)這個物品,然后主動問你應(yīng)該用哪種吸盤。

這類交互在實驗室里做過,但 Covariant 是在大規(guī)模的真實環(huán)境中落地。公司在每個客戶的場地都部署了攝像頭和數(shù)據(jù)采集設(shè)備,源源不斷地給模型反饋更多訓(xùn)練數(shù)據(jù)。


(來源:麻省理工科技評論)

它還不完美。2024 年 3 月的一次演示中,面前擺著一堆廚房用品,機器人被要求把香蕉放回原來的位置。它先拿起一塊海綿,又拿起一個蘋果,接著又拿了一堆別的東西,折騰半天才完成任務(wù)。

聯(lián)合創(chuàng)始人 Peter Chen 當時告訴我,它“還不理解回溯自己步驟這個新概念。但這是個很好的例子——在缺乏好的訓(xùn)練數(shù)據(jù)的場景里,它可能還不太行?!?/p>

Peter Chen 和另一位聯(lián)合創(chuàng)始人彼得·阿貝爾(Pieter Abbeel)后來被亞馬遜聘用。亞馬遜目前在許可使用 Covariant 的機器人模型(亞馬遜沒有回應(yīng)關(guān)于具體用途的提問,但該公司僅在美國就運營著大約 1300 座倉庫)。



Agility Robotics - Digit

多家企業(yè)正把這款人形機器人投入真實工作場景。

涌入機器人初創(chuàng)公司的新一輪投資,主要瞄準的不是燈狀或臂狀的機器人,而是人形的。人形機器人理論上可以無縫進入人類目前工作的空間和崗位,不用為了適應(yīng)什么巨型機械臂之類的新形態(tài)去改造流水線。

說起來容易做起來難。在人形機器人確實出現(xiàn)在真實倉庫中的少數(shù)案例里,它們往往被限制在測試區(qū)和試點項目中。


(來源:麻省理工科技評論)

不過 Agility 的人形機器人 Digit 確實在做一些真正的活。它的一些設(shè)計更多是出于功能考慮而非科幻審美,例如裸露的關(guān)節(jié)、頭部明顯不像人等。亞馬遜、豐田和 GXO(一家物流巨頭,客戶包括蘋果和耐克)都部署了 Digit,這讓它成為最早被企業(yè)視為“真的能省錢”而不只是新奇噱頭的人形機器人之一。它們每天的工作就是搬運、移動和堆疊貨運周轉(zhuǎn)箱。

不過目前的 Digit 離硅谷押注的那種“像人一樣的幫手”還差得遠。比如它只能搬起 35 磅的東西,而且每次 Agility 把 Digit 做得更有力,電池就更重,充電就更頻繁。標準制定機構(gòu)也表示,人形機器人需要比大多數(shù)工業(yè)機器人更嚴格的安全規(guī)則,因為它們被設(shè)計成可以移動的,而且會長時間在人類身邊工作。

但 Digit 說明了一件事:這場機器人訓(xùn)練的革命并沒有匯聚到某一種單一方法上。Agility 依賴的仿真技術(shù)和 OpenAI 訓(xùn)練機器手時用的類似,同時公司也在和 Google 的 Gemini 模型合作,幫助機器人適應(yīng)新環(huán)境。十多年的實驗把整個行業(yè)帶到了今天這個節(jié)點:現(xiàn)在,它們開始想把機器人造得越來越大。

https://www.technologyreview.com/2026/04/17/1135416/how-robots-learn-brief-contemporary-history/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
曾高喊打敗美帝:如今卻全家跑去美國,84歲活成這樣,引人熱議!

曾高喊打敗美帝:如今卻全家跑去美國,84歲活成這樣,引人熱議!

小莜讀史
2026-04-20 22:58:35
巴鐵也沒想到:跟在中國身后,一不小心,竟混成了“一方霸主”

巴鐵也沒想到:跟在中國身后,一不小心,竟混成了“一方霸主”

清沐執(zhí)筆
2026-04-21 13:08:07
副省級城市兩位市委常委先后落馬

副省級城市兩位市委常委先后落馬

上觀新聞
2026-04-21 10:32:09
中國高校只剩7年窗口期 學(xué)生數(shù)量斷崖式塌方后一半高校都得死

中國高校只剩7年窗口期 學(xué)生數(shù)量斷崖式塌方后一半高校都得死

六子吃涼粉
2026-04-20 19:10:49
日本7.7 級強震后,高市得罪 4 鄰國,誰還愿救日本核電站?

日本7.7 級強震后,高市得罪 4 鄰國,誰還愿救日本核電站?

眼界看視野
2026-04-21 09:49:11
印度加快推進蘋果反壟斷案 罰款或達380億美元

印度加快推進蘋果反壟斷案 罰款或達380億美元

財聯(lián)社
2026-04-20 20:53:05
7歲男孩高燒直沖40℃,渾身“黑化”面臨截肢,只因父母一個疏忽……武漢醫(yī)生提醒:這種病早期和感冒很像

7歲男孩高燒直沖40℃,渾身“黑化”面臨截肢,只因父母一個疏忽……武漢醫(yī)生提醒:這種病早期和感冒很像

環(huán)球網(wǎng)資訊
2026-04-20 19:07:08
這也能贏?美媒:海峽被封鎖后,中國對我們一樣?xùn)|西依賴猛增

這也能贏?美媒:海峽被封鎖后,中國對我們一樣?xùn)|西依賴猛增

聞識
2026-04-21 11:27:58
美媒:伊朗最高領(lǐng)袖穆杰塔巴已批準同美方進行談判,白宮20日一整天都在等德黑蘭,如出現(xiàn)進展跡象,特朗普也可能同意延長?;鹌谙?>
    </a>
        <h3>
      <a href=極目新聞
2026-04-21 09:44:58
越南百億高鐵訂單給德國,來華體驗12小時高鐵,背后算計太明顯

越南百億高鐵訂單給德國,來華體驗12小時高鐵,背后算計太明顯

云舟史策
2026-04-20 07:21:35
黃山市一位副鄉(xiāng)長發(fā)了16條私信,把知名主播“磨”進大山里賣筍,知名演員鄧超也來了

黃山市一位副鄉(xiāng)長發(fā)了16條私信,把知名主播“磨”進大山里賣筍,知名演員鄧超也來了

揚子晚報
2026-04-21 07:26:40
太揪心!女星流產(chǎn)5次痛失7子,試管圓夢后,43歲執(zhí)意再拼二胎

太揪心!女星流產(chǎn)5次痛失7子,試管圓夢后,43歲執(zhí)意再拼二胎

一盅情懷
2026-04-20 14:43:07
笑不活了!女孩把雞畫得圓肥被判不合格,家長把雞的照片發(fā)給老師

笑不活了!女孩把雞畫得圓肥被判不合格,家長把雞的照片發(fā)給老師

火山詩話
2026-04-21 09:46:21
左手幻覺,右手投毒,普通人憑什么相信AI?

左手幻覺,右手投毒,普通人憑什么相信AI?

果殼
2026-04-20 20:09:40
46號令落地執(zhí)行,退休人員舊賬一律清零,待遇重新核算!

46號令落地執(zhí)行,退休人員舊賬一律清零,待遇重新核算!

另子維愛讀史
2026-04-21 07:29:11
拼多多暴力抗法震驚全網(wǎng),市值萬億巨頭為何如此囂張

拼多多暴力抗法震驚全網(wǎng),市值萬億巨頭為何如此囂張

燕梳樓頻道
2026-04-20 21:12:04
美伊沖突中特朗普真實狀態(tài)首次披露:抱怨焦慮、搖擺與強撐;因情緒不穩(wěn)定,救飛行員時被幕僚擋戰(zhàn)情室外,每天都會觀看伊朗境內(nèi)爆炸畫面

美伊沖突中特朗普真實狀態(tài)首次披露:抱怨焦慮、搖擺與強撐;因情緒不穩(wěn)定,救飛行員時被幕僚擋戰(zhàn)情室外,每天都會觀看伊朗境內(nèi)爆炸畫面

極目新聞
2026-04-20 16:20:57
首組1-1!尼克斯丟壓哨絕殺惜敗老鷹 麥科勒姆32+6布倫森29+7

首組1-1!尼克斯丟壓哨絕殺惜敗老鷹 麥科勒姆32+6布倫森29+7

醉臥浮生
2026-04-21 10:47:56
主張250余萬元!全國首例職場性侵獲精神工傷認定案將開庭,崔麗麗年薪曾達120萬

主張250余萬元!全國首例職場性侵獲精神工傷認定案將開庭,崔麗麗年薪曾達120萬

瀟湘晨報
2026-04-21 12:39:25
霍爾木茲海峽驚現(xiàn)過路費詐騙 已有船只被騙并遭到炮擊

霍爾木茲海峽驚現(xiàn)過路費詐騙 已有船只被騙并遭到炮擊

財聯(lián)社
2026-04-21 14:54:13
2026-04-21 15:19:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
16604文章數(shù) 514894關(guān)注度
往期回顧 全部

科技要聞

重磅官宣:庫克卸任,特努斯接任蘋果CEO

頭條要聞

丈夫在海外做生意 妻子和兒子在家里充電經(jīng)歷驚魂一夜

頭條要聞

丈夫在海外做生意 妻子和兒子在家里充電經(jīng)歷驚魂一夜

體育要聞

“被優(yōu)化”8年后,國乒方博決定換一條路重新上場

娛樂要聞

周潤發(fā)時隔16年再賣樓,變現(xiàn)數(shù)億資產(chǎn)

財經(jīng)要聞

減速機訂單已排到明年!

汽車要聞

把天門山搬進廠?開仰望U8沖上45度坡的那刻 我腿軟了

態(tài)度原創(chuàng)

游戲
本地
親子
房產(chǎn)
公開課

《方舟:生存飛升》穴居角兔生物圖譜發(fā)布 ,跨平臺模組更新

本地新聞

春色滿城關(guān)不住|白鵑梅浪漫盛放,吳山藏了一片四月雪

親子要聞

4歲女兒養(yǎng)的兔子,爸爸養(yǎng)夠了想給它送人,結(jié)果女兒的話讓人意外

房產(chǎn)要聞

大規(guī)模商改住!??谖骱0叮@波項目要贏麻了!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版