国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

世界模型:機(jī)器能否理解現(xiàn)實(shí)?

0
分享至


人工智能研究的最新目標(biāo),尤其是在追求“通用人工智能”(AGI)的實(shí)驗(yàn)室中,是一個(gè)被稱(chēng)為“世界模型”(world model)的概念:這是一種AI內(nèi)部攜帶的環(huán)境表征,就像一個(gè)計(jì)算型的雪球玻璃球。AI系統(tǒng)可以借助這個(gè)簡(jiǎn)化的內(nèi)部模型,在真正執(zhí)行任務(wù)之前,先對(duì)預(yù)測(cè)和決策進(jìn)行評(píng)估。

深度學(xué)習(xí)領(lǐng)域的幾位重量級(jí)人物——Meta的楊立昆(Yann LeCun)、Google DeepMind的德米斯·哈薩比斯(Demis Hassabis)和加拿大魁北克人工智能研究院Mila的約書(shū)亞·本吉奧(Yoshua Bengio)都認(rèn)為,要構(gòu)建真正聰明、科學(xué)且安全的AI系統(tǒng),世界模型是不可或缺的。

實(shí)際上,心理學(xué)、機(jī)器人學(xué)和機(jī)器學(xué)習(xí)等領(lǐng)域幾十年來(lái)一直以不同方式使用類(lèi)似的概念。你大腦中現(xiàn)在可能就有一個(gè)“世界模型”在運(yùn)行——正是它讓你知道不該走到一列行駛中的火車(chē)前面,而不必真的先去試一試。

那么這是否意味著,AI 研究者終于找到了一個(gè)所有人都能達(dá)成共識(shí)其含義的核心概念?引用一位著名物理學(xué)家的話(huà):“你是在開(kāi)玩笑吧!笔澜缒P吐(tīng)起來(lái)簡(jiǎn)單明了,但一如既往,人們?cè)诩?xì)節(jié)上完全無(wú)法達(dá)成一致。比如:模型中應(yīng)該包含什么內(nèi)容?精度要達(dá)到什么水平?它是與生俱來(lái)的,還是通過(guò)學(xué)習(xí)獲得的,或者兩者的結(jié)合?我們又該如何確認(rèn)模型的存在?

了解這一概念的起源會(huì)有所幫助。早在1943年,也就是“人工智能”這個(gè)術(shù)語(yǔ)被提出的12年前,年僅29歲的蘇格蘭心理學(xué)家肯尼斯·克雷克(Kenneth Craik)發(fā)表了一本影響深遠(yuǎn)的小冊(cè)子,他在里面提出了這樣的設(shè)想:“如果有機(jī)體在腦中攜帶著一個(gè)外部現(xiàn)實(shí)的‘小尺度模型(small-scale model)’……它就能夠先行嘗試各種備選方案,判斷出其中哪一個(gè)最好……從而做出更全面、更安全、更有能力的反應(yīng)!

克雷克關(guān)于心智模型或心智模擬的設(shè)想,預(yù)示了在20世紀(jì)50年代重塑心理學(xué)并至今仍主導(dǎo)認(rèn)知科學(xué)的“認(rèn)知革命。更重要的是,它直接把認(rèn)知與計(jì)算聯(lián)系在一起:克雷克認(rèn)為,“并行或建模外部事件的能力”,是“神經(jīng)機(jī)制”與“計(jì)算機(jī)器”共有的“根本特征”。

新興的人工智能領(lǐng)域也迅速采納了世界模型的方法。在20世紀(jì)60年代末,一套名為SHRDLU的AI系統(tǒng)令人驚艷:它用一個(gè)簡(jiǎn)易的“積木世界”來(lái)回答有關(guān)桌面物體的常識(shí)問(wèn)題,比如“一個(gè)金字塔能支撐一個(gè)方塊嗎?”然而,這類(lèi)手工構(gòu)建的模型無(wú)法規(guī);,難以應(yīng)對(duì)更為真實(shí)環(huán)境的復(fù)雜性。到了上世紀(jì)80年代末,人工智能與機(jī)器人學(xué)先驅(qū)羅德尼·布魯克斯(Rodney Brooks)則干脆放棄了世界模型,他那句名言廣為流傳——“世界本身就是其最佳模型(the world is its own best model)”,而“顯式表征……只會(huì)礙事”。

讓克雷克的設(shè)想重?zé)ㄉ鷻C(jī)的是機(jī)器學(xué)習(xí)的崛起,尤其是基于人工神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)。深度神經(jīng)網(wǎng)絡(luò)不再依賴(lài)脆弱的手寫(xiě)規(guī)則,而是通過(guò)反復(fù)試驗(yàn),在訓(xùn)練過(guò)程中逐漸構(gòu)建出內(nèi)部的環(huán)境近似模型,并用來(lái)完成如駕駛虛擬賽車(chē)等狹窄定義的任務(wù)。

最近幾年,隨著支持聊天機(jī)器人(如 ChatGPT)的“大語(yǔ)言模型(LLM)”展現(xiàn)出許多“意外”能力——比如通過(guò)emoji推斷電影名稱(chēng),或玩黑白棋等,這讓世界模型成為一個(gè)頗具解釋力的思路。對(duì)杰出的AI專(zhuān)家而言,如杰弗里·辛頓(Geoffrey Hinton)、伊利亞·蘇茨克弗(Ilya Sutskever)與克里斯·奧拉(Chris Olah),答案幾乎是不言自明的:在某個(gè)深埋于LLM龐大“虛擬神經(jīng)元”叢林的角落里,一定存在著一個(gè)“外部現(xiàn)實(shí)的小尺度模型”,正如克雷克當(dāng)年所設(shè)想的那樣。

但現(xiàn)實(shí)(至少目前來(lái)看)并沒(méi)有那么理想。現(xiàn)在的生成式AI更像是在學(xué)習(xí)“啟發(fā)式集合”:成百上千條互不關(guān)聯(lián)的經(jīng)驗(yàn)法則,可以在特定場(chǎng)景下給出近似的應(yīng)對(duì),但無(wú)法整合成一個(gè)自洽的整體,有時(shí)它們甚至相互矛盾。這就像盲人摸象的故事:一個(gè)人摸到象鼻,以為大象像蛇;另一個(gè)人摸到腿,以為像樹(shù);還有人摸到尾巴,說(shuō)像繩子。當(dāng)研究者嘗試從大語(yǔ)言模型內(nèi)部找回世界模型的證據(jù)——例如,對(duì)黑白棋(Othello)棋盤(pán)的一種連貫的計(jì)算表征——他們尋找的是整頭大象。而他們真正找到的,卻是這里一點(diǎn)“蛇”、那里一截“樹(shù)”,再加上一段“繩子”。

當(dāng)然,這些啟發(fā)式規(guī)則并非一無(wú)是處。大語(yǔ)言模型可以在其數(shù)萬(wàn)億個(gè)參數(shù)中編碼數(shù)以“袋”計(jì)的此類(lèi)規(guī)則——而俗話(huà)說(shuō),“數(shù)量本身就是一種質(zhì)量”。正因如此,正如哈佛大學(xué)與麻省理工學(xué)院的研究者近期所發(fā)現(xiàn)的,只通過(guò)語(yǔ)言數(shù)據(jù)就幾乎完美地生成從曼哈頓任意兩點(diǎn)之間的導(dǎo)航路線(xiàn),盡管這個(gè)模型根本沒(méi)有學(xué)會(huì)整個(gè)街道網(wǎng)絡(luò)的連貫世界模型

那如果“一點(diǎn)蛇、一截樹(shù)、一些繩子”就能完成任務(wù),為何還要執(zhí)著于整只大象?答案只有一個(gè)詞:魯棒性。當(dāng)研究人員隨機(jī)封閉曼哈頓1%的街道,LLM的導(dǎo)航能力就明顯崩潰了。如果它內(nèi)部擁有的是一個(gè)一致且連貫的街道地圖,而不是在每個(gè)街角以相互矛盾的“最佳猜測(cè)”拼接成的一張極其復(fù)雜的補(bǔ)丁式網(wǎng),它完全可以輕松繞開(kāi)障礙。


即便是簡(jiǎn)單的世界模型也能帶來(lái)諸多益處,不難理解為什么所有大型AI實(shí)驗(yàn)室都在拼命研發(fā)它們,為什么學(xué)術(shù)界也越來(lái)越關(guān)注它們。一個(gè)魯棒且可驗(yàn)證的世界模型,或許未必能發(fā)現(xiàn)通用人工智能的“黃金城”,但至少有望提供一種在科學(xué)上站得住腳的工具,用來(lái)消除AI幻覺(jué)、支持可靠推理,并提升AI系統(tǒng)的可解釋性。

這就是世界模型的“是什么”和“為什么”。至于“怎么做”,依然是個(gè)未知數(shù)。Google DeepMind和OpenAI認(rèn)為,只要有足夠多的“多模態(tài)”訓(xùn)練數(shù)據(jù)——比如視頻、三維模擬和超越文本的其他輸入——世界模型會(huì)在神經(jīng)網(wǎng)絡(luò)中自然“凝聚”出來(lái)。與此同時(shí),楊立昆則認(rèn)為,構(gòu)建世界模型需要完全不同于生成式AI的全新架構(gòu)。在構(gòu)建這個(gè)“計(jì)算型的雪球玻璃球”的征途中,沒(méi)有人手握能預(yù)測(cè)未來(lái)的水晶球。但這一次的終極目標(biāo),也許的確配得上圍繞通用人工智能的那股熱度。

作者:John Pavlus

譯者:琴心

原文:https://www.quantamagazine.org/world-models-an-old-idea-in-ai-mount-a-comeback-20250902/


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
1分鐘2神撲!李昊力保球門(mén)不失,肋骨險(xiǎn)受傷,媒體人:身價(jià)還得漲

1分鐘2神撲!李昊力保球門(mén)不失,肋骨險(xiǎn)受傷,媒體人:身價(jià)還得漲

奧拜爾
2026-01-11 21:00:22
王毅同索馬里外長(zhǎng)德埃電話(huà)會(huì)談

王毅同索馬里外長(zhǎng)德埃電話(huà)會(huì)談

界面新聞
2026-01-11 18:49:08
霍啟剛主動(dòng)公開(kāi)個(gè)人財(cái)產(chǎn):35套物業(yè)曝光,遍及港澳、內(nèi)地與法、英,多項(xiàng)房產(chǎn)與郭晶晶共同持有

霍啟剛主動(dòng)公開(kāi)個(gè)人財(cái)產(chǎn):35套物業(yè)曝光,遍及港澳、內(nèi)地與法、英,多項(xiàng)房產(chǎn)與郭晶晶共同持有

大象新聞
2026-01-12 00:17:04
4分鐘對(duì)轟3球!3-2笑傲國(guó)家德比問(wèn)鼎 11.2億豪門(mén)10連勝?zèng)_擊四冠王

4分鐘對(duì)轟3球!3-2笑傲國(guó)家德比問(wèn)鼎 11.2億豪門(mén)10連勝?zèng)_擊四冠王

狍子歪解體壇
2026-01-12 05:04:26
重慶兩名女子從重慶北站打車(chē)到沙坪壩,20公里被收195元,打車(chē)平臺(tái)預(yù)估僅需20余元,當(dāng)?shù)亟煌▓?zhí)法局:黑車(chē)假冒出租車(chē),司機(jī)涉嫌非法營(yíng)運(yùn)

重慶兩名女子從重慶北站打車(chē)到沙坪壩,20公里被收195元,打車(chē)平臺(tái)預(yù)估僅需20余元,當(dāng)?shù)亟煌▓?zhí)法局:黑車(chē)假冒出租車(chē),司機(jī)涉嫌非法營(yíng)運(yùn)

環(huán)球網(wǎng)資訊
2026-01-11 08:00:27
爭(zhēng)議!烏克蘭名將0-2不敵薩巴倫卡 拒絕握手:我的國(guó)家正承受災(zāi)難

爭(zhēng)議!烏克蘭名將0-2不敵薩巴倫卡 拒絕握手:我的國(guó)家正承受災(zāi)難

風(fēng)過(guò)鄉(xiāng)
2026-01-11 21:45:41
中國(guó)隊(duì)1-0澳大利亞,賽后獲3個(gè)好消息和1個(gè)壞消息,末輪打平=出線(xiàn)

中國(guó)隊(duì)1-0澳大利亞,賽后獲3個(gè)好消息和1個(gè)壞消息,末輪打平=出線(xiàn)

侃球熊弟
2026-01-11 20:56:17
輸球又輸人!澳主帥吐槽國(guó)足用70年代打法,輸不起言論引爭(zhēng)議!

輸球又輸人!澳主帥吐槽國(guó)足用70年代打法,輸不起言論引爭(zhēng)議!

田先生籃球
2026-01-11 22:39:31
以色列在行動(dòng),伊朗導(dǎo)彈部隊(duì)指揮官遭刺殺,庫(kù)爾德武裝發(fā)起進(jìn)攻

以色列在行動(dòng),伊朗導(dǎo)彈部隊(duì)指揮官遭刺殺,庫(kù)爾德武裝發(fā)起進(jìn)攻

史政先鋒
2026-01-11 15:58:18
1月11日俄烏:當(dāng)之無(wú)愧的最高評(píng)價(jià)

1月11日俄烏:當(dāng)之無(wú)愧的最高評(píng)價(jià)

山河路口
2026-01-11 19:28:40
張本智和垂頭喪氣!3-4爆冷不敵林昀儒+無(wú)緣決賽 放話(huà)奪冠遭打臉

張本智和垂頭喪氣!3-4爆冷不敵林昀儒+無(wú)緣決賽 放話(huà)奪冠遭打臉

風(fēng)過(guò)鄉(xiāng)
2026-01-11 21:21:32
2場(chǎng)0勝!曝41歲曼聯(lián)救火教練6天便下課,周一官宣新帥:索肖出局

2場(chǎng)0勝!曝41歲曼聯(lián)救火教練6天便下課,周一官宣新帥:索肖出局

我愛(ài)英超
2026-01-12 07:14:35
58歲妮可·基德曼正式離婚,不要男方1分錢(qián)!前夫阿湯哥私下評(píng)價(jià)

58歲妮可·基德曼正式離婚,不要男方1分錢(qián)!前夫阿湯哥私下評(píng)價(jià)

頭號(hào)電影院
2026-01-11 12:48:08
專(zhuān)題片剖析唐仁健案:組建“周末愉快”微信群,每到周末就召老板們吃喝

專(zhuān)題片剖析唐仁健案:組建“周末愉快”微信群,每到周末就召老板們吃喝

澎湃新聞
2026-01-11 20:44:28
宋彬彬晚年回國(guó)道歉仍不被原諒,其父宋任窮也不愿提起她,為何

宋彬彬晚年回國(guó)道歉仍不被原諒,其父宋任窮也不愿提起她,為何

雍親王府
2026-01-09 15:20:02
閆學(xué)晶被資方追責(zé)!酸黃瓜牽扯趙家班多人,宋曉峰、趙四都快哭了

閆學(xué)晶被資方追責(zé)!酸黃瓜牽扯趙家班多人,宋曉峰、趙四都快哭了

阿纂看事
2026-01-10 17:28:59
葉文斌媽媽被傳限制出境,惡意尋子的陰謀論來(lái)了

葉文斌媽媽被傳限制出境,惡意尋子的陰謀論來(lái)了

映射生活的身影
2026-01-11 14:33:05
在隱蔽場(chǎng)所吃喝,項(xiàng)目有油水就撈,唐仁健貪腐細(xì)節(jié)曝光

在隱蔽場(chǎng)所吃喝,項(xiàng)目有油水就撈,唐仁健貪腐細(xì)節(jié)曝光

大風(fēng)新聞
2026-01-11 21:32:18
皇馬的痛!19歲恩德里克獲8.2分+MVP:首秀一劍封喉,助法甲勁旅晉級(jí)

皇馬的痛!19歲恩德里克獲8.2分+MVP:首秀一劍封喉,助法甲勁旅晉級(jí)

側(cè)身凌空斬
2026-01-12 05:57:37
網(wǎng)約車(chē)的戾氣已經(jīng)到什么程度了:司機(jī)奉勸乘客少說(shuō)話(huà),不然容易出事

網(wǎng)約車(chē)的戾氣已經(jīng)到什么程度了:司機(jī)奉勸乘客少說(shuō)話(huà),不然容易出事

六子吃涼粉
2026-01-12 08:42:18
2026-01-12 09:07:00
神經(jīng)現(xiàn)實(shí)
神經(jīng)現(xiàn)實(shí)
大腦,心智,認(rèn)知
2400文章數(shù) 25476關(guān)注度
往期回顧 全部

科技要聞

小米二手車(chē)價(jià)大跳水:SU7半年跌5萬(wàn)元

頭條要聞

牛彈琴:新的戰(zhàn)爭(zhēng)一觸即發(fā) 美國(guó)和以色列可能弄巧成拙

頭條要聞

牛彈琴:新的戰(zhàn)爭(zhēng)一觸即發(fā) 美國(guó)和以色列可能弄巧成拙

體育要聞

U23國(guó)足形勢(shì):末輪不負(fù)泰國(guó)即確保晉級(jí)

娛樂(lè)要聞

留幾手為閆學(xué)晶叫屈?稱(chēng)網(wǎng)友自卑敏感

財(cái)經(jīng)要聞

揭秘“穩(wěn)賺不賠”的代工項(xiàng)目騙局

汽車(chē)要聞

2026款宋Pro DM-i長(zhǎng)續(xù)航補(bǔ)貼后9.98萬(wàn)起

態(tài)度原創(chuàng)

藝術(shù)
教育
旅游
數(shù)碼
軍事航空

藝術(shù)要聞

10位著名畫(huà)家的女性人物繪畫(huà),張張經(jīng)典!

教育要聞

好消息?中小學(xué)將迎來(lái)超短學(xué)期,江蘇多校為趕進(jìn)度提前學(xué)下冊(cè)

旅游要聞

這兩座高鐵站,為什么專(zhuān)門(mén)為旅客設(shè)更衣室?

數(shù)碼要聞

Intel主流銳炫B370核顯首次跑分!超越AMD Radeon 890M

軍事要聞

俄大使:馬杜羅夫婦被控制時(shí)身邊沒(méi)人

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版