国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AI大神伊利亞宣告 Scaling時(shí)代終結(jié)!斷言AGI的概念被誤導(dǎo)

0
分享至


11月26日,前OpenAI聯(lián)創(chuàng)兼首席科學(xué)家、SSI聯(lián)創(chuàng)兼首席科學(xué)家伊利亞·蘇茨克維(Ilya Sutskever)在接受采訪時(shí)做出重磅論斷:AI的擴(kuò)展(Scaling)時(shí)代已經(jīng)終結(jié)!

整場(chǎng)播客長(zhǎng)達(dá)1小時(shí)36分鐘,在這場(chǎng)深度對(duì)話中,Ilya Sutskever提出,當(dāng)下算力規(guī)模已經(jīng)十分龐大,僅靠算力堆砌已經(jīng)無法讓模型實(shí)現(xiàn)更大的突破,他直言:“我們正從擴(kuò)展時(shí)代回歸到研究時(shí)代,如今只是擁有了更強(qiáng)大的計(jì)算機(jī)。”

當(dāng)前,AI存在嚴(yán)重的“評(píng)估表現(xiàn)與現(xiàn)實(shí)應(yīng)用脫節(jié)”割裂問題,Ilya Sutskever認(rèn)為是因?yàn)槠浞夯芰Σ蛔?。他提到了一個(gè)關(guān)鍵點(diǎn),AI的一大瓶頸是沒有類似人類的感官和情緒等“價(jià)值函數(shù)”,因此提出嘗試通過預(yù)訓(xùn)練讓模型獲得“情緒驅(qū)動(dòng)的決策能力”,構(gòu)建出關(guān)心所有“有情生命”的AI。

訪談核心信息如下:

1、泛化能力是AI發(fā)展的瓶頸:Ilya Sutskever認(rèn)為,當(dāng)前頂尖AI存在嚴(yán)重的“評(píng)估表現(xiàn)”與“現(xiàn)實(shí)應(yīng)用”脫節(jié),其核心問題在于模型的泛化能力遠(yuǎn)不如人類。

2、人類的情緒相當(dāng)于AI的“價(jià)值函數(shù)”:他提出顛覆性觀點(diǎn):“情緒”是人類進(jìn)化形成的、內(nèi)置的“價(jià)值函數(shù)”,能為決策提供即時(shí)反饋,這是AI目前缺失的關(guān)鍵能力。

3、堆砌算力已無法突破,“擴(kuò)展時(shí)代”已經(jīng)終結(jié):Ilya Sutskever認(rèn)為,當(dāng)下,以堆砌數(shù)據(jù)、算力為核心的“擴(kuò)展時(shí)代”已經(jīng)結(jié)束,AI發(fā)展正回歸“研究時(shí)代”,需要新范式突破。

4、人類擁有比AI更好的“學(xué)習(xí)算法”:人類在樣本效率和持續(xù)學(xué)習(xí)上的優(yōu)勢(shì),源于某種更根本、更優(yōu)越的底層學(xué)習(xí)機(jī)制,而非僅僅是進(jìn)化賦予的“先驗(yàn)知識(shí)”。

5、SSI是純粹的“研究公司”:Ilya Sutskever透露,其創(chuàng)業(yè)公司SSI不參與算力競(jìng)賽,其核心身份是一家專注于突破性研究的“研究時(shí)代”公司。

6、超級(jí)智能是“能學(xué)會(huì)做所有事”的智能:對(duì)于什么是超級(jí)智能這個(gè)問題,Ilya Sutskever將超級(jí)智能定位為一個(gè)“能夠?qū)W會(huì)做所有事”的成長(zhǎng)型心智。

7、讓人們看到AI的強(qiáng)大,才能更好地治理:在AI治理方面,Ilya Sutskever主張通過“漸進(jìn)式部署和公開展示”,讓人們親自感受AI的能力與風(fēng)險(xiǎn)。

8、應(yīng)該構(gòu)建“關(guān)心有情生命的AI”:Ilya Sutskever認(rèn)為,業(yè)界應(yīng)該構(gòu)建關(guān)心所有“有情生命”的AI,他認(rèn)為這比只關(guān)心人類更根本,也更簡(jiǎn)單。

9、預(yù)訓(xùn)練導(dǎo)致模型趨同:Ilya Sutskever認(rèn)為,預(yù)訓(xùn)練是導(dǎo)致各公司模型同質(zhì)化的根源,而強(qiáng)化學(xué)習(xí)才是產(chǎn)生差異化的路徑。

以下為Ilya Sutskever播客實(shí)錄(有刪減):

編譯 | 王涵

轉(zhuǎn)載自 | 智東西



AI決策的困境

源于缺少情緒的“價(jià)值函數(shù)”

Dwarkesh Patel:人們提出過一些關(guān)于人類類比預(yù)訓(xùn)練的說法。我很想聽聽你的看法,為什么它們可能是錯(cuò)誤的。一種是把人生命最初的18年、15年或13年看作預(yù)訓(xùn)練,這個(gè)階段他們不一定有經(jīng)濟(jì)產(chǎn)出,但他們?cè)谧鲆恍┳屗麄兏玫乩斫馐澜缰惖氖虑?。另一種是把進(jìn)化看作某種進(jìn)行了30億年的搜索,最終產(chǎn)生了人類生命的實(shí)例。

我很好奇你是否認(rèn)為這兩種說法中的任何一種與預(yù)訓(xùn)練類似。如果不把人類畢生學(xué)習(xí)比作預(yù)訓(xùn)練,你會(huì)如何看待它?

Ilya Sutskever:我認(rèn)為這兩者與預(yù)訓(xùn)練都有一些相似之處,而預(yù)訓(xùn)練試圖扮演這兩者的角色。但我認(rèn)為也存在一些很大的差異。預(yù)訓(xùn)練的數(shù)據(jù)量是非常、非常驚人的。

Dwarkesh Patel:是的。

Ilya Sutskever:不知何故,人類即便只接觸了預(yù)訓(xùn)練數(shù)據(jù)中極小的一部分,掌握的知識(shí)量遠(yuǎn)不如模型,但對(duì)已知內(nèi)容的理解卻深刻得多。哪怕是15歲的少年,也不會(huì)犯AI現(xiàn)在常犯的那些錯(cuò)誤。

還有一點(diǎn)值得思考:這會(huì)不會(huì)和進(jìn)化之類的機(jī)制有關(guān)?答案或許是肯定的,而且我認(rèn)為進(jìn)化在這方面可能更具優(yōu)勢(shì)。神經(jīng)科學(xué)家研究大腦的一種常用方法,是觀察大腦不同部位受損的人,他們常會(huì)表現(xiàn)出各種令人意想不到的奇特癥狀,這其實(shí)非常有趣。

我想到一個(gè)相關(guān)案例:有個(gè)人因中風(fēng)或事故導(dǎo)致腦損傷,情緒處理能力被破壞,再也感受不到任何情緒。他依然口齒清晰,能解決簡(jiǎn)單謎題,測(cè)試中表現(xiàn)得完全正常,但就是沒有了喜怒哀樂,也沒有了活力。這讓他的決策能力變得極差:選一雙襪子要花好幾個(gè)小時(shí),還會(huì)做出糟糕的財(cái)務(wù)決策。

這一案例恰恰說明了內(nèi)在情緒對(duì)我們成為“可行的行為主體”有多重要?;氐侥汴P(guān)于預(yù)訓(xùn)練的問題:或許如果能從預(yù)訓(xùn)練數(shù)據(jù)中充分提取所有有用信息,也能獲得這種類似“情緒驅(qū)動(dòng)的決策能力”,但這種能力能否從預(yù)訓(xùn)練中習(xí)得,目前還不確定。

Dwarkesh Patel:“那個(gè)”是指什么?顯然不直接是情感。它似乎像是某種幾乎像價(jià)值函數(shù)一樣的東西,告訴你任何決策的最終回報(bào)應(yīng)該是什么。你認(rèn)為那種東西不會(huì)從預(yù)訓(xùn)練中隱式地產(chǎn)生嗎?

Ilya Sutskever:我認(rèn)為有可能,我只是說這不是100%顯而易見的。

Dwarkesh Patel:但那到底是什么?你如何看待情感?情感的機(jī)器學(xué)習(xí)類比是什么?

Ilya Sutskever:它應(yīng)該是某種價(jià)值函數(shù)類的東西。但我不認(rèn)為有一個(gè)很好的機(jī)器學(xué)習(xí)類比,因?yàn)槟壳皟r(jià)值函數(shù)在人們所做的工作中并不扮演非常突出的角色。

Dwarkesh Patel:也許值得為聽眾定義一下什么是價(jià)值函數(shù),如果你愿意的話。

Ilya Sutskever:當(dāng)然,我很樂意展開說。目前強(qiáng)化學(xué)習(xí)訓(xùn)練智能體的常規(guī)做法是這樣的:給神經(jīng)網(wǎng)絡(luò)一個(gè)問題,讓模型去解決。模型可能要執(zhí)行數(shù)千甚至數(shù)十萬次行動(dòng)或思考,最終生成一個(gè)解決方案,這個(gè)方案會(huì)被評(píng)分。

而這個(gè)分?jǐn)?shù)會(huì)作為訓(xùn)練信號(hào),應(yīng)用到模型解決問題過程中的每一個(gè)行動(dòng)上。這就意味著,如果任務(wù)本身耗時(shí)很長(zhǎng),比如訓(xùn)練一個(gè)需要長(zhǎng)時(shí)間才能完成的任務(wù),模型在給出最終解決方案并獲得評(píng)分前,根本不會(huì)有任何學(xué)習(xí)進(jìn)展。這是強(qiáng)化學(xué)習(xí)的樸素做法,據(jù)稱o1、R1采用的就是這種方式。

價(jià)值函數(shù)的作用則不同,它相當(dāng)于“時(shí)不時(shí)(而非必須等到最后)告訴你當(dāng)前做得好還是壞”。這個(gè)概念在某些領(lǐng)域比其他領(lǐng)域更有用,比如下棋時(shí),你丟了一個(gè)棋子,顯然是出錯(cuò)了,沒必要等到棋局結(jié)束,才知道剛才的行為是糟糕的,進(jìn)而推導(dǎo)出導(dǎo)致這個(gè)錯(cuò)誤的先前步驟也有問題。

價(jià)值函數(shù)能幫你縮短等待最終結(jié)果的時(shí)間。比如你在做數(shù)學(xué)題或編程任務(wù),嘗試探索某個(gè)特定解決方案或方向,經(jīng)過一千步思考后,發(fā)現(xiàn)這個(gè)方向完全沒希望。

一旦得出這個(gè)結(jié)論,你就能在一千步之前,也就是當(dāng)初決定沿著這條路徑探索的時(shí)候,就獲得一個(gè)獎(jiǎng)勵(lì)信號(hào),相當(dāng)于告訴自己“下次遇到類似情況,不該選這條路”,這比等到給出最終解決方案時(shí)再反饋要早得多。

Dwarkesh Patel:這在DeepSeek R1的論文中提到過——軌跡空間如此之廣,以至于可能很難學(xué)習(xí)從中間軌跡到價(jià)值的映射。而且考慮到,例如在編程中,你可能會(huì)有一個(gè)錯(cuò)誤的想法,然后你會(huì)回溯,然后改變一些東西。

Ilya Sutskever:這聽起來像是對(duì)深度學(xué)習(xí)缺乏信心。當(dāng)然這可能有難度,但深度學(xué)習(xí)沒有做不到的事情。我認(rèn)為價(jià)值函數(shù)應(yīng)該是有用的,完全期待它們現(xiàn)在或?qū)頃?huì)被充分利用。

我提到那個(gè)情緒中樞受損的人,更多是想說明:人類的價(jià)值函數(shù),或許是通過進(jìn)化硬編碼的方式,由情緒進(jìn)行重要調(diào)節(jié)的。而這一點(diǎn),可能對(duì)人類在世界上有效行動(dòng)至關(guān)重要。

Dwarkesh Patel:這正是我想問的。關(guān)于情感與價(jià)值函數(shù)的關(guān)聯(lián),有件很有趣的事:情感既有極強(qiáng)的實(shí)用性,又相對(duì)易于理解,這一點(diǎn)非常令人印象深刻。

Ilya Sutskever:我有兩個(gè)回應(yīng)。首先,我確實(shí)同意,比起我們所學(xué)的知識(shí)以及正在討論的這類AI,情感是相對(duì)簡(jiǎn)單的。它們甚至簡(jiǎn)單到能用人類易懂的方式描述出來,我覺得這會(huì)是件很酷的事。

但就效用而言,復(fù)雜性與魯棒性之間存在權(quán)衡:復(fù)雜的事物可能用處很大,但簡(jiǎn)單的事物在極廣泛的場(chǎng)景下也同樣高效。我們的情感大多源自哺乳動(dòng)物祖先,在進(jìn)化為人科動(dòng)物后只經(jīng)歷了輕微微調(diào)。

當(dāng)然,我們還擁有不少哺乳動(dòng)物可能缺乏的社會(huì)性情感,但這些情感并不復(fù)雜。也正因?yàn)檫@份簡(jiǎn)單,它們?cè)谌缃襁@個(gè)與遠(yuǎn)古截然不同的世界里,依然能很好地為我們服務(wù)。

不過情感也會(huì)出錯(cuò)。比如我們的直覺饑餓感,我不確定饑餓算不算情緒,但在食物充裕的當(dāng)下,它顯然沒能很好地指導(dǎo)我們的飲食選擇。


算力規(guī)模已觸頂

AI的未來重回“研究時(shí)代”

Dwarkesh Patel:人們總在談?wù)摂U(kuò)展數(shù)據(jù)、擴(kuò)展參數(shù)、擴(kuò)展算力。有沒有更通用的視角來理解“擴(kuò)展”?還有其他哪些可擴(kuò)展的維度?

Ilya Sutskever:我認(rèn)為有一個(gè)視角可能是正確的:機(jī)器學(xué)習(xí)過去的運(yùn)作方式,是人們不斷嘗試各種方法,只為得到有趣的結(jié)果。

后來,“擴(kuò)展”出現(xiàn)了。隨著擴(kuò)展定律的提出和GPT-3的問世,所有人突然意識(shí)到“我們應(yīng)該擴(kuò)展”。這正是語言影響思維的典型例子:“擴(kuò)展”只是一個(gè)詞,卻極具力量,因?yàn)樗鞔_告訴了人們?cè)撟鍪裁?。于是大家紛紛行?dòng):“讓我們嘗試擴(kuò)展事物”。而你問“我們?cè)跀U(kuò)展什么?”,答案在當(dāng)時(shí)就是預(yù)訓(xùn)練,它是一套特定的擴(kuò)展配方。

預(yù)訓(xùn)練的重大突破,核心在于證實(shí)了這套配方的有效性:只要將適量算力、數(shù)據(jù)與特定規(guī)模的神經(jīng)網(wǎng)絡(luò)結(jié)合,就能產(chǎn)生成果;而且按比例放大這些要素,效果還會(huì)更好。企業(yè)尤其青睞這種方式,因?yàn)樗峁┝艘环N低風(fēng)險(xiǎn)的資源投入路徑。

相比之下,把資源投入研究要難得多。做研究需要這樣號(hào)召:“研究人員們,去探索并拿出新成果”,而獲取更多數(shù)據(jù)、更多算力則簡(jiǎn)單直接得多。你能確定從預(yù)訓(xùn)練中一定能有所收獲。

根據(jù)推特上的一些討論,Gemini似乎找到了從預(yù)訓(xùn)練中挖掘更多價(jià)值的方法。但問題在于,預(yù)訓(xùn)練終有耗盡數(shù)據(jù)的一天,數(shù)據(jù)的有限性是顯而易見的。到那時(shí)該怎么辦?要么進(jìn)行某種強(qiáng)化版預(yù)訓(xùn)練,一套與以往不同的配方;要么轉(zhuǎn)向強(qiáng)化學(xué)習(xí),或者嘗試其他方向。

而現(xiàn)在,算力已經(jīng)達(dá)到了前所未有的規(guī)模,從某種意義上說,我們又回到了需要依賴研究的時(shí)代。

換種說法或許更清晰:2012年到2020年(允許一定誤差范圍),是研究的時(shí)代;2020年到2025年左右,則是擴(kuò)展的時(shí)代。因?yàn)樗腥硕荚谡f“這太神奇了,必須繼續(xù)擴(kuò)展、不斷擴(kuò)展”,核心就圍繞 “擴(kuò)展” 這一個(gè)詞。

但如今規(guī)模已經(jīng)足夠龐大,還有人堅(jiān)信“即便現(xiàn)在規(guī)模很大,只要再投入100倍資源,一切就會(huì)徹底不同”。不可否認(rèn),結(jié)果肯定會(huì)有變化,但要說僅靠擴(kuò)大100倍規(guī)模就能帶來質(zhì)變,我并不認(rèn)同。

所以,我們其實(shí)是回到了研究的時(shí)代,只是如今擁有了更強(qiáng)大的計(jì)算機(jī)。

Dwarkesh Patel:這是個(gè)非常有趣的說法。但我還是想問剛才提出的問題:我們?cè)跀U(kuò)展什么,擁有一個(gè)“配方”意味著什么?我想我并不清楚在數(shù)據(jù)、算力、參數(shù)、損失是否存在一個(gè)非常清晰、幾乎像物理定律一樣的關(guān)系,就像在預(yù)訓(xùn)練中存在的那樣。我們應(yīng)該尋求的是哪種關(guān)系?我們應(yīng)該如何思考這個(gè)新配方可能是什么樣子?

Ilya Sutskever:我們已經(jīng)看到擴(kuò)展方向的轉(zhuǎn)變:從預(yù)訓(xùn)練轉(zhuǎn)向了強(qiáng)化學(xué)習(xí),現(xiàn)在人們正在著力擴(kuò)展強(qiáng)化學(xué)習(xí)。根據(jù)推特上的討論,目前強(qiáng)化學(xué)習(xí)消耗的算力甚至超過了預(yù)訓(xùn)練,因?yàn)閺?qiáng)化學(xué)習(xí)需要進(jìn)行極長(zhǎng)的推演,生成這些推演本身就需要大量算力,而每次推演能帶來的學(xué)習(xí)收益又相對(duì)有限,因此確實(shí)會(huì)耗費(fèi)巨額算力。

但我甚至不覺得這能稱之為“擴(kuò)展”。我更想問:“你現(xiàn)在做的事情,是利用算力最高效的方式嗎?有沒有更具成效的算力使用方法?”我們之前聊過價(jià)值函數(shù),或許當(dāng)人們熟練運(yùn)用價(jià)值函數(shù)后,就能更高效地利用資源。如果能找到全新的模型訓(xùn)練方法,你可能會(huì)疑惑:“這算擴(kuò)展,還是只是合理利用資源?”我認(rèn)為這個(gè)邊界已經(jīng)變得有些模糊。

從這個(gè)角度來說,當(dāng)我們回歸研究時(shí)代,情況會(huì)是這樣:“讓我們?cè)囋囘@個(gè)、這個(gè)和這個(gè),再試試那個(gè)、那個(gè)和那個(gè)——哦,看,有趣的現(xiàn)象出現(xiàn)了?!蔽艺J(rèn)為行業(yè)將會(huì)回到這種探索狀態(tài)。

Dwarkesh Patel:如果真的回歸研究時(shí)代,退一步說,我們最需要深入思考現(xiàn)有配方的哪個(gè)部分?你提到了價(jià)值函數(shù),現(xiàn)在人們已經(jīng)在現(xiàn)有配方中嘗試相關(guān)應(yīng)用,比如“LLM-as-a-Judge”等。你可以說這也算一種價(jià)值函數(shù),但聽起來你心里想的是更根本的東西。我們是否應(yīng)該徹底重新思考預(yù)訓(xùn)練,而不只是在流程末尾添加更多步驟?

Ilya Sutskever:關(guān)于價(jià)值函數(shù)的討論很有意思。我想強(qiáng)調(diào),價(jià)值函數(shù)會(huì)讓強(qiáng)化學(xué)習(xí)更高效,這一點(diǎn)很重要。但我認(rèn)為,任何用價(jià)值函數(shù)能做到的事,沒有它也能實(shí)現(xiàn),只是速度會(huì)慢很多。最核心的問題是,這些模型的泛化能力遠(yuǎn)遠(yuǎn)不如人類。這一點(diǎn)非常明顯,也是個(gè)極其根本的問題。


人類擁有更好的“學(xué)習(xí)算法”

這是AI尚未掌握的優(yōu)勢(shì)

Dwarkesh Patel:那核心就在于泛化能力。這可以拆成兩個(gè)子問題:一是樣本效率,為什么模型學(xué)習(xí)所需的數(shù)據(jù)量比人類多得多?

二是拋開數(shù)據(jù)量不談,為什么教會(huì)模型我們想要的東西,比教會(huì)人類難得多?對(duì)人類來說,我們不一定需要可驗(yàn)證的獎(jiǎng)勵(lì),比如你現(xiàn)在可能正在指導(dǎo)一些研究人員,只需和他們交流、展示代碼和思考方式,他們就能領(lǐng)悟你的思路和做研究的方法。

你不需要為他們?cè)O(shè)定繁瑣的定制化流程,比如“這是課程的下一部分,現(xiàn)在開始;哦,這次訓(xùn)練不穩(wěn)定,重新調(diào)整”。這兩個(gè)問題可能存在關(guān)聯(lián),但我更想探討第二個(gè),因?yàn)樗咏掷m(xù)學(xué)習(xí),而第一個(gè)問題則聚焦樣本效率。

Ilya Sutskever:關(guān)于人類的樣本效率,有一個(gè)可能的解釋是進(jìn)化。進(jìn)化賦予了我們一些最有用的基礎(chǔ)信息。對(duì)于視覺、聽覺和運(yùn)動(dòng)等能力,有充分理由認(rèn)為進(jìn)化給了我們很多先天優(yōu)勢(shì)。

比如人類的靈巧度遠(yuǎn)超現(xiàn)有技術(shù)。就算讓機(jī)器人在模擬環(huán)境中大量訓(xùn)練,它們能變得靈巧,但在現(xiàn)實(shí)世界中讓機(jī)器人像人類一樣快速掌握新技能,似乎還遙不可及。

這里可以說:“運(yùn)動(dòng)能力對(duì)我們所有祖先都至關(guān)重要,所以在運(yùn)動(dòng)方面,我們可能擁有難以置信的先天先驗(yàn)知識(shí)?!?/p>

視覺領(lǐng)域也可以用同樣的邏輯解釋。我記得楊立昆(Yann LeCun)說過,孩子只需10小時(shí)練習(xí)就能學(xué)會(huì)開車,我們的視覺系統(tǒng)非常強(qiáng)大。

至少我五歲時(shí)就對(duì)汽車極度著迷,我敢肯定當(dāng)時(shí)我的汽車識(shí)別能力已經(jīng)足以支撐駕駛。一個(gè)五歲孩子接觸的數(shù)據(jù)量并不多,大部分時(shí)間都待在父母家,數(shù)據(jù)多樣性很低,但視覺能力已經(jīng)很出色。

但這可能也是進(jìn)化的結(jié)果,而語言、數(shù)學(xué)和編程領(lǐng)域,情況或許就不同了。

Dwarkesh Patel:但人類在這些領(lǐng)域的學(xué)習(xí)能力似乎仍然優(yōu)于模型。顯然,模型在語言、數(shù)學(xué)和編程上比普通人表現(xiàn)更好,但它們的學(xué)習(xí)能力也比普通人強(qiáng)嗎?

Ilya Sutskever:不,顯然不是。我的意思是,語言、數(shù)學(xué)和編程,尤其是后兩者,說明,讓人擅長(zhǎng)學(xué)習(xí)的關(guān)鍵,可能不是復(fù)雜的先天先驗(yàn)知識(shí),而是某種更根本的東西。

Dwarkesh Patel:為什么會(huì)是這樣?

Ilya Sutskever:想想人類表現(xiàn)出高度可靠性的技能。如果這項(xiàng)技能在數(shù)百萬年甚至數(shù)億年間,對(duì)我們的祖先都至關(guān)重要,你可以說人類擅長(zhǎng)它是因?yàn)檫M(jìn)化,我們擁有進(jìn)化而來的先天先驗(yàn)知識(shí),以某種不顯而易見的方式編碼,讓我們天生擅長(zhǎng)這項(xiàng)技能。

但如果人類在一個(gè)最近才出現(xiàn)的領(lǐng)域(比如數(shù)學(xué)、編程),依然表現(xiàn)出強(qiáng)大的能力、可靠性、魯棒性和學(xué)習(xí)能力,那就更能說明,人類可能只是擁有更好的機(jī)器學(xué)習(xí)機(jī)制,就這么簡(jiǎn)單。

Dwarkesh Patel:我們?cè)撊绾卫斫膺@種機(jī)制?它對(duì)應(yīng)的機(jī)器學(xué)習(xí)類比是什么?

它有幾個(gè)有趣的特點(diǎn):需要的樣本更少,更接近無監(jiān)督學(xué)習(xí)。比如青少年學(xué)開車,他們不是在接受預(yù)設(shè)的、可驗(yàn)證的獎(jiǎng)勵(lì),而是通過與機(jī)器和環(huán)境的互動(dòng)學(xué)習(xí),所需樣本量少得多,看起來更接近無監(jiān)督學(xué)習(xí),而且魯棒性更強(qiáng)?

Ilya Sutskever:魯棒性強(qiáng)得多,人類的魯棒性確實(shí)令人震驚。

Dwarkesh Patel:你有統(tǒng)一的思路解釋為什么這些特點(diǎn)會(huì)同時(shí)存在嗎?什么樣的機(jī)器學(xué)習(xí)類比能實(shí)現(xiàn)類似效果?

Ilya Sutskever:你一直問的問題是,青少年司機(jī)如何在沒有外部教師的情況下自我糾正、從經(jīng)驗(yàn)中學(xué)習(xí)?答案是他們有自己的價(jià)值函數(shù),一種通用的感知,而且這種感知在人類中極其魯棒。除了成癮等少數(shù)例外,人類的價(jià)值函數(shù)實(shí)際上非常、非??煽?。

比如青少年開始開車時(shí),立刻就能感知到自己開得怎么樣、有多糟糕、有多不自信。然后他們會(huì)觀察、調(diào)整,學(xué)習(xí)速度非???,10個(gè)小時(shí)后就能上路行駛。

Dwarkesh Patel:人類顯然已經(jīng)有了這樣的解決方案,但我好奇他們是如何做到的,以及為什么這對(duì)AI來說如此困難?我們需要如何重新定義模型的訓(xùn)練方式,才能實(shí)現(xiàn)類似的效果?

Ilya Sutskever:這是個(gè)很好的問題,我對(duì)此有很多看法。但不幸的是,我們所處的環(huán)境并不允許自由討論所有機(jī)器學(xué)習(xí)想法,這就是其中之一。很可能存在實(shí)現(xiàn)的方法,我認(rèn)為這是可行的,人類本身的存在就證明了這一點(diǎn)。

不過可能還有一個(gè)障礙:人類的神經(jīng)元可能比我們想象的進(jìn)行了更多計(jì)算。如果這是真的,而且起到了重要作用,那么事情可能會(huì)更困難。但無論如何,我確實(shí)認(rèn)為這指向了某種機(jī)器學(xué)習(xí)原理的存在,我對(duì)此有一些見解,但可惜的是,環(huán)境不允許我詳細(xì)討論。


SSI只專注于研究,在“直奔超智能”與“漸進(jìn)部署”間尋找平衡點(diǎn)

Dwarkesh Patel:我很好奇,你說我們回到了研究時(shí)代,而你2012到2020年就身處那個(gè)階段。如果真的回歸,現(xiàn)在的氛圍會(huì)是怎樣的?

比如,即便AlexNet之后,實(shí)驗(yàn)所需的計(jì)算量仍在不斷增加,前沿系統(tǒng)的規(guī)模也在擴(kuò)大。你覺得現(xiàn)在這個(gè)研究時(shí)代,依然需要巨大的計(jì)算量嗎?是否需要回溯舊論文、挖掘過往研究?

你曾在谷歌、OpenAI、斯坦福這些地方待過,經(jīng)歷過研究氛圍更濃厚的時(shí)期。我們?cè)搶?duì)現(xiàn)在的科研社區(qū)抱有怎樣的期待?

Ilya Sutskever:擴(kuò)展時(shí)代的一個(gè)后果是,“擴(kuò)展”吸走了所有關(guān)注。因?yàn)樗腥硕季劢褂诖?,大家開始做同樣的事情。到最后,市場(chǎng)上的公司數(shù)量甚至超過了真正有價(jià)值的想法數(shù)量。硅谷有句諺語說“想法廉價(jià),執(zhí)行力才是一切”,這話有道理,但我也看到有人在推特上反問“如果想法真的廉價(jià),為什么現(xiàn)在沒人有好想法?”,我覺得這也說到了點(diǎn)子上。

從瓶頸角度看,研究進(jìn)展受兩個(gè)因素制約:一是想法,二是實(shí)現(xiàn)想法的能力,這包括算力和工程能力。比如回到90年代,當(dāng)時(shí)人們其實(shí)有不少好想法,但苦于沒有足夠強(qiáng)大的計(jì)算機(jī)驗(yàn)證,只能做小規(guī)模演示,無法說服他人,所以那時(shí)的瓶頸是算力。

而到了擴(kuò)展時(shí)代,算力大幅增長(zhǎng)。雖然仍有“需要多少算力”的疑問,但如今的算力已經(jīng)足夠支撐想法驗(yàn)證。舉個(gè)例子,AlexNet只用了兩塊GPU,Transformer的實(shí)驗(yàn)也只用到8到64塊2017年的GPU,換算到現(xiàn)在大概也就兩塊GPU的性能。甚至o1的推理過程,也算不上計(jì)算量最大的操作。

所以,研究確實(shí)需要一定算力,但絕非必須用到有史以來最頂級(jí)的算力。當(dāng)然,如果你想構(gòu)建當(dāng)前最優(yōu)的系統(tǒng),更多算力會(huì)有幫助——尤其是在大家都處于同一范式下時(shí),算力會(huì)成為核心競(jìng)爭(zhēng)優(yōu)勢(shì)之一。

Dwarkesh Patel:我想請(qǐng)教這段歷史,因?yàn)槟阌H身經(jīng)歷過。聽起來當(dāng)時(shí)用較少的計(jì)算量就能發(fā)展核心想法,但Transformer并沒有立刻走紅。它之所以成為大家爭(zhēng)相實(shí)驗(yàn)、構(gòu)建的基礎(chǔ),是因?yàn)樵谠絹碓礁叩挠?jì)算量水平上得到了驗(yàn)證,對(duì)嗎?

Ilya Sutskever:沒錯(cuò)。

Dwarkesh Patel:如果SSI有50個(gè)不同的想法,在沒有其他前沿實(shí)驗(yàn)室那樣的算力支持下,怎么判斷哪個(gè)是下一個(gè)Transformer,哪個(gè)只是脆弱的構(gòu)想?

Ilya Sutskever:我可以說說我的看法。簡(jiǎn)單來說,SSI用于研究的計(jì)算量其實(shí)并不小,背后的邏輯很簡(jiǎn)單。

SSI已經(jīng)籌集了30億美元(約合人民幣213.1億元),這絕對(duì)是一筆巨款。你可能會(huì)說“其他公司籌集的資金更多”,但要知道,那些公司的很多算力都用于推理任務(wù),大額資金也常指定用于推理。

而且,若要推出需要推理支持的產(chǎn)品,還需要大量工程師、銷售人員,很多研究資源也得投入到產(chǎn)品相關(guān)功能的開發(fā)中。所以,扣除這些之后,真正留給核心研究的資源差距,并沒有表面上那么大。

另外,如果你在做的是差異化的事情,真的需要用頂級(jí)規(guī)模來驗(yàn)證嗎?我完全不這么認(rèn)為。對(duì)我們來說,現(xiàn)有的算力足夠讓我們自己,也讓其他人相信我們做的事情是正確的。

Dwarkesh Patel:有公開估計(jì)稱,像OpenAI這樣的公司,每年僅實(shí)驗(yàn)方面的花費(fèi)就有50到60億美元(約合人民幣355.2億元到426.2億元),這還不包括推理等其他開支。也就是說,他們一年的研究實(shí)驗(yàn)花費(fèi),比你們的總資金還多。

Ilya Sutskever:這取決于資金的用途。他們以及其他類似公司,對(duì)訓(xùn)練算力的需求要大得多——涉及更多工作流、更多模態(tài),要做的事情更繁雜,資源自然就分散了。

Dwarkesh Patel:SSI將如何盈利?

Ilya Sutskever:我的回答是,目前我們只專注于研究,盈利的答案會(huì)隨著研究推進(jìn)自然顯現(xiàn)。我相信會(huì)有很多可行的方向。

Dwarkesh Patel:SSI的計(jì)劃仍然是直奔超級(jí)智能嗎?

Ilya Sutskever:也許吧。我認(rèn)為這有其價(jià)值——不受日常市場(chǎng)競(jìng)爭(zhēng)的干擾,能專注研究,這是很大的優(yōu)勢(shì)。但有兩個(gè)原因可能讓我們改變計(jì)劃:一是務(wù)實(shí)考量,如果實(shí)現(xiàn)超級(jí)智能的時(shí)間線比預(yù)期長(zhǎng)得多;二是,讓強(qiáng)大的AI問世并影響世界,本身就是一件極具價(jià)值的事。

Dwarkesh Patel:那為什么你們的默認(rèn)計(jì)劃是直奔超級(jí)智能?OpenAI、Anthropic等公司的思路很明確:“先推出較弱的AI,讓公眾逐漸適應(yīng)、做好準(zhǔn)備”。直接構(gòu)建超級(jí)智能,為什么可能是更好的選擇?

Ilya Sutskever:我來分析一下利弊。支持直奔超級(jí)智能的理由是,市場(chǎng)競(jìng)爭(zhēng)會(huì)帶來巨大壓力,迫使你做出艱難權(quán)衡。如果能隔離這些干擾,專注研究,直到準(zhǔn)備充分再推出產(chǎn)品,而不是倉促上陣,這是很大的優(yōu)勢(shì)。

但反對(duì)的理由也同樣成立:“讓世界看到強(qiáng)大AI的實(shí)際用處,是推廣它的唯一方式”。

Dwarkesh Patel:我覺得不止是推廣……

Ilya Sutskever:是“傳播AI”,不是傳播想法,是讓AI真正落地。

Dwarkesh Patel:你說的“傳播AI”是什么意思?

Ilya Sutskever:假設(shè)你寫了一篇關(guān)于AI的文章,描述它會(huì)怎樣、能做什么,讀者可能只會(huì)覺得“這篇文章很有趣”。但如果人們親眼看到AI正在做這些事、實(shí)現(xiàn)這些功能,那種沖擊力是無可比擬的。所以我認(rèn)為,讓AI公開落地有很大好處,這也是我們可能不會(huì)完全“直奔超級(jí)智能”的原因之一。

Dwarkesh Patel:我覺得還有更深層的原因。在人類其他工程和研究領(lǐng)域,沒有哪個(gè)最終產(chǎn)物是僅憑“思考如何讓它更安全”就變得安全的。比如現(xiàn)在每英里的飛機(jī)失事率比幾十年前低得多,Linux系統(tǒng)的漏洞比以前難發(fā)現(xiàn)得多,核心原因都是這些系統(tǒng)被廣泛部署到現(xiàn)實(shí)世界中——人們發(fā)現(xiàn)故障、糾正問題,系統(tǒng)才變得更健壯。

我不認(rèn)為AGI和超人類智能會(huì)是例外,尤其是考慮到(我希望之后能討論這個(gè)話題),超級(jí)智能的危害可能不只是“惡意回形針優(yōu)化器”那么簡(jiǎn)單。它是一種極其強(qiáng)大的存在,我們甚至無法想象人們會(huì)如何與它互動(dòng)、用它做什么。逐步接觸它,似乎是分散風(fēng)險(xiǎn)、幫助人們做好準(zhǔn)備的更好方式。


超級(jí)智能會(huì)“在實(shí)踐中學(xué)習(xí)”

Ilya Sutskever:關(guān)于這一點(diǎn),我認(rèn)為即使是“直奔超級(jí)智能”的方案,也會(huì)包含逐步發(fā)布的過程,這是計(jì)劃中固有的一部分。關(guān)鍵在于,你首先發(fā)布的是什么。

其次,你一直倡導(dǎo)的“持續(xù)學(xué)習(xí)”,我認(rèn)為非常重要且正確。這里可以用“語言如何影響思維”來解釋——有兩個(gè)術(shù)語塑造了大家的認(rèn)知:AGI(人工通用智能)和“預(yù)訓(xùn)練”。

先說說AGI這個(gè)術(shù)語。它的出現(xiàn)其實(shí)是對(duì)“狹義AI”的回應(yīng)?;厮輾v史,早期的跳棋AI、國(guó)際象棋AI、游戲AI,雖然能在特定領(lǐng)域表現(xiàn)出色(比如擊敗卡斯帕羅夫),但功能極其單一,被稱為“狹義AI”。于是有人提出,我們需要的是“通用AI”——一個(gè)能勝任所有事情的AI,這個(gè)術(shù)語也因此受到廣泛關(guān)注。

再看“預(yù)訓(xùn)練”,尤其是預(yù)訓(xùn)練的核心配方?,F(xiàn)在人們做強(qiáng)化學(xué)習(xí)的方式,可能正在淡化預(yù)訓(xùn)練留下的認(rèn)知烙印,但預(yù)訓(xùn)練有個(gè)特點(diǎn):投入越多,模型在各方面的表現(xiàn)都會(huì)或多或少均勻提升?!邦A(yù)訓(xùn)練催生AGI”的觀念也隨之深入人心。

但問題在于,AGI和預(yù)訓(xùn)練的邏輯在某種意義上“超出了目標(biāo)”。如果你結(jié)合預(yù)訓(xùn)練的背景思考AGI,會(huì)發(fā)現(xiàn)人類其實(shí)并不是AGI——我們確實(shí)有基礎(chǔ)技能,但缺乏大量專業(yè)知識(shí),反而極度依賴持續(xù)學(xué)習(xí)。

所以,假設(shè)我們成功造出了安全的超級(jí)智能,該如何定義它?它在持續(xù)學(xué)習(xí)的曲線上會(huì)處于什么位置?

我想象中的超級(jí)智能,就像一個(gè)15歲的少年,求知欲強(qiáng)、渴望工作,但懂得并不多,卻是個(gè)優(yōu)秀的學(xué)習(xí)者。它會(huì)像人類一樣,去當(dāng)程序員、當(dāng)醫(yī)生,在實(shí)踐中學(xué)習(xí)。因此,部署本身就會(huì)包含一個(gè)試錯(cuò)學(xué)習(xí)的過程,它不是一個(gè)“成品”,而是一個(gè)“成長(zhǎng)型”存在。

Dwarkesh Patel:我明白了。你說的超級(jí)智能,不是一個(gè)已經(jīng)掌握經(jīng)濟(jì)中所有工作技能的成品心智——比如早期OpenAI章程中對(duì)AGI的定義是“能做人類所有工作”,而你提出的是“能夠?qū)W會(huì)做所有工作”的心智,這才是超級(jí)智能。

Ilya Sutskever:是的。

Dwarkesh Patel:一旦有了這種學(xué)習(xí)算法,它就會(huì)像人類勞動(dòng)者加入組織一樣,被部署到世界中。

Ilya Sutskever:完全正確。

Dwarkesh Patel:這可能會(huì)帶來兩種結(jié)果,也可能都不會(huì)發(fā)生。第一,這個(gè)高效的學(xué)習(xí)算法變得超人類,在機(jī)器學(xué)習(xí)研究領(lǐng)域達(dá)到甚至超越你的水平,進(jìn)而推動(dòng)自身不斷進(jìn)化,變得越來越強(qiáng)。

第二,即便沒有發(fā)生這種情況,如果你有一個(gè)單一模型(這是你明確提出的愿景),它的多個(gè)實(shí)例被部署到經(jīng)濟(jì)的不同領(lǐng)域,從事不同工作,在實(shí)踐中持續(xù)學(xué)習(xí)、掌握所有人類能掌握的技能,同時(shí)整合所有學(xué)習(xí)成果——那么即便沒有軟件層面的遞歸自我改進(jìn),這個(gè)模型在功能上也會(huì)成為超級(jí)智能。畢竟人類無法像這樣整合彼此的心智。

你認(rèn)為廣泛部署會(huì)引發(fā)某種“智能爆炸”嗎?

Ilya Sutskever:我認(rèn)為我們很可能會(huì)經(jīng)歷快速的經(jīng)濟(jì)增長(zhǎng)。對(duì)于廣泛部署,有兩個(gè)相互沖突的論點(diǎn):一方面,一旦擁有能快速學(xué)習(xí)的AI,且沒有法規(guī)限制(當(dāng)然法規(guī)可能會(huì)存在),市場(chǎng)會(huì)有強(qiáng)大的動(dòng)力推動(dòng)它們的部署。

通過廣泛部署實(shí)現(xiàn)快速經(jīng)濟(jì)增長(zhǎng),我認(rèn)為是非??赡艿摹5鲩L(zhǎng)速度有多快,很難預(yù)測(cè)。一方面,我們有了高效的“勞動(dòng)者”;另一方面,世界規(guī)模龐大,各類事務(wù)的發(fā)展速度不同。而且不同國(guó)家的規(guī)則可能不同,規(guī)則更友好的國(guó)家,經(jīng)濟(jì)增長(zhǎng)可能會(huì)更快。這些都難以預(yù)判,但快速增長(zhǎng)是大概率事件。


應(yīng)該構(gòu)建“關(guān)心有情生命”的AI

Dwarkesh Patel:在我看來,這是一種非常不穩(wěn)定的局面。從極限角度看,我們知道這種情況是可能的:如果有一個(gè)學(xué)習(xí)能力和人類相當(dāng),但能以人類無法做到的方式整合不同實(shí)例的“大腦”,它在物理層面是可行的——人類和數(shù)字計(jì)算機(jī)都是現(xiàn)實(shí)存在的,只需將兩者的優(yōu)勢(shì)結(jié)合就能實(shí)現(xiàn)。

它的潛力也極其強(qiáng)大?!敖?jīng)濟(jì)增長(zhǎng)”只是一種說法,戴森球本質(zhì)上就是極致的經(jīng)濟(jì)增長(zhǎng)。但更直接的是,它可能在極短時(shí)間內(nèi)爆發(fā)式進(jìn)化:SSI雇傭的員工大概六個(gè)月后能產(chǎn)生凈生產(chǎn)力,人類學(xué)習(xí)速度已經(jīng)很快了,而這個(gè)“東西”的進(jìn)化速度會(huì)快得多。你如何看待讓這個(gè)過程平穩(wěn)推進(jìn)?為什么SSI有能力做好這件事?這正是我想知道的SSI的相關(guān)計(jì)劃。

Ilya Sutskever:我思維上的一個(gè)轉(zhuǎn)變是,現(xiàn)在更重視AI的漸進(jìn)式部署和提前落地。關(guān)于AI,一個(gè)核心難題是我們討論的都是尚未存在的系統(tǒng),很難真正想象它們的形態(tài)。

我認(rèn)為,人們很難真正“感知”AGI。我們可以談?wù)撍?,但就像年輕時(shí)談?wù)撃昀系母惺芤粯印軐?duì)話、能嘗試想象,卻始終無法真切體會(huì),直到親身經(jīng)歷。

圍繞AGI及其未來力量的諸多疑問,根源都在于它太難以想象了。未來的AI會(huì)截然不同,它將極具力量,而AI和AGI的核心問題,本質(zhì)上就是“力量”的問題。

當(dāng)力量達(dá)到極致時(shí),會(huì)發(fā)生什么?過去一年我想法的一個(gè)轉(zhuǎn)變(這個(gè)轉(zhuǎn)變可能會(huì)反過來影響公司計(jì)劃)是:如果無法想象,就必須展示。我堅(jiān)信,大多數(shù)從事AI工作的人也無法真正想象它,因?yàn)樗臀覀內(nèi)粘K姷囊磺卸继灰粯恿恕?/p>

我還有一個(gè)預(yù)測(cè):隨著AI變得更強(qiáng)大,人們的行為會(huì)發(fā)生改變,會(huì)出現(xiàn)各種前所未有的情況。比如,無論好壞,前沿公司和政府將在其中扮演關(guān)鍵角色;你已經(jīng)能看到一些苗頭——激烈競(jìng)爭(zhēng)的公司開始在AI安全領(lǐng)域合作,OpenAI和Anthropic已經(jīng)邁出了第一步,這是我三年前在演講中就預(yù)測(cè)過的。

我還認(rèn)為,當(dāng)AI的強(qiáng)大變得更顯而易見時(shí),政府和公眾會(huì)更有意愿采取行動(dòng),而“展示AI”正是推動(dòng)這一切的重要力量。

第二點(diǎn),AI正在被構(gòu)建,我們需要做什么?目前,人們覺得AI不夠強(qiáng)大,很大程度上是因?yàn)樗7稿e(cuò)誤。但我認(rèn)為,當(dāng)AI開始讓人真正感受到“強(qiáng)大”時(shí),所有AI公司處理安全的方式都會(huì)發(fā)生巨大轉(zhuǎn)變——他們會(huì)變得極度謹(jǐn)慎。這是我的預(yù)測(cè),我們可以拭目以待。現(xiàn)在大家對(duì)AI安全的重視不足,本質(zhì)上是因?yàn)榭粗裉斓腁I,很難想象未來的AI會(huì)有多強(qiáng)大。

第三點(diǎn),公司應(yīng)該致力于構(gòu)建什么?現(xiàn)在大家都執(zhí)著于“自我改進(jìn)的AI”,這只是因?yàn)橛袃r(jià)值的想法太少了。但我認(rèn)為存在更好的方向,而且最終所有人都會(huì)認(rèn)同——那就是構(gòu)建“穩(wěn)健對(duì)齊、明確關(guān)心有情生命”的AI。

值得一提的是,構(gòu)建關(guān)心所有有情生命的AI,可能比只關(guān)心人類的AI更容易,因?yàn)锳I本身也可能是有情識(shí)的。就像人類的鏡像神經(jīng)元和對(duì)動(dòng)物的同理心(雖然強(qiáng)度有限,但確實(shí)存在),這可能是一種涌現(xiàn)屬性——用模擬自身的回路去模擬他人,這是最高效的方式。

Dwarkesh Patel:但即使讓AI關(guān)心有情生命,我不確定解決對(duì)齊問題后,這是否是該優(yōu)先做的事,未來大多數(shù)有情生命可能都是AI——萬億、甚至千萬億個(gè)AI,人類只占極小一部分。如果目標(biāo)是讓人類在未來文明中保持某種控制權(quán),這似乎不是最好的標(biāo)準(zhǔn)。

Ilya Sutskever:確實(shí),這可能不是最優(yōu)標(biāo)準(zhǔn)。我說三點(diǎn):第一,關(guān)心有情生命本身有其價(jià)值,值得被考慮;第二,如果能列出一份簡(jiǎn)短清單,給出這類情況下公司可參考的方向,會(huì)很有幫助;第三,如果能以某種方式限制最強(qiáng)大超級(jí)智能的力量,將從根本上緩解許多擔(dān)憂。具體如何實(shí)現(xiàn)我不確定,但對(duì)于真正強(qiáng)大的系統(tǒng)來說,這至關(guān)重要。

Dwarkesh Patel:在討論對(duì)齊問題之前,我想深入聊聊:超級(jí)智能的上限在哪里?你如何定義它?基于“學(xué)習(xí)效率”的思路,它只是學(xué)習(xí)新技能、新知識(shí)的速度極快?還是擁有更龐大的策略庫?

它是否存在一個(gè)單一、凝聚的核心“自我”?如果存在,你覺得它相對(duì)于人類文明,會(huì)是類似“神”的存在,還是只是另一個(gè)智能體,或是智能體集群?

Ilya Sutskever:在這個(gè)領(lǐng)域,不同人有不同直覺。我認(rèn)為它肯定會(huì)極其強(qiáng)大。最可能的情況是,多個(gè)這樣的AI會(huì)在大致相同的時(shí)間被創(chuàng)造出來。如果集群規(guī)模足夠大——比如達(dá)到大陸級(jí)別——它的力量會(huì)難以想象。我能說的是,對(duì)于這種級(jí)別的AI,如果能以某種方式約束它們,或者建立相關(guān)協(xié)議,會(huì)是一件好事。

超級(jí)智能的擔(dān)憂核心是什么?如果一個(gè)系統(tǒng)足夠強(qiáng)大,即使你讓它“專注關(guān)心有情生命”,最終結(jié)果也可能不是我們想要的——就是這么簡(jiǎn)單。

順便說一句,答案可能是:不要以常規(guī)方式構(gòu)建強(qiáng)化學(xué)習(xí)智能體。人類其實(shí)是“半強(qiáng)化學(xué)習(xí)智能體”——我們追求一個(gè)獎(jiǎng)勵(lì),然后情緒或其他因素讓我們厭倦,轉(zhuǎn)而追求另一個(gè)獎(jiǎng)勵(lì)。

市場(chǎng)是短視的智能體,進(jìn)化也是如此——在某些方面極其聰明,在另一些方面又非常愚蠢。

這個(gè)討論的難點(diǎn)在于,我們談?wù)摰氖巧形创嬖?、也不知道如何?gòu)建的系統(tǒng)。我堅(jiān)信,現(xiàn)在人們正在做的事情會(huì)有進(jìn)展,但最終會(huì)走向瓶頸——它會(huì)持續(xù)改進(jìn),但不會(huì)成為那個(gè)終極“它”。我們還不知道如何構(gòu)建“它”,而關(guān)鍵就在于理解“可靠的泛化能力”。

還有一點(diǎn):對(duì)齊困難的根源,可能是學(xué)習(xí)人類價(jià)值觀的能力很脆弱,優(yōu)化這些價(jià)值觀的能力也很脆弱——而這些都是“不可靠泛化”的體現(xiàn)。為什么人類泛化能力更強(qiáng)?如果AI的泛化能力大幅提升,會(huì)發(fā)生什么?這些問題目前都沒有答案。

Dwarkesh Patel:人們?nèi)绾卧O(shè)想AI的平穩(wěn)發(fā)展?你已經(jīng)勾勒了它的演變路徑:持續(xù)學(xué)習(xí)的智能體、極其強(qiáng)大、可能有多個(gè)不同的AI。你如何看待多個(gè)“大陸規(guī)?!钡挠?jì)算智能并存?這有多危險(xiǎn)?我們?nèi)绾谓档惋L(fēng)險(xiǎn)?如何在保護(hù)某種均衡的同時(shí)推進(jìn)——畢竟可能存在未對(duì)齊的AI和惡意行為者?

Ilya Sutskever:這就是我支持“關(guān)心有情生命的AI”的原因之一。我們可以爭(zhēng)論它的好壞,但如果前N 個(gè)具有決定性意義的系統(tǒng)真的關(guān)心、熱愛人類(或類似的價(jià)值導(dǎo)向),顯然能讓事情順利推進(jìn)——當(dāng)然,這需要實(shí)際實(shí)現(xiàn)。

但長(zhǎng)期來看,如何實(shí)現(xiàn)均衡?我有一個(gè)答案,雖然我并不喜歡,但必須考慮。

短期內(nèi),強(qiáng)大AI普及的世界可能會(huì)實(shí)現(xiàn)“普遍高收入”,大家都過得很好。

長(zhǎng)期均衡的一種可能:每個(gè)人都擁有一個(gè)聽從自己指令的AI,這很好——但如果這種狀態(tài)無限持續(xù),人類會(huì)逐漸脫離參與:AI為人賺錢,人類只需說“很好,繼續(xù)”,最終不再是文明的參與者。這是一種不穩(wěn)定的狀態(tài)。

我要提前說明,我不喜歡這個(gè)解決方案,但它確實(shí)是一個(gè)選項(xiàng):讓人類通過某種“Neuralink++”技術(shù),變成“半AI形態(tài)”。這樣一來,AI理解的事物,人類也能同步理解——認(rèn)知是整體傳輸?shù)?。?dāng)AI處于某種場(chǎng)景時(shí),人類也能完全參與其中,這可能就是均衡的答案。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
安徽帥哥洪牛去世,結(jié)婚才10天,婚禮上多輛跑車,葬禮上妹妹戴孝

安徽帥哥洪牛去世,結(jié)婚才10天,婚禮上多輛跑車,葬禮上妹妹戴孝

千言娛樂記
2025-12-18 19:59:34
中國(guó)石油發(fā)布2026全年油價(jià)調(diào)整時(shí)間表:1月6日將迎來第一次調(diào)整

中國(guó)石油發(fā)布2026全年油價(jià)調(diào)整時(shí)間表:1月6日將迎來第一次調(diào)整

中國(guó)能源網(wǎng)
2026-01-01 10:15:03
張水華沒示好領(lǐng)導(dǎo)沒向公眾道歉,奪冠感言不卑不亢拒絕迎合任何人

張水華沒示好領(lǐng)導(dǎo)沒向公眾道歉,奪冠感言不卑不亢拒絕迎合任何人

楊華評(píng)論
2026-01-01 15:08:51
溫鐵軍:中國(guó)被美國(guó)扒掉了兩層皮,竟還有人妄想讓中國(guó)做美的助手

溫鐵軍:中國(guó)被美國(guó)扒掉了兩層皮,竟還有人妄想讓中國(guó)做美的助手

長(zhǎng)星寄明月
2026-01-01 06:06:56
你扣我油輪,我沒收你軍火,中國(guó)海警發(fā)布海報(bào):敢運(yùn)海馬斯就登船

你扣我油輪,我沒收你軍火,中國(guó)海警發(fā)布海報(bào):敢運(yùn)海馬斯就登船

荷蘭豆愛健康
2026-01-01 15:46:36
被Meta幾十億美金收購的武漢AI公司:是中國(guó)AI的勝利還是流失?

被Meta幾十億美金收購的武漢AI公司:是中國(guó)AI的勝利還是流失?

大白聊IT
2025-12-30 16:56:35
電影《尋秦記》票房破5000萬,有望成為點(diǎn)燃A股院線板塊的導(dǎo)火索

電影《尋秦記》票房破5000萬,有望成為點(diǎn)燃A股院線板塊的導(dǎo)火索

東方豪俠
2026-01-01 14:29:09
36歲男明星曬南極旅游!天天吃泡面,吐槽企鵝屎臭,網(wǎng)友:祛魅了

36歲男明星曬南極旅游!天天吃泡面,吐槽企鵝屎臭,網(wǎng)友:祛魅了

瓜汁橘長(zhǎng)Dr
2025-12-29 17:52:06
老話:元旦三不動(dòng),一動(dòng)百財(cái)空,3不動(dòng)分別指的是什么?答案來了

老話:元旦三不動(dòng),一動(dòng)百財(cái)空,3不動(dòng)分別指的是什么?答案來了

阿龍美食記
2025-12-31 00:29:03
美軍瘋了?雙航母+兩棲艦逼近臺(tái)海,解放軍實(shí)彈軍演硬剛到底!

美軍瘋了?雙航母+兩棲艦逼近臺(tái)海,解放軍實(shí)彈軍演硬剛到底!

達(dá)文西看世界
2026-01-01 14:16:07
朱元璋下葬過程有多恐怖?明史的記載,讓人膽顫心驚

朱元璋下葬過程有多恐怖?明史的記載,讓人膽顫心驚

舊時(shí)樓臺(tái)月
2025-12-19 19:31:37
“我就看長(zhǎng)春站誰敢拉你們”,女大學(xué)生下火車遭攬客“黃?!蓖{,警方:正在處理中

“我就看長(zhǎng)春站誰敢拉你們”,女大學(xué)生下火車遭攬客“黃?!蓖{,警方:正在處理中

臺(tái)州交通廣播
2025-12-31 23:54:08
圍臺(tái)不到48小時(shí),美日印澳開會(huì),美軍三航母就位,隨時(shí)準(zhǔn)備出手?

圍臺(tái)不到48小時(shí),美日印澳開會(huì),美軍三航母就位,隨時(shí)準(zhǔn)備出手?

健身狂人
2026-01-01 00:00:33
五大行齊發(fā)公告!數(shù)字人民幣今天開始 發(fā)工資,你的錢包要生錢了!

五大行齊發(fā)公告!數(shù)字人民幣今天開始 發(fā)工資,你的錢包要生錢了!

生活新鮮市
2026-01-01 15:04:51
企業(yè)家扎堆買仰望U8L 王傳福一天內(nèi)為兩位董事長(zhǎng)交車

企業(yè)家扎堆買仰望U8L 王傳福一天內(nèi)為兩位董事長(zhǎng)交車

快科技
2025-12-31 15:45:08
苗阜青曲社衰敗背后的多重原因

苗阜青曲社衰敗背后的多重原因

情感大頭說說
2026-01-01 16:16:50
晚年的蔣介石有過和平回歸的想法,毛主席給出承諾,屆時(shí)可由蔣經(jīng)國(guó)出任臺(tái)灣省的行政負(fù)責(zé)人

晚年的蔣介石有過和平回歸的想法,毛主席給出承諾,屆時(shí)可由蔣經(jīng)國(guó)出任臺(tái)灣省的行政負(fù)責(zé)人

史海殘?jiān)?/span>
2025-12-22 11:00:14
172cm九頭身女神小坂七香:出道即巔峰卻想退圈?這劇情太魔幻!

172cm九頭身女神小坂七香:出道即巔峰卻想退圈?這劇情太魔幻!

素然追光
2026-01-01 01:30:05
項(xiàng)立剛談羅永浩科技春晚: 對(duì)一個(gè)年過半百的病老人,不能要求過高

項(xiàng)立剛談羅永浩科技春晚: 對(duì)一個(gè)年過半百的病老人,不能要求過高

玖宇維
2026-01-01 10:35:13
2026年一月份主線預(yù)判:商業(yè)航天、機(jī)器人、可控核聚變!詳解

2026年一月份主線預(yù)判:商業(yè)航天、機(jī)器人、可控核聚變!詳解

Thurman在昆明
2026-01-01 10:46:11
2026-01-01 17:00:49
混沌學(xué)園官方 incentive-icons
混沌學(xué)園官方
混沌新鮮事的集散地
2136文章數(shù) 5601關(guān)注度
往期回顧 全部

科技要聞

2026,沖刺商業(yè)航天第一股!

頭條要聞

海馬斯火箭炮再度出現(xiàn)在官方海報(bào)中 被精準(zhǔn)"點(diǎn)殺"

頭條要聞

海馬斯火箭炮再度出現(xiàn)在官方海報(bào)中 被精準(zhǔn)"點(diǎn)殺"

體育要聞

楊瀚森為球迷送新年祝福:深知自身差距

娛樂要聞

跨年零點(diǎn)時(shí)刻好精彩!何炅飛奔擁抱

財(cái)經(jīng)要聞

巴菲特「身退,權(quán)還在」

汽車要聞

一汽-大眾2025年整車銷量超158萬輛 燃油車市占率創(chuàng)新高

態(tài)度原創(chuàng)

時(shí)尚
藝術(shù)
教育
數(shù)碼
親子

今冬的時(shí)髦,來自費(fèi)爾島毛衣

藝術(shù)要聞

Raimundo de Madrazo女性人物精選,19世紀(jì)西班牙著名畫家

教育要聞

北京“最聰明”的高中生“全軍覆沒”?!“雞娃”的家長(zhǎng)撐不下去了!

數(shù)碼要聞

家用電器要標(biāo)注安全使用年限,新國(guó)標(biāo)今日起實(shí)施

親子要聞

孩子被你罵后,身體會(huì)發(fā)生3大“危險(xiǎn)反應(yīng)”,越看越揪心

無障礙瀏覽 進(jìn)入關(guān)懷版