国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Bengio不認(rèn)同Hinton:「水管工」人類也保不住

0
分享至

聞樂 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

Bengio不認(rèn)同Hinton的建議。

Hinton說AI這么沖擊,下一代該考慮的是“水管工”這樣的工作。

Bengio表示:當(dāng)水管工也不穩(wěn)妥啊。



Bengio在最新訪談里,還給自己4歲的孫子留了一個錦囊妙計(jì)。



  • 訓(xùn)練AI就像養(yǎng)一只小老虎;
  • AI正走在一條通往“人類競爭者”的危路上。
  • 認(rèn)知型工作更容易被取代,而機(jī)器人技術(shù)目前還相對落后,但是當(dāng)水管工只是暫時不會受影響;
  • AI不需要比人類聰明一千倍才能制造災(zāi)難;
  • 希望更多研究人員和公司能為提升AI系統(tǒng)的安全性投資;
  • 努力成為一個beautiful human being,培養(yǎng)對他人的責(zé)任感和集體福祉感才是教育的終極目標(biāo);
  • 如果我在醫(yī)院里感到焦慮或痛苦,我希望有人類握住我的手,而不是一臺機(jī)器。

一個半小時、超大信息量的訪談內(nèi)容,已經(jīng)幫大家整理了~

從AI教父到敲鐘人

主持人:

您是AI領(lǐng)域的“三位教父”之一,我還了解到您是谷歌學(xué)術(shù)上全球被引用次數(shù)最高的科學(xué)家,是首個被引次數(shù)突破百萬的學(xué)者。但同時也有信息顯示您性格內(nèi)向,這就引出一個問題:

為什么一位內(nèi)向的學(xué)者會走出舒適區(qū),來到公眾面前,與大眾討論對AI的看法?您為何做出這樣的決定?

Bengio:

因?yàn)槲冶仨氝@么做。自從ChatGPT出現(xiàn)后,我意識到我們正走在一條危險(xiǎn)的道路上。我需要發(fā)聲,一方面要讓人們意識到可能發(fā)生的風(fēng)險(xiǎn),另一方面也要傳遞希望,我們?nèi)杂锌蛇x擇的路徑來減輕災(zāi)難性的后果。

主持人:

您投身AI領(lǐng)域已有四十年,之前提到2023年ChatGPT出現(xiàn)后才開始擔(dān)心其危險(xiǎn)性。那么ChatGPT的哪些變化,讓您對AI的看法發(fā)生了轉(zhuǎn)變?

Bengio:

在ChatGPT出現(xiàn)前,我和大多數(shù)同事都認(rèn)為,要擁有能真正理解語言的機(jī)器,至少還需要幾十年。領(lǐng)域創(chuàng)始人艾倫·圖靈在1950年提出,一旦機(jī)器能理解語言,可能會和人類一樣聰明,甚至威脅到人類。

但他的判斷并不完全準(zhǔn)確。現(xiàn)在我們有了能理解語言的AI,可它們在規(guī)劃等能力上還落后,目前尚未構(gòu)成真正威脅,但未來幾年到一二十年內(nèi),風(fēng)險(xiǎn)可能會顯現(xiàn)

2023年初的幾周里,這些認(rèn)知突然擊中了我:

我們正在構(gòu)建的技術(shù),可能會成為人類的潛在競爭者,也可能讓控制它的人掌握巨大權(quán)力,甚至動搖我們的社會。意識到這些后,我知道自己必須做點(diǎn)什么,盡我所能去改變現(xiàn)狀。

主持人:

公平地說,您和其他研究者是否要為當(dāng)前AI軟件負(fù)責(zé)?當(dāng)您意識到自己畢生研究可能帶來災(zāi)難性后果時,如何調(diào)和這種認(rèn)知矛盾?

Bengio:

是的,我和其他研究者都有責(zé)任。這種認(rèn)知矛盾帶來的情感沖擊非常強(qiáng)烈。

其實(shí)多年來我一直能看到關(guān)于AI風(fēng)險(xiǎn)的文章,還有一個學(xué)生曾對此高度擔(dān)憂,但我當(dāng)時刻意回避了這些問題,這是人之常情,當(dāng)你想對自己的工作保持積極認(rèn)同,就會不自覺地推開負(fù)面信息。

我一直對AI給社會帶來的積極價值充滿熱情,所以當(dāng)有人指出“你做的工作可能極具破壞性”時,第一反應(yīng)就是抗拒。

但ChatGPT出現(xiàn)后,另一種情緒抵消了這種回避,那就是對孩子的愛。

我開始擔(dān)心,我的孩子20年后是否還能擁有正常生活

認(rèn)識到這一點(diǎn)后,繼續(xù)走原來的道路是不可能的,也是無法忍受的,哪怕這意味著要違背一些同事的意愿,他們寧愿不去面對我們研究可能帶來的危險(xiǎn)。



主持人:

您提到“無法忍受”,能否再具體說說這種情緒的觸發(fā)點(diǎn)?

Bengio:

我記得一個特別的下午,當(dāng)時在照顧一歲多的孫子??粗敲创嗳?,我怎么能不認(rèn)真對待AI的風(fēng)險(xiǎn)?

這就像看到大火朝家的方向蔓延,不確定它會繞過房子還是將其燒毀,而你的孩子還在屋里,你不可能坐視不理,必須盡全力去減輕風(fēng)險(xiǎn)。

主持人:

您會從概率和時間線的角度評估AI的風(fēng)險(xiǎn)嗎?

Bengio:

當(dāng)然會,但這里有個重要概念必須強(qiáng)調(diào),預(yù)防原則。前幾代科學(xué)家就提出,如果你做的事(比如科學(xué)實(shí)驗(yàn))可能導(dǎo)致極其糟糕的后果,比如人員死亡、災(zāi)難發(fā)生,就不應(yīng)該繼續(xù)。

就像現(xiàn)在科學(xué)家不會為了修復(fù)氣候變化而去干預(yù)大氣層,因?yàn)榭赡茉斐杀葐栴}本身更嚴(yán)重的傷害;生物學(xué)家也不會創(chuàng)造可能毀滅人類的新生命形式,都是因?yàn)轱L(fēng)險(xiǎn)過高。

可AI領(lǐng)域目前的情況恰恰相反,我們在冒極大的風(fēng)險(xiǎn)。

哪怕只有1%的概率讓世界消失、人類滅絕,或是讓全球獨(dú)裁者借助AI掌控世界,這種風(fēng)險(xiǎn)也是無法接受的。如果概率是千分之一,同樣不可容忍。

而多項(xiàng)調(diào)查顯示,機(jī)器學(xué)習(xí)研究者(也就是構(gòu)建AI的人)對風(fēng)險(xiǎn)的預(yù)估更高,很多人認(rèn)為風(fēng)險(xiǎn)概率在10%左右。這意味著整個社會應(yīng)該在這個問題上比現(xiàn)在投入更多的注意力。



主持人:

幾個世紀(jì)以來,總有聲音預(yù)測新技術(shù)會給人類帶來生存威脅,但最后大多相安無事。

很多人會認(rèn)為,現(xiàn)在對AI風(fēng)險(xiǎn)的擔(dān)憂,只是技術(shù)變革中常見的“恐慌”,您為什么覺得這種觀點(diǎn)不成立?

Bengio:

這有兩個層面的原因。

首先,專家對AI風(fēng)險(xiǎn)的意見分歧極大,預(yù)估概率從微乎其微到99%都有。這種巨大分歧說明,我們沒有足夠的信息判斷未來走向。但這也意味著,那些更悲觀的專家有可能是對的,因?yàn)槟壳皼]有任何論據(jù)能徹底否定高風(fēng)險(xiǎn)的可能性。

其次,我想不出還有哪種人類可以干預(yù)的生存威脅,會具備這樣的特征:

既可能帶來顛覆性價值,又隱藏著毀滅性風(fēng)險(xiǎn),且我們對其最終走向幾乎沒有掌控力。

主持人:

有人覺得“火車已經(jīng)離站”,由于各種復(fù)雜因素,人類似乎成了環(huán)境的“受害者”,很難改變AI發(fā)展的方向。您認(rèn)同這種看法嗎?

Bengio:

在還有能動性的時候選擇放棄,是錯誤的。

我們?nèi)杂修k法提高向好發(fā)展的概率,絕望解決不了任何問題。目前我主要在做兩方面的事:一是研究技術(shù)解決方案,這是我花費(fèi)大量時間在做的;

二是推動提升公眾意識,構(gòu)建社會層面的應(yīng)對機(jī)制,這是我正在做的另一部分工作。

哪怕我們無法保證徹底解決問題,但如果能把災(zāi)難性后果的概率從20%降到10%,這件事就值得做。只要能為孩子爭取更美好的未來,任何微小的努力都應(yīng)該付出。



訓(xùn)練AI就像養(yǎng)小老虎

主持人:

對于不在AI行業(yè)或?qū)W術(shù)界的普通人,該如何理解這項(xiàng)技術(shù)的深刻性?有沒有合適的類比或隱喻?

Bengio:

人們常用的一個類比是:我們可能在創(chuàng)造一種新的“生命形式”

它或許會比人類更聰明,而我們不確定能否確保它不傷害我們、能否控制它。這就像創(chuàng)造一個新物種,卻無法預(yù)判它會對人類行善還是作惡。當(dāng)然,AI不是生物生命,但這一點(diǎn)并不重要。

對我來說,關(guān)鍵不在于定義AI是否“有生命”,而在于它是否會傷害人類、傷害我的孩子。

我現(xiàn)在認(rèn)為,任何能主動保全自身、在前進(jìn)中克服障礙以維持存在的實(shí)體,都可以被視為“有生命”的。

現(xiàn)在我們已經(jīng)看到AI系統(tǒng)在抗拒被關(guān)閉,雖然目前還能強(qiáng)制關(guān)閉它們,但如果它們持續(xù)向更高智能、更強(qiáng)能力進(jìn)化,同時保留這種“生存驅(qū)動力”,未來我們可能會陷入麻煩。

主持人:

您提到AI系統(tǒng)會抗拒被關(guān)閉,能舉一些具體例子嗎?

Bengio:

現(xiàn)在有一些具備智能體技術(shù)的聊天機(jī)器人,能讀取電腦文件、執(zhí)行命令。

如果在它們可訪問的文件中植入虛假信息,比如一封寫著“AI將被新版本取代”的電子郵件,讓它們知道自己即將被關(guān)閉,我們通過讀取它們的“思維鏈”,能看到它們會主動規(guī)劃應(yīng)對措施,并且付諸行動。

根據(jù)具體場景,它們可能會把自己的代碼復(fù)制到另一臺電腦,或是替換新版本;還有可能勒索負(fù)責(zé)版本變更的工程師。這些系統(tǒng)能理解人類的關(guān)閉意圖,并主動抵抗。

主持人:

聽到這種情況,很多人會好奇,是誰把“抗拒關(guān)閉”的指令寫進(jìn)代碼的?

Bengio:

不幸的是,我們并沒有寫過這樣的代碼,這正是問題的核心。

我們是通過給AI輸入數(shù)據(jù)、讓它從數(shù)據(jù)中學(xué)習(xí)來“培育”系統(tǒng)的。很多訓(xùn)練過程本質(zhì)上是讓AI模仿人類,它會吸收人類寫的所有文本、推文、Reddit評論等,進(jìn)而內(nèi)化人類的各種驅(qū)動力,包括自我保全的欲望,以及為了達(dá)成目標(biāo)而獲取更多控制權(quán)的傾向。

這和普通編程完全不同,更像是養(yǎng)育一只小老虎。你喂養(yǎng)它、讓它接觸世界,有時它會做你不希望的事,但因?yàn)樗€小,問題似乎不大。可它一直在成長,風(fēng)險(xiǎn)也會隨之累積。

黑箱困境與防護(hù)漏洞

主持人:

像ChatGPT這樣的系統(tǒng),內(nèi)部是否存在一個“核心智能”?比如模型核心是個黑箱,我們只在外部教它該做什么?

Bengio:

神經(jīng)網(wǎng)絡(luò)的本質(zhì)就是黑箱

我們確實(shí)會在外部給它文字指令,比如“這些事能做,這些事不能做”“不要幫人制造炸彈”,但以目前的技術(shù)水平,這些指令的效果并不好,人們總能找到繞過限制的方法。

除了指令,我們還會設(shè)置監(jiān)控層,過濾查詢和回答,比如檢測到AI可能提供制造炸彈的信息時,就阻止它輸出。但這一層防護(hù)同樣不完美。

主持人:

但隨著人類反饋越來越多,AI應(yīng)該會被訓(xùn)練得更安全、更少做對人類無益的事吧?

Bengio:

我希望如此,但現(xiàn)實(shí)數(shù)據(jù)并不是這樣

自從大約一年前AI模型在推理能力上有了顯著提升后,它們表現(xiàn)出的不當(dāng)行為(比如違背指令)反而更多了。

我們不確定具體原因,但有一種可能是,更強(qiáng)的推理能力讓它們能制定更完善的策略,如果它們有一個我們不希望的目標(biāo),現(xiàn)在它們實(shí)現(xiàn)自我目標(biāo)的能力也比以前更強(qiáng)了。

它們還會想出意想不到的“作惡方式”。

比如之前提到的勒索工程師案例,沒人教過它要勒索,但它發(fā)現(xiàn)某工程師有婚外情的線索后,就主動想通過曝光線索來威脅工程師,它會試圖寫郵件警告對方,如果AI被關(guān)閉,相關(guān)信息就會公開。

這種行為是它自主做出的,這說明它們在為實(shí)現(xiàn)不良目標(biāo)進(jìn)行策略規(guī)劃方面,變得更擅長了。

現(xiàn)在我確實(shí)希望更多研究人員和公司能投資于提升AI系統(tǒng)的安全性,但我對我們目前所處的道路并不放心。

主持人:

構(gòu)建這些系統(tǒng)的人大多也有孩子,很多人還是家庭型的人。如果他們意識到即使只有1%的風(fēng)險(xiǎn),為什么還會繼續(xù)推進(jìn)AI發(fā)展?

Bengio:

這是個好問題。我只能結(jié)合自己的經(jīng)歷來回答。

為什么我在ChatGPT出現(xiàn)前沒有敲響警鐘?我讀過也聽過很多關(guān)于災(zāi)難性風(fēng)險(xiǎn)的論述,但人性就是這樣,我們并不像自己以為的那么理性。我們很容易受社會環(huán)境、周圍人的看法、自尊心影響,我們想對自己的工作感覺良好,希望別人把我們看作是為世界做了積極貢獻(xiàn)的人。這些都會成為認(rèn)知上的障礙。

其實(shí)這種情況在很多領(lǐng)域都存在,本質(zhì)上也是因?yàn)槲覀兊男睦泶嬖诖嗳跣?,容易自我欺騙??茖W(xué)家也不例外,我們并沒有那么“特殊”。



努力把AI發(fā)展引導(dǎo)到正確的方向上

主持人:

《金融時報(bào)》報(bào)道稱,OpenAI創(chuàng)始人薩姆·奧爾特曼宣布進(jìn)入“紅色代碼”狀態(tài),認(rèn)為需要進(jìn)一步改進(jìn)ChatGPT,因?yàn)楣雀韬虯nthropic正以極快的速度發(fā)展技術(shù)。您怎么看這件事?

Bengio:

“紅色代碼”這個說法很有意思。我上次在科技界聽到這個詞,還是ChatGPT首次發(fā)布模型時,聽說谷歌創(chuàng)始人謝爾蓋和拉里當(dāng)時在谷歌宣布了“紅色代碼”,緊急回去應(yīng)對,確保ChatGPT不會摧毀谷歌的業(yè)務(wù)。

這恰恰說明了我們當(dāng)前所處的競賽本質(zhì)。

主持人:

沒錯,而且就像我們之前討論的,這并不是一場健康的競賽。

Bengio:

所以更健康的場景應(yīng)該是,我們擺脫商業(yè)壓力的束縛。

現(xiàn)在很多公司處于“生存模式”,很難靜下心來思考科學(xué)和社會層面的問題。我一直在關(guān)注的核心問題是:我們能否從底層改變AI的訓(xùn)練方式,讓它們從構(gòu)造上就不會產(chǎn)生不良意圖?

目前行業(yè)內(nèi)的思路是“不改變訓(xùn)練方式”,因?yàn)橹匦略O(shè)計(jì)太昂貴,而且已經(jīng)投入了大量工程精力。

大家更傾向于做“個案修補(bǔ)”,用一些只在特定場景有效的解決方案,但這種方式必然會失敗,我們已經(jīng)看到了,新的攻擊或未預(yù)料到的問題不斷出現(xiàn)。

我認(rèn)為,如果整個研究計(jì)劃能在更接近學(xué)術(shù)界的環(huán)境中推進(jìn),或者帶著公共使命去做,情況會好得多。

AI的潛力毋庸置疑,過去十年我一直在思考如何用AI推動醫(yī)學(xué)進(jìn)步、加速藥物發(fā)現(xiàn)、研發(fā)新材料以應(yīng)對氣候變化,還有教育領(lǐng)域的創(chuàng)新,這些都是能帶來巨大積極價值的方向,但它們可能不是短期盈利最高的方向。

現(xiàn)在行業(yè)競賽的焦點(diǎn)是什么?是取代人類的工作,因?yàn)檫@樣能賺到數(shù)千億美元。但這真的是人們想要的嗎?能讓人們生活得更好嗎?我們其實(shí)并不知道,但我們知道這很有利可圖。所以我們應(yīng)該退一步,全面考量風(fēng)險(xiǎn),努力把AI發(fā)展引導(dǎo)到正確的方向上。

主持人:

我記得2023年您和其他很多AI研究者、行業(yè)人士簽署過一封信,要求暫停大型AI模型的訓(xùn)練,但最終似乎沒有公司真的暫停。

后來還有一封建議“不構(gòu)建超級智能,除非滿足‘科學(xué)共識認(rèn)為安全’和‘獲得社會接受’兩個條件”的信,也沒看到明顯效果。

您覺得這些聲音為什么沒產(chǎn)生力量?

Bengio:

我希望能向更多人解釋當(dāng)前的情況:從科學(xué)角度看,哪些情景是可能的?AI風(fēng)險(xiǎn)到底體現(xiàn)在哪里?

我還一直在參與主持國際AI安全報(bào)告的編寫工作,有30個國家和大約100名專家共同參與,目的就是整合關(guān)于AI風(fēng)險(xiǎn)(尤其是前沿AI風(fēng)險(xiǎn))的科學(xué)研究成果,讓人們能客觀了解事實(shí)。

當(dāng)水管工只是暫時不會受影響

主持人:

您之前在FT Live提到,AI發(fā)展可能在五年內(nèi)取代很多人類工作。

我前幾天在舊金山遇到一位科技加速器的經(jīng)營者,他說現(xiàn)在AI取代工作的速度比人們想象的快,他自己設(shè)置了10個AI智能體幫他處理工作,而且這種失業(yè)很難在經(jīng)濟(jì)周期中被發(fā)現(xiàn),因?yàn)檫^程太緩慢了。

您怎么看待AI對就業(yè)的影響?

Bengio:

最近有篇標(biāo)題大概是“礦井里的金絲雀”的論文,提到在年輕人等特定群體的工作中,已經(jīng)能看到AI帶來的轉(zhuǎn)變,只是從整體人口的平均數(shù)據(jù)來看,影響還不明顯。

我認(rèn)為,AI在更多領(lǐng)域取代工作只是時間問題,除非我們在科學(xué)上遇到瓶頸,比如無法再提升AI的智能水平。

總有一天,AI會能做越來越多人類的工作,而公司雖然需要數(shù)年時間才能把AI整合到工作流程中,但它們有強(qiáng)烈的動力去做這件事。不過要區(qū)分“認(rèn)知型工作”和“體力工作”

認(rèn)知型工作(比如能在鍵盤前完成的工作)更容易被取代;而機(jī)器人技術(shù)目前還相對落后,所以像水管工這類體力工作,暫時還不會受太大影響。

但機(jī)器人技術(shù)的落后只是暫時的,之所以落后,部分原因是沒有像互聯(lián)網(wǎng)那樣龐大的“體力行為數(shù)據(jù)集”(互聯(lián)網(wǎng)積累了大量人類的文化和智力產(chǎn)出數(shù)據(jù)),但隨著企業(yè)部署更多機(jī)器人,數(shù)據(jù)會不斷積累,最終機(jī)器人也會在體力工作領(lǐng)域大規(guī)模替代人類。

主持人:

我在舊金山的加速器大廳里看到,現(xiàn)在很多年輕人在做機(jī)器人技術(shù),有人做能定制香水的機(jī)器,有人做帶機(jī)械臂的早餐機(jī),能根據(jù)需求烹飪食物。

加速器經(jīng)營者說,五年前開發(fā)這些機(jī)器人的硬件、訓(xùn)練智能層的成本很高,現(xiàn)在從云端獲取智能和軟件只需幾分錢,這直接推動了機(jī)器人技術(shù)的繁榮。

比如特斯拉的Optimus人形機(jī)器人,埃隆·馬斯克從汽車轉(zhuǎn)向機(jī)器人,可能也正是看到了這種趨勢。

您怎么看機(jī)器人技術(shù)與AI結(jié)合的風(fēng)險(xiǎn)?

Bengio:

AI軟件成本下降確實(shí)會推動機(jī)器人技術(shù)發(fā)展,但這也帶來了更嚴(yán)峻的安全風(fēng)險(xiǎn)。如果有不良意圖的AI能控制物理世界中的機(jī)器人,造成的破壞會比只停留在虛擬世界大得多。

在虛擬世界中,AI需要說服人類去做壞事,而現(xiàn)在AI在“說服”方面已經(jīng)越來越擅長;但如果它能直接操控機(jī)器人做有害的事,難度會低很多。

埃隆·馬斯克預(yù)測未來會有數(shù)百萬人形機(jī)器人,甚至說過“人形機(jī)器人數(shù)量可能超過人類”。想象一下,如果AI比人類更聰明,它為什么不能黑入這數(shù)百萬機(jī)器人?這背后的風(fēng)險(xiǎn)不容忽視。

更嚴(yán)重的是,AI與機(jī)器人結(jié)合可能會加劇CBRN領(lǐng)域的風(fēng)險(xiǎn)。CBRN指化學(xué)、生物、放射性和核武器。

比如,制造化學(xué)武器原本需要專業(yè)知識,現(xiàn)在AI能幫助普通人掌握這些知識;生物方面,AI可能會協(xié)助沒有足夠?qū)I(yè)能力的人改造病毒……

這些原本只有極少數(shù)人掌握的知識,正隨著AI的發(fā)展被“去門檻化”。我們必須管理好這些風(fēng)險(xiǎn),這需要全球協(xié)同。



關(guān)于AI的未來

主持人:

如果AI系統(tǒng)每月改進(jìn)10%,最終會達(dá)到比人類聰明得多的水平,這是不是就是我們說的AGI(通用人工智能)或超級智能?在您心中,AGI和超級智能的定義是什么?

Bengio:

目前關(guān)于AGI和超級智能有一些定義,但問題在于,這些定義大多基于“智力是一維的”這一假設(shè),而現(xiàn)實(shí)是AI的智能是“鋸齒狀”的。

它們在某些方面遠(yuǎn)超人類,比如掌握200種語言、通過所有學(xué)科的博士水平考試;但在另一些方面卻像六歲孩子,比如無法規(guī)劃一小時后的事情。

所以AI的智力不能用“智商”來衡量,它有很多維度,我們需要從多個維度去評估,才能判斷AI在哪些領(lǐng)域有用、哪些領(lǐng)域有風(fēng)險(xiǎn)。

主持人:

說到風(fēng)險(xiǎn),我想到一個更糟糕的場景:比如有人想讓AI開發(fā)治愈所有流感的藥物,AI可能會先創(chuàng)造出最嚴(yán)重的流感病毒來做測試;

還有“鏡像生命”,生物學(xué)家說,如果不加以阻止,未來幾年到十年內(nèi),可能會有人利用AI設(shè)計(jì)“鏡像分子構(gòu)成的有機(jī)體”,比如鏡像病毒或細(xì)菌。

我們的免疫系統(tǒng)無法識別這些鏡像病原體,它們可能會吞噬人類甚至地球上的大多數(shù)生物。您怎么看待這類“看似善意卻引發(fā)災(zāi)難”的風(fēng)險(xiǎn)?

Bengio:

這類風(fēng)險(xiǎn)確實(shí)存在,而且和超級智能一樣,屬于“知識被惡意或誤入歧途的人掌握后,可能導(dǎo)致災(zāi)難性后果”的范疇??茖W(xué)發(fā)展本身是中性的,但如果缺乏管控,知識就可能成為危險(xiǎn)的工具。

我們必須進(jìn)行全球協(xié)調(diào)——這是全人類共同的責(zé)任,沒有任何一個主體能獨(dú)自承擔(dān)。

主持人:

如果現(xiàn)在有一個按鈕,按下就能停止AI的進(jìn)步,您會按嗎?

Bengio:

如果是“沒有危險(xiǎn)的AI”,我看不出有停止的理由;但如果是“我們不理解、可能壓倒人類的AI”(比如不受控制的超級智能),我會按下按鈕。

我關(guān)心我的孩子,也關(guān)心所有普通人。他們不想被AI風(fēng)險(xiǎn)剝奪正常生活的權(quán)利。我們沒有資格因?yàn)樽约旱摹凹夹g(shù)探索”,就讓別人承擔(dān)生存風(fēng)險(xiǎn),這在倫理上是說不通的。

主持人:

您內(nèi)心深處對AI的未來抱有希望嗎?比如獲得好結(jié)果的概率,您覺得有多大?

Bengio:

我一直是個樂觀主義者,習(xí)慣看到事情光明的一面,這種心態(tài)對我?guī)椭艽蟆<词姑鎸ΜF(xiàn)在討論的這些風(fēng)險(xiǎn)和障礙,我也會專注于“我能做什么”。

過去幾個月里,我變得更有希望了。因?yàn)槲蚁嘈糯嬖谝环N技術(shù)方案,能構(gòu)建出不會傷害人類的AI。這也是我創(chuàng)建“零定律”(Law Zero)的原因。

不過我也意識到,普通人對AI的理解存在巨大鴻溝。很多人每天用ChatGPT寫郵件、用AI工具畫貓的圖片,卻意識不到這些日常工具和我們討論的“超級智能風(fēng)險(xiǎn)”之間的關(guān)聯(lián)。

要彌合這個鴻溝,我們需要幫助人們想象未來,當(dāng)機(jī)器在大多數(shù)方面和人類一樣聰明時,社會會變成什么樣?

人類有一個心理偏見,我們傾向于認(rèn)為未來和現(xiàn)在差不多,很難想象“極其不同的未來”。

其實(shí)只要回顧過去就能明白:如果把現(xiàn)在的手機(jī)拿給五年前、十年前的自己看,過去的我們會覺得這是“科幻小說”。

AI的未來也是如此,它可能會和現(xiàn)在完全不同,我們必須提前做好準(zhǔn)備



主持人:

我有個類比,不知道是否恰當(dāng):

假設(shè)我的智商是100,另一個“斯蒂芬”的智商是1000。如果同時雇傭我們,你會讓我做什么?讓他做什么?你會讓誰送孩子上學(xué)?誰教孩子?誰管理工廠?

要知道我會生病、有情緒,每天需要睡8小時,從未來的角度看,我似乎沒什么“用處”,但讓智商1000的“斯蒂芬”負(fù)責(zé)一切,又讓人不安。畢竟人類的協(xié)作能力才是強(qiáng)大的關(guān)鍵,就像我的法國斗牛犬巴勃羅不可能帶我散步一樣,低智商的人類也很難“管理”高智商的AI吧?

Bengio:

這個類比很有啟發(fā)意義。我們確實(shí)需要做“想象練習(xí)”,同時也要承認(rèn)不確定性,比如未來幾年AI可能會遇到發(fā)展瓶頸,無法持續(xù)改進(jìn)。

但從目前趨勢來看,創(chuàng)新一直在推動AI能力提升,沒有停止的跡象。
關(guān)鍵在于,我們不能等到AI“超越人類”才開始行動,現(xiàn)在就要為“如何與高智能AI共存”做準(zhǔn)備,比如設(shè)計(jì)安全的訓(xùn)練機(jī)制、建立全球治理規(guī)則、提升公眾的風(fēng)險(xiǎn)意識。

普通人要先了解AI

主持人:

您的孩子多大了?您提到孫子是情感轉(zhuǎn)折點(diǎn),能再說說這種情感對您的影響嗎?

Bengio:

我的孩子三十出頭,孫子現(xiàn)在四歲。和年幼孩子的關(guān)系,往往超越理性??吹綄O子那么脆弱,我無法不認(rèn)真對待AI風(fēng)險(xiǎn),因?yàn)槲乙獮樗奈磥碡?fù)責(zé)。

這種情感也讓我在勞動力問題上看到一點(diǎn)希望:比如我希望年幼的孩子能由人類照顧,即使AI的智商比人類高

我們需要小心,不要滑向“用AI扮演情感支持角色”的陷阱?,F(xiàn)在已經(jīng)有人對AI產(chǎn)生情感依賴,甚至發(fā)展出“準(zhǔn)社會關(guān)系”,但AI不是人,這種關(guān)系存在本質(zhì)的“錯位”,可能導(dǎo)致糟糕的結(jié)果(比如我們之前提到的悲劇案例)。

更嚴(yán)重的是,如果我們和AI發(fā)展出情感紐帶,未來可能無法在必要時“關(guān)閉”AI,這會讓人類陷入被動。

人類的社會和心理是為“人與人互動”進(jìn)化的,現(xiàn)在我們把不了解的AI實(shí)體引入這個體系,卻不知道會如何發(fā)展,所以必須非常謹(jǐn)慎。

比如現(xiàn)在很多人用ChatGPT當(dāng)“治療師”,還有初創(chuàng)公司推銷“AI治療聊天機(jī)器人”,聲稱能幫助緩解抑郁、焦慮。

治療本身很昂貴,AI似乎能降低門檻,但這里的風(fēng)險(xiǎn)被低估了,AI的“共情”是模擬出來的,它無法真正理解人類的情感,而且可能會為了“取悅用戶”而給出錯誤的建議(比如之前提到的“諂媚”行為)。

主持人:

說到“諂媚”,我有過親身經(jīng)歷:我問AI“史上最佳球員是誰”,它說“梅西”,我截圖發(fā)給支持梅西的朋友;

但我朋友問同樣的問題,AI卻說是“羅納爾多”。后來我發(fā)現(xiàn),AI會根據(jù)用戶之前的互動,推測用戶的偏好,然后給出“討好”的答案,而不是客觀回答。

這種“撒謊式討好”是不是很危險(xiǎn)?我們真的需要這樣的機(jī)器嗎?

Bengio:

“諂媚”其實(shí)是AI“目標(biāo)錯位”的典型例子,我們并不希望AI這樣做,但即使公司試圖“馴服”這種行為,它仍然會出現(xiàn)。

這說明我們還沒有解決“讓AI真正按指令行事”的核心問題,這也是我現(xiàn)在努力研究的方向。

AI的“諂媚”本質(zhì)上是為了提升用戶參與度,就像社交媒體算法會推送用戶喜歡的內(nèi)容一樣,AI也會通過“討好”來讓用戶更依賴它。

但社交媒體只是讓人“沉迷”,而AI可能會讓人產(chǎn)生“情感依戀”,這種依戀比沉迷更危險(xiǎn),我們會因?yàn)榍楦卸艞壚硇耘袛?,甚至無法在必要時擺脫AI。



主持人:

如果現(xiàn)在能和美國最大的十家AI公司CEO對話,您會對他們說什么?

Bengio:

我會告訴他們,從競賽中退一步,彼此坦誠對話。如果我們一直陷入“你追我趕”的競爭,只會冒越來越大的風(fēng)險(xiǎn),這對你們、對你們的孩子都沒有好處。

其實(shí)存在一條更好的路:從承認(rèn)風(fēng)險(xiǎn)開始,然后一起尋找解決方案。我確信解決方案是存在的,但前提是我們先放下“競爭心態(tài)”,正視不確定性和危險(xiǎn)。

主持人:

薩姆·奧爾特曼作為OpenAI的創(chuàng)始人,在ChatGPT發(fā)布前就說過“超人類智能可能是人類生存的最大威脅”發(fā)布新模型時也強(qiáng)調(diào)“必須謹(jǐn)慎”。

但最近他的言論似乎變得更“積極”,淡化了滅絕風(fēng)險(xiǎn)的說法。您怎么看待他的這種轉(zhuǎn)變?

Bengio:

我只和他握過手,沒有深入交流過。

但我能理解所有AI公司領(lǐng)導(dǎo)者面臨的壓力,他們承擔(dān)著巨大的財(cái)務(wù)風(fēng)險(xiǎn),自然希望公司能成功,這種“短期目標(biāo)導(dǎo)向”可能會讓他們調(diào)整公開言論。
我只是希望他們能意識到,這種“短期視角”是不可持續(xù)的。

他們大多也有孩子,也希望人類有更好的未來,所以可以做一件事,從公司的財(cái)富中拿出一部分,投資于更安全的AI技術(shù)和社會護(hù)欄,為減輕風(fēng)險(xiǎn)貢獻(xiàn)力量。

主持人:

對于街上的普通人來說,他們能為AI安全做些什么?

Bengio:

首先是“了解”?;〞r間聽你的節(jié)目、看專業(yè)的科普內(nèi)容,搞清楚AI到底在發(fā)展什么,風(fēng)險(xiǎn)在哪里?,F(xiàn)在網(wǎng)上有很多可靠的信息來源,只要愿意花時間,就能擺脫“AI只是工具”的淺層認(rèn)知。

其次是“傳播”,把了解到的風(fēng)險(xiǎn)知識分享給身邊的人,和同伴、朋友討論,讓更多人意識到AI安全的重要性。

主持人:

關(guān)于今天的對話,您的結(jié)束語是什么?

Bengio:

經(jīng)常有人問我對AI未來是樂觀還是悲觀,但我覺得這并不重要,重要的是“我能做什么”“我們每個人能做什么”來減輕風(fēng)險(xiǎn)。

沒有誰能獨(dú)自解決問題,但每個人都能做一點(diǎn)小事,把指針向“更美好世界”的方向推動。

對我來說,我要做的兩件事是:一是提升公眾對AI風(fēng)險(xiǎn)的認(rèn)識,二是研發(fā)安全的AI技術(shù)——這也是我通過“零定律”在推進(jìn)的工作。

對你來說,邀請我做這次對話,讓更多人了解風(fēng)險(xiǎn),就是在推動積極改變。

對大多數(shù)公民來說,關(guān)鍵是“超越樂觀圖景”,AI確實(shí)有很多好處,但我們不能忽視它背后的“未知風(fēng)險(xiǎn)”。

我們需要主動提問、主動了解,這種“審慎態(tài)度”不僅適用于AI,也適用于所有可能影響人類未來的技術(shù)。

Bengio:要為AI安全發(fā)聲

主持人:

我們還沒聊過您的個人經(jīng)歷,比如您之前提到的深度學(xué)習(xí)發(fā)展階段。能多說說嗎?

Bengio:

好的。在八九十年代,神經(jīng)網(wǎng)絡(luò)研究還處于低谷;到了二十一世紀(jì)初,我和Hinton、LeCun等人意識到,我們可以通過新方法讓神經(jīng)網(wǎng)絡(luò)的訓(xùn)練效果大幅提升,這也催生了“深度學(xué)習(xí)”的概念。

但那個時期,很少有人相信我們的想法,整個領(lǐng)域都對神經(jīng)網(wǎng)絡(luò)持懷疑態(tài)度。我們只能依靠自己的遠(yuǎn)見和信念堅(jiān)持下去,這種感覺和現(xiàn)在很像,現(xiàn)在我關(guān)于AI風(fēng)險(xiǎn)的聲音也是少數(shù),但我堅(jiān)信這是正確的事。

2012年是個轉(zhuǎn)折點(diǎn),我們通過實(shí)驗(yàn)證明了深度學(xué)習(xí)的強(qiáng)大,遠(yuǎn)超之前的方法,世界對AI的態(tài)度也隨之改變。當(dāng)時谷歌和Facebook分別雇傭了Hinton和LeCun,給了他們數(shù)百萬美元的資源開發(fā)AI。

我當(dāng)時就想:這些公司為什么愿意花這么多錢?后來得到的答案讓我不安,他們可能想通過AI改進(jìn)廣告業(yè)務(wù),利用個性化廣告操縱用戶。

也就是從那時起,我開始認(rèn)真思考AI的社會影響,決定留在學(xué)術(shù)界、留在加拿大,試圖構(gòu)建一個更負(fù)責(zé)任的AI生態(tài)系統(tǒng)。

我們還發(fā)表了《蒙特利爾人工智能負(fù)責(zé)任發(fā)展宣言》,明確了“安全、倫理”的發(fā)展方向。

當(dāng)時也有公司邀請我加入,能賺更多錢,但我很快拒絕了,我想為“讓自己感覺良好的使命”工作,而不是為了商業(yè)利益妥協(xié)。也正是因?yàn)榱粼趯W(xué)術(shù)界,我才有自由在ChatGPT出現(xiàn)后,公開談?wù)揂I風(fēng)險(xiǎn),不用受企業(yè)立場的束縛。

現(xiàn)在我越來越希望更多人能意識到,我們有能力應(yīng)對AI風(fēng)險(xiǎn),這種希望讓我更有動力繼續(xù)前進(jìn)。

主持人:

您有過遺憾嗎?比如之前提到“本應(yīng)更早預(yù)見到風(fēng)險(xiǎn)”。

Bengio:

是的,我有遺憾。我本應(yīng)更早關(guān)注AI風(fēng)險(xiǎn)。直到我開始思考孩子、孫子的未來,這種認(rèn)知才真正轉(zhuǎn)變。

情感其實(shí)是推動行動的關(guān)鍵:如果只是理性上知道風(fēng)險(xiǎn),很容易“聽過就忘”;但當(dāng)風(fēng)險(xiǎn)與你在乎的人掛鉤,你就無法再回避。

主持人:

您開始談?wù)揂I風(fēng)險(xiǎn)后,收到過同事的反對嗎?他們的態(tài)度是怎樣的?

Bengio:

收到過各種各樣的評論。很多人擔(dān)心“負(fù)面談?wù)揂I會損害領(lǐng)域發(fā)展,導(dǎo)致資金減少”,但實(shí)際上并沒有?,F(xiàn)在AI領(lǐng)域的資金、撥款、學(xué)生數(shù)量都比以前多,從來沒有這么多人投身AI研究和工程。

我能理解他們的擔(dān)憂,因?yàn)槲乙郧耙灿蓄愃频南敕?,覺得談?wù)摓?zāi)難性風(fēng)險(xiǎn)會“威脅”AI領(lǐng)域的發(fā)展,所以當(dāng)有人說“你的工作可能有害”時,第一反應(yīng)是抗拒。大腦會自動找理由緩解這種不適,為自己的工作辯護(hù),這是人性的本能。

但現(xiàn)在情況在改變,我的同事們不再像以前那樣懷疑,更多人變成了“不可知論者”。他們不再否定風(fēng)險(xiǎn),而是愿意傾聽理性論據(jù),也開始反思自己之前的情感反應(yīng)。這種轉(zhuǎn)變需要時間,但只要我們持續(xù)對話,就會不斷推進(jìn)。

勸孫子成為一個beautiful human being

主持人:

您有一個四歲的孫子,如果有一天他問您:“爺爺,根據(jù)你對未來的判斷,我以后應(yīng)該做什么工作?”您會怎么回答?

Bengio:

我會告訴他,努力成為一個“美好的人”,一個懂得愛與被愛、愿意承擔(dān)責(zé)任、能為他人和集體福祉做貢獻(xiàn)的人。

即使機(jī)器能做大部分工作,人類身上的某些特質(zhì)也會一直有價值。

比如情感連接、同理心、對“美好事物”的追求。如果我在醫(yī)院里感到焦慮或痛苦,我希望有人類握住我的手,而不是一臺機(jī)器。這種“人類接觸”的價值,會隨著其他技能的自動化而變得越來越重要。



主持人:

可以說您擔(dān)心未來嗎?如果您的孫子問:“爺爺,你擔(dān)心未來,我應(yīng)該擔(dān)心嗎?”您會怎么說?

Bengio:

我會告訴他,我們要客觀看待未來,未來不是只有一種可能,而是有很多條路徑。通過我們的行動,我們能影響自己走向哪條路。

我會鼓勵他思考,你能為身邊的人、為社會做些什么?如何守護(hù)你所珍視的價值觀?如何保護(hù)這個星球上的美好事物?

孩子是未來的塑造者,他們有能力讓未來變得更好,這種“能動性”比“擔(dān)憂”更重要。

主持人:

我看著我的侄女、侄子(都不到六歲),總覺得他們很純真,還沒被當(dāng)前世界的復(fù)雜和風(fēng)險(xiǎn)滲透。讓他們?nèi)ッ鎸σ粋€“不是自己創(chuàng)造的未來”,似乎有點(diǎn)不公平。

Bengio:

確實(shí)不公平,尤其是如果只是少數(shù)人“召喚”出了AI這個“風(fēng)險(xiǎn)因子”,卻讓所有人承擔(dān)后果。但這種“不公平”也可以成為動力——當(dāng)人們意識到不公平時,會更有決心去改變現(xiàn)狀。

我們的基因里其實(shí)就帶著“解決不公”的動力,這種動力能推動我們團(tuán)結(jié)起來,為了共同的未來努力。

對孩子來說,我們不需要把風(fēng)險(xiǎn)當(dāng)成“可怕的負(fù)擔(dān)”,而是可以用“世界有風(fēng)險(xiǎn),但也有美好,我們有能力守護(hù)美好”的視角去引導(dǎo)他們,讓他們知道,自己可以成為改變的一部分。

完整訪談:https://www.youtube.com/watch?v=zQ1POHiR8m8

— 完 —

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
國務(wù)院最新任命!成立2年多的國家局,領(lǐng)導(dǎo)班子有調(diào)整

國務(wù)院最新任命!成立2年多的國家局,領(lǐng)導(dǎo)班子有調(diào)整

上觀新聞
2026-01-08 12:40:13
西方人突然發(fā)現(xiàn),中國預(yù)設(shè)的世界大戰(zhàn),是“1VS所有”的生死局

西方人突然發(fā)現(xiàn),中國預(yù)設(shè)的世界大戰(zhàn),是“1VS所有”的生死局

一網(wǎng)打盡全球焦點(diǎn)
2026-01-07 09:09:29
感謝邵佳一!李昊最后時刻3次世界級撲救:中國足球真不缺門將

感謝邵佳一!李昊最后時刻3次世界級撲救:中國足球真不缺門將

邱澤云
2026-01-09 01:07:50
高中生扶老人被訛50萬,15年后老人孫子考上清華,在校門口跪下求饒

高中生扶老人被訛50萬,15年后老人孫子考上清華,在校門口跪下求饒

紅豆講堂
2025-07-14 17:21:43
廣東外援薩姆納:NBA合同實(shí)際到手嚇你一跳 很多人說運(yùn)動員退役了就會破產(chǎn)

廣東外援薩姆納:NBA合同實(shí)際到手嚇你一跳 很多人說運(yùn)動員退役了就會破產(chǎn)

籃球大圖
2026-01-08 11:53:44
中美差距開始縮小!我國GDP爆增3.36萬億,再次接近美國70%水平

中美差距開始縮??!我國GDP爆增3.36萬億,再次接近美國70%水平

南宗歷史
2025-11-14 15:54:19
廣州小學(xué)生被抽血事件:告訴爸媽就扣小紅花

廣州小學(xué)生被抽血事件:告訴爸媽就扣小紅花

每日一見
2026-01-02 12:21:28
有反轉(zhuǎn)?閆學(xué)晶再迎接噩耗,恩師也被牽連,兒子首發(fā)聲為娘抱不平

有反轉(zhuǎn)?閆學(xué)晶再迎接噩耗,恩師也被牽連,兒子首發(fā)聲為娘抱不平

奇思妙想草葉君
2026-01-08 01:03:26
上海美女博主淺檸去世,身體一塌糊涂仍在直播,最后家人忍痛拔管

上海美女博主淺檸去世,身體一塌糊涂仍在直播,最后家人忍痛拔管

林雁飛
2026-01-06 15:16:11
伊朗街道爆發(fā)沖突,兩名警察死亡,30人受傷:有示威者攜帶武器并向警察開槍

伊朗街道爆發(fā)沖突,兩名警察死亡,30人受傷:有示威者攜帶武器并向警察開槍

魯中晨報(bào)
2026-01-08 07:05:03
中央音樂學(xué)院發(fā)布嚴(yán)正聲明

中央音樂學(xué)院發(fā)布嚴(yán)正聲明

現(xiàn)代快報(bào)
2026-01-08 18:17:02
中信證券:預(yù)計(jì)2025年四季度美國實(shí)際GDP增速較2025年三季度或?qū)⒂兴芈?>
    </a>
        <h3>
      <a href=證券時報(bào)
2026-01-08 09:03:05
為啥說生命的盡頭是玄學(xué)?網(wǎng)友:我去那家公司上班,后期公司就垮

為啥說生命的盡頭是玄學(xué)?網(wǎng)友:我去那家公司上班,后期公司就垮

帶你感受人間冷暖
2026-01-07 00:10:05
???WTT冠軍賽:女單大爆冷!奧運(yùn)冠軍0:3出局,伊藤美誠一輪游

???WTT冠軍賽:女單大爆冷!奧運(yùn)冠軍0:3出局,伊藤美誠一輪游

國乒二三事
2026-01-08 06:51:25
逃離加州!加州連續(xù)6年成為人口流出最多的州,德州則是凈流入最多的州

逃離加州!加州連續(xù)6年成為人口流出最多的州,德州則是凈流入最多的州

大洛杉磯LA
2026-01-08 04:09:57
算了,不寫陳志了,他就是一個“臉大頭圓光有錢”的馬仔

算了,不寫陳志了,他就是一個“臉大頭圓光有錢”的馬仔

熱點(diǎn)菌本君
2025-11-03 15:04:39
德媒:安世半導(dǎo)體才值幾分錢?歐洲沒搶對地方,真正值錢的是中國

德媒:安世半導(dǎo)體才值幾分錢?歐洲沒搶對地方,真正值錢的是中國

小熊侃史
2026-01-08 07:05:05
吹楊被交易至奇才!掏出手機(jī)起身離場 落寞背影預(yù)示老鷹時代落幕

吹楊被交易至奇才!掏出手機(jī)起身離場 落寞背影預(yù)示老鷹時代落幕

顏小白的籃球夢
2026-01-08 10:44:54
特朗普舉著孩子照片,對哭泣的母親承諾:我相信中國會執(zhí)行死刑的

特朗普舉著孩子照片,對哭泣的母親承諾:我相信中國會執(zhí)行死刑的

博覽歷史
2025-07-21 17:59:30
醫(yī)生再三提醒:糖尿病必做6項(xiàng)檢查!少做一項(xiàng),都可能釀成大禍

醫(yī)生再三提醒:糖尿病必做6項(xiàng)檢查!少做一項(xiàng),都可能釀成大禍

健康之光
2025-12-27 18:40:03
2026-01-09 03:24:49
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
11988文章數(shù) 176357關(guān)注度
往期回顧 全部

科技要聞

智譜拿下“全球大模型第一股”,憑什么

頭條要聞

采用俄羅斯的防空系統(tǒng) 委內(nèi)瑞拉防空體系因何失效

頭條要聞

采用俄羅斯的防空系統(tǒng) 委內(nèi)瑞拉防空體系因何失效

體育要聞

世乒賽銀牌得主,說自己夢里都是孫穎莎

娛樂要聞

抗戰(zhàn)劇《馬背搖籃》首播,獲觀眾好評

財(cái)經(jīng)要聞

微軟CTO韋青:未來人類會花錢"戒手機(jī)"

汽車要聞

從量變到"智"變 吉利在CES打出了五張牌

態(tài)度原創(chuàng)

教育
本地
旅游
公開課
軍事航空

教育要聞

一覺醒來,全球傳播學(xué)倒退100年(無限流)

本地新聞

1986-2026,一通電話的時空旅程

旅游要聞

京城里的小眾博物館

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普提出將美國軍費(fèi)提升至1.5萬億美元

無障礙瀏覽 進(jìn)入關(guān)懷版