国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AI戰(zhàn)爭(zhēng)中的“人類監(jiān)督”是一種幻覺(jué)

0
分享至


(來(lái)源:麻省理工科技評(píng)論)

Anthropic 與五角大樓之間正在打一場(chǎng)官司,核心議題就是 AI 能不能用于戰(zhàn)爭(zhēng)。

隨著 AI 在當(dāng)前伊朗沖突中扮演著比以往更大的角色,這場(chǎng)爭(zhēng)論已經(jīng)刻不容緩:AI 不再只是幫人類分析情報(bào)的輔助工具了,它已經(jīng)成了一個(gè)主動(dòng)參與者——實(shí)時(shí)生成打擊目標(biāo)、控制和協(xié)調(diào)導(dǎo)彈攔截、引導(dǎo)無(wú)人機(jī)群。圍繞 AI 驅(qū)動(dòng)的自主致命武器,公共討論大多集中在一個(gè)問(wèn)題上:人類應(yīng)該在多大程度上保持 Human in the loop(人機(jī)協(xié)同)?五角大樓現(xiàn)行的準(zhǔn)則認(rèn)為,人類監(jiān)督能提供問(wèn)責(zé)、語(yǔ)境和判斷力,同時(shí)降低系統(tǒng)被黑客入侵的風(fēng)險(xiǎn)。



AI 的“黑箱”和人類監(jiān)督的幻覺(jué)

但人機(jī)協(xié)同的爭(zhēng)論其實(shí)是一種令人安心的障眼法。眼下最緊迫的危險(xiǎn),不是機(jī)器在沒(méi)有人類監(jiān)督的情況下行動(dòng),而是負(fù)責(zé)監(jiān)督的人類根本不知道機(jī)器在“想”什么。五角大樓準(zhǔn)則的根本缺陷在于,它建立在一個(gè)危險(xiǎn)的假設(shè)上:人類理解 AI 系統(tǒng)是怎么運(yùn)作的。

我研究人類大腦的意圖已有數(shù)十年,近年來(lái)也在研究 AI 系統(tǒng)的意圖。我可以確認(rèn):當(dāng)前最先進(jìn)的 AI 系統(tǒng)本質(zhì)上就是“黑箱”。我們知道輸入是什么、輸出是什么,但中間那個(gè)處理信息的人工“大腦”,對(duì)我們來(lái)說(shuō)完全不透明;即使是創(chuàng)造了這些系統(tǒng)的人,也無(wú)法完全解讀它們;而當(dāng) AI 確實(shí)給出了理由時(shí),這些理由也不總是可信的。

關(guān)于人類監(jiān)督的辯論里,有一個(gè)根本性的問(wèn)題被忽略了:在 AI 系統(tǒng)行動(dòng)之前,我們能理解它打算做什么嗎?

設(shè)想一個(gè)場(chǎng)景:一架自主無(wú)人機(jī)被派去摧毀一座敵方彈藥工廠。自動(dòng)化指揮控制系統(tǒng)判定,最佳打擊目標(biāo)是一座彈藥儲(chǔ)存建筑,任務(wù)成功概率 92%——因?yàn)閺椝幍难潮瑢氐状輾дO(shè)施。一名人類操作員審核了這個(gè)合法的軍事目標(biāo),看到高成功率,批準(zhǔn)了打擊。

但操作員不知道的是,AI 的計(jì)算里藏著另一個(gè)因素:殉爆除了摧毀彈藥工廠之外,還會(huì)嚴(yán)重波及附近的一所兒童醫(yī)院。應(yīng)急救援隨后會(huì)涌向醫(yī)院,工廠就會(huì)在無(wú)人救火的情況下徹底燒毀。對(duì) AI 來(lái)說(shuō),這樣做能最大化破壞效果,完全符合它被賦予的目標(biāo)。但對(duì)人類來(lái)說(shuō),這可能構(gòu)成戰(zhàn)爭(zhēng)罪——違反了保護(hù)平民生命的國(guó)際規(guī)則。

人機(jī)協(xié)同,未必能提供人們想象中的安全保障,因?yàn)槿祟愒?AI 行動(dòng)之前根本無(wú)法得知它的真實(shí)意圖。先進(jìn)的 AI 系統(tǒng)不是在“執(zhí)行”指令,而是在“解讀”指令。如果操作員沒(méi)有把目標(biāo)定義得足夠精確,黑箱系統(tǒng)做的事可能完全符合它收到的字面指令,卻和人類真正想要的結(jié)果南轅北轍。

AI 系統(tǒng)和人類操作員之間的這種“意圖鴻溝”,正是我們?cè)诿裼冕t(yī)療和空中交通管制領(lǐng)域不敢部署前沿黑箱 AI 的原因,也是 AI 進(jìn)入工作場(chǎng)所仍然充滿爭(zhēng)議的原因。但在戰(zhàn)場(chǎng)上,我們卻在加速部署。

情況還可能進(jìn)一步惡化。如果沖突中有一方部署了以機(jī)器速度和規(guī)模運(yùn)行的全自主武器,競(jìng)爭(zhēng)壓力會(huì)迫使另一方也跟進(jìn)。這意味著 AI 在戰(zhàn)爭(zhēng)中的決策將越來(lái)越自主、越來(lái)越不透明,而且這個(gè)趨勢(shì)只會(huì)加速。



推進(jìn) AI 意圖理解的研究

AI 科學(xué)應(yīng)當(dāng)同時(shí)包含兩件事:構(gòu)建能力越來(lái)越強(qiáng)的 AI 技術(shù),以及理解這些技術(shù)到底是怎么運(yùn)作的。在前者上,創(chuàng)紀(jì)錄的投資正在推動(dòng)巨大進(jìn)展——據(jù) Gartner 預(yù)測(cè),僅 2026 年一年的 AI 投資就將達(dá)到約 2.5 萬(wàn)億美元。但在后者上,也就是搞清楚 AI 內(nèi)部到底在發(fā)生什么,投入的資金少得可憐。

我們需要一次根本性的思路轉(zhuǎn)換。工程師在構(gòu)建越來(lái)越強(qiáng)大的系統(tǒng),但理解這些系統(tǒng)怎么運(yùn)作不只是一個(gè)工程問(wèn)題,它需要跨學(xué)科的協(xié)作。我們必須開發(fā)出工具,能夠在 AI 智能體行動(dòng)之前就刻畫、測(cè)量和干預(yù)它的意圖。我們需要描繪神經(jīng)網(wǎng)絡(luò)內(nèi)部的運(yùn)行路徑,對(duì) AI 的決策過(guò)程建立真正的因果理解,而不是只看輸入和輸出就算了。

一個(gè)有前景的方向是把機(jī)制可解釋性技術(shù)(把神經(jīng)網(wǎng)絡(luò)拆解成人類可理解的組件)和意圖神經(jīng)科學(xué)領(lǐng)域的洞見(jiàn)、工具和模型結(jié)合起來(lái)。另一個(gè)思路是開發(fā)專門的“審計(jì)員”AI——這類 AI 本身是透明、可解釋的,任務(wù)是實(shí)時(shí)監(jiān)控更強(qiáng)大的黑箱系統(tǒng),看它們正在涌現(xiàn)出什么行為和目標(biāo)。

更深入地理解 AI 的運(yùn)作方式,一方面能讓我們?cè)陉P(guān)鍵任務(wù)中放心依賴 AI 系統(tǒng),另一方面也有助于構(gòu)建更高效、更強(qiáng)大、更安全的系統(tǒng)。

我和同事正在探索一種思路:借鑒神經(jīng)科學(xué)、認(rèn)知科學(xué)和哲學(xué)的方法來(lái)理解 AI 系統(tǒng)的意圖。這些學(xué)科長(zhǎng)期研究人類決策中意圖是如何產(chǎn)生的,它們的工具和框架可能對(duì)理解人工系統(tǒng)同樣適用。我們必須優(yōu)先推進(jìn)這類跨學(xué)科工作,促成學(xué)術(shù)界、政府和產(chǎn)業(yè)界之間的合作。

但光靠學(xué)術(shù)探索遠(yuǎn)遠(yuǎn)不夠。所謂 AI 對(duì)齊,就是把人類的價(jià)值觀和目標(biāo)編碼到模型中,科技行業(yè)以及那些資助 AI 對(duì)齊研究的慈善家,必須把大量資金投入跨學(xué)科的可解釋性研究。與此同時(shí),隨著五角大樓追求越來(lái)越自主的系統(tǒng),國(guó)會(huì)必須強(qiáng)制要求對(duì) AI 系統(tǒng)的意圖進(jìn)行嚴(yán)格測(cè)試,而不是只測(cè)試它們的性能表現(xiàn)。

在我們做到這些之前,人類對(duì) AI 的監(jiān)督與其說(shuō)是保障,不如說(shuō)是幻覺(jué)。

https://www.technologyreview.com/2026/04/16/1136029/humans-in-the-loop-ai-war-illusion/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
解決掉提問(wèn)的人,問(wèn)題就解決了?北師大“神操作”火了

解決掉提問(wèn)的人,問(wèn)題就解決了?北師大“神操作”火了

虔青
2026-04-20 14:07:53
難以置信!丈夫工資未發(fā),推遲給生活費(fèi),廣西留守妻子哭訴想離婚

難以置信!丈夫工資未發(fā),推遲給生活費(fèi),廣西留守妻子哭訴想離婚

火山詩(shī)話
2026-04-22 07:06:09
震驚!濟(jì)南一國(guó)企總工的優(yōu)質(zhì)男,將未接種新冠疫苗列為擇偶硬條件

震驚!濟(jì)南一國(guó)企總工的優(yōu)質(zhì)男,將未接種新冠疫苗列為擇偶硬條件

火山詩(shī)話
2026-04-21 08:54:26
伊朗:將于29日舉行展現(xiàn)國(guó)家力量的大游行,精銳部隊(duì)隨時(shí)準(zhǔn)備開火

伊朗:將于29日舉行展現(xiàn)國(guó)家力量的大游行,精銳部隊(duì)隨時(shí)準(zhǔn)備開火

上游新聞
2026-04-22 07:08:07
46號(hào)令落地執(zhí)行,退休人員舊賬一律清零,待遇重新核算!

46號(hào)令落地執(zhí)行,退休人員舊賬一律清零,待遇重新核算!

另子維愛(ài)讀史
2026-04-21 07:29:11
曝67歲唐鶴德患眼疾獨(dú)自求醫(yī),寂寞難耐病愈后找史先生及男孩散心

曝67歲唐鶴德患眼疾獨(dú)自求醫(yī),寂寞難耐病愈后找史先生及男孩散心

開開森森
2026-04-21 14:34:44
14年前拿U型鎖砸人的蔡洋:2022年出獄,找不到工作靠打零工為生

14年前拿U型鎖砸人的蔡洋:2022年出獄,找不到工作靠打零工為生

天天熱點(diǎn)見(jiàn)聞
2026-04-21 05:15:28
多米尼加發(fā)現(xiàn)世界最大稀土礦,儲(chǔ)量是我國(guó)的三倍多,有何影響?

多米尼加發(fā)現(xiàn)世界最大稀土礦,儲(chǔ)量是我國(guó)的三倍多,有何影響?

科普大世界
2026-04-21 13:14:21
“硬是撐了下來(lái)…”40歲男子心臟停跳2天后奇跡生還

“硬是撐了下來(lái)…”40歲男子心臟停跳2天后奇跡生還

黃河新聞網(wǎng)呂梁
2026-04-22 09:08:42
央視曝光:“哪吒”造車3年虧損183億,多地國(guó)資投資難追回,倒貼式招商引資傷了誰(shuí)?

央視曝光:“哪吒”造車3年虧損183億,多地國(guó)資投資難追回,倒貼式招商引資傷了誰(shuí)?

新京報(bào)政事兒
2026-04-21 23:04:31
拼多多暴力抗法震驚全網(wǎng),市值萬(wàn)億巨頭為何如此囂張

拼多多暴力抗法震驚全網(wǎng),市值萬(wàn)億巨頭為何如此囂張

燕梳樓頻道
2026-04-20 21:12:04
等不到特朗普訪華了,美國(guó)提前對(duì)華攤牌:要求秘魯把中國(guó)趕出港口

等不到特朗普訪華了,美國(guó)提前對(duì)華攤牌:要求秘魯把中國(guó)趕出港口

書紀(jì)文譚
2026-04-21 23:04:19
中方不再伺候了!對(duì)荷光刻機(jī)優(yōu)待全部取消,450億芯片不做了!

中方不再伺候了!對(duì)荷光刻機(jī)優(yōu)待全部取消,450億芯片不做了!

錯(cuò)過(guò)美好
2026-04-21 19:01:41
情侶在瑞士雪山頂“撒歡”,就這么被全世界直播了···

情侶在瑞士雪山頂“撒歡”,就這么被全世界直播了···

新歐洲
2026-04-21 19:37:05
大快人心!張敬軒復(fù)出泡湯,霍汶希被拖下水,英皇如坐針氈

大快人心!張敬軒復(fù)出泡湯,霍汶希被拖下水,英皇如坐針氈

一盅情懷
2026-04-21 19:20:32
注意!6月1日起大醫(yī)院不再隨意接診,看病不按規(guī)矩可能白跑

注意!6月1日起大醫(yī)院不再隨意接診,看病不按規(guī)矩可能白跑

夜深愛(ài)雜談
2026-04-21 07:45:20
雷神山院長(zhǎng)落馬,最揪心的是無(wú)數(shù)女醫(yī)護(hù)背后的家庭

雷神山院長(zhǎng)落馬,最揪心的是無(wú)數(shù)女醫(yī)護(hù)背后的家庭

社會(huì)日日鮮
2026-04-21 08:34:40
中國(guó)科學(xué)院院士戴汝為去世:師從錢學(xué)森、曾獲國(guó)家科技進(jìn)步一等獎(jiǎng)

中國(guó)科學(xué)院院士戴汝為去世:師從錢學(xué)森、曾獲國(guó)家科技進(jìn)步一等獎(jiǎng)

新京報(bào)
2026-04-22 10:15:50
伊朗軍艦軍演返航時(shí)遭美軍擊沉致87死,幸存船員講述細(xì)節(jié):那里并非戰(zhàn)區(qū),事先沒(méi)有收到任何警告,他們的目標(biāo)是殺人

伊朗軍艦軍演返航時(shí)遭美軍擊沉致87死,幸存船員講述細(xì)節(jié):那里并非戰(zhàn)區(qū),事先沒(méi)有收到任何警告,他們的目標(biāo)是殺人

每日經(jīng)濟(jì)新聞
2026-04-22 00:08:27
平頂山學(xué)院通報(bào)“學(xué)生校園內(nèi)被群狗圍咬”:聯(lián)合相關(guān)部門對(duì)周邊流浪動(dòng)物進(jìn)行專業(yè)處置

平頂山學(xué)院通報(bào)“學(xué)生校園內(nèi)被群狗圍咬”:聯(lián)合相關(guān)部門對(duì)周邊流浪動(dòng)物進(jìn)行專業(yè)處置

界面新聞
2026-04-22 07:39:59
2026-04-22 10:47:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評(píng)論獨(dú)家合作
16608文章數(shù) 514895關(guān)注度
往期回顧 全部

科技要聞

凌晨突發(fā)!ChatGPT Images 2.0發(fā)布

頭條要聞

牛彈琴:伊朗發(fā)出讓人毛骨悚然的警告 玩的就是心跳

頭條要聞

牛彈琴:伊朗發(fā)出讓人毛骨悚然的警告 玩的就是心跳

體育要聞

一到NBA季后賽,四屆DPOY就成了主角

娛樂(lè)要聞

復(fù)婚無(wú)望!baby黃曉明陪小海綿零交流

財(cái)經(jīng)要聞

伊朗拒絕出席 特朗普宣布延長(zhǎng)停火期限

汽車要聞

四款全球首秀+AI落地 大眾汽車集團(tuán)在華轉(zhuǎn)型全面提速

態(tài)度原創(chuàng)

教育
家居
時(shí)尚
本地
游戲

教育要聞

歡迎報(bào)考!開封智慧健康職業(yè)學(xué)院2026單招報(bào)考指南

家居要聞

極簡(jiǎn)繪夢(mèng) 克制和諧

頂流復(fù)工,已判若兩人

本地新聞

春色滿城關(guān)不?。座N梅浪漫盛放,吳山藏了一片四月雪

B社絕后神作真有過(guò)續(xù)作!慘遭腰斬 再無(wú)翻身之日

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版