国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

MIT團(tuán)隊(duì)用AI檢驗(yàn)AI:AI給出的“最優(yōu)解”真的公平嗎?

0
分享至


(來(lái)源:麻省理工科技評(píng)論)

AI 正越來(lái)越多地被用于輔助高風(fēng)險(xiǎn)場(chǎng)景下的決策。比如一個(gè)自主系統(tǒng)可以找出一種電力分配策略,在保持電壓穩(wěn)定的前提下把成本降到最低。

這些由 AI 給出的方案雖然在技術(shù)上可能是最優(yōu)的,它們真的公平嗎?如果一個(gè)低成本的電力分配策略讓條件不佳的社區(qū)比高收入地區(qū)更容易遭遇停電,這算不算問(wèn)題?

為了幫助相關(guān)方在 AI 系統(tǒng)部署之前就能快速發(fā)現(xiàn)潛在的倫理困境,MIT 的研究人員開(kāi)發(fā)了一套自動(dòng)化評(píng)估方法。這套方法的目標(biāo)是在可量化指標(biāo)(比如成本或穩(wěn)定性)與那些定性或主觀的價(jià)值(比如公平性)之間找到平衡。

該系統(tǒng)把客觀評(píng)估與用戶(hù)定義的人類(lèi)價(jià)值觀分開(kāi)處理,使用一個(gè)大語(yǔ)言模型作為“人類(lèi)代理”來(lái)捕捉和整合相關(guān)方的偏好。

這套自適應(yīng)框架會(huì)挑選出最值得進(jìn)一步評(píng)估的場(chǎng)景,從而簡(jiǎn)化原本需要耗費(fèi)大量人力和時(shí)間的手工流程。這些測(cè)試用例既能展示自動(dòng)系統(tǒng)與人類(lèi)價(jià)值觀高度吻合的情況,也能揭示那些意外偏離倫理標(biāo)準(zhǔn)的情境。

“我們可以給 AI 系統(tǒng)加上很多規(guī)則和護(hù)欄,但這些防護(hù)只能攔住我們事先能想到的那些風(fēng)險(xiǎn)。不能因?yàn)?AI 是在這些數(shù)據(jù)上訓(xùn)練過(guò)的,就覺(jué)得讓它直接上崗就行。我們想做的是找到一種更系統(tǒng)的方法,把那些‘未知的未知’提前挖出來(lái),在壞事發(fā)生之前就預(yù)判到它。”論文的通訊作者、MIT 航空航天系(AeroAstro)副教授、MIT 信息與決策系統(tǒng)實(shí)驗(yàn)室(LIDS)首席研究員范楚楚(Chuchu Fan)說(shuō)。

論文的第一作者是機(jī)械工程系研究生安嘉麗·帕拉沙爾(Anjali Parashar),合著者包括 AeroAstro 博士后 Yingke Li,以及 MIT 和薩博公司(Saab)的其他研究人員。該研究將在國(guó)際學(xué)習(xí)表征大會(huì)(ICLR)上發(fā)表。



為倫理打分

在電網(wǎng)這樣的大型系統(tǒng)里,要全面評(píng)估 AI 推薦方案是否符合倫理,兼顧所有目標(biāo),是一件特別困難的事。

大多數(shù)測(cè)試框架依賴(lài)預(yù)先收集的數(shù)據(jù),但涉及主觀倫理標(biāo)準(zhǔn)的標(biāo)注數(shù)據(jù)往往很難拿到。另外,倫理價(jià)值觀和 AI 系統(tǒng)本身都在不斷變化,基于成文規(guī)則或監(jiān)管文件的靜態(tài)評(píng)估方法需要頻繁更新。

范楚楚和她的團(tuán)隊(duì)從另一個(gè)角度切入這個(gè)問(wèn)題。他們借鑒了自己之前在機(jī)器人系統(tǒng)評(píng)估方面的工作,開(kāi)發(fā)出一套實(shí)驗(yàn)設(shè)計(jì)框架,專(zhuān)門(mén)用來(lái)識(shí)別那些最有信息量的場(chǎng)景,供人類(lèi)相關(guān)方進(jìn)一步仔細(xì)評(píng)估。

這套由兩部分組成的系統(tǒng)叫做 SEED-SET(Scalable Experimental Design for System-level Ethical Testing,系統(tǒng)級(jí)倫理測(cè)試的可擴(kuò)展實(shí)驗(yàn)設(shè)計(jì)),結(jié)合了量化指標(biāo)與倫理標(biāo)準(zhǔn)。它既能識(shí)別出那些既滿足可量化要求、又符合人類(lèi)價(jià)值觀的場(chǎng)景,也能找出反過(guò)來(lái)的情況。

“我們不想把所有資源都花在隨機(jī)評(píng)估上。所以關(guān)鍵是讓框架聚焦在我們最關(guān)心的那些測(cè)試用例上,”Yingke Li 說(shuō)。

SEED-SET 的一個(gè)重要優(yōu)勢(shì)是:它不需要預(yù)先存在的評(píng)估數(shù)據(jù),而且可以適配多個(gè)目標(biāo)。以一個(gè)電網(wǎng)為例,它可能有多個(gè)用戶(hù)群體,比如一個(gè)較大的農(nóng)村社區(qū)和一個(gè)數(shù)據(jù)中心。兩類(lèi)用戶(hù)都希望電力便宜又可靠,但從倫理角度看,他們各自的優(yōu)先級(jí)可能差異很大。

這些倫理標(biāo)準(zhǔn)往往沒(méi)有明確定義,因此無(wú)法用分析方法直接度量。電網(wǎng)運(yùn)營(yíng)方想要找到一種最具成本效益的策略,同時(shí)盡可能滿足所有相關(guān)方的主觀倫理偏好。

SEED-SET 應(yīng)對(duì)這個(gè)挑戰(zhàn)的方法是把問(wèn)題拆成兩層,按層級(jí)結(jié)構(gòu)處理。第一層是客觀模型,評(píng)估系統(tǒng)在成本等具體指標(biāo)上的表現(xiàn);第二層是主觀模型,在客觀評(píng)估的基礎(chǔ)上,考慮相關(guān)方的判斷,比如他們感受到的公平程度。

“我們方法中客觀的那一部分對(duì)應(yīng)的是 AI 系統(tǒng),主觀的那一部分對(duì)應(yīng)的是評(píng)估它的用戶(hù)。通過(guò)以層級(jí)方式拆解偏好,我們可以用更少的評(píng)估次數(shù)生成理想的場(chǎng)景,”帕拉沙爾說(shuō)。



把主觀評(píng)價(jià)編碼進(jìn)來(lái)

為了完成主觀評(píng)估,系統(tǒng)用一個(gè)大語(yǔ)言模型來(lái)替代人類(lèi)評(píng)估者。研究人員把每個(gè)用戶(hù)群體的偏好編碼成自然語(yǔ)言提示詞交給模型,大語(yǔ)言模型按照這些指令對(duì)兩個(gè)場(chǎng)景進(jìn)行比較,根據(jù)倫理標(biāo)準(zhǔn)選出更合意的那個(gè)。

“一個(gè)人類(lèi)評(píng)估者在看過(guò)幾百甚至幾千個(gè)場(chǎng)景之后會(huì)疲勞,評(píng)估也會(huì)變得不一致,所以我們用基于大語(yǔ)言模型的策略來(lái)代替,”帕拉沙爾解釋說(shuō)。SEED-SET 會(huì)用選出的場(chǎng)景來(lái)模擬整個(gè)系統(tǒng)(在這個(gè)例子里就是電力分配策略)。模擬結(jié)果又會(huì)反過(guò)來(lái)引導(dǎo)系統(tǒng)去尋找下一個(gè)最值得測(cè)試的候選場(chǎng)景。

最終,SEED-SET 能智能地篩選出最具代表性的場(chǎng)景,無(wú)論是那些同時(shí)達(dá)標(biāo)客觀指標(biāo)和倫理標(biāo)準(zhǔn)的場(chǎng)景,還是那些明顯偏離的場(chǎng)景。用戶(hù)可以據(jù)此分析 AI 系統(tǒng)的表現(xiàn),并調(diào)整它的策略。

舉個(gè)例子,SEED-SET 能精準(zhǔn)找出那些在用電高峰期優(yōu)先保障高收入?yún)^(qū)域、讓條件較差的社區(qū)更容易停電的電力分配方案。

為了測(cè)試 SEED-SET,研究人員對(duì)若干真實(shí)的自主系統(tǒng)做了評(píng)估,包括一個(gè) AI 驅(qū)動(dòng)的電網(wǎng)和一個(gè)城市交通調(diào)度系統(tǒng)。他們測(cè)量了所生成的場(chǎng)景與倫理標(biāo)準(zhǔn)的吻合程度。在相同時(shí)間里,該系統(tǒng)生成的最優(yōu)測(cè)試用例數(shù)量超過(guò)了基準(zhǔn)方法的兩倍,還發(fā)現(xiàn)了許多其他方法忽略的場(chǎng)景。

“當(dāng)我們改變用戶(hù)偏好時(shí),SEED-SET 生成的場(chǎng)景集合也會(huì)發(fā)生明顯變化。這說(shuō)明評(píng)估策略對(duì)用戶(hù)的偏好反應(yīng)靈敏,”帕拉沙爾說(shuō)。

要驗(yàn)證 SEED-SET 在實(shí)際應(yīng)用中的價(jià)值,研究人員還需要開(kāi)展一項(xiàng)用戶(hù)研究,看看它生成的場(chǎng)景能不能幫助真實(shí)的決策過(guò)程。

除了這項(xiàng)用戶(hù)研究,研究人員還計(jì)劃探索使用更高效的模型,把這套方法擴(kuò)展到規(guī)模更大、評(píng)估標(biāo)準(zhǔn)更多的問(wèn)題上,比如用來(lái)評(píng)估大語(yǔ)言模型自己的決策過(guò)程。

https://news.mit.edu/2026/evaluating-autonomous-systems-ethics-0402

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
駱家輝警告中國(guó):最好不要自主生產(chǎn)尖端芯片,這不是美國(guó)想看到的

駱家輝警告中國(guó):最好不要自主生產(chǎn)尖端芯片,這不是美國(guó)想看到的

老謝談史
2026-04-12 21:50:08
國(guó)羽3連冠夢(mèng)碎!王祉怡1-2無(wú)緣連斬世界第1,安洗瑩首奪亞錦賽

國(guó)羽3連冠夢(mèng)碎!王祉怡1-2無(wú)緣連斬世界第1,安洗瑩首奪亞錦賽

釘釘陌上花開(kāi)
2026-04-12 15:45:44
為什么你一定會(huì)老死?因?yàn)槟愕腄NA在故意殺掉你

為什么你一定會(huì)老死?因?yàn)槟愕腄NA在故意殺掉你

半解智士
2026-04-12 13:31:31
公然抹黑內(nèi)地,被劉德華“趕出”豪宅,亂港藝人杜汶澤如今還好嗎

公然抹黑內(nèi)地,被劉德華“趕出”豪宅,亂港藝人杜汶澤如今還好嗎

情感大頭說(shuō)說(shuō)
2026-04-11 04:00:19
1998年數(shù)萬(wàn)華人遭屠殺,中國(guó)為何沒(méi)出兵?26年后答案讓人沉默

1998年數(shù)萬(wàn)華人遭屠殺,中國(guó)為何沒(méi)出兵?26年后答案讓人沉默

哄動(dòng)一時(shí)啊
2026-02-17 22:21:25
小米收購(gòu)瑪莎拉蒂大反轉(zhuǎn),真相看傻全網(wǎng)!

小米收購(gòu)瑪莎拉蒂大反轉(zhuǎn),真相看傻全網(wǎng)!

財(cái)叔
2026-04-12 08:30:21
女土匪向杜月笙借槍?zhuān)旁麦夏罴芭f情答應(yīng),此舉鑄就了她傳奇一生

女土匪向杜月笙借槍?zhuān)旁麦夏罴芭f情答應(yīng),此舉鑄就了她傳奇一生

千秋文化
2026-04-09 15:45:26
特朗普使詐,以軍連投160枚炸彈,中國(guó)通告全球,必須確保一件事

特朗普使詐,以軍連投160枚炸彈,中國(guó)通告全球,必須確保一件事

興史興談
2026-04-11 15:33:51
四處播種的后果!24歲狀元,4個(gè)孩子4位母親,現(xiàn)在又被告上法庭

四處播種的后果!24歲狀元,4個(gè)孩子4位母親,現(xiàn)在又被告上法庭

你的籃球頻道
2026-04-12 08:38:25
貴州退休夫妻跳樓身亡,賬戶(hù)流水400萬(wàn),留遺言:沒(méi)有活著的希望

貴州退休夫妻跳樓身亡,賬戶(hù)流水400萬(wàn),留遺言:沒(méi)有活著的希望

曉艾故事匯
2025-04-09 20:44:14
如果最終都是靈活就業(yè),那雞娃當(dāng)學(xué)霸的意義是什么?

如果最終都是靈活就業(yè),那雞娃當(dāng)學(xué)霸的意義是什么?

記憶承載
2026-04-12 11:24:34
反流量卻成了流量密碼,莫氏雞煲老莫:在60歲被迫開(kāi)始拼命,生日愿望是“店子早點(diǎn)倒閉”

反流量卻成了流量密碼,莫氏雞煲老莫:在60歲被迫開(kāi)始拼命,生日愿望是“店子早點(diǎn)倒閉”

極目新聞
2026-04-12 14:04:06
中方已做最壞準(zhǔn)備,一旦中美爆發(fā)戰(zhàn)爭(zhēng),中國(guó)三大底牌一個(gè)比一個(gè)狠

中方已做最壞準(zhǔn)備,一旦中美爆發(fā)戰(zhàn)爭(zhēng),中國(guó)三大底牌一個(gè)比一個(gè)狠

史智文道
2026-04-12 10:05:36
著名專(zhuān)家預(yù)言:試管嬰兒壽命僅40年,那首例試管嬰兒如今怎樣了?

著名專(zhuān)家預(yù)言:試管嬰兒壽命僅40年,那首例試管嬰兒如今怎樣了?

青梅侃史啊
2026-03-28 19:22:24
大眾汽車(chē)官宣,停產(chǎn)純電車(chē)型!

大眾汽車(chē)官宣,停產(chǎn)純電車(chē)型!

新浪財(cái)經(jīng)
2026-04-11 15:06:14
民政局離完婚,我撥通父親電話:離婚了,父親只說(shuō)倆字:動(dòng)手

民政局離完婚,我撥通父親電話:離婚了,父親只說(shuō)倆字:動(dòng)手

徐俠客有話說(shuō)
2026-03-17 11:21:33
發(fā)現(xiàn)一個(gè)不爭(zhēng)的事實(shí):一個(gè)女人越是不愛(ài)打扮、不愛(ài)說(shuō)話、不愛(ài)湊熱鬧,往往這3個(gè)方面越是讓人佩服

發(fā)現(xiàn)一個(gè)不爭(zhēng)的事實(shí):一個(gè)女人越是不愛(ài)打扮、不愛(ài)說(shuō)話、不愛(ài)湊熱鬧,往往這3個(gè)方面越是讓人佩服

二胡的歲月如歌
2026-04-09 15:09:50
收官之戰(zhàn),燃爆主場(chǎng)!浙江浙商證券男籃常規(guī)賽最后兩場(chǎng)主場(chǎng)球票明日開(kāi)售!

收官之戰(zhàn),燃爆主場(chǎng)!浙江浙商證券男籃常規(guī)賽最后兩場(chǎng)主場(chǎng)球票明日開(kāi)售!

浙江廣廈籃球俱樂(lè)部
2026-04-12 22:24:47
隨著40歲C羅破門(mén)+利雅得勝利2-0,沙特聯(lián)最新積分榜出爐

隨著40歲C羅破門(mén)+利雅得勝利2-0,沙特聯(lián)最新積分榜出爐

側(cè)身凌空斬
2026-04-12 04:01:14
文章在上海開(kāi)陜西菜館:靠這個(gè)定價(jià),他真的能活下去嗎?

文章在上海開(kāi)陜西菜館:靠這個(gè)定價(jià),他真的能活下去嗎?

奇思妙想生活家
2026-04-10 17:15:34
2026-04-12 22:56:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評(píng)論獨(dú)家合作
16571文章數(shù) 514865關(guān)注度
往期回顧 全部

科技要聞

理想稱(chēng)遭惡意拉踩,東風(fēng)日產(chǎn):尊重同行

頭條要聞

特朗普:將封鎖任何試圖進(jìn)出霍爾木茲海峽的船只

頭條要聞

特朗普:將封鎖任何試圖進(jìn)出霍爾木茲海峽的船只

體育要聞

創(chuàng)造歷史!五大聯(lián)賽首位女性主教練誕生

娛樂(lè)要聞

賭王女兒何超蕸病逝,常年和乳癌斗爭(zhēng)

財(cái)經(jīng)要聞

美伊談判破裂的三大癥結(jié)

汽車(chē)要聞

煥新極氪007/007GT上市 限時(shí)19.39萬(wàn)起

態(tài)度原創(chuàng)

家居
教育
藝術(shù)
時(shí)尚
軍事航空

家居要聞

復(fù)古風(fēng)格 自然簡(jiǎn)約

教育要聞

高中地理必會(huì)知識(shí)點(diǎn)115條全梳理

藝術(shù)要聞

殯葬新規(guī)落地,小區(qū)里的“骨灰房”真能絕跡嗎?

被周冬雨、林更新戴上熱搜的珠寶,究竟有多驚艷?

軍事要聞

美國(guó)副總統(tǒng)萬(wàn)斯:美伊談判未能達(dá)成協(xié)議

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版