国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

北大提出CAP方法:讓AI在混淆的語(yǔ)境中也能準(zhǔn)確判斷用戶(hù)真實(shí)意圖

0
分享至


這項(xiàng)由北京大學(xué)計(jì)算機(jī)學(xué)院張卓然、張峰、李尚源等研究者共同完成的研究發(fā)表于2025年12月,論文編號(hào)為arXiv:2512.14719v1。該研究針對(duì)小型語(yǔ)言模型在分類(lèi)任務(wù)中面臨的解釋性和魯棒性挑戰(zhàn),提出了全新的類(lèi)感知?dú)w因先驗(yàn)方法,為構(gòu)建更可靠的AI系統(tǒng)提供了重要突破。

當(dāng)我們使用手機(jī)上的語(yǔ)音助手時(shí),經(jīng)常會(huì)遇到這樣的情況:明明說(shuō)的是"查看鬧鐘",助手卻理解成了"設(shè)置鬧鐘"。這種混淆在AI系統(tǒng)中極為常見(jiàn),特別是當(dāng)不同指令包含相似關(guān)鍵詞時(shí)。北京大學(xué)的研究團(tuán)隊(duì)深入研究了這一現(xiàn)象,并發(fā)現(xiàn)了一個(gè)有趣的規(guī)律:傳統(tǒng)的AI訓(xùn)練方法雖然能識(shí)別重要關(guān)鍵詞,但往往無(wú)法區(qū)分語(yǔ)義相近的不同類(lèi)別。

研究團(tuán)隊(duì)通過(guò)分析發(fā)現(xiàn),現(xiàn)有的歸因方法存在兩個(gè)關(guān)鍵問(wèn)題。第一個(gè)問(wèn)題被稱(chēng)為"同質(zhì)化"現(xiàn)象,就像不同品牌的導(dǎo)航軟件都會(huì)重點(diǎn)標(biāo)注"高速公路"這個(gè)關(guān)鍵詞,但它們給出的路線(xiàn)建議卻驚人地相似。在AI系統(tǒng)中,不同的解釋方法也會(huì)一致地突出顯示某些高頻關(guān)鍵詞,但這種一致性并不一定意味著準(zhǔn)確性。第二個(gè)更嚴(yán)重的問(wèn)題是"類(lèi)別混淆",當(dāng)研究人員分析那些容易被AI搞錯(cuò)的類(lèi)別時(shí),發(fā)現(xiàn)它們往往共享許多相同的關(guān)鍵詞。這就好比"預(yù)約醫(yī)生"和"取消預(yù)約"都包含"預(yù)約"這個(gè)關(guān)鍵詞,傳統(tǒng)方法會(huì)讓AI過(guò)度關(guān)注這個(gè)共同詞匯,反而忽略了真正的區(qū)分性特征。

為了解決這些問(wèn)題,研究團(tuán)隊(duì)開(kāi)發(fā)了一種名為"類(lèi)感知?dú)w因先驗(yàn)"(CAP)的創(chuàng)新方法。這種方法的核心思想可以用廚師學(xué)習(xí)烹飪來(lái)類(lèi)比。傳統(tǒng)方法就像讓廚師只記住"鹽、糖、醋"等基本調(diào)料,但面對(duì)"糖醋排骨"和"糖醋里脊"時(shí)就會(huì)困惑,因?yàn)閮傻啦硕夹枰呛痛?。而CAP方法則會(huì)教廚師不僅要知道需要什么調(diào)料,更要理解在什么情境下、以什么比例、按什么順序使用這些調(diào)料,從而真正掌握每道菜的精髓。

具體來(lái)說(shuō),CAP方法通過(guò)向大型語(yǔ)言模型提供完整的任務(wù)指令和標(biāo)簽空間信息,讓模型能夠更好地理解不同類(lèi)別之間的細(xì)微差別。研究團(tuán)隊(duì)設(shè)計(jì)了一套巧妙的"遮蓋實(shí)驗(yàn)":他們會(huì)隨機(jī)遮蓋輸入文本中的某些詞匯,然后觀察模型預(yù)測(cè)結(jié)果的變化。通過(guò)數(shù)學(xué)優(yōu)化算法,他們能夠精確計(jì)算出每個(gè)詞匯對(duì)最終判斷的真實(shí)貢獻(xiàn)度。這個(gè)過(guò)程類(lèi)似于調(diào)香師在制作香水時(shí),通過(guò)逐一去除不同香料來(lái)判斷每種成分的重要性。

研究的實(shí)驗(yàn)部分覆蓋了三個(gè)重要的數(shù)據(jù)集,包含從日常對(duì)話(huà)到銀行業(yè)務(wù)等不同領(lǐng)域的語(yǔ)言任務(wù)。在這些測(cè)試中,CAP方法不僅在標(biāo)準(zhǔn)條件下表現(xiàn)出色,更在面臨惡意攻擊和數(shù)據(jù)稀缺的困難環(huán)境中展現(xiàn)出強(qiáng)大的適應(yīng)性。研究團(tuán)隊(duì)特別設(shè)計(jì)了"對(duì)抗性測(cè)試",模擬現(xiàn)實(shí)中可能遇到的各種干擾情況。結(jié)果顯示,使用CAP方法訓(xùn)練的模型在面對(duì)這些挑戰(zhàn)時(shí),準(zhǔn)確率比傳統(tǒng)方法提高了8%以上。

更進(jìn)一步,研究團(tuán)隊(duì)還提出了混合歸因方法CAPHybrid,將CAP與現(xiàn)有技術(shù)相結(jié)合。這種融合策略就像組建一支多技能專(zhuān)家團(tuán)隊(duì),每個(gè)成員都有自己的專(zhuān)長(zhǎng):LIME方法擅長(zhǎng)識(shí)別與目標(biāo)標(biāo)簽高度相關(guān)的詞匯,就像經(jīng)驗(yàn)豐富的老師能快速找到課文中的關(guān)鍵信息;集成梯度方法則善于捕捉模型內(nèi)部的敏感性變化,如同細(xì)心的醫(yī)生能察覺(jué)病人微妙的癥狀變化;而CAP方法專(zhuān)注于發(fā)現(xiàn)類(lèi)別間的區(qū)分性特征,類(lèi)似于偵探能從相似的案件中找出關(guān)鍵差異。通過(guò)巧妙地融合這些不同視角的信息,CAPHybrid方法實(shí)現(xiàn)了更全面、更可靠的性能提升。

在實(shí)際應(yīng)用測(cè)試中,研究團(tuán)隊(duì)發(fā)現(xiàn)這種方法特別適合處理語(yǔ)義相近的復(fù)雜分類(lèi)任務(wù)。當(dāng)面對(duì)"查詢(xún)余額"和"轉(zhuǎn)賬匯款"這樣的銀行指令時(shí),傳統(tǒng)方法可能會(huì)因?yàn)槎及?錢(qián)"相關(guān)的詞匯而產(chǎn)生混淆,但CAP方法能夠準(zhǔn)確識(shí)別"查詢(xún)"和"轉(zhuǎn)賬"這些動(dòng)作詞的關(guān)鍵區(qū)別。更令人印象深刻的是,這種方法在數(shù)據(jù)量較少的情況下仍能保持良好性能,這對(duì)于那些無(wú)法獲得大量訓(xùn)練數(shù)據(jù)的專(zhuān)業(yè)領(lǐng)域具有重要價(jià)值。

研究還揭示了一個(gè)重要發(fā)現(xiàn):不同數(shù)據(jù)集的內(nèi)在結(jié)構(gòu)會(huì)顯著影響方法的改進(jìn)效果。銀行業(yè)務(wù)和日常對(duì)話(huà)數(shù)據(jù)集中存在大量語(yǔ)義相近的類(lèi)別,這些類(lèi)別之間的混淆正是傳統(tǒng)方法的軟肋,因此CAP方法在這些場(chǎng)景中展現(xiàn)出顯著優(yōu)勢(shì)。相比之下,在類(lèi)別區(qū)分度較高的數(shù)據(jù)集上,改進(jìn)效果相對(duì)溫和,這說(shuō)明CAP方法特別善于處理那些真正困難的細(xì)粒度分類(lèi)問(wèn)題。

從技術(shù)實(shí)現(xiàn)的角度來(lái)看,CAP方法的計(jì)算過(guò)程經(jīng)過(guò)精心優(yōu)化。研究團(tuán)隊(duì)采用了穩(wěn)定的數(shù)學(xué)分解技術(shù),確保即使在大規(guī)模數(shù)據(jù)處理時(shí)也能保持高效運(yùn)行。這種設(shè)計(jì)讓該方法不僅具有理論價(jià)值,更具備了實(shí)際應(yīng)用的可行性。同時(shí),方法的模塊化設(shè)計(jì)使其可以輕松與現(xiàn)有的AI系統(tǒng)集成,為廣泛應(yīng)用奠定了基礎(chǔ)。

這項(xiàng)研究的意義遠(yuǎn)超技術(shù)層面。在當(dāng)今AI技術(shù)快速發(fā)展的背景下,如何讓AI系統(tǒng)更好地理解人類(lèi)語(yǔ)言的細(xì)微差別,如何在復(fù)雜環(huán)境中保持穩(wěn)定可靠的表現(xiàn),這些都是亟待解決的關(guān)鍵問(wèn)題。CAP方法為這些挑戰(zhàn)提供了一個(gè)新的解決思路:不是簡(jiǎn)單地增加數(shù)據(jù)量或模型復(fù)雜度,而是通過(guò)更智能的訓(xùn)練方法來(lái)提升AI的"理解力"和"判斷力"。

展望未來(lái),這種方法有望在智能客服、醫(yī)療診斷輔助、法律文檔分析等對(duì)準(zhǔn)確性要求極高的領(lǐng)域發(fā)揮重要作用。當(dāng)AI能夠更準(zhǔn)確地理解用戶(hù)意圖,更可靠地在復(fù)雜情況下做出判斷時(shí),我們距離真正實(shí)用的人工智能助手又近了一步。這項(xiàng)研究不僅為學(xué)術(shù)界提供了新的研究方向,更為工業(yè)界開(kāi)發(fā)更可靠的AI產(chǎn)品指明了道路。對(duì)于普通用戶(hù)而言,這意味著未來(lái)的AI助手將更少出現(xiàn)令人困擾的誤解,更多地提供真正有用的幫助。

Q&A

Q1:什么是類(lèi)感知?dú)w因先驗(yàn)方法?

A:類(lèi)感知?dú)w因先驗(yàn)(CAP)是北京大學(xué)團(tuán)隊(duì)提出的一種新訓(xùn)練方法,它能讓AI更好地區(qū)分語(yǔ)義相近的不同指令。就像教會(huì)AI不僅要識(shí)別關(guān)鍵詞,更要理解這些詞在不同語(yǔ)境下的真實(shí)含義,從而避免把"查看鬧鐘"誤解為"設(shè)置鬧鐘"這樣的錯(cuò)誤。

Q2:CAP方法與傳統(tǒng)方法相比有什么優(yōu)勢(shì)?

A:傳統(tǒng)方法容易被相同關(guān)鍵詞誤導(dǎo),就像看到"預(yù)約"就無(wú)法區(qū)分是"預(yù)約醫(yī)生"還是"取消預(yù)約"。CAP方法通過(guò)分析完整的語(yǔ)境和任務(wù)背景,能準(zhǔn)確識(shí)別真正的區(qū)分性特征,在復(fù)雜情況下準(zhǔn)確率比傳統(tǒng)方法提高8%以上,特別擅長(zhǎng)處理容易混淆的相似指令。

Q3:這項(xiàng)研究對(duì)普通用戶(hù)有什么實(shí)際意義?

A:這項(xiàng)研究將直接改善我們使用AI助手的體驗(yàn)。未來(lái)的語(yǔ)音助手、智能客服和各種AI應(yīng)用將更準(zhǔn)確地理解用戶(hù)真實(shí)意圖,減少因誤解造成的困擾。無(wú)論是銀行業(yè)務(wù)查詢(xún)還是日常語(yǔ)音指令,AI都能提供更精準(zhǔn)、更可靠的服務(wù)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
來(lái)聚餐還補(bǔ)工資!東莞一工廠年底聚餐,當(dāng)晚按工時(shí)3.5小時(shí)核工資

來(lái)聚餐還補(bǔ)工資!東莞一工廠年底聚餐,當(dāng)晚按工時(shí)3.5小時(shí)核工資

火山詩(shī)話(huà)
2025-12-28 11:03:19
內(nèi)訌了?洛夫頓發(fā)文:都不相信我,我要回母校,網(wǎng)友: 趕緊滾吧!

內(nèi)訌了?洛夫頓發(fā)文:都不相信我,我要回母校,網(wǎng)友: 趕緊滾吧!

南海浪花
2025-12-28 12:32:59
女子分享10年前火車(chē)上偶遇的唱歌小男孩,竟被當(dāng)事人刷到:互聯(lián)網(wǎng)讓10年前的“一面之緣”有了續(xù)集

女子分享10年前火車(chē)上偶遇的唱歌小男孩,竟被當(dāng)事人刷到:互聯(lián)網(wǎng)讓10年前的“一面之緣”有了續(xù)集

環(huán)球網(wǎng)資訊
2025-12-28 10:11:35
民族英雄從課本移除,“民族英雄”卻受到吹捧,這事該反思嗎

民族英雄從課本移除,“民族英雄”卻受到吹捧,這事該反思嗎

何氽簡(jiǎn)史
2025-12-27 13:45:11
美國(guó)經(jīng)濟(jì)難于擺脫嚴(yán)重衰退 1975年11月19日《人民日?qǐng)?bào)》

美國(guó)經(jīng)濟(jì)難于擺脫嚴(yán)重衰退 1975年11月19日《人民日?qǐng)?bào)》

那些看得見(jiàn)的老照片
2025-12-17 17:13:44
董明珠零下三十度蹲守黑瞎子島,盯著空調(diào)連續(xù)燒了一百小時(shí)

董明珠零下三十度蹲守黑瞎子島,盯著空調(diào)連續(xù)燒了一百小時(shí)

百態(tài)人間
2025-12-28 05:20:05
中國(guó)不跟美國(guó)談判?特朗普以最高統(tǒng)帥的身份,下令美軍造更多航母

中國(guó)不跟美國(guó)談判?特朗普以最高統(tǒng)帥的身份,下令美軍造更多航母

議紀(jì)史
2025-12-27 17:25:02
極品領(lǐng)導(dǎo)人高市早苗,創(chuàng)下十年最快紀(jì)錄

極品領(lǐng)導(dǎo)人高市早苗,創(chuàng)下十年最快紀(jì)錄

陸棄
2025-11-12 08:55:03
攤牌了!72歲唐國(guó)強(qiáng)終于承認(rèn)與劉曉慶的真實(shí)關(guān)系,曾志偉當(dāng)場(chǎng)傻眼

攤牌了!72歲唐國(guó)強(qiáng)終于承認(rèn)與劉曉慶的真實(shí)關(guān)系,曾志偉當(dāng)場(chǎng)傻眼

觀察鑒娛
2025-12-28 09:51:57
掃地機(jī)器人巨頭給全員發(fā)金子,或共超37斤

掃地機(jī)器人巨頭給全員發(fā)金子,或共超37斤

21世紀(jì)經(jīng)濟(jì)報(bào)道
2025-12-28 17:13:20
俄國(guó)防部前副部長(zhǎng)薩多文科上將在莫斯科突然去世,享年56歲

俄國(guó)防部前副部長(zhǎng)薩多文科上將在莫斯科突然去世,享年56歲

山河路口
2025-12-26 19:47:21
43歲男保姆哭訴:大媽每月給我10000工資,卻讓我每天做這樣的事

43歲男保姆哭訴:大媽每月給我10000工資,卻讓我每天做這樣的事

孢木情感
2025-11-25 07:55:53
腦?!捌珢?ài)”中國(guó)人?80%患者都缺一種維生素!

腦?!捌珢?ài)”中國(guó)人?80%患者都缺一種維生素!

孟大夫之家1
2025-12-02 19:46:07
俱樂(lè)部對(duì)主帥失控,邱彪對(duì)球員失控,球隊(duì)對(duì)輿論失控,山東隊(duì)真亂

俱樂(lè)部對(duì)主帥失控,邱彪對(duì)球員失控,球隊(duì)對(duì)輿論失控,山東隊(duì)真亂

姜大叔侃球
2025-12-27 19:46:34
烏專(zhuān)家:中國(guó)“榨干”蘇聯(lián)遺產(chǎn),我們圖紙都沒(méi)看懂,他們?cè)斐?.0

烏專(zhuān)家:中國(guó)“榨干”蘇聯(lián)遺產(chǎn),我們圖紙都沒(méi)看懂,他們?cè)斐?.0

混沌錄
2025-12-27 21:33:28
分手后“60后”男子起訴“90后”女友,開(kāi)庭前在法院門(mén)口捅刺女方致重傷二級(jí),法院判了

分手后“60后”男子起訴“90后”女友,開(kāi)庭前在法院門(mén)口捅刺女方致重傷二級(jí),法院判了

大象新聞
2025-12-28 16:53:04
馬斯克語(yǔ)出驚人:“日本若繼續(xù)這樣下去,遲早會(huì)從世界上消失!”

馬斯克語(yǔ)出驚人:“日本若繼續(xù)這樣下去,遲早會(huì)從世界上消失!”

忠于法紀(jì)
2025-11-29 22:02:53
1977 年李敏見(jiàn)親姐楊月花,姐姐提特殊要求,舅舅嘆如母性格

1977 年李敏見(jiàn)親姐楊月花,姐姐提特殊要求,舅舅嘆如母性格

嘮叨說(shuō)歷史
2025-12-24 09:40:23
河北:降雪時(shí)間確定!

河北:降雪時(shí)間確定!

掌中邯鄲
2025-12-28 11:07:50
1952 年鄭洞國(guó)進(jìn)京任職,妻嫌薪低改嫁,20 年后哭著找上門(mén)

1952 年鄭洞國(guó)進(jìn)京任職,妻嫌薪低改嫁,20 年后哭著找上門(mén)

嘮叨說(shuō)歷史
2025-12-24 14:47:32
2025-12-28 19:07:00
科技行者 incentive-icons
科技行者
科技正在如何變革商業(yè)世界
6680文章數(shù) 544關(guān)注度
往期回顧 全部

科技要聞

特斯拉將在華布局自動(dòng)駕駛?記者求證→

頭條要聞

杭州"兔子警官"哄孩子式執(zhí)法火了 曾當(dāng)過(guò)2年幼兒園老師

頭條要聞

杭州"兔子警官"哄孩子式執(zhí)法火了 曾當(dāng)過(guò)2年幼兒園老師

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂(lè)要聞

白敬亭現(xiàn)身冰雪大世界 拍視頻還翻車(chē)了

財(cái)經(jīng)要聞

英偉達(dá)的收購(gòu)史

汽車(chē)要聞

理想的2026:L9不容有失,i9再戰(zhàn)純電?

態(tài)度原創(chuàng)

教育
時(shí)尚
親子
游戲
家居

教育要聞

于潔:教師怎樣走出這10個(gè)認(rèn)知誤區(qū)

瑞典拉普蘭:凜冽北境的萬(wàn)物平衡之道

親子要聞

千萬(wàn)別把孩子,養(yǎng)成這種“奴隸”?

PS5到底還能戰(zhàn)幾年?外媒解析“買(mǎi)或等PS6”

家居要聞

格調(diào)時(shí)尚 智慧品質(zhì)居所

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版