国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

多倫多大學發(fā)現(xiàn):聊天機器人的"嘴巴"影響它們的智商

0
分享至


當我們與聊天機器人對話時,很少有人會思考一個有趣的問題:這些機器人是如何理解我們的文字的?事實上,在機器人能夠理解我們說什么之前,它們需要先把我們的文字"切碎"成小塊,就像廚師在烹飪前需要先把食材切成合適的大小一樣。這個過程叫做"分詞",而負責這項工作的工具叫做"分詞器"。

這項由多倫多大學的古爾·塞納·阿爾廷塔什和馬利克·埃格哈吉領(lǐng)導的研究團隊發(fā)表于2025年12月的最新研究揭示了一個驚人的發(fā)現(xiàn):分詞器的選擇會像給機器人換了一張嘴一樣,直接影響它們的思考能力和表現(xiàn)水平。團隊成員還包括來自谷歌DeepMind的布賴恩·萊斯特、麥吉爾大學的馮淵劉、劍橋大學的萬如趙等多位研究者。有興趣深入了解的讀者可以通過arXiv編號2512.20757查詢完整論文。

為了探究這個問題,研究團隊做了一個前所未有的實驗:他們創(chuàng)建了14個完全相同的聊天機器人,唯一的區(qū)別就是給它們配備了不同的"嘴巴",也就是不同的分詞器。這就像是培養(yǎng)了14個基因完全相同的孩子,然后讓他們學習不同的語言切分方式,最后觀察他們在理解和表達能力上的差異。同時,研究團隊還精心設計了一套測試題,專門用來檢驗這些機器人在面對各種文字"陷阱"時的表現(xiàn)。

一、為什么機器人需要"切詞師傅"

在深入探討研究發(fā)現(xiàn)之前,我們需要理解一個基本問題:為什么機器人不能直接理解我們的文字呢?這就像人類嬰兒學習語言的過程一樣。當你對一個剛學會說話的孩子說"我愛你"時,孩子需要先學會把這句話分解成"我"、"愛"、"你"三個部分,然后理解每個部分的含義,最后把它們組合起來理解整句話的意思。

機器人面臨著同樣的挑戰(zhàn),但它們的處理方式更加復雜。不同的分詞器就像不同的語言老師,有些老師喜歡把詞匯切得很細,比如把"大學生"切成"大"、"學"、"生"三個部分;有些老師則傾向于保持完整,把"大學生"作為一個整體來處理。還有一些特殊的分詞器甚至會直接處理每一個字母或字符,就像教孩子從最基礎(chǔ)的筆畫開始學習漢字一樣。

研究團隊選擇了14種不同類型的分詞器,它們代表了當前最主流的"切詞"方法。這些分詞器包括了Google的ByT5(字符級處理)、微軟的TokenMonster(特殊算法)、GPT-2(經(jīng)典方法)、以及各大公司最新開發(fā)的分詞技術(shù),比如Meta的Llama系列、Google的Gemma系列等。每種分詞器都有自己的"個性":有些擅長處理英文,有些對多種語言都很友好,有些詞匯量龐大,有些則相對精簡。

更有趣的是,研究團隊發(fā)現(xiàn)這些分詞器在處理同樣內(nèi)容時會產(chǎn)生完全不同的結(jié)果。比如說"doctor"(醫(yī)生)這個詞,如果遇到拼寫錯誤變成"doctro",不同的分詞器會有截然不同的處理方式。有些會把它切成"doc"和"tro",有些會切成"doct"和"ro",而字符級的分詞器則會一個字母一個字母地處理。這種差異看似微小,但就像蝴蝶效應一樣,會對最終的理解能力產(chǎn)生巨大影響。

二、史無前例的公平比賽

要真正了解分詞器對機器人能力的影響,最大的挑戰(zhàn)是如何確保比較的公平性。這就像要測試不同品牌的跑鞋對運動員成績的影響,你需要確保參與測試的運動員在身體素質(zhì)、訓練程度、跑步技巧等方面都完全相同,唯一的變量就是腳上穿的鞋子。

研究團隊采用了一個巧妙的方法來解決這個問題。他們首先創(chuàng)建了一個"超級詞匯表",這個詞匯表包含了所有14種分詞器能夠識別的所有詞匯。然后,他們?yōu)槊總€分詞器建立了一個映射關(guān)系,確保相同的詞匯在所有模型中都對應相同的初始理解。這樣做的好處是,所有機器人都從完全相同的起點開始學習,就像14個學生拿到了相同的教材,只是老師教授的方法不同。

訓練過程同樣嚴格控制變量。所有14個模型都使用了相同的神經(jīng)網(wǎng)絡架構(gòu),都有大約10億個參數(shù),都接受了相同的訓練數(shù)據(jù),訓練時間也完全一致。訓練數(shù)據(jù)包含了大約1000億個詞匯,其中40%是英文內(nèi)容,其余60%平均分配給中文、土耳其語、意大利語和波斯語。這種設計確保了任何性能差異都可以直接歸因于分詞器的影響,而不是其他因素。

然而,這種嚴格控制也帶來了一個有趣的現(xiàn)象。由于不同分詞器的壓縮效率不同,雖然所有模型都處理了相同數(shù)量的詞匯單位,但它們實際"閱讀"的原始文本量卻不相同。就像有些閱讀者習慣快速瀏覽獲取要點,有些則喜歡字斟句酌,結(jié)果在相同時間內(nèi)接觸到的信息量會有差異。ByT5由于采用字符級處理,實際只處理了大約100GB的原始文本,而其他分詞器處理的文本量在215GB到477GB之間。

三、精心設計的"陷阱"測試

為了全面評估不同分詞器的影響,研究團隊設計了一套包含約5000個問題的測試套件,這些測試題專門用來"為難"機器人的分詞能力。這就像一個專門考驗廚師刀工的比賽,不僅要看他們能不能切出漂亮的絲,還要測試在各種"惡劣條件"下的表現(xiàn),比如刀具不鋒利時、食材不新鮮時、或者廚房環(huán)境嘈雜時。

測試內(nèi)容覆蓋了五種語言:英語、中文、土耳其語、意大利語和波斯語。選擇這些語言并非隨意,每種語言都代表了不同的文字挑戰(zhàn)。英語相對簡單,中文是漢字系統(tǒng),波斯語使用阿拉伯文字且有可選的音標,土耳其語是黏著語(詞匯變化復雜),意大利語則代表了拉丁語族的特點。

測試的"陷阱"設計得非常巧妙,模擬了現(xiàn)實世界中可能遇到的各種情況。比如,當用戶在土耳其語鍵盤上打字時,某些特殊字符可能會變成相似但不同的字符。再比如,當波斯語文本中的可選音標被添加或省略時,分詞器是否還能正確處理。還有一些測試模擬了OCR識別錯誤,比如把字母"O"誤認為數(shù)字"0",或者把"I"誤認為"l"。

更有趣的是Unicode格式化測試,研究團隊使用了各種特殊的Unicode字符來"裝飾"普通文字。比如把普通的"Python"變成花體的"

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
來聚餐還補工資!東莞一工廠年底聚餐,當晚按工時3.5小時核工資

來聚餐還補工資!東莞一工廠年底聚餐,當晚按工時3.5小時核工資

火山詩話
2025-12-28 11:03:19
內(nèi)訌了?洛夫頓發(fā)文:都不相信我,我要回母校,網(wǎng)友: 趕緊滾吧!

內(nèi)訌了?洛夫頓發(fā)文:都不相信我,我要回母校,網(wǎng)友: 趕緊滾吧!

南海浪花
2025-12-28 12:32:59
女子分享10年前火車上偶遇的唱歌小男孩,竟被當事人刷到:互聯(lián)網(wǎng)讓10年前的“一面之緣”有了續(xù)集

女子分享10年前火車上偶遇的唱歌小男孩,竟被當事人刷到:互聯(lián)網(wǎng)讓10年前的“一面之緣”有了續(xù)集

環(huán)球網(wǎng)資訊
2025-12-28 10:11:35
民族英雄從課本移除,“民族英雄”卻受到吹捧,這事該反思嗎

民族英雄從課本移除,“民族英雄”卻受到吹捧,這事該反思嗎

何氽簡史
2025-12-27 13:45:11
美國經(jīng)濟難于擺脫嚴重衰退 1975年11月19日《人民日報》

美國經(jīng)濟難于擺脫嚴重衰退 1975年11月19日《人民日報》

那些看得見的老照片
2025-12-17 17:13:44
董明珠零下三十度蹲守黑瞎子島,盯著空調(diào)連續(xù)燒了一百小時

董明珠零下三十度蹲守黑瞎子島,盯著空調(diào)連續(xù)燒了一百小時

百態(tài)人間
2025-12-28 05:20:05
中國不跟美國談判?特朗普以最高統(tǒng)帥的身份,下令美軍造更多航母

中國不跟美國談判?特朗普以最高統(tǒng)帥的身份,下令美軍造更多航母

議紀史
2025-12-27 17:25:02
極品領(lǐng)導人高市早苗,創(chuàng)下十年最快紀錄

極品領(lǐng)導人高市早苗,創(chuàng)下十年最快紀錄

陸棄
2025-11-12 08:55:03
攤牌了!72歲唐國強終于承認與劉曉慶的真實關(guān)系,曾志偉當場傻眼

攤牌了!72歲唐國強終于承認與劉曉慶的真實關(guān)系,曾志偉當場傻眼

觀察鑒娛
2025-12-28 09:51:57
掃地機器人巨頭給全員發(fā)金子,或共超37斤

掃地機器人巨頭給全員發(fā)金子,或共超37斤

21世紀經(jīng)濟報道
2025-12-28 17:13:20
俄國防部前副部長薩多文科上將在莫斯科突然去世,享年56歲

俄國防部前副部長薩多文科上將在莫斯科突然去世,享年56歲

山河路口
2025-12-26 19:47:21
43歲男保姆哭訴:大媽每月給我10000工資,卻讓我每天做這樣的事

43歲男保姆哭訴:大媽每月給我10000工資,卻讓我每天做這樣的事

孢木情感
2025-11-25 07:55:53
腦梗“偏愛”中國人?80%患者都缺一種維生素!

腦?!捌珢邸敝袊??80%患者都缺一種維生素!

孟大夫之家1
2025-12-02 19:46:07
俱樂部對主帥失控,邱彪對球員失控,球隊對輿論失控,山東隊真亂

俱樂部對主帥失控,邱彪對球員失控,球隊對輿論失控,山東隊真亂

姜大叔侃球
2025-12-27 19:46:34
烏專家:中國“榨干”蘇聯(lián)遺產(chǎn),我們圖紙都沒看懂,他們造出2.0

烏專家:中國“榨干”蘇聯(lián)遺產(chǎn),我們圖紙都沒看懂,他們造出2.0

混沌錄
2025-12-27 21:33:28
分手后“60后”男子起訴“90后”女友,開庭前在法院門口捅刺女方致重傷二級,法院判了

分手后“60后”男子起訴“90后”女友,開庭前在法院門口捅刺女方致重傷二級,法院判了

大象新聞
2025-12-28 16:53:04
馬斯克語出驚人:“日本若繼續(xù)這樣下去,遲早會從世界上消失!”

馬斯克語出驚人:“日本若繼續(xù)這樣下去,遲早會從世界上消失!”

忠于法紀
2025-11-29 22:02:53
1977 年李敏見親姐楊月花,姐姐提特殊要求,舅舅嘆如母性格

1977 年李敏見親姐楊月花,姐姐提特殊要求,舅舅嘆如母性格

嘮叨說歷史
2025-12-24 09:40:23
河北:降雪時間確定!

河北:降雪時間確定!

掌中邯鄲
2025-12-28 11:07:50
1952 年鄭洞國進京任職,妻嫌薪低改嫁,20 年后哭著找上門

1952 年鄭洞國進京任職,妻嫌薪低改嫁,20 年后哭著找上門

嘮叨說歷史
2025-12-24 14:47:32
2025-12-28 19:07:00
科技行者 incentive-icons
科技行者
科技正在如何變革商業(yè)世界
6680文章數(shù) 544關(guān)注度
往期回顧 全部

科技要聞

特斯拉將在華布局自動駕駛?記者求證→

頭條要聞

杭州"兔子警官"哄孩子式執(zhí)法火了 曾當過2年幼兒園老師

頭條要聞

杭州"兔子警官"哄孩子式執(zhí)法火了 曾當過2年幼兒園老師

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂要聞

白敬亭現(xiàn)身冰雪大世界 拍視頻還翻車了

財經(jīng)要聞

英偉達的收購史

汽車要聞

理想的2026:L9不容有失,i9再戰(zhàn)純電?

態(tài)度原創(chuàng)

藝術(shù)
時尚
數(shù)碼
教育
游戲

藝術(shù)要聞

郭沫若為何輸給康生?只因后者練過一部“百億法帖”,內(nèi)藏古人秘法

瑞典拉普蘭:凜冽北境的萬物平衡之道

數(shù)碼要聞

華為FreeClip 2耳夾耳機通過星閃認證,有望近期OTA星閃音頻

教育要聞

于潔:教師怎樣走出這10個認知誤區(qū)

PS5到底還能戰(zhàn)幾年?外媒解析“買或等PS6”

無障礙瀏覽 進入關(guān)懷版