国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

AI模型首次實(shí)現(xiàn)與人類專家等同的語言分析能力

0
分享至


摘要

當(dāng) OpenAI 的 o1 模型在無訓(xùn)練語料的虛構(gòu)語言中,表現(xiàn)出精準(zhǔn)繪制句法樹、破解中心遞歸、厘清單句歧義并自主發(fā)現(xiàn)音系規(guī)則的能力后,語言學(xué)家不得不重新回答那個(gè)古老問題:如果語言曾被視為人類最后的“專屬領(lǐng)地”,人類再次追問語言的獨(dú)特性究竟還剩多少?

關(guān)鍵詞:LLMs;語言能力;遞歸;句法樹;音系推理

來源:集智俱樂部

作者:Steve Nadis

譯者:任筱芃

審校:趙思怡

如果語言是人之所以為人的特性,那么當(dāng)大語言模型獲得了“元語言”能力,這又意味著什么?

在人類擁有的無窮多量的能力中,哪些是人類獨(dú)有的?至少從亞里士多德開始,語言就一直是首要的備選答案。他曾寫道,人類是“擁有語言的動(dòng)物”。盡管像 ChatGPT 這樣的大語言模型在表面上復(fù)制了日常言談,但研究人員想知道,人類語言的某些特定方面是否獨(dú)特到在其他動(dòng)物或人工智能設(shè)備的通信系統(tǒng)中根本不存在對(duì)應(yīng)物。


Noam Chomsky,語言學(xué)家

研究人員尤其一直在探索語言模型在多大程度上能夠?qū)φZ言本身進(jìn)行推理。對(duì)于語言學(xué)界的一些人來說,語言模型不僅沒有推理能力,而且也沒有對(duì)應(yīng)的潛力。著名語言學(xué)家諾姆·喬姆斯基(Noam Chomsky)與伊恩·羅伯茨(Ian Roberts)、杰弗里·瓦圖穆爾(Jeffrey Watmull)在 2023 年聲明了這一觀點(diǎn),他們當(dāng)時(shí)在《紐約時(shí)報(bào)》上寫道:“對(duì)語言的正確解釋是復(fù)雜的,不能僅僅通過沉浸在大數(shù)據(jù)中就學(xué)會(huì)!边@些研究人員認(rèn)為,人工智能模型或許擅長使用語言,但它們沒有能力以復(fù)雜的方式分析語言。


Ga?per Begu?, 加州大學(xué)伯克利分校語言學(xué)家

這一觀點(diǎn)在最近的一篇論文——《Large linguistic models: Investigating LLMs’ metalinguistic abilities》——中受到了挑戰(zhàn),該論文由加州大學(xué)伯克利分校的語言學(xué)家 Ga?per Begu?、最近在伯克利獲得語言學(xué)博士學(xué)位的 Maksymilian D?bkowski 以及羅格斯大學(xué)的 Ryan Rhodes 共同撰寫。研究人員讓多個(gè)大語言模型接受了一系列語言學(xué)測試——其中一項(xiàng)測試是讓大語言模型歸納一種虛構(gòu)語言的規(guī)則。雖然大多數(shù)大語言模型未能像人類那樣解析語言規(guī)則,但其中一個(gè)模型展現(xiàn)出了令人印象深刻的能力,遠(yuǎn)遠(yuǎn)超出了預(yù)期。它能夠像語言學(xué)專業(yè)的研究生一樣分析語言——繪制句子結(jié)構(gòu)圖、解析多種歧義,并利用像遞歸recursion)這樣的復(fù)雜語言特性。Begu? 說,這一發(fā)現(xiàn)“挑戰(zhàn)了我們對(duì)人工智能潛力的理解”。


Tom McCoy, 耶魯大學(xué)計(jì)算語言學(xué)家

“這項(xiàng)新工作既及時(shí)又‘非常重要’,”耶魯大學(xué)計(jì)算語言學(xué)家 Tom McCoy 說道(他并未參與這項(xiàng)研究)“隨著社會(huì)對(duì)這項(xiàng)技術(shù)的依賴程度越來越高,了解它在哪些方面可能成功以及在哪些方面可能失敗變得日益重要!彼a(bǔ)充說,語言分析是評(píng)估這些語言模型在多大程度上能像人類一樣推理的理想試驗(yàn)臺(tái)。

無限的復(fù)雜性

對(duì)語言模型進(jìn)行嚴(yán)格的語言學(xué)測試,挑戰(zhàn)的一部分是確保它們事先并不知道答案。這些系統(tǒng)通常在海量的書面信息上進(jìn)行訓(xùn)練——不僅包括互聯(lián)網(wǎng)上的大量內(nèi)容(涵蓋幾十甚至上百種語言),還包括語言學(xué)教科書。理論上,模型可能只是死記硬背了訓(xùn)練時(shí)見過的內(nèi)容,然后在測試中原樣輸出。

為了避免這種情況,Begu? 和他的同事設(shè)計(jì)了一個(gè)分為四個(gè)部分的語言學(xué)測試。其中三個(gè)部分要求模型使用樹狀圖來分析特制的句子,這種圖表最早由喬姆斯基在其 1957 年的里程碑式著作《句法結(jié)構(gòu)》(Syntactic Structures)中引入。這些圖表將句子分解為名詞短語和動(dòng)詞短語,然后再進(jìn)一步細(xì)分為名詞、動(dòng)詞、形容詞、副詞、介詞、連詞等。

測試的另一部分則聚焦于遞歸——也就是把短語嵌套進(jìn)其他短語的能力。比如,“The sky is blue”(天空是藍(lán)色的)是一個(gè)簡單的英語句子!癑ane said that the sky is blue”(簡說天空是藍(lán)色的)則把原句嵌套進(jìn)了一個(gè)更復(fù)雜的結(jié)構(gòu)中。重要的是,這種遞歸過程可以無限進(jìn)行。“Maria wondered if Sam knew that Omar heard that Jane said that the sky is blue”(瑪麗亞想知道薩姆是否知道奧馬爾聽說簡說天空是藍(lán)色的)雖然聽起來有點(diǎn)拗口,但在語法上仍然是正確的遞歸句。

遞歸不僅是語言的關(guān)鍵要素,也是自然界的一個(gè)特征。例如,在加拿大北部的維多利亞島上,人們可以找到一個(gè)位于島上湖泊中的小島。但那個(gè)小島本身又位于一個(gè)更大的島上的湖泊中。這個(gè)最里面的無名島是已知最大的“三階”島嶼,它有時(shí)被開玩笑地稱為“盜夢島”(Inception Island),源于 2010 年克里斯托弗·諾蘭執(zhí)導(dǎo)的電影《盜夢空間》(Inception),影片中角色們會(huì)進(jìn)入夢中夢的夢中世界。

遞歸一直被喬姆斯基等人稱為人類語言的決定性特征之一。實(shí)際上,它或許也是人類思維的決定性特征。語言學(xué)家認(rèn)為,正是遞歸的無限潛力,使得人類語言能夠用有限的詞匯和有限的規(guī)則,生成無限多的可能句子。到目前為止,還沒有令人信服的證據(jù)表明其他動(dòng)物能夠以復(fù)雜的方式使用遞歸。

遞歸可以發(fā)生在句首或句尾,但最難掌握的形式是發(fā)生在句中的中心嵌入center embedding)。例如,從“the cat died(貓死了)”變成“the cat the dog bit died(狗咬了的那只貓死了)”。

Begu? 的測試向語言模型輸入了 30 個(gè)包含復(fù)雜遞歸例子的原創(chuàng)句子。例如:“The astronomy the ancients we revere studied was not separate from astrology。”(我們崇敬的古人所研究的天文學(xué)與占星術(shù)并非涇渭分明。)使用句法樹,其中一個(gè)語言模型——OpenAI 的 o1——能夠確定該句子的結(jié)構(gòu)如下:

The astronomy [the ancients [we revere] studied] was not separate from astrology. 我們崇敬的古人所研究的天文學(xué)與占星術(shù)并非涇渭分明。

該模型隨后更進(jìn)一步,為該句子添加了另一層遞歸:

The astronomy [the ancients [we revere [who lived in lands we cherish]] studied] was not separate from astrology. 我們所尊敬的那些生活在我們珍視的土地上的古人所研究的天文學(xué)與占星術(shù)并非涇渭分明。

Begu? 和其他一些人沒有預(yù)料到,這項(xiàng)研究會(huì)發(fā)現(xiàn)一個(gè)具有更高層次“元語言”(metalinguistic)能力的 AI 模型——正如他所說,這“不僅是使用語言的能力,更是思考語言的能力”。


David Mortensen, 卡內(nèi)基梅隆大學(xué)計(jì)算語言學(xué)家

“這是他們論文中‘引人注目’的方面之一,”卡內(nèi)基梅隆大學(xué)的計(jì)算語言學(xué)家 David Mortensen 說道。關(guān)于語言模型是否只是在預(yù)測句子中的下一個(gè)詞或語言學(xué)上的標(biāo)記 (token)一直存在爭議。這種能力與人類對(duì)語言的深刻理解有著本質(zhì)區(qū)別!罢Z言學(xué)界的一些人曾說,大語言模型并不是真的在‘處理’語言,”他說。“這項(xiàng)研究看起來像是否定了那些說法。”

你什么意思?

McCoy 對(duì) o1 模型的整體表現(xiàn)感到驚訝,尤其是它識(shí)別歧義的能力,他說,這是眾所周知的計(jì)算語言模型難以捕捉的東西。人類“擁有大量的常識(shí)知識(shí),使我們能夠排除歧義。但計(jì)算機(jī)很難擁有那種程度的常識(shí)知識(shí)!

例如“Rowan fed his pet chicken”這樣的句子,既可以描述羅文(Rowan)喂了他當(dāng)寵物養(yǎng)的雞,也可以描述他喂了他的(大概是更傳統(tǒng)的意義上的)動(dòng)物伴侶一頓雞肉。o1 模型正確地生成了兩棵不同的句法樹,一棵對(duì)應(yīng)句子的第一種解釋,另一棵對(duì)應(yīng)第二種解釋。

研究人員還進(jìn)行了一些與音系學(xué)(phonology)相關(guān)的實(shí)驗(yàn)。該學(xué)科研究聲音的模式以及最小聲音單位——稱為音位 (phonemes) ——的組織方式。為了像母語者一樣流利地說話,人們會(huì)遵循一些音系規(guī)則,這些規(guī)則可能是通過練習(xí)習(xí)得的,而從未被明確教授過。例如,在英語中,在以“g”結(jié)尾的單詞后添加“s”會(huì)產(chǎn)生“z”音,如“dogs”。但是,在以“t”結(jié)尾的單詞后添加“s”,發(fā)音則更接近標(biāo)準(zhǔn)的“s”,如“cats”。

在音系學(xué)任務(wù)中,研究小組創(chuàng)造了 30 種新的“迷你語言”(Begu? 稱之為),以測試大語言模型是否能在沒有任何先驗(yàn)知識(shí)的情況下正確推斷出音系規(guī)則。每種語言包含 40 個(gè)虛構(gòu)詞。以下是其中一種語言的示例詞:

θalp ?ebre ei?z? ga?rbo?nda? ?i?z?ee?jo

然后,他們要求語言模型分析每種語言的音系過程。對(duì)于上面這種語言,o1模型正確地寫出:“當(dāng)一個(gè)元音緊接在一個(gè)既是濁音又是阻礙音(obstruent)的輔音之后時(shí),它就會(huì)變成一個(gè)氣聲元音(breathy vowel)”—— 阻礙音是一種通過限制氣流形成的音,比如“top”中的“t”。

這些語言是新發(fā)明的,所以 o1 不可能在訓(xùn)練期間接觸過它們。“我沒想到結(jié)果會(huì)如此出色,如此令人印象深刻,”Mortensen 說。

非得是人類嗎?

這些語言模型能走多遠(yuǎn)?它們會(huì)僅僅通過變得更大——疊加更多的計(jì)算能力、更復(fù)雜的結(jié)構(gòu)和更多的訓(xùn)練數(shù)據(jù)——就無限地變得更好嗎?還是說,人類語言的某些特征是我們物種獨(dú)有的進(jìn)化過程的結(jié)果?

最近的研究結(jié)果表明,這些模型原則上可以進(jìn)行復(fù)雜的語言學(xué)分析。但是,目前還沒有一個(gè)模型能提出任何原創(chuàng)性的東西,也沒有教會(huì)我們?nèi)魏侮P(guān)于語言的、我們以前不知道的知識(shí)。

如果模型的改進(jìn)真的只是增加計(jì)算能力和訓(xùn)練數(shù)據(jù)的問題,那么 Begu? 認(rèn)為語言模型最終將在語言技能上超越我們。Mortensen 則表示,當(dāng)前的模型有一定局限性!八鼈儽挥(xùn)練來做一件非常具體的事情:給定一個(gè)標(biāo)記(tokens)或單詞的歷史,預(yù)測下一個(gè)標(biāo)記,”他說!坝捎谒鼈儽挥(xùn)練的方式,它們在概括方面存在一些困難!

但考慮到最近的進(jìn)展,Mortensen 表示,他看不出任何理由語言模型最終不會(huì)表現(xiàn)出超越人類的語言理解能力!坝貌涣硕嗑,我們就能打造出用更少數(shù)據(jù)做出更好泛化、且更具創(chuàng)造力的模型。”

Begu? 指出,新結(jié)果正一步步“削平”那些曾被視為人類語言專屬領(lǐng)地的特性!翱雌饋,我們并沒有我們以為的那么獨(dú)一無二!

參考文獻(xiàn)

https://www.nytimes.com/2023/03/08/opinion/noam-chomsky-chatgpt-ai.html

閱讀最新前沿科技趨勢報(bào)告,請?jiān)L問歐米伽研究所的“未來知識(shí)庫”

https://wx.zsxq.com/group/454854145828


未來知識(shí)庫是“ 歐米伽 未來研究所”建立的在線知識(shí)庫平臺(tái),收藏的資料范圍包括人工智能、腦科學(xué)、互聯(lián)網(wǎng)、超級(jí)智能,數(shù)智大腦、能源、軍事、經(jīng)濟(jì)、人類風(fēng)險(xiǎn)等等領(lǐng)域的前沿進(jìn)展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進(jìn)入。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
美女白色露臍T恤配藍(lán)色瑜伽褲,性感值拉滿,簡直是行走的 荷爾蒙

美女白色露臍T恤配藍(lán)色瑜伽褲,性感值拉滿,簡直是行走的 荷爾蒙

小喬古裝漢服
2025-09-24 07:20:03
43歲高圓圓牛仔褲殺瘋了!松弛感才是女人最好的醫(yī)美

43歲高圓圓牛仔褲殺瘋了!松弛感才是女人最好的醫(yī)美

陌上桃花開的
2025-12-25 01:10:04
不到1天,央視2次發(fā)文宣布春晚新舉措,網(wǎng)友:這次終于要聽勸了

不到1天,央視2次發(fā)文宣布春晚新舉措,網(wǎng)友:這次終于要聽勸了

涼羽亭
2025-12-25 17:50:13
中國駐墨西哥使館:奉勸納瓦羅之流認(rèn)真反思錯(cuò)誤,停止自欺欺人的表演

中國駐墨西哥使館:奉勸納瓦羅之流認(rèn)真反思錯(cuò)誤,停止自欺欺人的表演

環(huán)球網(wǎng)資訊
2025-12-27 06:43:19
12月31日,新能源充電服務(wù)補(bǔ)貼停止,網(wǎng)約車司機(jī):天塌了

12月31日,新能源充電服務(wù)補(bǔ)貼停止,網(wǎng)約車司機(jī):天塌了

用車指南
2025-12-25 10:00:59
食堂承包商舉報(bào)校領(lǐng)導(dǎo)兩年拿走三百余萬現(xiàn)金,校方:給老師發(fā)津貼

食堂承包商舉報(bào)校領(lǐng)導(dǎo)兩年拿走三百余萬現(xiàn)金,校方:給老師發(fā)津貼

新京報(bào)
2025-12-26 11:36:10
網(wǎng)購“10-9”枚鹵蛋實(shí)得1枚顧客最新發(fā)聲:蛋已吃,并獲10倍賠償;律師:商家強(qiáng)詞奪理涉嫌欺詐

網(wǎng)購“10-9”枚鹵蛋實(shí)得1枚顧客最新發(fā)聲:蛋已吃,并獲10倍賠償;律師:商家強(qiáng)詞奪理涉嫌欺詐

極目新聞
2025-12-26 19:33:46
“第三次世界大戰(zhàn)”導(dǎo)火索?如果中國攔截售臺(tái)武器,會(huì)發(fā)生什么?

“第三次世界大戰(zhàn)”導(dǎo)火索?如果中國攔截售臺(tái)武器,會(huì)發(fā)生什么?

扶蘇聊歷史
2025-12-27 10:30:21
將耳朵寄養(yǎng)在腳背5個(gè)多月,山東女子的離斷左耳成功回植

將耳朵寄養(yǎng)在腳背5個(gè)多月,山東女子的離斷左耳成功回植

人民日報(bào)健康客戶端
2025-12-25 20:06:24
“飛人”劉翔徹底躺平,42歲每天游山玩水,看他曬世界各地游玩照

“飛人”劉翔徹底躺平,42歲每天游山玩水,看他曬世界各地游玩照

可樂談情感
2025-12-25 15:47:33
致全體市民的一封暖冬倡議書

致全體市民的一封暖冬倡議書

上觀新聞
2025-12-27 16:42:11
陪睡陪玩只是冰山一角!萬達(dá)蒸發(fā)800億后,王思聰再次傳出大丑聞

陪睡陪玩只是冰山一角!萬達(dá)蒸發(fā)800億后,王思聰再次傳出大丑聞

民間平哥
2025-12-25 14:54:58
深圳創(chuàng)投圈“搶人”實(shí)錄:機(jī)構(gòu)蹲守大疆樓下,離職就拿2000萬

深圳創(chuàng)投圈“搶人”實(shí)錄:機(jī)構(gòu)蹲守大疆樓下,離職就拿2000萬

財(cái)經(jīng)AI湃
2025-12-27 10:01:14
徐湖平父子只是沾光的小卒,真正害怕的幕后“大人物”是他

徐湖平父子只是沾光的小卒,真正害怕的幕后“大人物”是他

李博世財(cái)經(jīng)
2025-12-26 14:26:17
CBA本賽季最差外援排名:薩姆納居首,表現(xiàn)不佳坑慘上海

CBA本賽季最差外援排名:薩姆納居首,表現(xiàn)不佳坑慘上海

趙或是個(gè)熱血青年
2025-12-27 10:02:14
看了南北朝150年的歷史,才明白劉裕滅司馬家全族,埋了多大的雷

看了南北朝150年的歷史,才明白劉裕滅司馬家全族,埋了多大的雷

銘記歷史呀
2025-12-27 17:41:59
庫里獲提名!MVP榜TOP10更新:約基奇轟56+16+15領(lǐng)跑火箭申京入選

庫里獲提名!MVP榜TOP10更新:約基奇轟56+16+15領(lǐng)跑火箭申京入選

鍋?zhàn)踊@球
2025-12-27 12:40:41
53 歲老將 1955 年授銜從中將改少將,不爭待遇只向粟裕澄清事

53 歲老將 1955 年授銜從中將改少將,不爭待遇只向粟裕澄清事

嘮叨說歷史
2025-12-25 12:41:56
馬筱梅媽媽被贊情商高,汪小菲宴請好友,她陪著小楊阿姨不上桌

馬筱梅媽媽被贊情商高,汪小菲宴請好友,她陪著小楊阿姨不上桌

振華觀史
2025-12-27 11:20:01
許家印為保命爆出三大靠山!百億房東浮出水面,抱得美人歸引熱議

許家印為保命爆出三大靠山!百億房東浮出水面,抱得美人歸引熱議

詩意世界
2025-09-26 10:31:06
2025-12-27 20:40:49
人工智能學(xué)家 incentive-icons
人工智能學(xué)家
人工智能領(lǐng)域權(quán)威媒體
4423文章數(shù) 37357關(guān)注度
往期回顧 全部

科技要聞

小米也漲價(jià)了!業(yè)界稱終端再不漲明年必虧

頭條要聞

美媒:特朗普顯然觸及了中國的紅線 中方怒了

頭條要聞

美媒:特朗普顯然觸及了中國的紅線 中方怒了

體育要聞

NBA教練圈的布朗尼,花了22年證明自己

娛樂要聞

張昊唯逃稅涉黃風(fēng)波落幕:法院認(rèn)定朋友造謠

財(cái)經(jīng)要聞

注意,開始拉物價(jià)了!

汽車要聞

好音響比大屏更重要?車企開始“聽”用戶的

態(tài)度原創(chuàng)

健康
教育
親子
游戲
軍事航空

這些新療法,讓化療不再那么痛苦

教育要聞

大學(xué)教師:我給學(xué)生打A,學(xué)生給我滿分

親子要聞

1歲多的小朋友上托管班,吃飯時(shí)自己拿起勺子就“開炫”,網(wǎng)友:這小孩是來報(bào)恩的吧

多款抗日游戲公布 會(huì)是打愛國情懷的圈錢爛作嗎?

軍事要聞

英法德三國領(lǐng)導(dǎo)人通話 重申對(duì)烏支持

無障礙瀏覽 進(jìn)入關(guān)懷版