国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

人工智能在某些創(chuàng)造力測試中超越普通人

0
分享至

研究人員對人工智能和10萬名人類進行了創(chuàng)造力測試。 人工智能可以超越普通人類的創(chuàng)造力——但最具想象力的頭腦仍然無疑是人類的。

  • 日期:
  • 2026年1月25日
  • 蒙特利爾大學
  • 概括:
  • 一項大規(guī)模的新研究對比了超過10萬名人類和當今最先進的人工智能系統(tǒng),得出了一個令人驚訝的結果:生成式人工智能在某些創(chuàng)造力測試中已經(jīng)能夠超越普通人類。像GPT-4這樣的模型在旨在衡量原創(chuàng)思維和創(chuàng)意生成的任務中表現(xiàn)出色,有時甚至超越了典型的人類反應。但人工智能的上限依然存在。最具創(chuàng)造力的人類——尤其是排名前10%的人群——仍然遠遠領先于人工智能,尤其是在詩歌和故事創(chuàng)作等更復雜的創(chuàng)意工作方面。

最新研究表明,人工智能在某些創(chuàng)造力測試中能夠超越普通人——這對于生成模型而言是一個引人注目的轉折點。圖片來源:Shutterstock

像 ChatGPT 這樣的生成式人工智能系統(tǒng)真的能創(chuàng)造出原創(chuàng)的想法嗎?蒙特利爾大學心理學系的 Karim Jerbi 教授領導的一項新研究,并邀請了著名人工智能研究員 Yoshua Bengio 參與,以前所未有的規(guī)模探討了這個問題。這項研究是迄今為止對人類創(chuàng)造力和大型語言模型創(chuàng)造力進行的最大規(guī)模的直接比較。

這項發(fā)表在《科學報告》(自然系列)上的研究指出,人工智能的發(fā)展正經(jīng)歷著重大轉變。生成式人工智能系統(tǒng)如今已達到在某些創(chuàng)造力指標上超越普通人類的水平。與此同時,最具創(chuàng)造力的人仍然展現(xiàn)出明顯且持續(xù)的優(yōu)勢,甚至超越了最強大的人工智能模型。

人工智能達到人類平均創(chuàng)造力水平

研究人員評估了包括 ChatGPT、Claude、Gemini 等在內(nèi)的幾種領先的大型語言模型,并將它們的性能與超過 10 萬名人類參與者的測試結果進行了比較。研究結果凸顯了一個明顯的轉折點。一些人工智能系統(tǒng),例如 GPT-4,在旨在衡量語言創(chuàng)造力差異的任務中,其表現(xiàn)甚至超過了人類的平均水平。

“我們的研究表明,一些基于大型語言模型的AI系統(tǒng)在特定任務上的表現(xiàn)已經(jīng)超越了人類的平均創(chuàng)造力,”卡里姆·杰爾比教授解釋說。“這一結果或許令人驚訝,甚至令人不安,但我們的研究也凸顯了一個同樣重要的觀察結果:即使是最好的AI系統(tǒng),其創(chuàng)造力水平仍然不及最具創(chuàng)造力的人類?!?/p>

該研究的共同第一作者,蒙特利爾大學的博士后研究員安托萬·貝勒馬爾-佩潘和康考迪亞大學的博士候選人弗朗索瓦·萊斯皮納斯進行的進一步分析揭示了一個引人注目的模式。盡管一些人工智能模型現(xiàn)在的表現(xiàn)已經(jīng)超越了普通人,但創(chuàng)造力的巔峰仍然牢牢掌握在人類手中。

事實上,當研究人員考察最具創(chuàng)造力的那半數(shù)參與者時,他們的平均得分超過了所有測試過的AI模型。而在最具創(chuàng)造力的前10%人群中,這種差距甚至更大。

“我們與多倫多大學的杰伊·奧爾森合作,基于超過 10 萬名參與者的數(shù)據(jù),開發(fā)了一個嚴謹?shù)目蚣?,使我們能夠使用相同的工具比較人類和人工智能的創(chuàng)造力,”卡里姆·杰爾比教授說道,他同時也是 Mila 的副教授。

科學家如何衡量人類和人工智能的創(chuàng)造力

為了公平地評估人類和機器的創(chuàng)造力,研究團隊采用了多種方法。主要工具是發(fā)散聯(lián)想任務(DAT),這是一種廣泛使用的心理測試,用于測量發(fā)散創(chuàng)造力,即根據(jù)單一提示產(chǎn)生多樣化原創(chuàng)想法的能力。

由該研究的合著者杰伊·奧爾森(Jay Olson)創(chuàng)建的DAT測試要求參與者(無論是人類還是人工智能)列出十個含義盡可能不相關的單詞。一個極具創(chuàng)意的回答示例包括“星系、叉子、自由、藻類、口琴、量子、懷舊、天鵝絨、颶風、光合作用”等單詞。

這項任務的表現(xiàn)與寫作、創(chuàng)意生成和創(chuàng)造性問題解決等其他成熟的創(chuàng)造力測試結果密切相關。雖然這項任務以語言為基礎,但它遠不止于詞匯量。它調(diào)動了跨多個領域創(chuàng)造性思維所涉及的更廣泛的認知過程。DAT 還具有實用優(yōu)勢,只需兩到四分鐘即可完成,并且公眾可以在線訪問。

從詞匯表到真正的創(chuàng)意寫作

研究人員隨后探索了人工智能在這種簡單的詞語聯(lián)想任務上的成功是否能夠推廣到更復雜、更貼近現(xiàn)實的創(chuàng)意活動中。為了驗證這一點,他們將人工智能系統(tǒng)和人類參與者在創(chuàng)作俳句(一種三行短詩)、撰寫電影劇情簡介和創(chuàng)作短篇小說等創(chuàng)意寫作挑戰(zhàn)中的表現(xiàn)進行了比較。

結果遵循著熟悉的模式。雖然人工智能系統(tǒng)有時表現(xiàn)優(yōu)于普通人類,但技藝最精湛的人類創(chuàng)作者始終能創(chuàng)作出更優(yōu)秀、更具原創(chuàng)性的作品。

人工智能的創(chuàng)造力可以調(diào)整嗎?

這些發(fā)現(xiàn)引出了另一個重要問題:人工智能的創(chuàng)造力是固定的,還是可以塑造的?研究表明,人工智能的創(chuàng)造力可以通過改變技術設置來調(diào)整,尤其是模型的溫度。這個參數(shù)控制著生成響應的可預測性或創(chuàng)新性。

在較低溫度設置下,人工智能會產(chǎn)生更安全、更常規(guī)的輸出結果。在較高溫度下,響應會變得更加多樣化、更難以預測,也更具探索性,從而使系統(tǒng)能夠超越既有的思維模式。

研究人員還發(fā)現(xiàn),創(chuàng)造力很大程度上受指令編寫方式的影響。例如,鼓勵模型運用詞源學思考詞源和結構的提示,能夠帶來更多意想不到的聯(lián)想,并提升創(chuàng)造力得分。這些結果強調(diào),人工智能的創(chuàng)造力高度依賴于人類的指導,因此交互和提示是創(chuàng)造過程的核心組成部分。

人工智能會取代人類創(chuàng)作者嗎?

這項研究對人工智能可能取代創(chuàng)意專業(yè)人士的擔憂提出了較為平衡的觀點。雖然人工智能系統(tǒng)在某些任務上已經(jīng)能夠達到甚至超越人類的平均創(chuàng)造力水平,但它們?nèi)匀淮嬖诿黠@的局限性,并且需要依賴人類的指導。

“盡管人工智能在某些測試中已經(jīng)能夠達到人類的創(chuàng)造力水平,但我們需要超越這種誤導性的競爭觀念,”卡里姆·杰爾比教授說道。“生成式人工智能首先已經(jīng)成為服務于人類創(chuàng)造力的極其強大的工具:它不會取代創(chuàng)造者,而是會深刻地改變?nèi)藗兿胂?、探索和?chuàng)造的方式——對于那些選擇使用它的人來說。”

研究結果并非預示著創(chuàng)意職業(yè)的終結,而是表明人工智能未來將成為創(chuàng)意助手。通過拓展思路、開辟新的探索路徑,人工智能或許能夠增強而非取代人類的想象力。

“通過直接比較人類和機器的能力,像我們這樣的研究促使我們重新思考創(chuàng)造力的含義,”卡里姆·杰爾比教授總結道。

關于這項研究

題為“人類和大型語言模型中的發(fā)散性創(chuàng)造力”的論文于 2026 年 1 月 21 日發(fā)表在《科學報告》上。該研究匯集了來自蒙特利爾大學、康考迪亞大學、多倫多大學密西沙加分校、魁北克人工智能研究所 (Mila) 和谷歌 DeepMind 的科學家。

這項研究由卡里姆·杰爾比教授領導,安托萬·貝勒馬爾-佩潘(蒙特利爾大學)和弗朗索瓦·萊斯皮納斯(康考迪亞大學)共同擔任第一作者。研究團隊還包括約書亞·本吉奧,他是Mila和LoiZéro的創(chuàng)始人,也是深度學習領域的先驅(qū),而深度學習正是ChatGPT等現(xiàn)代人工智能系統(tǒng)背后的技術。

  1. Antoine Bellemare-Pepin、Fran?ois Lespinasse、Philipp Th?lke、Yann Harel、Kory Mathewson、Jay A. Olson、Yoshua Bengio、Karim Jerbi.人類的發(fā)散性創(chuàng)造力與大型語言模型.科學報告, 2026; 16 (1) DOI: 10.1038/s41598-025-25157-3

引用此頁面

蒙特利爾大學?!把芯咳藛T對人工智能和10萬名人類的創(chuàng)造力進行了測試?!?ScienceDaily。ScienceDaily,2026年1月25日。 / releases / 2026 / 01 / 260125083356.htm>。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
哈妹內(nèi)衣沒了

哈妹內(nèi)衣沒了

名人茍或
2026-03-01 06:06:59
2萬余名旅客滯留 阿聯(lián)酋政府將承擔因此產(chǎn)生費用

2萬余名旅客滯留 阿聯(lián)酋政府將承擔因此產(chǎn)生費用

看看新聞Knews
2026-03-01 18:15:18
上海發(fā)布2026年為民辦實事項目

上海發(fā)布2026年為民辦實事項目

中國網(wǎng)
2026-03-02 09:48:15
1971年,陜西老光棍圖便宜,娶了小自己10歲又坐過牢房的女大學生

1971年,陜西老光棍圖便宜,娶了小自己10歲又坐過牢房的女大學生

南權先生
2026-02-26 15:38:59
美國“無法接受”,馬斯克贊不絕口,這位中國年輕人實在強得可怕

美國“無法接受”,馬斯克贊不絕口,這位中國年輕人實在強得可怕

卷史
2026-02-27 19:40:42
羨慕!索尼宣布將把應屆生的起薪提至1.87萬元/月

羨慕!索尼宣布將把應屆生的起薪提至1.87萬元/月

隨波蕩漾的漂流瓶
2026-03-01 17:25:03
突發(fā)!阿曼灣那邊出大事了!

突發(fā)!阿曼灣那邊出大事了!

達文西看世界
2026-03-02 15:36:59
感謝西藏吧,沒有他們今天的中國大概率是全民穆斯林!

感謝西藏吧,沒有他們今天的中國大概率是全民穆斯林!

阿諢體育
2026-02-18 12:44:39
美軍方稱摧毀伊朗伊斯蘭革命衛(wèi)隊總部

美軍方稱摧毀伊朗伊斯蘭革命衛(wèi)隊總部

財聯(lián)社
2026-03-02 03:44:09
周杰倫和田馥甄的瓜,沖上熱搜第一

周杰倫和田馥甄的瓜,沖上熱搜第一

背包旅行
2026-02-27 17:05:44
當年舉債120億“吞”下沃爾沃!如今16年過去,李書福賺了多少?

當年舉債120億“吞”下沃爾沃!如今16年過去,李書福賺了多少?

牛鍋巴小釩
2026-02-25 15:15:15
潛伏11年,那些被礦渣喂大的香蕉,終于開始向人類“復仇”了

潛伏11年,那些被礦渣喂大的香蕉,終于開始向人類“復仇”了

墨印齋
2026-02-26 08:32:20
王朔痛批87版《紅樓夢》:把原著毀了,簡直沒法看

王朔痛批87版《紅樓夢》:把原著毀了,簡直沒法看

談史論天地
2026-03-02 07:27:17
國際油價大漲!沙特、俄羅斯、伊拉克等8個主要產(chǎn)油國宣布增產(chǎn)!油價下步走勢如何?

國際油價大漲!沙特、俄羅斯、伊拉克等8個主要產(chǎn)油國宣布增產(chǎn)!油價下步走勢如何?

戶外釣魚哥阿旱
2026-03-02 16:11:01
洛克希德·馬丁的生產(chǎn)線突然停了,中國凍結了他們在華的全部資產(chǎn)

洛克希德·馬丁的生產(chǎn)線突然停了,中國凍結了他們在華的全部資產(chǎn)

百態(tài)人間
2026-02-25 15:33:21
湖南省株洲市醫(yī)療保障局原局長陳志鴻接受審查調(diào)查

湖南省株洲市醫(yī)療保障局原局長陳志鴻接受審查調(diào)查

界面新聞
2026-03-02 16:55:28
阿聯(lián)酋首都阿布扎比再次遭襲

阿聯(lián)酋首都阿布扎比再次遭襲

環(huán)球網(wǎng)資訊
2026-03-01 20:47:47
曼聯(lián):約羅狀態(tài)低迷,卡里克卻為何提前換下馬奎爾?

曼聯(lián):約羅狀態(tài)低迷,卡里克卻為何提前換下馬奎爾?

星耀國際足壇
2026-03-02 11:49:33
絕地反擊!革命衛(wèi)隊報復襲擊,美中東基地集體被揍,27個基地被炸

絕地反擊!革命衛(wèi)隊報復襲擊,美中東基地集體被揍,27個基地被炸

井普椿的獨白
2026-03-02 16:19:27
6年了,郭麒麟的反擊幾乎斷送了朱亞文的演藝生涯

6年了,郭麒麟的反擊幾乎斷送了朱亞文的演藝生涯

小熊侃史
2025-12-25 11:24:12
2026-03-02 17:27:00
科學的歷程 incentive-icons
科學的歷程
吳國盛、田松主編
3135文章數(shù) 15005關注度
往期回顧 全部

科技要聞

榮耀發(fā)布機器人手機、折疊屏、人形機器人

頭條要聞

女子1天接五六通催收電話崩潰:欠錢的是不熟的前同事

頭條要聞

女子1天接五六通催收電話崩潰:欠錢的是不熟的前同事

體育要聞

“想要我簽名嗎” 梅西逆轉后嘲諷對手主帥

娛樂要聞

美伊以沖突爆發(fā),多位明星被困中東

財經(jīng)要聞

金銀大漲 市場仍在評估沖突會否長期化

汽車要聞

國民SUV再添一員 瑞虎7L靜態(tài)體驗

態(tài)度原創(chuàng)

藝術
本地
時尚
公開課
軍事航空

藝術要聞

2025北京青年美術作品展 | 油畫作品選刊

本地新聞

津南好·四時總相宜

從每天只睡4小時到8小時:一個失眠者的自救指南

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美軍動用新型武器:山寨伊朗的

無障礙瀏覽 進入關懷版