国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

大語言模型在心理學應用中的前沿探索:一項綜合性綜述(下)

0
分享至


Ke, L., Tong, S., Cheng, P., & Peng, K. (2025). Exploring the frontiers of llms in psychological applications: A comprehensive review. Artificial Intelligence Review, 58(10), 305.https://doi.org/10.1007/s10462-025-11297-5

6

大語言模型作為心理學的研究工具

在第 2–5 節(jié)探討了 LLMs 在認知與行為心理學中的理論基礎與實踐應用,并強調其在推動心理學研究方法發(fā)展中的作用之后,本節(jié)將重點關注 LLMs 在研究中最重要的應用之一:其在系統(tǒng)綜述與元分析自動化與優(yōu)化方面的潛力。這一部分凸顯了 LLMs 作為基于認知與行為原理的工具,如何能夠革新證據綜合(evidence synthesis)過程,并為心理學家提供可操作的洞見。換句話說,盡管前文主要聚焦于 LLMs 作為心理學研究中客觀性工具的作用,但本節(jié)將關注點轉向心理學家自身的科研工作流程。與第 5 節(jié)中討論的生產力提升類似,LLMs 也能夠在心理學家工作的各個環(huán)節(jié)提升效率。具體而言,LLMs 作為科學研究工具,可以幫助心理學家完成從文獻綜述、假設生成、實驗設計、實驗被試、數據分析到促進學術交流的全鏈條任務(見表 5)。



表5.大語言模型(LLMs)作為心理學研究工具的應用

6.1 自動化文獻綜述和元分析

進行文獻綜述與元分析是一項復雜而繁重的工作,需要大量時間與專業(yè)知識(Michelson & Reuter, 2019)。《Nature》曾報道,研究人員已開始使用 GPT 作為科研助理來總結文獻(Dis 等,2023)。在一項研究中,研究人員利用 GPT 完成了部分系統(tǒng)性文獻綜述任務(Qureshi 等,2023)。在另一項研究中,作者借助 GPT 撰寫了一篇關于數字孿生在健康領域應用的文獻綜述,結果顯示,在 LLMs 的幫助下,知識匯編與表達得到了加速,但其學術有效性仍需進一步驗證(Ayd?n & Karaarslan, 2022)。此外,研究人員還專門訓練 LLMs 以支持科學研究的實際需求(Taylor 等,2022),包括執(zhí)行系統(tǒng)性文獻綜述的能力。

近期研究進一步強調了 LLMs 在支持元分析方面的高效性。例如,Luo 等(2024)證明,LLMs 可以對文獻進行篩選、數據提取,并生成用于元分析的統(tǒng)計代碼,在顯著減少工作量的同時,保持了與人工整理相當的召回率。類似地,Tong 等(2024)使用 LLMs 從 43,312 篇心理學文章中提取因果對,通過自適應提示實現(xiàn)了 86.98% 的提取成功率。正如第 3 節(jié)所述,LLMs 在從大型文本數據集中提取因果關系方面表現(xiàn)出很強的能力,這凸顯了其在簡化系統(tǒng)綜述與元分析的證據綜合過程中的潛力。然而,盡管 LLMs 在整理定性數據與識別概念模式方面表現(xiàn)優(yōu)異,但在提取元分析所需的精確數值數據時仍存在挑戰(zhàn)。例如,雖然基于 LLM 的工具可以檢索并總結結果指標,但在處理復雜圖表或數據表時,人工驗證仍然必不可少,以確保準確性。

總之,LLMs 可以加快文獻綜述與元分析的進程。研究人員可以利用此類模型系統(tǒng)性地回顧與整合現(xiàn)有研究,從而提高循證心理學的研究效率。

6.2 假設生成和實驗設計

假設驅動型研究是科學活動的核心。LLMs 能夠從科學文獻中生成假設、基于數據進行推斷,并通過解釋來澄清結論(Banker 等,2024;Zheng 等,2023)。盡管 LLMs 具備成為“假設生成機器”的潛力,但其邏輯推理與數學推導能力仍需提升,以消除事實性錯誤、快速檢驗假設并從錯誤中學習(Y. J. Park 等,2024)。作為創(chuàng)新性工具,LLMs 在心理學實驗中具有巨大應用潛力,尤其是其能夠為實驗設計提供基于文本的材料,從而優(yōu)化研究流程并降低實驗復雜性。研究人員可以利用此類模型輕松創(chuàng)建實驗刺激、設計測試題目,甚至在受控環(huán)境中模擬交互環(huán)節(jié)(Aher, Arriaga, & Kalai, 2022;Akata 等,2023),從而在實驗過程中實現(xiàn)高度的可控性與精確性。

總之,從假設生成到實驗設計,LLMs 為心理學研究提供了功能強大且靈活多樣的工具,能夠幫助研究人員實現(xiàn)更精準、高效的科研目標。

6.3 大語言模型作為心理學實驗的受試者

盡管大語言模型(LLMs)能夠模擬某些人類行為和反應——這為檢驗有關人類行為的理論與假設提供了機會(Grossmann 等, 2023)——但關于 LLMs 是否可以作為心理學研究中人類被試的替代者仍存在爭議。盡管研究者認識到仍有一些問題存在(例如偏差和訓練數據不足),一些學者建議,LLMs 可以作為人類被試的替代方案,以節(jié)省時間和成本,并可應用于不適合人類參與的實驗(Hutson, 2023)。還有研究者提出,根據其在特定研究主題、任務和樣本等因素下的表現(xiàn),在合適的情況下可以將 LLMs 作為研究被試的一種替代方法(Dillion 等, 2023)。然而,也有人認為,盡管 LLMs 可能會對科學研究產生重大影響,但它們不太可能以任何有意義的方式取代人類被試(Harding 等, 2023)。與此同時,一些關于將 LLMs 作為被試的研究表明,LLMs 的表現(xiàn)與人類相似(Orru 等, 2023;P. S. Park 等, 2024),這可能意味著 LLMs 在一定程度上有潛力取代人類被試。

總之,雖然 LLMs 能夠模擬人類的判斷,但其對人類思維的模擬仍然有限,因此在將其作為心理學被試時,其輸出結果應謹慎驗證和解讀。

6.4 數據分析的工具

各種形式的人工智能(AI)早已被用于分析心理學數據,例如用于飛行員選拔的飛行數據分析(Ke 等, 2023)。機器學習算法能夠促進大規(guī)模數據集的處理,識別原本可能被忽視的模式和相關性。然而,大語言模型(LLMs)將這一能力提升到了新的水平;它們能夠以前所未有的規(guī)模高效分析海量文本數據,從而獲得有關人類行為和情緒的洞察(Patel & Fan, 2023)。對于心理學研究而言,這意味著更快速且更全面的數據分析,從而產生更加可靠和細致的研究發(fā)現(xiàn)。LLMs 可以分析多種語言的文本數據,準確識別其中的心理結構(Rathje 等, 2023),并能基于社交媒體數據生成心理畫像(Peters & Matz, 2023)。LLMs 還在醫(yī)學領域展現(xiàn)出一定的能力,例如,它們能夠針對特定的臨床表現(xiàn)預測最優(yōu)的神經影像學檢查方式。然而,LLMs 仍無法超越經驗豐富的神經放射科醫(yī)生,這表明在醫(yī)學應用中仍需持續(xù)改進(Nazario-Johnson 等, 2023)。這些研究結果表明,LLMs 在數據評估與分析方面具有巨大潛力。

6.5 促進學術交流

學術交流是學術研究的基石,涵蓋了知識的創(chuàng)造、評估與傳播過程。這包括撰寫研究論文、開展同行評審,以及確保研究成果的透明與合倫理傳播。在心理學領域,由于其理論框架和方法路徑的多樣性——從實驗研究到質性研究——這一過程尤其復雜。該學科關注人類行為,并與技術產生交叉,因此對精確且合乎倫理的交流實踐有著更高的要求。

有觀點認為,當前的大語言模型(LLMs)尚不能完全取代人類寫作,而只能回答問題并生成自然流暢且信息豐富的內容,但缺乏真正的智能——即基于先前所見詞匯模式生成的文本(Stokel-Walker, 2022)。一項研究中,學生在寫作時使用了 GPT 作為輔助工具。結果發(fā)現(xiàn),使用 GPT 的實驗組在寫作質量、速度和真實性方面與對照組相似;作者認為,這可能是因為有經驗的研究人員能夠更好地引導 GPT 生成高質量的信息。相比之下,寫作經驗不足的學生發(fā)現(xiàn) GPT 的表現(xiàn)不夠理想(Ba?i? 等, 2023)。另一篇文章討論了 GPT 在學術寫作中的前景與潛在威脅,并強調在學術研究中使用 GPT 時應優(yōu)先依賴經過同行評議的學術來源。同時,該文也指出了 GPT 在學術研究中的潛在優(yōu)勢,包括處理海量文本數據、自動生成摘要和研究問題(Dergaa 等, 2023)。此外,LLMs 還可在同行評審中發(fā)揮潛在作用(Van Dis 等, 2023)。在一項文本評估任務中,LLMs 的判斷結果與人類專家保持一致(Chiang & Lee, 2023)。

總之,像 GPT 這樣的大語言模型是心理學學術交流的有力工具,能夠處理海量文本數據,并自動化完成原本需要人工進行的任務。它們可以用于掃描學術論文并提取關鍵信息,生成客觀且無偏的摘要,并在社會心理學中提出研究問題(Banker 等, 2023;Tong 等, 2024)。然而,研究人員在使用它們時必須保持謹慎,因為它們也可能將虛假或有偏見的信息引入論文,從而導致無意的抄襲或概念的錯誤歸屬(Van Dis 等, 2023)。

7

挑戰(zhàn)與未來方向

7.1 挑戰(zhàn)與局限性

大語言模型(LLMs)在模擬復雜認知過程方面具有巨大潛力,為研究者提供了全新的工具,以探索人類認知與行為的機制,并在臨床與咨詢心理學、教育與發(fā)展心理學、社會與文化心理學等多個領域廣泛應用。然而,LLM 的輸出不應被誤認為具備思維,而應視為基于概率建模的復雜模式匹配(Floridi & Chiriatti, 2020)。盡管 LLM 的表現(xiàn)令人印象深刻,但這與意識或真正的理解不同。對 LLM 能力的解讀必須建立在對其局限性和運行機制本質的理解之上,而這些可能與人類認知存在根本差異。因此,必須在關注 LLM 在心理學研究潛力的同時,正視可能出現(xiàn)的技術與倫理挑戰(zhàn)。

首先,盡管 LLM 的能力不斷涌現(xiàn)(Wei 等, 2022),但從認知與行為心理學的角度,其內部工作機制仍是“黑箱”。例如,LLM 在需要形式語言能力(包括對特定語言規(guī)則與模式的掌握)的任務中表現(xiàn)優(yōu)異,但在需要功能性語言能力(理解并在真實世界中使用語言所需的認知能力)的測試中卻屢屢失利(Mahowald 等, 2023)。它們在類比推理與道德推理任務中表現(xiàn)出色,但在空間推理任務中表現(xiàn)不佳(Agrawal, 2023)。

其次,雖然 LLM 加速了人工智能在臨床與咨詢心理治療中的應用,但也可能帶來隱私與倫理問題(Graber-Stiehl, 2023)。例如,守門人、患者,甚至使用 GPT 評估自殺風險或輔助決策的心理健康專業(yè)人員,可能會收到低估風險的不準確評估(Elyoseph & Levkovich, 2023),或在臨床決策中受到偏見影響,從而導致醫(yī)療不公平(Pal 等, 2023)。此外,在精神病學研究與實踐中,LLM 的使用還可能帶來潛在的偏差與隱私侵犯風險(Zhong 等, 2023)。

第三,LLM 在教育、發(fā)展以及社會與文化心理學等領域的應用同樣面臨挑戰(zhàn)。在教育應用中,LLM 可能出現(xiàn)輸出偏差與被濫用的風險(Kasneci 等, 2023)。有研究發(fā)現(xiàn),GPT 生成的文本并不總是一致或邏輯自洽,有時甚至相互矛盾(Stojanov, 2023)。在社會與文化心理學中,LLM 展現(xiàn)出與人類相似的認知偏差(Talboy & Fuller, 2023)與文化偏差(Atari 等, 2023),并隱含更為負面的個性特征(X. Li 等, 2022)。Bender 等(2021)指出,LLM 的訓練數據可能反映并延續(xù)社會偏見,這些偏見可能在研究環(huán)境中被進一步固化。

最后,LLM 作為科學研究的輔助工具也存在一定局限。例如在寫作方面,當前的 LLM 尚不能完全替代人類,而是通過回答問題與生成自然流暢、信息豐富的內容來輔助,但并不具備真正的智能(Stokel-Walker, 2022)。盡管宏語言模型在作為實驗被試時可以模擬人類判斷,但它們對人類思維的“理解”仍有限(Dillion 等, 2023)。Van Dis 等(2023)指出,LLM 可能加速創(chuàng)新、縮短發(fā)表周期,并提升科研的多樣性與公平性,但也可能降低研究的質量與透明度,并從根本上改變科學家作為研究者的自主性。

綜上所述,LLM 在心理學研究中具備非凡能力,但同時也伴隨偏差、倫理問題、數據安全、透明度以及技術能力等方面的挑戰(zhàn)。研究人員在使用 LLM 時應充分認識到這些挑戰(zhàn),并在研究項目中采取負責任的應對措施。表 6 總結了 LLM 在心理學應用中的挑戰(zhàn)與局限性。





表6.大語言模型(LLMs)在心理學應用中的挑戰(zhàn)與局限

7.2 未來方向與新興趨勢

目前,大語言模型(LLMs)已被應用于心理學的不同領域,包括認知與行為心理學、臨床與咨詢心理學、教育與發(fā)展心理學,以及社會與文化心理學。隨著 LLM 能力的不斷提升,其在心理學中的潛在應用將持續(xù)發(fā)展。

首先,在認知與行為心理學領域,隨著多模態(tài) LLM 的出現(xiàn)(OpenAI, 2023),有可能將視覺、聽覺信息與文本數據相結合,更好地理解和建模情緒、行為與心理狀態(tài),以促進認知研究。此外,神經影像數據可用于優(yōu)化 LLM 的架構與參數,并與傳統(tǒng)文本數據相融合,從而構建更為準確且符合生物學原理的人類語言與思維模型。

其次,在臨床與咨詢心理學領域,一方面,可以利用個人數據(如社交媒體發(fā)布內容、病歷記錄或可穿戴設備數據)來創(chuàng)建個性化的 LLM,從而更精準、更具針對性地洞察個體心理狀態(tài)。同時,將人類臨床與咨詢專業(yè)知識的優(yōu)勢,與 LLM 的可擴展性和計算能力相結合,有望開發(fā)出新的診斷、治療與干預工具。此外,在教育與發(fā)展心理學以及社會與文化心理學領域,構建具備倫理性的 LLM 至關重要,并需確保其設計與應用過程尊重隱私、合理且負責任地使用數據。

歸根結底,LLM 是一項系統(tǒng)性工程,其未來發(fā)展離不開心理學、計算機科學、語言學等多個領域研究者的跨學科協(xié)作。對于心理學研究者而言,易于獲取的開源 LLM 框架與工具或將成為未來科研工作的重要組成部分。表 7 總結了 LLM 在心理學應用中的未來發(fā)展方向與新興趨勢。



表 7. 大語言模型(LLMs)在心理學應用中的未來方向與新興趨勢

8

結論

隨著人工智能技術的快速發(fā)展,尤其是大語言模型(LLMs)的不斷進步,機器學習已能夠識別人類語言并生成自然語言。這一發(fā)展不僅是心理學領域的技術突破,更為一系列潛在應用打開了大門。

首先,在認知與行為心理學領域,LLMs 在多種認知任務中表現(xiàn)優(yōu)異。盡管在因果認知與規(guī)劃方面仍存在一定局限,這些模型復興了“聯(lián)想”這一原理,展現(xiàn)出跨距離聯(lián)想和復雜推理的能力。同時,將 LLMs 與認知模型相結合的能力,是心理學研究的一大優(yōu)勢,使得研究者能夠對人類認知與行為加工機制展開新的探索。

其次,在臨床與咨詢心理學領域,LLMs 可用作心理健康的初步診斷工具。傳統(tǒng)心理健康診斷依賴專業(yè)人員的經驗以及與患者的直接交流,而 LLMs 可以通過分析個體的語言表達與文本內容,快速識別潛在的心理健康問題,如抑郁和焦慮。需要強調的是,這類診斷不能完全取代專業(yè)心理評估,但可作為一種有效的輔助手段,幫助心理學家更快了解患者的狀況,或在基礎心理健康干預中發(fā)揮作用。同時,個性化心理干預也是 LLMs 的重要應用方向之一。通過結合個體的健康數據與生活習慣信息,這些模型能夠提供定制化的心理建議與干預方案。這種個性化路徑有望顯著提升心理干預的有效性。

第三,LLMs 在教育與發(fā)展心理學,以及社會與文化心理學領域也具有廣闊的應用潛力。例如,LLMs 可以提供互動式、個性化的學習體驗,或基于真實情境生成研究任務,從而提升學習動機并促進學習效果。此外,通過分析海量社交媒體數據,這些模型還能幫助研究者追蹤與分析公眾情緒變化,更好地理解社會心理動態(tài)。

最后,在心理學研究中,LLMs 能夠顯著提升研究效率。研究人員可以利用這些模型快速整理與分析大量文獻,從而節(jié)省時間;它們還可輔助實驗設計、數據分析,甚至推動學術交流,使心理學研究更高效、更精準。

綜上所述,LLMs 在心理學中具有廣闊的應用前景,包括科研支持、認知建模、個性化干預以及個性化學習等。它們還有潛力顯著加深我們對人類交流、思維過程與行為的理解,從而推動更為全面的心智理論與認知科學的發(fā)展。然而,也必須正視相關的風險與挑戰(zhàn),確保遵守倫理規(guī)范,尤其是在涉及個人隱私與數據安全時。同時,我們應認識到,無論技術多么先進,LLMs 也只能在一定程度上替代人類專業(yè)人員的判斷與經驗。因此,這類模型應被視為輔助工具,而非一體化的解決方案。

(完結)


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
2026春晚分會場揭曉!你絕對想不到的四座城市!

2026春晚分會場揭曉!你絕對想不到的四座城市!

復轉這些年
2025-12-28 23:38:48
交警隊去掉“警察”2字,以后不管了?背后3個真相令人舒適

交警隊去掉“警察”2字,以后不管了?背后3個真相令人舒適

陳博世財經
2025-12-27 17:15:45
痛定思定,高市早苗想通了:跟中國動手之前,一定要先哄好普京。

痛定思定,高市早苗想通了:跟中國動手之前,一定要先哄好普京。

現(xiàn)代小青青慕慕
2025-12-28 09:58:34
歐洲三國宣布:正式退出!

歐洲三國宣布:正式退出!

每日經濟新聞
2025-12-28 15:09:05
西方媒體:哪怕中國全力以赴,也不可能按時建成這樣龐大的工程

西方媒體:哪怕中國全力以赴,也不可能按時建成這樣龐大的工程

樂天閑聊
2025-12-20 10:59:49
回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

就一點
2025-11-22 10:36:39
失血過重!伯恩茅斯1-4遭9輪英超不勝 從第2到第15 后5輪4硬仗

失血過重!伯恩茅斯1-4遭9輪英超不勝 從第2到第15 后5輪4硬仗

智道足球
2025-12-28 14:38:52
黃曉明帶兒子和媽媽包餃子,摘了假發(fā)套發(fā)量很藝術,兒子很像楊穎

黃曉明帶兒子和媽媽包餃子,摘了假發(fā)套發(fā)量很藝術,兒子很像楊穎

笑飲孤鴻非
2025-12-24 01:09:08
白銀價格暴漲的真相:倫敦實物擠兌,一場全球金融信用的崩塌預警

白銀價格暴漲的真相:倫敦實物擠兌,一場全球金融信用的崩塌預警

流蘇晚晴
2025-12-28 17:21:40
中國最敗家的兒子:為追求女明星與文強約架,在天上人間激起動蕩

中國最敗家的兒子:為追求女明星與文強約架,在天上人間激起動蕩

凱裕說故事
2024-12-19 10:12:44
剛剛!小米,重大突發(fā)!

剛剛!小米,重大突發(fā)!

中國基金報
2025-12-28 19:57:15
姚晨發(fā)文紀念高崎機場即將關閉

姚晨發(fā)文紀念高崎機場即將關閉

韓小娛
2025-12-28 08:59:57
突發(fā)!香港知名天王身體疑出問題?雙掌發(fā)黃,被指可能肝功能受損

突發(fā)!香港知名天王身體疑出問題?雙掌發(fā)黃,被指可能肝功能受損

小小李娛
2025-12-28 11:05:43
頭皮老是長疙瘩和膿包,可能是這3種病在求救,并非排毒,別大意

頭皮老是長疙瘩和膿包,可能是這3種病在求救,并非排毒,別大意

阿兵科普
2025-12-27 17:03:37
12月28日晚間,多家上市公司發(fā)布重大利好利空好消息

12月28日晚間,多家上市公司發(fā)布重大利好利空好消息

A股數據表
2025-12-28 19:01:59
楊少華長子楊威,對兒子楊化然說:我去德云社演出,郭德綱給錢了

楊少華長子楊威,對兒子楊化然說:我去德云社演出,郭德綱給錢了

知法而形
2025-12-27 19:44:29
蒙古國大膽想法:拿400平方公里和中國換通道?想將稀土運往美國

蒙古國大膽想法:拿400平方公里和中國換通道?想將稀土運往美國

游者走天下
2025-12-26 16:20:18
“消失”的王小海,揭穿玖月奇跡的尷尬處境,印證了鳳凰傳奇的話

“消失”的王小海,揭穿玖月奇跡的尷尬處境,印證了鳳凰傳奇的話

豐譚筆錄
2025-12-24 00:06:58
汪峰小女兒醒醒給他掙臉,10歲生日宣布喜訊:已創(chuàng)作出自己的繪本

汪峰小女兒醒醒給他掙臉,10歲生日宣布喜訊:已創(chuàng)作出自己的繪本

TVB的四小花
2025-12-29 02:07:06
廣東隊2紅5黃+港隊0牌!36歲前國腳氣炸 摁住主裁手阻止掏牌+抗議

廣東隊2紅5黃+港隊0牌!36歲前國腳氣炸 摁住主裁手阻止掏牌+抗議

我愛英超
2025-12-28 22:27:11
2025-12-29 03:32:49
彭凱平 incentive-icons
彭凱平
個人積極心理方面的心得感悟
408文章數 4470關注度
往期回顧 全部

教育要聞

3招查詢專業(yè)評估!避免選錯踩坑

頭條要聞

男子強奸女友出獄后兩人復合 又因爭吵掐死對方

頭條要聞

男子強奸女友出獄后兩人復合 又因爭吵掐死對方

體育要聞

MVP概率達82.5%!約基奇連超大鳥喬丹

娛樂要聞

白敬亭現(xiàn)身冰雪大世界 拍視頻還翻車了

財經要聞

英偉達的收購史

科技要聞

特斯拉將在華布局自動駕駛?記者求證→

汽車要聞

理想的2026:L9不容有失,i9再戰(zhàn)純電?

態(tài)度原創(chuàng)

游戲
健康
時尚
家居
旅游

老庫反復拉伸!鳴潮開服至今到底是拉了還是神了?

這些新療法,讓化療不再那么痛苦

“這頂帽子”太火了,今年流行的風格都離不開它

家居要聞

格調時尚 智慧品質居所

旅游要聞

什剎海這三條斜街胡同彰顯獨特意蘊

無障礙瀏覽 進入關懷版