国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

【患者安全】大語言模型-誤診卓越診斷?

0
分享至


Large Language Models

—Misdiagnosing Diagnostic Excellence?

編譯自:Sumant R. Ranji, MD,JAMA Netw Open. 2024;7(10) 圖片來自網(wǎng)絡。


在最近的一次美國國家醫(yī)學科學院會議上,Goh團隊的研究成果引起了聽眾的震驚與擔憂。這項隨機臨床試驗評估了全科醫(yī)生在診斷6個模擬病例時的表現(xiàn)。醫(yī)生被分為兩組:一組僅使用常規(guī)在線資源,另一組除了這些資源外,還額外使用大語言模型(LLM) (ChatGPT Plus [GPT-4]; OpenAI)。此外,研究還單獨測試了LLM的診斷能力。為了客觀評價診斷質(zhì)量,研究團隊設計了一套評分標準,由專家對臨床推理過程進行盲評,包括醫(yī)生的最終診斷、鑒別診斷及支持/不支持診斷的因素。

研究的主要發(fā)現(xiàn)是:使用LLM輔助診斷的醫(yī)生得分與僅使用傳統(tǒng)資源的醫(yī)生相比,并沒有顯著提高。然而,LLM單獨完成診斷時的表現(xiàn)卻顯著優(yōu)于任何一組醫(yī)生。這一結果引發(fā)了不少人對自身職業(yè)未來的擔憂,不少與會者甚至擔憂:“我們會失業(yè)嗎?”

Goh團隊的試驗在探索生成式人工智能(AI)應用于診斷方面邁出了重要一步。該研究通過分析未經(jīng)專業(yè)LLM培訓的醫(yī)生如何在實際場景中使用GPT-4,為現(xiàn)階段和可預見未來的臨床實踐提供了真實的評估。值得注意的是,這項研究沒有單純關注最終診斷的準確性,而是強調(diào)診斷過程的質(zhì)量,這種更全面的評價方法值得未來研究借鑒。研究同時表明,僅靠生成式AI并不能提高診斷質(zhì)量,醫(yī)生需要接受專門的培訓,才能充分發(fā)揮這類工具的潛力。


作者提醒道:“研究結果并不意味著LLM可以獨立承擔診斷任務,醫(yī)生的監(jiān)督仍然必不可少。”然而,LLM單獨診斷表現(xiàn)優(yōu)于醫(yī)生的結果,勢必成為引發(fā)關注的核心話題。對于以診斷為核心職業(yè)身份的醫(yī)生來說,使用LLM進行診斷的前景既讓人興奮,也讓人感到不安。隨著更多關于LLM診斷能力的研究發(fā)表,醫(yī)生應當如何看待這些新技術的挑戰(zhàn)和機遇呢?

需要謹慎對待的是,LLM在模擬病例中的優(yōu)異表現(xiàn)是否可以推廣到實際的臨床實踐中。模擬病例的診斷條件通常是理想化的——病史、體格檢查結果、實驗室及影像學數(shù)據(jù)都以整齊有序的方式呈現(xiàn),便于構建鑒別診斷。而實際臨床診斷是一個復雜的迭代過程,往往需要在繁雜的環(huán)境中整合來自患者、家屬及多學科團隊的多種信息,這種非線性的過程需要在不斷獲取新信息的基礎上不斷修正診斷,同時還需要將治療反應納入診斷推理,診斷和治療之間的區(qū)別往往變得模糊。

那么,LLM在接近真實臨床環(huán)境下的表現(xiàn)如何?最近的一項研究評估了LLM在處理4種常見腹部疾病的診斷和管理方案制定中的表現(xiàn)。研究中,LLM接收的是逐步呈現(xiàn)的患者數(shù)據(jù),每個步驟后需總結信息并提出診斷或額外檢查建議。完成診斷后,LLM還需制定治療計劃。然而,在這種現(xiàn)實化的場景中,LLM的表現(xiàn)很差:除最簡單的病例外,其診斷表現(xiàn)顯著遜色于醫(yī)生,同時,LLM 也未能始終如一地要求進行適當?shù)脑\斷檢查,即使在得出正確診斷后也經(jīng)常提出錯誤的治療建議。

盡管LLM的性能在不斷提升,但當前的局限性仍需關注。即便未來LLM能夠基于不斷變化的信息完成復雜的迭代診斷,它是否能夠有效減少診斷錯誤帶來的傷害仍然值得懷疑。

醫(yī)學診斷中的錯誤通常源于系統(tǒng)性失誤(潛在錯誤),這些問題讓個體醫(yī)生的錯誤(顯性錯誤)最終影響患者。生成式AI的優(yōu)勢在于幫助醫(yī)生減少認知錯誤,即數(shù)據(jù)收集和整合方面的失敗。但認知錯誤并不是孤立于醫(yī)療系統(tǒng)之外的,它往往是醫(yī)生在充滿潛在錯誤的環(huán)境中工作時的表現(xiàn),例如人員不足、工作壓力大、不完善的電子病歷系統(tǒng)以及醫(yī)護團隊溝通不暢。這些系統(tǒng)性問題會增加醫(yī)生的認知負擔,阻礙其做出準確決策。專注于 AI 的生成潛力以防止認知錯誤,可能會最大限度地減少系統(tǒng)故障在診斷錯誤中的作用,并分散人們對解決這些問題的注意力。

實現(xiàn)卓越診斷需要建立一個支持醫(yī)生準確決策并全程服務患者的醫(yī)療體系。生成式AI可以成為其中的重要組成部分,但要成功地將LLM融入臨床診斷,還需要技術的進一步完善、醫(yī)生的系統(tǒng)性培訓,以及AI與臨床環(huán)境的深度融合。即使這些條件都具備,也不應期待AI能夠獨立解決所有診斷問題。


對于那些認為Goh團隊的研究結果威脅到醫(yī)生職業(yè)安全的人來說,本文試驗中使用AI平臺的回答或許能帶來一些安慰。在試驗中,研究團隊使用了加州大學舊金山分校的安全AI平臺(Versa),并向其提出以下問題:“既然最近的研究顯示LLM在模擬病例中的診斷準確性已經(jīng)達到甚至超過了醫(yī)生,這是否意味著未來LLM會取代醫(yī)生?”

LLM的回答如下:

“大語言模型(LLM)在模擬病例診斷中顯示出前景,但完全取代醫(yī)生并不現(xiàn)實。LLM可以通過提供決策支持、處理大量數(shù)據(jù)和提出診斷建議來增強醫(yī)療實踐。然而,醫(yī)學實踐還包括復雜的人際互動、倫理判斷和體格檢查,這些是AI無法完全復制的。LLM是提升醫(yī)療質(zhì)量的工具,而非醫(yī)生的替代品。LLM的整合應以協(xié)作為目標,而非取代?!?/strong>

這段回應恰如其分地總結了生成式AI在醫(yī)療領域的定位。我們不應將其視為威脅,而應將其視為一種可以與醫(yī)生合作的強大工具,共同推動醫(yī)療診斷的進步。


【原文】 https://jamanetwork.com/journals/jamanetworkopen/fullarticle/2825399

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
沸騰全場!開拓者擒國王鎖附加賽,楊瀚森末節(jié)登場燃爆主場

沸騰全場!開拓者擒國王鎖附加賽,楊瀚森末節(jié)登場燃爆主場

我是阿Sen
2026-04-13 13:47:10
保存蠶豆,切記不要焯水和直接放冰箱,教你一招,一年四季都新鮮

保存蠶豆,切記不要焯水和直接放冰箱,教你一招,一年四季都新鮮

阿龍美食記
2026-04-10 19:38:34
以軍坦克在黎南部沖撞聯(lián)黎部隊意大利車輛

以軍坦克在黎南部沖撞聯(lián)黎部隊意大利車輛

海外網(wǎng)
2026-04-13 07:32:01
31歲!維金斯徹底進化!交易市場又一香餑餑

31歲!維金斯徹底進化!交易市場又一香餑餑

籃球?qū)崙?zhàn)寶典
2026-04-12 22:45:40
知名網(wǎng)站宣布:5月1日停止服務!用戶超8000萬,抓緊退費!很多人用過

知名網(wǎng)站宣布:5月1日停止服務!用戶超8000萬,抓緊退費!很多人用過

南方都市報
2026-04-11 20:29:45
霍爾木茲海峽船舶通行再次完全中斷,封鎖已持續(xù)數(shù)小時

霍爾木茲海峽船舶通行再次完全中斷,封鎖已持續(xù)數(shù)小時

大象新聞
2026-04-13 13:45:07
知名演員因前夫負債被迫接戲,坦言離婚后“不知道自己有1000萬元的債,為還債一天拍42場戲”

知名演員因前夫負債被迫接戲,坦言離婚后“不知道自己有1000萬元的債,為還債一天拍42場戲”

揚子晚報
2026-04-11 15:28:12
戲瘋子劉琳:演完江德華回家,老公三天沒緩過神

戲瘋子劉琳:演完江德華回家,老公三天沒緩過神

優(yōu)趣紀史記
2026-04-12 17:36:06
美軍79架運輸機瘋往中東囤彈藥,巴鐵借中械露臉,印度急的跳腳

美軍79架運輸機瘋往中東囤彈藥,巴鐵借中械露臉,印度急的跳腳

華人星光
2026-04-13 11:17:31
條件超棒的業(yè)界新人鈴木希

條件超棒的業(yè)界新人鈴木希

吃瓜黨二號頭目
2026-04-13 09:43:34
芒果臺踩雷!趙子琪被淘汰后直播開撕,她的過往連張朝陽都忌憚

芒果臺踩雷!趙子琪被淘汰后直播開撕,她的過往連張朝陽都忌憚

小徐講八卦
2026-04-12 06:23:01
全網(wǎng)震怒!女生遭法官猥褻16分鐘錄音曝光!下流挑逗強吻摸私!

全網(wǎng)震怒!女生遭法官猥褻16分鐘錄音曝光!下流挑逗強吻摸私!

魔都囡
2026-04-13 10:56:53
終于體會到村口大媽的快樂,網(wǎng)友:是兄妹是夫妻是父女

終于體會到村口大媽的快樂,網(wǎng)友:是兄妹是夫妻是父女

夜深愛雜談
2026-04-12 17:40:09
爆大冷!大黑馬26分慘敗:輪休主力不想贏球,如愿避開哈登騎士

爆大冷!大黑馬26分慘敗:輪休主力不想贏球,如愿避開哈登騎士

體壇小李
2026-04-13 09:35:21
“作弊” 內(nèi)幕曝光!3DMark回應將某知名國產(chǎn)手機除名:實測性能相差24%、溫度超過50℃

“作弊” 內(nèi)幕曝光!3DMark回應將某知名國產(chǎn)手機除名:實測性能相差24%、溫度超過50℃

快科技
2026-04-12 16:35:46
當大男子主義色彩的美國防長成為戰(zhàn)爭推手

當大男子主義色彩的美國防長成為戰(zhàn)爭推手

澎湃新聞
2026-04-13 07:26:27
鄭麗文明確兩岸統(tǒng)一方向,十位臺縣市長表態(tài),蔣萬安盧秀燕顯怯懦

鄭麗文明確兩岸統(tǒng)一方向,十位臺縣市長表態(tài),蔣萬安盧秀燕顯怯懦

領悟看世界
2026-04-13 01:11:25
天?。】吹?987年春晚觀眾席的遲重瑞,才懂陳麗華為啥一見鐘情

天啊!看到1987年春晚觀眾席的遲重瑞,才懂陳麗華為啥一見鐘情

真的八卦小學弟
2026-04-12 00:30:12
李宇春咋穿成這樣?為藝術獻身我真的看不懂!

李宇春咋穿成這樣?為藝術獻身我真的看不懂!

手工制作阿殲
2026-04-13 11:13:38
改變對華定位,高市向中國討債,不到24小時,中方對日本反制升級

改變對華定位,高市向中國討債,不到24小時,中方對日本反制升級

共工之錨
2026-04-13 13:46:18
2026-04-13 14:19:00
醫(yī)護健康科普 incentive-icons
醫(yī)護健康科普
分享健康科普知識
2517文章數(shù) 2415關注度
往期回顧 全部

科技要聞

傳榮耀與字節(jié)跳動接洽“豆包手機”合作

頭條要聞

毛焦爾:匈牙利將再次成為歐盟和北約國家的堅定盟友

頭條要聞

毛焦爾:匈牙利將再次成為歐盟和北約國家的堅定盟友

體育要聞

一支球隊不夠爛,也是一種悲哀

娛樂要聞

賈玲減重后現(xiàn)身馮鞏生日宴 身材未反彈

財經(jīng)要聞

封鎖,還是收費站?

汽車要聞

不止命名更純粹 領克10/10+要做純電操控新王

態(tài)度原創(chuàng)

家居
教育
游戲
時尚
軍事航空

家居要聞

復古風格 自然簡約

教育要聞

發(fā)音不準或引發(fā)的自信危機與應對措施

杰洛特來東瀛!《巫師》新衍生作官宣 和服葉奈法超美

這些才是普通人借鑒的穿搭!上短下長、上窄下寬,顯瘦又舒適

軍事要聞

美國副總統(tǒng)萬斯:美伊談判未能達成協(xié)議

無障礙瀏覽 進入關懷版