国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

80萬條數(shù)據(jù)揭示隱患:AI正在污染病歷,你的診療數(shù)據(jù)越來越不靠譜

0
分享至



本研究是由新加坡國立大學劉鈿渤組博士生何洪宇領(lǐng)銜、包括哈佛大學、斯坦福大學、耶魯大學、谷歌公司、梅奧診所等機構(gòu)共同完成的,研究團隊成員有醫(yī)學 AI、放射學、臨床醫(yī)學等各方面的專家,具有很強的跨學科研究背景和臨床實踐經(jīng)驗。

隨著生成式人工智能在醫(yī)療領(lǐng)域的加速滲透,越來越多的病歷、影像報告及各類臨床文本正逐步納入 AI 參與生成的范疇。這一旨在提升醫(yī)療效率的技術(shù)革新背后,潛藏著威脅診斷安全性的深層隱患。

最近新加坡國立大學、哈佛大學、斯坦福大學等機構(gòu)聯(lián)合團隊最新研究顯示,當 AI 生成的臨床文本被用作訓練新一代 AI 模型時,一些罕見但是重要的病理信息會在數(shù)據(jù)迭代的過程中悄悄地消失,從而使得醫(yī)療 AI 整體診斷可靠性在群體上不斷下降。

研究團隊對臨床文本生成、視覺-語言報告、醫(yī)學圖像合成這三個任務下的 80 多萬條合成數(shù)據(jù)進行了系統(tǒng)的分析(如圖 1 表示),首次證明了在沒有強制性人工驗證的情況下,多代自我訓練循環(huán)會使病理多樣性迅速消失,診斷可靠度急劇降低,并且醫(yī)師評估也表明臨床效用的退化。

最后研究團隊提出了可以直接融入到目前臨床工作流程中的緩解方法,在 AI 全面進入醫(yī)療之前給醫(yī)生提供一條安全的操作路線。

  • 論文標題:AI-generated data contamination erodes pathological variability and diagnostic reliability
  • 論文鏈接:https://arxiv.org/abs/2601.12946



圖 1 人工智能生成的數(shù)據(jù)污染造成的病理多樣性喪失、診斷安全性降低的現(xiàn)象以及緩解方法

現(xiàn)實困境:

醫(yī)療 AI 生成普及背后的隱形危機

人工智能正在改變?nèi)蜥t(yī)療文檔系統(tǒng),大型語言模型已經(jīng)被廣泛地應用到臨床報告、出院小結(jié)、電子健康檔案等方面,AI 輔助診斷已經(jīng)得到廣泛的應用。但是其中隱藏的風險是,原來依靠人工建立起來的醫(yī)療數(shù)據(jù)庫正在被大量的 AI 生成內(nèi)容所取代,而且不斷保存在診療記錄中,從而成為下一代 AI 訓練的數(shù)據(jù)來源,形成了一個「生成-訓練-再生成」的自循環(huán)結(jié)構(gòu)。

在其它領(lǐng)域,自我訓練循環(huán)被證明會造成「模型退化」,也就是輸出的多樣性以及保真度會降低。而醫(yī)學領(lǐng)域的特殊性使得該問題的危害更加嚴重。醫(yī)學診斷很大程度上依靠罕見病、非典型臨床表現(xiàn)、臨床分布尾部細微異常等信息的輕微流失都會造成系統(tǒng)性診斷盲區(qū),增加漏診風險,加重醫(yī)療不公,影響疾病監(jiān)測。更嚴重的是,目前醫(yī)療 AI 評價標準大多只看表面的語言質(zhì)量,而沒有考慮診斷的準確性,導致這樣的模型和臨床應用出現(xiàn)退化很難被常規(guī)監(jiān)測到。

核心發(fā)現(xiàn):

多種任務下性能全面退化,

虛假信心掩蓋致命漏洞

研究團隊對 216307 份放射學報告、790 份臨床筆記、1000 份眼科病歷和 9781 張胸部 X 線片進行了多任務實驗,研究表明,AI 生成的數(shù)據(jù)污染造成模型性能退化甚至失效,并不是單一數(shù)據(jù)類型或者臨床任務造成的,而是貫穿臨床文本生成、視覺-語言放射學報告、醫(yī)學圖像合成這三個不同的真實臨床任務,采用多種代表性模型架構(gòu)開展實驗并且各個任務都存在類似的退化邏輯,即自我訓練循環(huán)造成病理多樣性喪失、診斷可靠度降低,同時又被虛假的預測信心所掩蓋。為評估研究結(jié)果的臨床相關(guān)性,研究團隊通過對人工智能生成輸出進行結(jié)構(gòu)化審查和編輯,并納入了醫(yī)師評估環(huán)節(jié)。



圖 2 人工智能生成的數(shù)據(jù)污染導致臨床筆記語言多樣性喪失和臨床知識退化

AI 生成的臨床文本隱患:

詞匯和知識的雙重流失以及敘事的碎片化

研究團隊首先用多種臨床文檔和人工智能模型架構(gòu),研究用合成臨床文本進行自我訓練會不會造成語言模型性能下降。圖 2 結(jié)果表明經(jīng)過四代自我訓練之后,模型就會出現(xiàn)災難性的退化。放射學報告中印象部分的詞匯量由原來的 12078 個減少到現(xiàn)在的 200 個左右,減少了 98.9%;獨特醫(yī)學術(shù)語減少 66%,報告公式化趨勢明顯。類似的結(jié)論也可以用在更廣泛的臨床文書上,例如 790 份 i2b2 臨床數(shù)據(jù)庫。隨著 AI 模型對于自身產(chǎn)生的合成數(shù)據(jù)的信心越來越大,但它所具有的真實醫(yī)療語言的能力卻降低了到原來的四分之一,這給醫(yī)療人工智能的部署帶來嚴重的風險,虛假的信心會掩蓋患者文書記錄中的重大失誤。



圖 3 人工智能生成的數(shù)據(jù)污染造成基于視覺-語言模型的放射學報告生成出現(xiàn)語言多樣性的喪失和臨床知識的退化

視覺-語言報告:

圖像錨定失效,虛假安心率激增

人工智能在醫(yī)學影像生成報告的時候,語言退化仍然會發(fā)生。研究使用了 Swin-Transformer、Llama-2 的視覺語言模型 R2GenGPT,用真實的胸部 X 線片做輸入,只用合成報告來訓練。圖 3 結(jié)果說明即使有真實的圖像,模型也會出現(xiàn)嚴重的退化,報告的唯一性從原來的 96.2% 下降到現(xiàn)在的 0.9%,詞匯量從原來的 8186 個減少到現(xiàn)在的 94 個,減少了 98.9%。

更危險的是虛假的安心率急劇上升,當存在危及生命危險的病理情況時,「無急性發(fā)現(xiàn)」的錯誤比例從原來的 13.3% 上升到現(xiàn)在的 40.3%,但是模型本身的置信度很高,因此模型具有臨床危險性的結(jié)果,不能滿足患者的診療需求。



圖 4 人工智能生成的數(shù)據(jù)污染給醫(yī)學圖像合成造成的視覺質(zhì)量下降、病理表征失真和人口統(tǒng)計學偏差變大

醫(yī)學圖像合成:

出現(xiàn)質(zhì)量退化、偏見放大、弱勢人群代表性缺失

除此之外,人工智能生成的合成醫(yī)學影像也越來越廣泛地被用來進行研究、產(chǎn)品研發(fā)等,用以擴充訓練數(shù)據(jù)集、實現(xiàn)隱私保護型的數(shù)據(jù)共享。但是當這些合成影像被用來訓練后續(xù)的人工智能模型的時候,生成出來的影像很難體現(xiàn)真實患者人群的多樣性,為了探究影像生成會不會出現(xiàn)和文本模型一樣的退化模式,研究團隊在多輪自我訓練循環(huán)中,用胸部 X 光片來訓練人工智能影像生成模型。從實驗結(jié)果(圖 4)可知,由于人工智能合成的數(shù)據(jù)污染而產(chǎn)生的視覺退化、病理表征扭曲以及人口統(tǒng)計學偏倚等都會被加重。

納入醫(yī)生評估環(huán)節(jié),

提出三種策略解決 AI 生成困境

為了評價研究結(jié)果的臨床相關(guān)性,對人工智能生成出來的輸出做了結(jié)構(gòu)化的審查和編輯,并且加入了醫(yī)師評價的過程證實臨床效用的退化。另外,研究團隊對三種應對 AI 數(shù)據(jù)污染導致模型退化的策略進行了系統(tǒng)的驗證,分別為真實數(shù)據(jù)混合訓練為基本方案,當真實數(shù)據(jù)占比達到 75% 時,可以較好地保持病理的多樣性、語言的保真度,從而有效地減少人口統(tǒng)計學偏差;質(zhì)量感知過濾是在有限真實數(shù)據(jù)的基礎(chǔ)上提高利用效率的一種方式,可以作為增效補充,但是不能代替高比例真實數(shù)據(jù)的作用;單純擴增合成數(shù)據(jù)不僅無效,還會加快模型退化、加重性別偏見,數(shù)據(jù)數(shù)量不能彌補質(zhì)量缺陷。

結(jié)論與展望

研究團隊認為應該把數(shù)據(jù)溯源作為醫(yī)療 AI 部署的政策強制要求,實行強制的人工檢驗制度。僅僅依靠自愿監(jiān)督是不夠的,隨著臨床 AI 應用規(guī)模的擴大,嚴格的機械驗證的經(jīng)濟可行性會越來越低,如果沒有制度性的限制,醫(yī)療系統(tǒng)就會存在污染未來患者數(shù)字生理數(shù)據(jù)的風險。如果缺少政策強制的溯源機制,那么生成式 AI 部署后就會影響到它本身的醫(yī)療數(shù)據(jù)生態(tài)系統(tǒng),進而引發(fā)安全問題。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
玄學提醒:如果一個人還在穿著10年前的衣服,只說明3個問題

玄學提醒:如果一個人還在穿著10年前的衣服,只說明3個問題

洞讀君
2026-03-04 14:30:12
伊朗戰(zhàn)爭還將持續(xù)多久?據(jù)傳特朗普希望4-6周內(nèi)終結(jié)戰(zhàn)事

伊朗戰(zhàn)爭還將持續(xù)多久?據(jù)傳特朗普希望4-6周內(nèi)終結(jié)戰(zhàn)事

財聯(lián)社
2026-03-26 18:29:05
日本不再歡迎中國人?3月起日本簽證“一刀切”,華人進退兩難!

日本不再歡迎中國人?3月起日本簽證“一刀切”,華人進退兩難!

有范又有料
2026-03-25 14:08:39
奇瑞回應48%熱效率爭議,順帶下戰(zhàn)書:定會做成,油耗低至1L

奇瑞回應48%熱效率爭議,順帶下戰(zhàn)書:定會做成,油耗低至1L

明鏡pro
2026-03-26 09:22:44
京東外賣虧了466億,但劉強東笑了

京東外賣虧了466億,但劉強東笑了

新浪財經(jīng)
2026-03-25 10:04:53
男演員千萬別整容!看看28歲張凌赫和29歲陳哲遠,瞬間就明白了

男演員千萬別整容!看看28歲張凌赫和29歲陳哲遠,瞬間就明白了

小貓追劇
2026-03-26 22:14:05
蔡正元即將入獄,國臺辦做出回應,內(nèi)容不尋常,已看透他的真面目

蔡正元即將入獄,國臺辦做出回應,內(nèi)容不尋常,已看透他的真面目

墜入二次元的海洋
2026-03-26 16:00:05
隨著雷霆12連勝被終結(jié),湖人137-130,西部最新排名出爐!馬刺第2

隨著雷霆12連勝被終結(jié),湖人137-130,西部最新排名出爐!馬刺第2

薇說體育
2026-03-26 10:48:02
張雪峰的病,速效救心丸能救嗎?

張雪峰的病,速效救心丸能救嗎?

中國新聞周刊
2026-03-25 16:23:30
女司機踏寶馬引擎蓋后續(xù)!真相曝光車主身份被扒,難怪女方暴怒

女司機踏寶馬引擎蓋后續(xù)!真相曝光車主身份被扒,難怪女方暴怒

阿纂看事
2026-03-26 16:20:25
狂賺18億!比愛馬仕還狠的運動奢侈品,正在掏空中產(chǎn)的錢包

狂賺18億!比愛馬仕還狠的運動奢侈品,正在掏空中產(chǎn)的錢包

青眼財經(jīng)
2026-03-17 16:03:09
20億美元還不夠!中企對巴拿馬索賠漲價,巴政府內(nèi)部已經(jīng)亂套了

20億美元還不夠!中企對巴拿馬索賠漲價,巴政府內(nèi)部已經(jīng)亂套了

悄悄史話
2026-03-26 14:09:05
很多被奉為經(jīng)典的古文,很難說有多少教育意義

很多被奉為經(jīng)典的古文,很難說有多少教育意義

小院之觀
2026-03-24 08:30:13
別再說微胖的女生穿緊身牛仔褲顯胖了!這身材誰看了不迷糊

別再說微胖的女生穿緊身牛仔褲顯胖了!這身材誰看了不迷糊

牛彈琴123456
2026-03-22 13:59:13
穩(wěn)居西部第二!馬刺三大年輕核心,已成聯(lián)盟無解難題!

穩(wěn)居西部第二!馬刺三大年輕核心,已成聯(lián)盟無解難題!

田先生籃球
2026-03-26 14:23:29
中國公布喜訊

中國公布喜訊

楊興文
2026-03-26 21:08:26
原來他12年前就已離世!患病3年女兒不愿照看,死后為爭遺產(chǎn)現(xiàn)身

原來他12年前就已離世!患病3年女兒不愿照看,死后為爭遺產(chǎn)現(xiàn)身

白面書誏
2026-03-26 13:38:18
碘伏再次成為關(guān)注對象!醫(yī)生發(fā)現(xiàn):使用碘伏,千萬多留意這幾點

碘伏再次成為關(guān)注對象!醫(yī)生發(fā)現(xiàn):使用碘伏,千萬多留意這幾點

39健康網(wǎng)
2026-03-25 16:00:38
森林狼逆火箭:申京努力了,然而杜蘭特啊

森林狼逆火箭:申京努力了,然而杜蘭特啊

張佳瑋寫字的地方
2026-03-26 13:03:18
何超瓊沒想到,倒貼14億嫁東北小伙的何超盈,如今竟給她狠狠長臉

何超瓊沒想到,倒貼14億嫁東北小伙的何超盈,如今竟給她狠狠長臉

往史過眼云煙
2026-03-26 20:33:55
2026-03-26 23:40:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12608文章數(shù) 142594關(guān)注度
往期回顧 全部

科技要聞

美團發(fā)布外賣大戰(zhàn)后成績單:虧損超200億

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財經(jīng)要聞

油價"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

數(shù)碼
手機
親子
房產(chǎn)
公開課

數(shù)碼要聞

英特爾發(fā)Q1.26版Arc Pro專業(yè)顯卡驅(qū)動,支持B70 / B65顯卡

手機要聞

OPPO K15 Pro 系列定檔,嵐影呼吸燈搭配金屬中框

親子要聞

看看把孩子嚇得哈哈哈

房產(chǎn)要聞

突發(fā),三亞又有大批征遷補償方案出爐!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版