国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

當(dāng)大模型遇見醫(yī)學(xué)推理:香港理工大學(xué)等發(fā)布AI醫(yī)學(xué)推理綜述

0
分享至



作者 | 論文團(tuán)隊

編輯 | ScienceAI

在臨床工作中,醫(yī)生每天都要面對復(fù)雜的推理過程:從病人主訴、化驗數(shù)據(jù)、影像學(xué)檢查,到診斷、治療方案和隨訪決策。

但這些過程不僅繁瑣,還充滿不確定性。能否讓人工智能來幫忙?

近年來,大型語言模型(LLMs)在醫(yī)療健康領(lǐng)域展現(xiàn)出前所未有的潛力。它們能讀懂病歷、生成診斷意見,甚至和患者對話。但要真正成為臨床的「智慧助手」,LLMs 需要的不僅是語言能力,更是醫(yī)學(xué)推理能力。

最近,一項由香港理工大學(xué)的研究者主導(dǎo)完成的綜述 ——《Aligning Clinical Needs and AI Capabilities: A Survey on LLMs for Medical Reasoning》,首次系統(tǒng)梳理了醫(yī)學(xué)推理的全景圖:需求、方法、數(shù)據(jù)、挑戰(zhàn)與未來方向。



論文鏈接:https://www.techrxiv.org/users/966100/articles/1334596-aligning-clinical-needs-and-ai-capabilities-a-survey-on-llms-for-medical-reasoning

Github鏈接(整理的現(xiàn)有的工作,更新中,歡迎補(bǔ)充):https://github.com/pqpq17/Awesome-LLM-Reasoning-on-Medicine

五級醫(yī)學(xué)推理能力框架



該綜述基于 Miller’s Pyramid(米勒金字塔),提出了五級醫(yī)學(xué)推理能力分層體系:

  • Level 1:醫(yī)學(xué)知識識別與標(biāo)準(zhǔn)化(Knows)
  • Level 2:信息分類與初步分診(Knows How)
  • Level 3:因果推理與綜合診斷(Shows How)
  • Level 4:臨床決策支持與個性化推薦(Shows How / Does)
  • Level 5:動態(tài)交互與復(fù)雜場景管理(Does)

這個框架清晰描繪了 LLM 從「會認(rèn)知識」到「能當(dāng)助手」的進(jìn)階路徑,對現(xiàn)有benchmark/dataset的做出了清晰的劃分。

此外,基于這個五級分類體系以及Reasoning類型的討論,該綜述明確指出一個雙視角(即computational & clinical)的對齊框架。

首個標(biāo)準(zhǔn)化五級基準(zhǔn)數(shù)據(jù)集



該綜述構(gòu)建了一個包含 5,000 條標(biāo)注樣本的基準(zhǔn)數(shù)據(jù)集,覆蓋五個層次的能力要求,并首次系統(tǒng)評測了 18 個代表性模型。

結(jié)果顯示:

  • ??颇P?→ 在診斷類任務(wù)上更突出
  • 通用大模型 → 在決策支持、對話和總結(jié)上表現(xiàn)更佳

這為未來的模型選擇和任務(wù)分工提供了實證依據(jù)。

前沿方法全景回顧



該綜述全面回顧了醫(yī)學(xué) LLM 中的主流推理范式:

  • 鏈?zhǔn)酵评恚–oT):逐步解釋,思路清晰
  • 長鏈推理(Long-CoT):更深入的逐步分析,包含自我修正
  • 檢索增強(qiáng)推理(RAG):結(jié)合醫(yī)學(xué)文獻(xiàn)和知識庫
  • 多模態(tài)推理:同時理解病歷、影像和文本
  • 智能體推理(Agentic Reasoning):主動規(guī)劃、調(diào)用外部工具、動態(tài)決策

同時,也直面四大挑戰(zhàn):

  • 高質(zhì)量醫(yī)學(xué)數(shù)據(jù)不足
  • 「幻覺」問題仍然存在
  • 缺乏證據(jù)溯源與臨床可解釋性
  • 模型結(jié)果不確定性難以控制

社會意義

這項工作不僅僅是綜述,更是一種「對齊」的嘗試:

  • 對齊臨床需求:明確醫(yī)生真正需要的推理能力
  • 對齊 AI 能力:梳理當(dāng)前模型能做什么、還欠缺什么
  • 對齊未來方向:為科研、產(chǎn)業(yè)和醫(yī)療實踐提供參考

研究團(tuán)隊希望這項工作能推動醫(yī)學(xué)大模型真正落地臨床,從「實驗室里的聰明模型」變成「病房里的可靠助手」。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
微信聊天遭老板監(jiān)視,殺毒軟件“失明”,員工隱私被系統(tǒng)性采集!軟件商公開售賣“監(jiān)控神器”,稱已服務(wù)多家企業(yè)

微信聊天遭老板監(jiān)視,殺毒軟件“失明”,員工隱私被系統(tǒng)性采集!軟件商公開售賣“監(jiān)控神器”,稱已服務(wù)多家企業(yè)

每日經(jīng)濟(jì)新聞
2025-12-24 20:24:06
15歲女兒遭同班14歲男生殺害,父親講述煎熬:5個月來借酒澆愁最多一天喝2斤

15歲女兒遭同班14歲男生殺害,父親講述煎熬:5個月來借酒澆愁最多一天喝2斤

大風(fēng)新聞
2025-12-24 20:58:04
鬧大了!中J某局的員工在網(wǎng)上掀桌子了!

鬧大了!中J某局的員工在網(wǎng)上掀桌子了!

黯泉
2025-12-24 20:53:06
內(nèi)政上各種無敵,外交上基本無力

內(nèi)政上各種無敵,外交上基本無力

我是歷史其實挺有趣
2025-12-24 14:57:52
福建艦上唯一能用明火的地方披露:理療室,艦員稱“針灸項目相當(dāng)火爆,一針難求”

福建艦上唯一能用明火的地方披露:理療室,艦員稱“針灸項目相當(dāng)火爆,一針難求”

極目新聞
2025-12-24 22:24:20
離譜!楊書記為何敢直接拿走博物館的瓷花瓶?

離譜!楊書記為何敢直接拿走博物館的瓷花瓶?

仕道
2025-12-22 09:20:15
徐湖平跑不了!收藏家顏明:江南春剛調(diào)撥出去,隔天就被陸挺買走

徐湖平跑不了!收藏家顏明:江南春剛調(diào)撥出去,隔天就被陸挺買走

知法而形
2025-12-23 17:56:52
老同志借而不還的畫,現(xiàn)估價8800萬現(xiàn)身拍賣會這個老東西究竟是誰

老同志借而不還的畫,現(xiàn)估價8800萬現(xiàn)身拍賣會這個老東西究竟是誰

深度報
2025-12-22 22:36:02
南博事件發(fā)酵!吳家哭訴,和龐家同病相憐,我們家捐的文物也丟了

南博事件發(fā)酵!吳家哭訴,和龐家同病相憐,我們家捐的文物也丟了

火山詩話
2025-12-24 17:35:41
皇帝的功績,與我何干?

皇帝的功績,與我何干?

柴差說
2025-12-24 18:34:03
徐湖平家中字畫的高清版,被網(wǎng)友們找到了!

徐湖平家中字畫的高清版,被網(wǎng)友們找到了!

麥杰遜
2025-12-24 12:06:49
三刷電影《長津湖》:它在提醒我們平安從何而來

三刷電影《長津湖》:它在提醒我們平安從何而來

白羽居士
2025-12-24 19:10:15
首批中國游客赴俄遭“天價宰殺”落地即“失聯(lián)”支付系統(tǒng)全面失靈

首批中國游客赴俄遭“天價宰殺”落地即“失聯(lián)”支付系統(tǒng)全面失靈

深度報
2025-12-23 22:47:10
澤連斯基公布20點“和平計劃”草案細(xì)節(jié):領(lǐng)土“維持現(xiàn)狀”,軍隊保持80萬人,盡快選舉!“不放棄加入北約”

澤連斯基公布20點“和平計劃”草案細(xì)節(jié):領(lǐng)土“維持現(xiàn)狀”,軍隊保持80萬人,盡快選舉!“不放棄加入北約”

魯中晨報
2025-12-25 07:21:08
尷尬!龐叔令稱央視《文明之旅》出現(xiàn)的龐戎,與南潯虛齋龐氏無關(guān)

尷尬!龐叔令稱央視《文明之旅》出現(xiàn)的龐戎,與南潯虛齋龐氏無關(guān)

火山詩話
2025-12-24 15:32:49
特朗普下令,真正的較量開始,美國選好主戰(zhàn)場,要與中國一決高下

特朗普下令,真正的較量開始,美國選好主戰(zhàn)場,要與中國一決高下

空天力量
2025-12-24 17:06:37
曝徐湖平已被帶走,前一天晚開了一夜燈,更多謊言被戳穿

曝徐湖平已被帶走,前一天晚開了一夜燈,更多謊言被戳穿

古希臘掌管松餅的神
2025-12-24 13:29:23
85后韓國財閥千金,在柬埔寨被捕!她被曝為電詐園區(qū)洗錢、招攬性交易和販毒,曾多次因吸毒被判刑

85后韓國財閥千金,在柬埔寨被捕!她被曝為電詐園區(qū)洗錢、招攬性交易和販毒,曾多次因吸毒被判刑

每日經(jīng)濟(jì)新聞
2025-12-24 17:22:08
高市早苗支持率居高不下!高達(dá)75.9%,年輕人支持率突破92%

高市早苗支持率居高不下!高達(dá)75.9%,年輕人支持率突破92%

環(huán)球熱點快評
2025-12-24 14:13:34
園長開車送幼兒回家,汽車墜入池塘8人遇難

園長開車送幼兒回家,汽車墜入池塘8人遇難

新京報
2025-12-24 19:44:13
2025-12-25 08:32:49
ScienceAI incentive-icons
ScienceAI
關(guān)注人工智能與其他前沿技術(shù)
1189文章數(shù) 222關(guān)注度
往期回顧 全部

科技要聞

老板監(jiān)視員工微信只需300元

頭條要聞

中美安理會激烈交鋒 委內(nèi)瑞拉:撕破美國假面

頭條要聞

中美安理會激烈交鋒 委內(nèi)瑞拉:撕破美國假面

體育要聞

26歲廣西球王,在質(zhì)疑聲中成為本土得分王

娛樂要聞

懷孕增重30斤!闞清子驚傳誕一女夭折?

財經(jīng)要聞

北京進(jìn)一步放松限購 滬深是否會跟進(jìn)?

汽車要聞

“運動版庫里南”一月份亮相???或命名極氪9S

態(tài)度原創(chuàng)

數(shù)碼
家居
時尚
公開課
軍事航空

數(shù)碼要聞

AMD Zen 6與Intel Nova Lake或?qū)⑸涎?88 MB 3D緩存“大戰(zhàn)”

家居要聞

法式大平層 智能家居添彩

對不起周柯宇,是陳靖可先來的

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

澤連斯基版“和平計劃”透露哪些信息

無障礙瀏覽 進(jìn)入關(guān)懷版