国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

哈佛Science重磅:AI急診診斷準(zhǔn)確率67%,超越資深主治!取代醫(yī)生尚早

0
分享至


新智元報道

編輯:犀牛 所羅門

【新智元導(dǎo)讀】哈佛研究登上Science:在76名真實(shí)急診患者的雙盲對決中,OpenAI o1診斷準(zhǔn)確率67%碾壓人類醫(yī)生的50%,治療方案得分89%對34%更是斷崖式領(lǐng)先——但AI還看不見患者的臉色和痛苦,真正的變革不是「AI贏了」,而是急診室正在走向「醫(yī)生×患者×AI」三方共治的新范式。

剛剛,一顆重磅炸彈砸進(jìn)了全球醫(yī)療圈。

哈佛大學(xué)醫(yī)學(xué)院聯(lián)合貝斯以色列女執(zhí)事醫(yī)療中心(Beth Israel Deaconess Medical Center),把一項(xiàng)令人坐立不安的研究結(jié)果發(fā)在了《Science》上。


在急診室的真實(shí)分診場景中,OpenAI的o1推理模型診斷準(zhǔn)確率達(dá)到67%,而兩位經(jīng)驗(yàn)豐富的內(nèi)科主治醫(yī)生,一個55%,一個50%。

AI贏了。

不是在做題,不是在考試,而是在真刀真槍的急診室里。


更扎心的數(shù)據(jù)還在后面——在制定治療管理方案的測試中,o1拿了89%,而人類醫(yī)生使用傳統(tǒng)資源輔助后,中位數(shù)只有34%。


差距不是一星半點(diǎn),是兩倍多。

這不是一個AI公司的自賣自夸,這是哈佛醫(yī)學(xué)院牽頭、頂級學(xué)術(shù)期刊背書、雙盲評審確認(rèn)的結(jié)果。

研究論文的通訊作者、哈佛醫(yī)學(xué)院AI實(shí)驗(yàn)室負(fù)責(zé)人Arjun Manrai說了一句意味深長的話:「我們用幾乎所有基準(zhǔn)測試了這個AI模型,它超越了此前所有模型和醫(yī)生基線!


一個時代的裂縫,就這么被撕開了。

76個真實(shí)患者,零預(yù)處理,雙盲對決

這項(xiàng)研究最硬核的地方在于:它不是拿精心整理的教科書病例去考AI,而是直接把急診室里最原始、最混亂的電子病歷扔給了機(jī)器。

研究團(tuán)隊(duì)從貝斯以色列急診科隨機(jī)選取了76名真實(shí)患者,在三個關(guān)鍵診斷節(jié)點(diǎn)進(jìn)行對比——急診分診(患者剛進(jìn)門)、急診醫(yī)生首次接診、以及收治入院或進(jìn)ICU。

每個節(jié)點(diǎn),兩位內(nèi)科主治醫(yī)生和OpenAI的o1、4o模型同時給出鑒別診斷,每方最多列5個可能診斷。

關(guān)鍵細(xì)節(jié)是:研究人員對數(shù)據(jù)零預(yù)處理。

論文明確寫道,AI模型接收到的信息和醫(yī)生看到的電子病歷完全一致——那些凌亂的、缺失的、充滿噪聲的真實(shí)臨床數(shù)據(jù)。


然后,由另外兩名主治醫(yī)生進(jìn)行「盲評」——他們不知道哪個診斷來自人類、哪個來自AI。

盲評結(jié)果顯示,評審醫(yī)生幾乎完全無法分辨診斷來源:一位醫(yī)生猜對AI/人類的準(zhǔn)確率僅15.2%(83.6%的時候選了「分不清」),另一位更夸張,只有3.1%(94.4%「分不清」)。

換句話說,AI寫的診斷,連資深醫(yī)生都看不出是機(jī)器生成的。

在這樣的嚴(yán)苛條件下,o1模型在急診分診階段——信息最少、時間最緊、決策最關(guān)鍵的環(huán)節(jié)——給出了67.1%的準(zhǔn)確率(包含精確診斷或非常接近的診斷)。

兩位人類醫(yī)生分別是55.3%和50.0%。


隨著信息逐漸增多,所有人的表現(xiàn)都在提升:到入院階段,o1準(zhǔn)確率升至81.6%,醫(yī)生分別為78.9%和69.7%。

但差距始終存在,而且在信息最匱乏的初始階段差距最大。

這恰恰是最可怕的發(fā)現(xiàn)——急診最要命的就是「前幾分鐘」,患者剛被推進(jìn)來,信息碎片化,生死攸關(guān),醫(yī)生需要在極度不確定中做出判斷。

而恰恰在這個環(huán)節(jié),AI表現(xiàn)最突出。

急診醫(yī)生不干了:拿內(nèi)科醫(yī)生跟AI比,能說明什么?

論文發(fā)布后,一位名叫Kristen Panthagani的急診科醫(yī)生在社交媒體上直接開懟:這是一個「被過度炒作的有趣研究」。

她的核心質(zhì)疑是:研究中和AI對比的是內(nèi)科主治醫(yī)生,不是急診科醫(yī)生。

「如果我們要拿AI和醫(yī)生的臨床能力做比較,至少應(yīng)該拿同一個?频尼t(yī)生來比。我不會驚訝于一個大語言模型能在神經(jīng)外科的?瓶荚囍写驍∑つw科醫(yī)生,但這并不能說明什么!


她還指出了急診醫(yī)學(xué)的本質(zhì)邏輯:「作為一名第一次看到患者的急診醫(yī)生,我的首要目標(biāo)不是猜出最終診斷。我的首要目標(biāo)是判斷你是否有一種可能會殺死你的疾病!

這個反駁有力量嗎?

有。但也需要注意,研究論文本身已經(jīng)承認(rèn)了這一局限性,而且論文的核心論點(diǎn)從來不是「AI可以替代急診醫(yī)生」,而是「AI在有限信息下的推理能力已經(jīng)達(dá)到值得臨床試驗(yàn)的水平」。

急診醫(yī)生在現(xiàn)場做的遠(yuǎn)不止「猜病名」——他們要看患者的面色、聽呼吸的聲音、感受疼痛的程度、判斷生命體征的微妙變化。

這些細(xì)微的非語言信號,有時候比任何檢驗(yàn)指標(biāo)都重要。

一個經(jīng)驗(yàn)豐富的急診醫(yī)生走進(jìn)病房,掃一眼患者,可能就已經(jīng)做出了80%的判斷——這種能力叫「臨床直覺」(clinical gestalt),它來自數(shù)以萬計的真實(shí)接診經(jīng)驗(yàn),目前沒有任何AI能夠復(fù)制。

Manrai自己也承認(rèn),團(tuán)隊(duì)正在研究AI處理影像和其他非文本信號的能力,「看到了快速進(jìn)步的結(jié)果」,但距離臨床部署還有很長的路。

辛頓的「預(yù)言」教訓(xùn):放射科醫(yī)生沒下崗,反而更忙了

說到AI取代醫(yī)生這個話題,不得不提一個經(jīng)典的「打臉」案例。

2016年,AI教父、諾貝爾獎得主Geoffrey Hinton說了一句震動醫(yī)學(xué)界的話:人們現(xiàn)在就應(yīng)該停止培訓(xùn)放射科醫(yī)生了。深度學(xué)習(xí)在五年內(nèi)就會比放射科醫(yī)生做得更好,這完全是顯而易見的。


這句話當(dāng)時嚇退了不少準(zhǔn)備選擇放射科的醫(yī)學(xué)生。整個2010年代后期,媒體上鋪天蓋地都是「放射科即將消亡」的文章。

十年過去了。

梅奧診所的放射科醫(yī)生團(tuán)隊(duì)從2016年至今增長了55%,達(dá)到400人。美國放射學(xué)會預(yù)測,未來30年放射科醫(yī)生供給還將增長26%。

全球最大的放射科醫(yī)生短缺正在發(fā)生——不是因?yàn)锳I搶走了工作,而是因?yàn)锳I讓影像檢查變得更便捷,反而催生了更多需求。

Hinton本人后來也承認(rèn)自己「說得太寬泛了」。

他修正了預(yù)測:未來的醫(yī)學(xué)影像解讀將由「AI和放射科醫(yī)生的組合」來完成,AI會讓放射科醫(yī)生「效率大大提高,同時提升準(zhǔn)確率」。

這個故事里有一個深刻的經(jīng)濟(jì)學(xué)原理——杰文斯悖論:當(dāng)一項(xiàng)技術(shù)讓某種資源的使用更高效時,這種資源的總需求反而可能大幅增加。

影像診斷變便宜、變快了,于是醫(yī)生開了更多檢查,放射科醫(yī)生反而更忙了。

哈佛這項(xiàng)新研究的作者們顯然吸取了辛頓的教訓(xùn)。

論文通訊作者M(jìn)anrai在新聞發(fā)布會上明確說:「我們的發(fā)現(xiàn)并不意味著AI取代醫(yī)生,盡管有些賣AI醫(yī)療產(chǎn)品的公司可能會這么說!

共同通訊作者、貝斯以色列AI項(xiàng)目負(fù)責(zé)人Adam Rodman則更直白:「目前AI診斷沒有任何正式的問責(zé)框架;颊呦胍氖侨藖硪龑(dǎo)他們度過生死攸關(guān)的決策,引導(dǎo)他們面對艱難的治療選擇!

不是「AI贏了」

而是醫(yī)療決策權(quán)在重組

據(jù)美國醫(yī)學(xué)會(AMA)2026年調(diào)查,超過80%的美國醫(yī)生已經(jīng)在職業(yè)中使用AI——是2023年的兩倍。

17%的醫(yī)生使用AI進(jìn)行「輔助診斷」。

2025年的一項(xiàng)Elsevier研究發(fā)現(xiàn),20%的臨床醫(yī)生已經(jīng)在向大語言模型尋求「第二意見」。

哈佛這項(xiàng)研究證明,AI在信息最匱乏、決策最緊迫的急診場景中,推理能力已經(jīng)超過了人類醫(yī)生。

三個數(shù)據(jù)疊加在一起,指向一個清晰的趨勢:醫(yī)療決策的權(quán)力結(jié)構(gòu)正在發(fā)生根本性的重組。

過去的急診室模式是:患者進(jìn)來→醫(yī)生判斷→做出決策。

未來的模式可能變成:患者進(jìn)來→AI快速掃描電子病歷給出初步判斷→醫(yī)生結(jié)合臨床觀察和AI建議做出決策→患者參與討論治療方案。

研究作者Rodman預(yù)測,未來會出現(xiàn)三種分化:一部分任務(wù)人類持續(xù)做得更好,一部分任務(wù)AI持續(xù)做得更好,還有一部分任務(wù)需要人機(jī)協(xié)作增強(qiáng)。

這就是研究者所說的「醫(yī)生-患者-AI」三方協(xié)作模式。

聽起來很像自動駕駛。

L2級別——AI輔助人類決策;L3級別——AI主導(dǎo)、人類監(jiān)督;L4級別——特定場景全自動。

目前AI在醫(yī)療領(lǐng)域大概處在L2到L3之間的階段:它已經(jīng)能在「文字世界」里給出超越人類的判斷,但在真實(shí)的、多模態(tài)的臨床場景中,它還需要人類的眼睛、耳朵和直覺來補(bǔ)位。

AI誤診了,誰負(fù)責(zé)?

在所有討論中,有一個房間里的大象無人敢正面觸碰:AI出錯了,誰來承擔(dān)責(zé)任?

Rodman在接受《衛(wèi)報》采訪時坦言:目前AI診斷沒有任何正式的問責(zé)框架。

如果一名醫(yī)生誤診了,有成熟的醫(yī)療糾紛處理體系——患者可以投訴、可以訴訟、醫(yī)生面臨執(zhí)照風(fēng)險。

但如果AI給出了錯誤建議,醫(yī)生采納了,患者受到了傷害——是算醫(yī)生的責(zé)任?AI公司的責(zé)任?醫(yī)院的責(zé)任?還是三方共擔(dān)?

更復(fù)雜的場景是:如果AI給出了正確建議,但醫(yī)生否決了AI的判斷、堅持自己的錯誤診斷,導(dǎo)致患者延誤治療——此時醫(yī)生要不要為「忽視A建議」承擔(dān)額外責(zé)任?

還有一個更隱蔽的風(fēng)險:過度依賴。

當(dāng)醫(yī)生習(xí)慣了AI給出的高準(zhǔn)確率判斷,他們的獨(dú)立思考能力會不會退化?就像GPS讓很多人喪失了自主導(dǎo)航能力一樣,AI輔助診斷是否會讓醫(yī)生的臨床推理「肌肉」逐漸萎縮?

這些問題,目前沒有任何國家有清晰的答案。

參考資料:

https://www.science.org/doi/10.1126/science.adz4433

https://www.harvardmagazine.com/ai/ai-outperforms-doctors-diagnosis-harvard-study

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
這跟不穿有啥區(qū)別?內(nèi)褲外露、開叉開到腰,有錢人的時尚真看不懂

這跟不穿有啥區(qū)別?內(nèi)褲外露、開叉開到腰,有錢人的時尚真看不懂

潮鹿逐夢
2026-03-02 17:19:02
新月補(bǔ)賽2-1逆轉(zhuǎn)!開賽31輪不敗 C羅沙特首冠告急 剩3輪僅領(lǐng)先2分

新月補(bǔ)賽2-1逆轉(zhuǎn)!開賽31輪不敗 C羅沙特首冠告急 剩3輪僅領(lǐng)先2分

我愛英超
2026-05-06 04:43:58
蔡一杰腦癌擴(kuò)散!59歲頻繁回內(nèi)地農(nóng)村老家,重溫童年時光

蔡一杰腦癌擴(kuò)散!59歲頻繁回內(nèi)地農(nóng)村老家,重溫童年時光

原夢叁生
2026-04-30 08:10:48
我去相親說月薪1萬,卻被女人直接貶低,5天后她面試推開門時懵了

我去相親說月薪1萬,卻被女人直接貶低,5天后她面試推開門時懵了

白云故事
2025-04-18 05:30:04
政府200億挽留失敗,ASML光刻機(jī)巨頭堅持遷離荷蘭

政府200億挽留失敗,ASML光刻機(jī)巨頭堅持遷離荷蘭

璀璨明星
2026-05-04 01:00:04
躺平網(wǎng)吧惹爭議,6毛一小時,10元飯管飽,有人直接待了一年

躺平網(wǎng)吧惹爭議,6毛一小時,10元飯管飽,有人直接待了一年

映射生活的身影
2026-05-03 20:10:56
阿森納1-0馬競,時隔20年再進(jìn)歐冠決賽太解氣

阿森納1-0馬競,時隔20年再進(jìn)歐冠決賽太解氣

軍武英雄
2026-05-06 09:13:04
賴清德“偷渡”非洲行程結(jié)束,回程方式依舊奇葩!鄭麗文一語點(diǎn)破

賴清德“偷渡”非洲行程結(jié)束,回程方式依舊奇葩!鄭麗文一語點(diǎn)破

觀星賞月
2026-05-06 08:09:59
實(shí)話很傷人!雷迪克:火箭的最高防守強(qiáng)度,僅僅只是雷霆的下限

實(shí)話很傷人!雷迪克:火箭的最高防守強(qiáng)度,僅僅只是雷霆的下限

移動擋拆
2026-05-06 07:07:34
季后賽場均14+6!博伊爾斯這個新秀值得期待!而他的女友同樣搶鏡!

季后賽場均14+6!博伊爾斯這個新秀值得期待!而他的女友同樣搶鏡!

籃球大圖
2026-05-05 11:26:52
由豆包付費(fèi)想到,AI到底會長成一門什么生意

由豆包付費(fèi)想到,AI到底會長成一門什么生意

鈦媒體APP
2026-05-05 17:33:14
謝幕!5月2日,吳京《鏢人》8萬,張藝謀《驚蟄》4萬,下映吧!

謝幕!5月2日,吳京《鏢人》8萬,張藝謀《驚蟄》4萬,下映吧!

另子維愛讀史
2026-05-03 10:34:35
隨著C羅爭冠最大勁敵2-1逆轉(zhuǎn),沙特聯(lián)最新積分榜出爐:爭冠白熱化

隨著C羅爭冠最大勁敵2-1逆轉(zhuǎn),沙特聯(lián)最新積分榜出爐:爭冠白熱化

側(cè)身凌空斬
2026-05-06 04:02:38
中國選手吳宜澤奪冠,破紀(jì)錄獲693萬豪華獎金

中國選手吳宜澤奪冠,破紀(jì)錄獲693萬豪華獎金

余憁搞笑段子
2026-05-05 10:37:20
獎金470萬!22歲吳宜澤世錦賽奪冠創(chuàng)5大紀(jì)錄:身披國旗與父母慶祝

獎金470萬!22歲吳宜澤世錦賽奪冠創(chuàng)5大紀(jì)錄:身披國旗與父母慶祝

李喜林籃球絕殺
2026-05-05 09:18:25
亮劍中趙剛死前透露:李云龍當(dāng)年不顧降職也要斬山貓子是另有原因

亮劍中趙剛死前透露:李云龍當(dāng)年不顧降職也要斬山貓子是另有原因

呆子的故事
2026-02-09 14:19:33
"花30萬娶的新婚妻子,是KTV小姐”:一場騙局正在圍獵大齡男性......

"花30萬娶的新婚妻子,是KTV小姐”:一場騙局正在圍獵大齡男性......

脆皮先生
2026-05-05 19:37:13
白人女性與黑人女性的體味差異,網(wǎng)友真實(shí)分享引發(fā)熱議

白人女性與黑人女性的體味差異,網(wǎng)友真實(shí)分享引發(fā)熱議

特約前排觀眾
2025-12-22 00:20:06
沃爾科特:從沒見過酋長球場這般景象,或許阿森納能再邁一步

沃爾科特:從沒見過酋長球場這般景象,或許阿森納能再邁一步

懂球帝
2026-05-06 05:24:44
四川懸崖秋千慘。∮慰痛蠛皼]綁緊無人理,高空墜落不幸身亡

四川懸崖秋千慘!游客大喊沒綁緊無人理,高空墜落不幸身亡

天空空啊
2026-05-06 07:12:13
2026-05-06 09:43:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
15136文章數(shù) 66837關(guān)注度
往期回顧 全部

科技要聞

告別廢話文學(xué)與幻覺!GPT-5.5 Instant發(fā)布

頭條要聞

牛彈琴:高市終于下跪了 中韓等亞洲人內(nèi)心感到氣憤

頭條要聞

牛彈琴:高市終于下跪了 中韓等亞洲人內(nèi)心感到氣憤

體育要聞

全世界都等著看他笑話,他帶國米拿下冠軍

娛樂要聞

內(nèi)娛真情誼!楊紫為謝娜演唱會送花籃

財經(jīng)要聞

70億,保時捷把布加迪賣了

汽車要聞

同比大漲190% 方程豹4月銷量29138臺

態(tài)度原創(chuàng)

藝術(shù)
本地
時尚
數(shù)碼
軍事航空

藝術(shù)要聞

江青鄧穎超等四位女性罕見合影,書法風(fēng)格各異引關(guān)注!

本地新聞

用青花瓷的方式,打開西溪濕地

卷首語|這屆年輕人,全員渡劫奧德賽

數(shù)碼要聞

蘋果為AirPods Max 2耳機(jī)推送新固件,版本號8E258

軍事要聞

特朗普威脅伊朗不要向美國船開火

無障礙瀏覽 進(jìn)入關(guān)懷版