国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

哈佛Science重磅:AI急診診斷準(zhǔn)確率67%,超越資深主治!取代醫(yī)生尚早

0
分享至


新智元報(bào)道

編輯:犀牛 所羅門

【新智元導(dǎo)讀】哈佛研究登上Science:在76名真實(shí)急診患者的雙盲對(duì)決中,OpenAI o1診斷準(zhǔn)確率67%碾壓人類醫(yī)生的50%,治療方案得分89%對(duì)34%更是斷崖式領(lǐng)先——但AI還看不見患者的臉色和痛苦,真正的變革不是「AI贏了」,而是急診室正在走向「醫(yī)生×患者×AI」三方共治的新范式。

剛剛,一顆重磅炸彈砸進(jìn)了全球醫(yī)療圈。

哈佛大學(xué)醫(yī)學(xué)院聯(lián)合貝斯以色列女執(zhí)事醫(yī)療中心(Beth Israel Deaconess Medical Center),把一項(xiàng)令人坐立不安的研究結(jié)果發(fā)在了《Science》上。


在急診室的真實(shí)分診場(chǎng)景中,OpenAI的o1推理模型診斷準(zhǔn)確率達(dá)到67%,而兩位經(jīng)驗(yàn)豐富的內(nèi)科主治醫(yī)生,一個(gè)55%,一個(gè)50%。

AI贏了。

不是在做題,不是在考試,而是在真刀真槍的急診室里。


更扎心的數(shù)據(jù)還在后面——在制定治療管理方案的測(cè)試中,o1拿了89%,而人類醫(yī)生使用傳統(tǒng)資源輔助后,中位數(shù)只有34%。


差距不是一星半點(diǎn),是兩倍多。

這不是一個(gè)AI公司的自賣自夸,這是哈佛醫(yī)學(xué)院牽頭、頂級(jí)學(xué)術(shù)期刊背書、雙盲評(píng)審確認(rèn)的結(jié)果。

研究論文的通訊作者、哈佛醫(yī)學(xué)院AI實(shí)驗(yàn)室負(fù)責(zé)人Arjun Manrai說(shuō)了一句意味深長(zhǎng)的話:「我們用幾乎所有基準(zhǔn)測(cè)試了這個(gè)AI模型,它超越了此前所有模型和醫(yī)生基線?!?/p>


一個(gè)時(shí)代的裂縫,就這么被撕開了。

76個(gè)真實(shí)患者,零預(yù)處理,雙盲對(duì)決

這項(xiàng)研究最硬核的地方在于:它不是拿精心整理的教科書病例去考AI,而是直接把急診室里最原始、最混亂的電子病歷扔給了機(jī)器。

研究團(tuán)隊(duì)從貝斯以色列急診科隨機(jī)選取了76名真實(shí)患者,在三個(gè)關(guān)鍵診斷節(jié)點(diǎn)進(jìn)行對(duì)比——急診分診(患者剛進(jìn)門)、急診醫(yī)生首次接診、以及收治入院或進(jìn)ICU。

每個(gè)節(jié)點(diǎn),兩位內(nèi)科主治醫(yī)生和OpenAI的o1、4o模型同時(shí)給出鑒別診斷,每方最多列5個(gè)可能診斷。

關(guān)鍵細(xì)節(jié)是:研究人員對(duì)數(shù)據(jù)零預(yù)處理

論文明確寫道,AI模型接收到的信息和醫(yī)生看到的電子病歷完全一致——那些凌亂的、缺失的、充滿噪聲的真實(shí)臨床數(shù)據(jù)。


然后,由另外兩名主治醫(yī)生進(jìn)行「盲評(píng)」——他們不知道哪個(gè)診斷來(lái)自人類、哪個(gè)來(lái)自AI。

盲評(píng)結(jié)果顯示,評(píng)審醫(yī)生幾乎完全無(wú)法分辨診斷來(lái)源:一位醫(yī)生猜對(duì)AI/人類的準(zhǔn)確率僅15.2%(83.6%的時(shí)候選了「分不清」),另一位更夸張,只有3.1%(94.4%「分不清」)。

換句話說(shuō),AI寫的診斷,連資深醫(yī)生都看不出是機(jī)器生成的。

在這樣的嚴(yán)苛條件下,o1模型在急診分診階段——信息最少、時(shí)間最緊、決策最關(guān)鍵的環(huán)節(jié)——給出了67.1%的準(zhǔn)確率(包含精確診斷或非常接近的診斷)。

兩位人類醫(yī)生分別是55.3%和50.0%。


隨著信息逐漸增多,所有人的表現(xiàn)都在提升:到入院階段,o1準(zhǔn)確率升至81.6%,醫(yī)生分別為78.9%和69.7%。

但差距始終存在,而且在信息最匱乏的初始階段差距最大。

這恰恰是最可怕的發(fā)現(xiàn)——急診最要命的就是「前幾分鐘」,患者剛被推進(jìn)來(lái),信息碎片化,生死攸關(guān),醫(yī)生需要在極度不確定中做出判斷。

而恰恰在這個(gè)環(huán)節(jié),AI表現(xiàn)最突出。

急診醫(yī)生不干了:拿內(nèi)科醫(yī)生跟AI比,能說(shuō)明什么?

論文發(fā)布后,一位名叫Kristen Panthagani的急診科醫(yī)生在社交媒體上直接開懟:這是一個(gè)「被過(guò)度炒作的有趣研究」。

她的核心質(zhì)疑是:研究中和AI對(duì)比的是內(nèi)科主治醫(yī)生,不是急診科醫(yī)生。

「如果我們要拿AI和醫(yī)生的臨床能力做比較,至少應(yīng)該拿同一個(gè)專科的醫(yī)生來(lái)比。我不會(huì)驚訝于一個(gè)大語(yǔ)言模型能在神經(jīng)外科的專科考試中打敗皮膚科醫(yī)生,但這并不能說(shuō)明什么?!?/p>


她還指出了急診醫(yī)學(xué)的本質(zhì)邏輯:「作為一名第一次看到患者的急診醫(yī)生,我的首要目標(biāo)不是猜出最終診斷。我的首要目標(biāo)是判斷你是否有一種可能會(huì)殺死你的疾病。」

這個(gè)反駁有力量嗎?

有。但也需要注意,研究論文本身已經(jīng)承認(rèn)了這一局限性,而且論文的核心論點(diǎn)從來(lái)不是「AI可以替代急診醫(yī)生」,而是「AI在有限信息下的推理能力已經(jīng)達(dá)到值得臨床試驗(yàn)的水平」。

急診醫(yī)生在現(xiàn)場(chǎng)做的遠(yuǎn)不止「猜病名」——他們要看患者的面色、聽呼吸的聲音、感受疼痛的程度、判斷生命體征的微妙變化。

這些細(xì)微的非語(yǔ)言信號(hào),有時(shí)候比任何檢驗(yàn)指標(biāo)都重要。

一個(gè)經(jīng)驗(yàn)豐富的急診醫(yī)生走進(jìn)病房,掃一眼患者,可能就已經(jīng)做出了80%的判斷——這種能力叫「臨床直覺(jué)」(clinical gestalt),它來(lái)自數(shù)以萬(wàn)計(jì)的真實(shí)接診經(jīng)驗(yàn),目前沒(méi)有任何AI能夠復(fù)制。

Manrai自己也承認(rèn),團(tuán)隊(duì)正在研究AI處理影像和其他非文本信號(hào)的能力,「看到了快速進(jìn)步的結(jié)果」,但距離臨床部署還有很長(zhǎng)的路。

辛頓的「預(yù)言」教訓(xùn):放射科醫(yī)生沒(méi)下崗,反而更忙了

說(shuō)到AI取代醫(yī)生這個(gè)話題,不得不提一個(gè)經(jīng)典的「打臉」案例。

2016年,AI教父、諾貝爾獎(jiǎng)得主Geoffrey Hinton說(shuō)了一句震動(dòng)醫(yī)學(xué)界的話:人們現(xiàn)在就應(yīng)該停止培訓(xùn)放射科醫(yī)生了。深度學(xué)習(xí)在五年內(nèi)就會(huì)比放射科醫(yī)生做得更好,這完全是顯而易見的。


這句話當(dāng)時(shí)嚇退了不少準(zhǔn)備選擇放射科的醫(yī)學(xué)生。整個(gè)2010年代后期,媒體上鋪天蓋地都是「放射科即將消亡」的文章。

十年過(guò)去了。

梅奧診所的放射科醫(yī)生團(tuán)隊(duì)從2016年至今增長(zhǎng)了55%,達(dá)到400人。美國(guó)放射學(xué)會(huì)預(yù)測(cè),未來(lái)30年放射科醫(yī)生供給還將增長(zhǎng)26%。

全球最大的放射科醫(yī)生短缺正在發(fā)生——不是因?yàn)锳I搶走了工作,而是因?yàn)锳I讓影像檢查變得更便捷,反而催生了更多需求。

Hinton本人后來(lái)也承認(rèn)自己「說(shuō)得太寬泛了」。

他修正了預(yù)測(cè):未來(lái)的醫(yī)學(xué)影像解讀將由「AI和放射科醫(yī)生的組合」來(lái)完成,AI會(huì)讓放射科醫(yī)生「效率大大提高,同時(shí)提升準(zhǔn)確率」。

這個(gè)故事里有一個(gè)深刻的經(jīng)濟(jì)學(xué)原理——杰文斯悖論:當(dāng)一項(xiàng)技術(shù)讓某種資源的使用更高效時(shí),這種資源的總需求反而可能大幅增加。

影像診斷變便宜、變快了,于是醫(yī)生開了更多檢查,放射科醫(yī)生反而更忙了。

哈佛這項(xiàng)新研究的作者們顯然吸取了辛頓的教訓(xùn)。

論文通訊作者M(jìn)anrai在新聞發(fā)布會(huì)上明確說(shuō):「我們的發(fā)現(xiàn)并不意味著AI取代醫(yī)生,盡管有些賣AI醫(yī)療產(chǎn)品的公司可能會(huì)這么說(shuō)?!?/p>

共同通訊作者、貝斯以色列AI項(xiàng)目負(fù)責(zé)人Adam Rodman則更直白:「目前AI診斷沒(méi)有任何正式的問(wèn)責(zé)框架?;颊呦胍氖侨藖?lái)引導(dǎo)他們度過(guò)生死攸關(guān)的決策,引導(dǎo)他們面對(duì)艱難的治療選擇。」

不是「AI贏了」

而是醫(yī)療決策權(quán)在重組

據(jù)美國(guó)醫(yī)學(xué)會(huì)(AMA)2026年調(diào)查,超過(guò)80%的美國(guó)醫(yī)生已經(jīng)在職業(yè)中使用AI——是2023年的兩倍。

17%的醫(yī)生使用AI進(jìn)行「輔助診斷」。

2025年的一項(xiàng)Elsevier研究發(fā)現(xiàn),20%的臨床醫(yī)生已經(jīng)在向大語(yǔ)言模型尋求「第二意見」。

哈佛這項(xiàng)研究證明,AI在信息最匱乏、決策最緊迫的急診場(chǎng)景中,推理能力已經(jīng)超過(guò)了人類醫(yī)生。

三個(gè)數(shù)據(jù)疊加在一起,指向一個(gè)清晰的趨勢(shì):醫(yī)療決策的權(quán)力結(jié)構(gòu)正在發(fā)生根本性的重組。

過(guò)去的急診室模式是:患者進(jìn)來(lái)→醫(yī)生判斷→做出決策。

未來(lái)的模式可能變成:患者進(jìn)來(lái)→AI快速掃描電子病歷給出初步判斷→醫(yī)生結(jié)合臨床觀察和AI建議做出決策→患者參與討論治療方案。

研究作者Rodman預(yù)測(cè),未來(lái)會(huì)出現(xiàn)三種分化:一部分任務(wù)人類持續(xù)做得更好,一部分任務(wù)AI持續(xù)做得更好,還有一部分任務(wù)需要人機(jī)協(xié)作增強(qiáng)。

這就是研究者所說(shuō)的「醫(yī)生-患者-AI」三方協(xié)作模式。

聽起來(lái)很像自動(dòng)駕駛。

L2級(jí)別——AI輔助人類決策;L3級(jí)別——AI主導(dǎo)、人類監(jiān)督;L4級(jí)別——特定場(chǎng)景全自動(dòng)。

目前AI在醫(yī)療領(lǐng)域大概處在L2到L3之間的階段:它已經(jīng)能在「文字世界」里給出超越人類的判斷,但在真實(shí)的、多模態(tài)的臨床場(chǎng)景中,它還需要人類的眼睛、耳朵和直覺(jué)來(lái)補(bǔ)位。

AI誤診了,誰(shuí)負(fù)責(zé)?

在所有討論中,有一個(gè)房間里的大象無(wú)人敢正面觸碰:AI出錯(cuò)了,誰(shuí)來(lái)承擔(dān)責(zé)任?

Rodman在接受《衛(wèi)報(bào)》采訪時(shí)坦言:目前AI診斷沒(méi)有任何正式的問(wèn)責(zé)框架。

如果一名醫(yī)生誤診了,有成熟的醫(yī)療糾紛處理體系——患者可以投訴、可以訴訟、醫(yī)生面臨執(zhí)照風(fēng)險(xiǎn)。

但如果AI給出了錯(cuò)誤建議,醫(yī)生采納了,患者受到了傷害——是算醫(yī)生的責(zé)任?AI公司的責(zé)任?醫(yī)院的責(zé)任?還是三方共擔(dān)?

更復(fù)雜的場(chǎng)景是:如果AI給出了正確建議,但醫(yī)生否決了AI的判斷、堅(jiān)持自己的錯(cuò)誤診斷,導(dǎo)致患者延誤治療——此時(shí)醫(yī)生要不要為「忽視A建議」承擔(dān)額外責(zé)任?

還有一個(gè)更隱蔽的風(fēng)險(xiǎn):過(guò)度依賴。

當(dāng)醫(yī)生習(xí)慣了AI給出的高準(zhǔn)確率判斷,他們的獨(dú)立思考能力會(huì)不會(huì)退化?就像GPS讓很多人喪失了自主導(dǎo)航能力一樣,AI輔助診斷是否會(huì)讓醫(yī)生的臨床推理「肌肉」逐漸萎縮?

這些問(wèn)題,目前沒(méi)有任何國(guó)家有清晰的答案。

參考資料:

https://www.science.org/doi/10.1126/science.adz4433

https://www.harvardmagazine.com/ai/ai-outperforms-doctors-diagnosis-harvard-study

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
日本高層抵華后傻眼了!中方?jīng)]安排一位要員!高市只能親自搬救兵

日本高層抵華后傻眼了!中方?jīng)]安排一位要員!高市只能親自搬救兵

老燈愛(ài)野史
2026-05-04 18:38:53
太離譜!華西醫(yī)院五一放假引爭(zhēng)議,被罵想休息別當(dāng)醫(yī)生,網(wǎng)友吵翻

太離譜!華西醫(yī)院五一放假引爭(zhēng)議,被罵想休息別當(dāng)醫(yī)生,網(wǎng)友吵翻

譚談社會(huì)
2026-05-02 14:27:21
為保普京出席閱兵 俄羅斯集中280套防空系統(tǒng)守住莫斯科

為保普京出席閱兵 俄羅斯集中280套防空系統(tǒng)守住莫斯科

桂系007
2026-05-03 20:03:49
1953年毛主席接見昔日黃埔校花,擰眉問(wèn)道:阿曾,怎么不來(lái)看我?

1953年毛主席接見昔日黃埔?;ǎ瑪Q眉問(wèn)道:阿曾,怎么不來(lái)看我?

翠羽
2026-05-04 16:30:15
心理學(xué)揭秘:一個(gè)人對(duì)家人暴躁易怒,對(duì)外人卻溫和有禮,并非天性冷血,真正原因藏在這兩點(diǎn)深層心理里

心理學(xué)揭秘:一個(gè)人對(duì)家人暴躁易怒,對(duì)外人卻溫和有禮,并非天性冷血,真正原因藏在這兩點(diǎn)深層心理里

心理觀察局
2026-05-02 06:59:03
97年我跑長(zhǎng)途捎了一位尼姑,尼姑下車時(shí)送我三句話,三年后全應(yīng)驗(yàn)

97年我跑長(zhǎng)途捎了一位尼姑,尼姑下車時(shí)送我三句話,三年后全應(yīng)驗(yàn)

千秋文化
2026-04-29 19:09:51
他若不死必是十大元帥之首?毛主席:他比我厲害十倍

他若不死必是十大元帥之首?毛主席:他比我厲害十倍

小豫講故事
2026-05-04 06:00:15
四川成都市邛崍市發(fā)生3.1級(jí)地震,震源深度10千米

四川成都市邛崍市發(fā)生3.1級(jí)地震,震源深度10千米

界面新聞
2026-05-04 19:56:57
丈夫就是“三無(wú)價(jià)值”!廣東10年全職媽媽撕開遮羞布,評(píng)論區(qū)反轉(zhuǎn)

丈夫就是“三無(wú)價(jià)值”!廣東10年全職媽媽撕開遮羞布,評(píng)論區(qū)反轉(zhuǎn)

火山詩(shī)話
2026-05-02 07:19:28
62歲韋唯近況曝光:體內(nèi)12顆鈦釘,深山獨(dú)居10年,錢多有什么用?

62歲韋唯近況曝光:體內(nèi)12顆鈦釘,深山獨(dú)居10年,錢多有什么用?

子芫伴你成長(zhǎng)
2026-05-01 22:53:40
臺(tái)當(dāng)局每年要撒幣近15億收買,斯威士蘭這一“金元孤島”還能撐多久

臺(tái)當(dāng)局每年要撒幣近15億收買,斯威士蘭這一“金元孤島”還能撐多久

海峽導(dǎo)報(bào)社
2026-05-04 08:09:17
早年高舉雙手的鞏俐,大氣飽滿

早年高舉雙手的鞏俐,大氣飽滿

娛你同歡
2026-05-01 21:50:35
沒(méi)想到澳大利亞離我國(guó)這么遠(yuǎn)啊,達(dá)到8000公里左右,令人震撼!

沒(méi)想到澳大利亞離我國(guó)這么遠(yuǎn)啊,達(dá)到8000公里左右,令人震撼!

歲月有情1314
2026-05-04 18:05:56
2026 年深圳 60 歲以上老人福利大全:養(yǎng)老、補(bǔ)貼、出行都很好

2026 年深圳 60 歲以上老人福利大全:養(yǎng)老、補(bǔ)貼、出行都很好

生活魔術(shù)專家
2026-05-04 18:21:23
哈佛教授揭開7個(gè)健康謊言:你越努力鍛煉,可能越走在錯(cuò)誤的路上

哈佛教授揭開7個(gè)健康謊言:你越努力鍛煉,可能越走在錯(cuò)誤的路上

真相Truth
2026-04-26 21:51:51
他接受紀(jì)律審查和監(jiān)察調(diào)查

他接受紀(jì)律審查和監(jiān)察調(diào)查

錫望
2026-05-03 16:38:20
遼寧凌海一女子駕車雙手離開方向盤,半個(gè)身子探出車窗外,疑似曾因同樣行為被處罰,交警回應(yīng):當(dāng)事人或存精神異常,案件正偵辦中

遼寧凌海一女子駕車雙手離開方向盤,半個(gè)身子探出車窗外,疑似曾因同樣行為被處罰,交警回應(yīng):當(dāng)事人或存精神異常,案件正偵辦中

揚(yáng)子晚報(bào)
2026-05-04 12:17:25
一句“你趕上了”惹怒全網(wǎng),如今員工被捕,銀行終于扛不住了

一句“你趕上了”惹怒全網(wǎng),如今員工被捕,銀行終于扛不住了

時(shí)尚的弄潮
2026-05-04 06:36:12
2026養(yǎng)老金上漲“暫停鍵”已按下?真相:錢已到賬,信號(hào)已出

2026養(yǎng)老金上漲“暫停鍵”已按下?真相:錢已到賬,信號(hào)已出

陳恧侃故事
2026-05-03 16:16:17
伊朗:霍爾木茲海峽不會(huì)回到戰(zhàn)前狀態(tài),伊朗絕對(duì)不會(huì)后退一步;永久禁止以色列船只通過(guò),敵對(duì)國(guó)家船只必須支付戰(zhàn)爭(zhēng)賠償金才能獲得通行許可

伊朗:霍爾木茲海峽不會(huì)回到戰(zhàn)前狀態(tài),伊朗絕對(duì)不會(huì)后退一步;永久禁止以色列船只通過(guò),敵對(duì)國(guó)家船只必須支付戰(zhàn)爭(zhēng)賠償金才能獲得通行許可

魯中晨報(bào)
2026-05-04 14:57:07
2026-05-04 20:59:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
15130文章數(shù) 66835關(guān)注度
往期回顧 全部

科技要聞

OpenAI“復(fù)活”了QQ寵物,網(wǎng)友直接玩瘋

頭條要聞

英媒:伊朗革命衛(wèi)隊(duì)要求特朗普“二選一”

頭條要聞

英媒:伊朗革命衛(wèi)隊(duì)要求特朗普“二選一”

體育要聞

騎士破猛龍:加雷特·阿倫的活力

娛樂(lè)要聞

張敬軒還是站上了英皇25周年舞臺(tái)

財(cái)經(jīng)要聞

魔幻的韓國(guó)股市,父母給嬰兒開戶買股票

汽車要聞

同比大漲190% 方程豹4月銷量29138臺(tái)

態(tài)度原創(chuàng)

藝術(shù)
數(shù)碼
健康
親子
房產(chǎn)

藝術(shù)要聞

火災(zāi)后第17年,TVCC電視文化中心正式啟用

數(shù)碼要聞

IPI預(yù)熱Haze X鼠標(biāo):PAW3955,支持Rapid Trigger

干細(xì)胞治燒燙傷面臨這些“瓶頸”

親子要聞

孩子6歲前有5個(gè)特質(zhì),暗示大腦前額葉發(fā)達(dá),家長(zhǎng)一定要好好培養(yǎng)

房產(chǎn)要聞

五一樓市徹底明牌!塔尖人群都在重倉(cāng)凱旋新世界

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版