国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

LEADS幫研究者節(jié)省近三成時間,比通用大模型更懂醫(yī)學(xué)綜述

0
分享至



AI 正越來越廣泛的應(yīng)用在各類科研工作里,它對數(shù)據(jù)的處理能力在加強(qiáng)循證醫(yī)學(xué)方面具有巨大潛力,但由于訓(xùn)練和評估不足而受到限制。

考慮到這種情況,美國 KeiJi AI 牽頭了一項(xiàng)研究,提出了 LEADS,這是一種 AI 基礎(chǔ)模型,該模型在 633,759 個樣本上進(jìn)行了訓(xùn)練,并于測試中達(dá)到了 0.81 的召回率與 0.85 的數(shù)據(jù)提取準(zhǔn)確率。

相關(guān)研究內(nèi)容以「A foundation model for human-AI collaboration in medical literature mining」為題,于 2025 年 9 月 24 日發(fā)布在《Nature Communications》。



論文鏈接:https://www.nature.com/articles/s41467-025-62058-5

高代價的工作還是交給AI

文獻(xiàn)挖掘,在當(dāng)下各類期刊、綜述類文章頻出的當(dāng)下,顯得越發(fā)重要,尤其是系統(tǒng)評價的激增。但是考慮到每年發(fā)布的文章數(shù)量與系統(tǒng)文件評價所需要的時間與成本,無疑讓一切都顯得障礙重重。

而諸如 ChatGPT 這樣的大語言模型(LLMs),它們作為通用 AI 能夠適應(yīng)各種任務(wù),有些還推出了以理解分析為主要導(dǎo)向的學(xué)習(xí)功能。這些基礎(chǔ)模型通常通過兩種主要方法適應(yīng)醫(yī)學(xué)任務(wù):提示,如情境學(xué)習(xí)(ICL)、思維鏈(CoT)和檢索增強(qiáng)生成(RAG);以及針對特定任務(wù)的微調(diào),如命名實(shí)體識別和證據(jù)摘要。

但是,研究團(tuán)隊發(fā)現(xiàn),用 GPT-4o 這樣的通用模型來挖掘醫(yī)學(xué)文獻(xiàn),常常出現(xiàn)召回率不足、提取信息不準(zhǔn)的問題。換句話說,它懂語言,但不夠懂「醫(yī)學(xué)文獻(xiàn)套路」。所以,大家決定打造一個專門的基礎(chǔ)模型,LEADS 就此誕生。



圖 1:LEADS 和 LEADSInstruct 概述。

LEADS 基于通用大模型(Mistral-7B),再用大規(guī)模醫(yī)學(xué)綜述數(shù)據(jù)集 LEADSInstruct 進(jìn)行指令微調(diào)。該數(shù)據(jù)集來源于21,335 篇系統(tǒng)綜述、453,625 篇相關(guān)文獻(xiàn)、27,015 個臨床試驗(yàn)記錄,覆蓋了633,759 條指令樣本。

這種全面的訓(xùn)練策略使 LEADS 能夠?qū)崿F(xiàn)多任務(wù)能力,處理靈活的輸入請求,并在不進(jìn)行額外微調(diào)的情況下泛化到各種文獻(xiàn)主題。在團(tuán)隊的關(guān)于廣泛綜述主題和數(shù)千項(xiàng)系統(tǒng)評價的實(shí)驗(yàn)中,LEADS 在所有目標(biāo)任務(wù)上均優(yōu)于 GPT-4o 等尖端通用 LLM。

訓(xùn)練的方式還是很直接的,就像《我愛發(fā)明》的經(jīng)典環(huán)節(jié)一樣:人工組對 AI 組。

測試與人機(jī)對比

LEADS 解決了系統(tǒng)評價方法中的三個基本任務(wù):文獻(xiàn)檢索、引文篩選和數(shù)據(jù)提取。在出版物和臨床試驗(yàn)搜索任務(wù)中的性能評估里,LEADS 在兩個任務(wù)中實(shí)現(xiàn)了 24.68 和 32.11 的召回率,分別超過了最佳基線 3.76 和 7.43。

在實(shí)際應(yīng)用中,可以采用集成方法,并使用匯總結(jié)果以最大化覆蓋范圍,團(tuán)隊將此稱為 LEADS + 集成。這種方法顯著提高了性能,與單次遍歷的 LEADS 相比,召回率提高了三到四倍,對于出版物搜索的平均召回率超過 70,對于試驗(yàn)搜索任務(wù)超過 65。



圖 2:LEADS 執(zhí)行文獻(xiàn)篩選任務(wù)。

除此之外,團(tuán)隊還就文獻(xiàn)檢索、自動化評估與提取數(shù)據(jù)簡化等方向?qū)δP驼归_了評估,均表現(xiàn)出了優(yōu)異的性能。在隨后進(jìn)行的專家+AI 與純專家組的對比中,這一點(diǎn)會更直觀地反映出來。



圖 3:研究篩選和數(shù)據(jù)提取的試點(diǎn)用戶研究。

在模擬實(shí)驗(yàn)中,專家單干的召回率是 0.78,加上 LEADS 提升到 0.81;平均用時從 580 秒降到 449 秒,節(jié)省了約 20.8% 的時間。數(shù)據(jù)提取的準(zhǔn)確率由 0.80 提升到 0.85;時間從 113.9 秒降到 83.3 秒,節(jié)省了 26.9%。

團(tuán)隊表示:LEADS 排除的幾乎所有研究也都被人工審稿人排除,且 LEADS 的 Recall@100 超過 90%,這意味著在實(shí)踐中,專家可以放心地主要關(guān)注前 100 個結(jié)果,而不會錯過相關(guān)研究。

刷文獻(xiàn)的好方法

LEADS 的出現(xiàn),意味著醫(yī)學(xué)研究不再只能靠研究者「手動刨文獻(xiàn)」。它不是要取代專家,而是幫他們減輕負(fù)擔(dān),讓結(jié)果更快、更準(zhǔn)。憑借其設(shè)計,LEADS 可以無縫集成到現(xiàn)有的 TrialMind 網(wǎng)絡(luò)平臺作為后端組件,使醫(yī)學(xué)專業(yè)人士能夠無任何技術(shù)障礙地使用它。

但究其本質(zhì)仍然只是一個挖掘信息的道具,LEADS 還是依賴于從醫(yī)學(xué)文獻(xiàn)中獲取的培訓(xùn)數(shù)據(jù)以及指令數(shù)據(jù)生成管道的質(zhì)量。不過,既然它已經(jīng)表現(xiàn)出來優(yōu)于通用 LLMs 的卓越性能,那不妨就此嘗試一下人機(jī)協(xié)作。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
原來大家都是這樣給老公安排生活的!網(wǎng)友:知道真相,流下了眼淚

原來大家都是這樣給老公安排生活的!網(wǎng)友:知道真相,流下了眼淚

另子維愛讀史
2025-12-24 17:26:05
十年磨一劍,那位給全球游戲人帶來“噩夢”的龍王,又要回來給游戲行業(yè)上一課了?

十年磨一劍,那位給全球游戲人帶來“噩夢”的龍王,又要回來給游戲行業(yè)上一課了?

情報姬
2025-12-23 23:14:02
闞清子車停醫(yī)院2天!3個細(xì)節(jié)戳破早產(chǎn)謠言,怎么判斷爆料真假?

闞清子車停醫(yī)院2天!3個細(xì)節(jié)戳破早產(chǎn)謠言,怎么判斷爆料真假?

可樂談情感
2025-12-25 00:55:18
太諷刺!龐家無償捐4700平米祖宅,院長雙謊被戳穿,省多部門介入

太諷刺!龐家無償捐4700平米祖宅,院長雙謊被戳穿,省多部門介入

好賢觀史記
2025-12-23 18:14:27
有線電視免費(fèi)回歸家庭?多地已落地,但全面普及還有三道坎

有線電視免費(fèi)回歸家庭?多地已落地,但全面普及還有三道坎

小柱解說游戲
2025-12-25 11:27:00
離譜!楊書記為何敢直接拿走博物館的瓷花瓶?

離譜!楊書記為何敢直接拿走博物館的瓷花瓶?

仕道
2025-12-22 09:20:15
山東8名公安局長落馬榜:有人跨省高升終落網(wǎng),有人護(hù)黑護(hù)成無期囚

山東8名公安局長落馬榜:有人跨省高升終落網(wǎng),有人護(hù)黑護(hù)成無期囚

濟(jì)寧人
2025-12-25 08:21:01
嚴(yán)防死守36年,利智還是輸了,李連杰終是沒放下一直虧欠的“她”

嚴(yán)防死守36年,利智還是輸了,李連杰終是沒放下一直虧欠的“她”

法老不說教
2025-12-24 18:25:17
“中立媒體人”黃暐瀚幫賴清德洗地,妄稱臺灣被統(tǒng)一的那一天不會到來

“中立媒體人”黃暐瀚幫賴清德洗地,妄稱臺灣被統(tǒng)一的那一天不會到來

海峽導(dǎo)報社
2025-12-24 15:52:13
比恒大還慘!中國第二大民企倒了,負(fù)債7500億,創(chuàng)始人被帶走

比恒大還慘!中國第二大民企倒了,負(fù)債7500億,創(chuàng)始人被帶走

混沌錄
2025-12-24 20:11:11
開拓者1分惜敗魔術(shù)!賽后聽蘇群對楊瀚森的分析,讓人恍然大悟!

開拓者1分惜敗魔術(shù)!賽后聽蘇群對楊瀚森的分析,讓人恍然大悟!

田先生籃球
2025-12-24 16:12:48
當(dāng)段奕宏和00后演員同框,一個健壯一個油頭粉面,才懂啥叫真男人

當(dāng)段奕宏和00后演員同框,一個健壯一個油頭粉面,才懂啥叫真男人

銀河史記
2025-12-24 14:32:30
實(shí)在不想動武!美國扣押中國油輪后,中國在聯(lián)合國發(fā)動強(qiáng)烈反擊!

實(shí)在不想動武!美國扣押中國油輪后,中國在聯(lián)合國發(fā)動強(qiáng)烈反擊!

阿龍聊軍事
2025-12-25 12:03:59
巴菲特:富人從不碰,窮人卻“玩”上癮的兩樣?xùn)|西,越碰越窮!

巴菲特:富人從不碰,窮人卻“玩”上癮的兩樣?xùn)|西,越碰越窮!

南權(quán)先生
2025-12-01 17:06:44
項(xiàng)立剛?cè)嗽O(shè)崩塌:本想踩羅永浩上位,反被扒出一地雞毛

項(xiàng)立剛?cè)嗽O(shè)崩塌:本想踩羅永浩上位,反被扒出一地雞毛

熱點(diǎn)菌本君
2025-12-24 15:29:50
蒙古國總統(tǒng)簽文件,要在與中國接壤的東戈壁省增建130公里鐵絲網(wǎng)

蒙古國總統(tǒng)簽文件,要在與中國接壤的東戈壁省增建130公里鐵絲網(wǎng)

百態(tài)人間
2025-12-24 16:51:04
意外收獲!南博事件拔出蘿卜帶出泥!

意外收獲!南博事件拔出蘿卜帶出泥!

大道微言
2025-12-23 19:29:03
神秘“華人”爆料,某島上錢色交易不值一提,深層次的秘密才可怕

神秘“華人”爆料,某島上錢色交易不值一提,深層次的秘密才可怕

林林故事揭秘
2024-12-25 12:24:41
當(dāng)我把“有線電視”換成“網(wǎng)絡(luò)電視”后,有些心里話,不吐不快

當(dāng)我把“有線電視”換成“網(wǎng)絡(luò)電視”后,有些心里話,不吐不快

小柱解說游戲
2025-12-24 12:53:06
并非回歸國家隊,返京收拾東西,全紅嬋匆忙離開,原因曝光

并非回歸國家隊,返京收拾東西,全紅嬋匆忙離開,原因曝光

樂聊球
2025-12-25 13:00:58
2025-12-25 16:27:00
ScienceAI incentive-icons
ScienceAI
關(guān)注人工智能與其他前沿技術(shù)
1190文章數(shù) 222關(guān)注度
往期回顧 全部

科技要聞

屠龍少年被"招安"!英偉達(dá)平安夜豪擲200億

頭條要聞

男子信訪被勸返收鎮(zhèn)干部4300元路費(fèi)獲罪 二審駁回上訴

頭條要聞

男子信訪被勸返收鎮(zhèn)干部4300元路費(fèi)獲罪 二審駁回上訴

體育要聞

單賽季11冠,羽壇“安洗瑩時代”真的來了

娛樂要聞

金莎小19歲男友求婚成功!兩人雪地?fù)砦?/h3>

財經(jīng)要聞

時隔15月,人民幣升破7,三大推手曝光

汽車要聞

預(yù)售31.3萬元起 全新奧迪Q5L將于1月內(nèi)上市

態(tài)度原創(chuàng)

家居
教育
藝術(shù)
房產(chǎn)
公開課

家居要聞

經(jīng)典彌新 品味浪漫居所

教育要聞

孩子第一次有組織的撒謊,往往就始于語文作文

藝術(shù)要聞

緬懷 | 著名油畫家宮立龍逝世,享年73歲

房產(chǎn)要聞

太猛了!單月新增企業(yè)4.1萬家,又一波巨頭涌向海南!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版