国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

螞蟻再把醫(yī)療AI卷出新高度!螞蟻·安診兒醫(yī)療大模型開源即SOTA

0
分享至

鷺羽 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

就在醫(yī)療AI賽道激戰(zhàn)正酣時,一個攪局者低調(diào)入場了。

依舊是螞蟻,依舊「SOTA」!

它就是螞蟻集團聯(lián)合浙江省衛(wèi)生健康信息中心、浙江省安診兒醫(yī)學人工智能科技有限公司開源的醫(yī)療大模型——螞蟻·安診?(AntAngelMed)。

一經(jīng)發(fā)布就登頂多項醫(yī)療基準測試榜單。



不講什么噱頭,也絲毫不喧囂,它用數(shù)據(jù)和排名說話:

在OpenAI發(fā)布的HealthBench評測中強勢霸榜開源模型第一,超越Baichuan-M2和gpt-oss-120B。

并橫掃MedAIBench、MedBench等權威醫(yī)療榜單。

它也是迄今為止參數(shù)規(guī)模最大的開源醫(yī)療模型,足足有100B。

應用門檻相當?shù)?,即使是在中小型醫(yī)療機構,AntAngelMed也足以支撐起實時多輪交互和規(guī)?;渴?,是真正能夠落地跑起來的模型。



它為行業(yè)示范出一條清晰明確的路徑——通過“專、精、穩(wěn)”三位一體,構建通用智能+醫(yī)療專長的全棧能力閉環(huán)。

環(huán)顧全球,AI醫(yī)療正在成為一場關乎全人類健康的數(shù)字化變革。

李飛飛團隊發(fā)布的斯坦福《2025 AI Index Report》中明確指出,AI已經(jīng)從實驗室正式走向臨床和實際應用。

研究表明,AI比專業(yè)醫(yī)生在診斷復雜臨床病例時表現(xiàn)更優(yōu),而AI與醫(yī)生的協(xié)作往往能取得最佳結(jié)果。與此同時,一系列醫(yī)療專用大模型也呈現(xiàn)出持續(xù)涌現(xiàn)的態(tài)勢。

螞蟻則在用實際行動全面押注這一賽道。

開源即登頂多項權威醫(yī)療榜單

具體來說,AntAngelMed是螞蟻集團聯(lián)合浙江省衛(wèi)?健康委共同研發(fā)的開源醫(yī)療大模型,從誕生之初就是專為真實醫(yī)療場景所設計的。



這也充分體現(xiàn)在模型的基準測試表現(xiàn)上。

比如由OpenAI在去年發(fā)布的醫(yī)療健康領域評估測試集HealthBench,來自全球60個國家、262名醫(yī)?共同構建,包含5000種多輪醫(yī)療對話場景,評分標準涵蓋準確性、完整性、溝通質(zhì)量、情境感知等多維度。

在面對DeepSeek-R1、Qwen3、OpenAI GPT-OSS等一眾開源模型,AntAngelMed以62.5的評分拿下第一。

更進一步,在HealthBench的子集HealthBench-Hard(專為困難場景設計)上,AntAngelMed同樣穩(wěn)居榜首。

這也是繼Baichuan-M2后,唯二打破HealthBench-Hard 32分魔咒的開源模型,要知道在HealthBench-Hard剛發(fā)布時,其困難程度一度讓所有模型都拜倒在32分之下,甚至當時還有很多頂尖模型都直接掛零。

AntAngelMed的表現(xiàn)足以證明,其在最真實也最容易出錯的復雜醫(yī)療環(huán)境中,仍然能夠表現(xiàn)穩(wěn)定,專業(yè)度拉滿。



在由國家??智能應?中試基地(醫(yī)療)·浙江、中國醫(yī)學科學院北京協(xié)和醫(yī)學院、中國信息通信研究院三?共建的權威測評體系MedAIBench中,AntAngelMed同樣表現(xiàn)突出,尤其是在醫(yī)療知識問答、醫(yī)療倫理安全等多個核心維度上優(yōu)勢顯著。

這側(cè)面說明,模型不是在醫(yī)療基礎知識或者臨床診斷這類單一科目上能力強勁,而是整體醫(yī)療水平均衡,短板夠長、專業(yè)夠全面,容錯率也會更低。



而在面向中文醫(yī)療場景的醫(yī)療大模型評測體系MedBench時,AntAngelMed依舊位列?測榜單第?。

MedBench擁有36個自主評測集,約70萬條樣本,最關鍵的是它區(qū)別于很多以英文為主的國際benchmark,更偏向于本土醫(yī)療體系,在表達上也更貼合國內(nèi)問診場景。

AntAngelMed在醫(yī)學知識問答、醫(yī)學語?理解、醫(yī)學語??成、復雜醫(yī)學推理、醫(yī)療安全與倫理五?核?維度上穩(wěn)定領先,展現(xiàn)出與基層臨床流程的高度適配和無縫集成。



日常生活場景為例,我們向AntAngelMed提問:

  • 我最近總是頭暈,可能是什么原因?



生成速度很快,幾乎是秒入秒出。

仔細看思考過程,它首先提及的是要照顧用戶情緒,在給出答案時避免引起恐慌。

nice!這波人性化必須好評,畢竟之前每次上網(wǎng)搜癥狀,都感覺自己得了絕癥……(慌張.jpg)



在給出具體建議時,它也會基于自身醫(yī)學知識,仔細分析癥狀表現(xiàn),找到最契合的成因。



結(jié)構上邏輯嚴謹,從共感→原因分析→建議→鼓勵,全方位解決用戶需求。



最終給出的答案也很專業(yè)暖心,感覺像是在和一位主任級醫(yī)生面對面就診。



P.S.不過正如AntAngelMed所說,癥狀加劇時一定要及時就醫(yī)哦~



接著讓AntAngelMed試著解讀專業(yè)術語

  • 我的一份乳腺癌手術病理報告顯示:ER(90%+),PR(80%+),HER2(1+),Ki-67(15%)。請解釋這些指標代表什么?這對我的分型和后續(xù)治療方案意味著什么?



在腫瘤病理報告中,免疫組化(IHC)指標是決定癌癥治療方案(如化療、靶向、免疫治療)的關鍵,而指標組合又極其復雜。

AntAngelMed首先用通俗易懂的語言解釋了這幾個相關指標的含義,對于極少接觸專業(yè)醫(yī)學知識的普通人,或者需要查找狹窄領域信息的專業(yè)醫(yī)生來說,頗具參考價值。



此外,它也能準確識別出癌癥亞型,給出傾向于激素治療而非靶向治療的參考意見。



值得關注的是,AntAngelMed還會告知用戶接下來可以去掛哪些科室,以及可以詢問主治醫(yī)師哪些問題。

對于本看病困難星人,實在是暖暖的、很貼心~



整體感受下來,AntAngelMed既像一個無微不至的家庭醫(yī)生,也像一位經(jīng)驗豐富的專家學者,無論是個人、醫(yī)生、醫(yī)療機構,或許都能從中找到最適合的匹配方案。

既要專業(yè)度,也要人情味

那么AntAngelMed是如何做到的呢?

要厘清思路,首先需要回到模型本身。

AntAngelMed繼承了百靈?模型Ling-flash-2.0的?效混合專家(MoE)架構,并建立起三階段的訓練過程:

Step 1:持續(xù)預訓練。

通過持續(xù)預訓練,大量的臨床指南、醫(yī)學文獻等高質(zhì)量知識被融入進模型參數(shù)中,讓模型與知識深度融合,能夠自然地以專業(yè)醫(yī)學角度進行思考和表述。

換言之,這是在為醫(yī)學AI打下最堅實的地基。



Step 2:監(jiān)督微調(diào)。

為了解決真實場景應用的問題,在這個階段里,指令數(shù)據(jù)兼具多種類型的表述形式,能夠增強模型的通用推理能力,學會分步思考和多方案權衡。

另外,模型的人性化也同步得到提升,要知道醫(yī)患問答不等同于學術問答,模型的輸出如何能夠更貼近真實醫(yī)生的表達,這是關鍵。

Step 3:GRPO強化學習算法+雙階段強化學習路徑。

這一步?jīng)Q定模型最終能不能被真實使用。

GRPO強化學習算法的引入,讓模型對復雜任務的處理更加得心應手,也能更好地對齊人類價值,約束模型安全邊界。

其中雙階段強化學習又分為兩步:

  • 推理強化學習:保障模型的推理邏輯嚴謹,避免中途跳躍。
  • 通用強化學習:強化模型的行為風格,明確指導風險。

最終二者結(jié)合,共同推動模型朝著專業(yè)、克制又能共情的方向演化。



為了實現(xiàn)模型效率與性能兩手抓,在原有的Ling-flash-2.0架構上,模型也在一系列核心設計上進行了全面優(yōu)化,比如1/32激活?例、?輔助損失+Sigmoid路由策略、MTP層以及Partial-RoPE等。

最終幫助模型在參數(shù)規(guī)模相近的情況下,實現(xiàn)了相比Dense架構的7倍效率提升,模型計算成本同步得到大幅度降低。



要讓模型跑得快、跑得穩(wěn),還需要進行推理加速。

這里采用的是FP8量化+EAGLE3優(yōu)化

前者負責將模型推理時的數(shù)值精度壓縮到FP8,可顯著減少內(nèi)存占用以提高計算吞吐;而后者主要用于抑制FP8量化帶來的數(shù)值抖動,在效率與穩(wěn)定性中找到最優(yōu)解。

最終在真實線上醫(yī)療系統(tǒng)的典型負載32并發(fā)場景中,實現(xiàn)推理吞吐的穩(wěn)步提升:HumanEval提升71%,GSM8K提升45%,Math-500提升?達94%。

螞蟻醫(yī)療AI布局有跡可循

不難看出,AntAngelMed反映了螞蟻對醫(yī)療AI領域的洞察細致入微,因為近一線所以懂行業(yè)痛點,因為有技術所以懂如何改進。

所以AntAngelMed才能從一眾醫(yī)療大模型中脫穎而出,做到真實環(huán)境中也可以智商情商雙在線,而非僅僅局限于基準測試的demo。

可以說,AntAngelMed的出現(xiàn),進一步完善了螞蟻在醫(yī)療AI領域的布局。

技術層面,AntAngelMed可以作為最堅實的基座模型,承載起AI在專業(yè)場景的規(guī)?;涞?,解決的是螞蟻最底層的技術需求。

它走的不是通用大模型+Prompt的基礎醫(yī)學問答路線,而是深度對齊醫(yī)學語料、診療流程和醫(yī)學推理鏈后,完成的專業(yè)性更強的診療推理。



國內(nèi)外目前也有越來越多模型正在推進這一相似的范式轉(zhuǎn)移。

顯然,螞蟻已率先預見到這條路線的正確性,并沿著它一路狂飆,來到了收獲成果的階段。

產(chǎn)品層面,螞蟻也建立起了以面向用戶的AI健康管家、面向醫(yī)生的好大夫在線、面向機構的醫(yī)療大模型一體機為代表的三端一體產(chǎn)品矩陣。

從患者、醫(yī)生到機構,螞蟻的AI產(chǎn)品全方位覆蓋醫(yī)療服務體系,滿足從下至上每一個角色對AI醫(yī)療的切身需求。

組織層面,螞蟻在去年年末,完成了一次相當重要的戰(zhàn)略調(diào)整,將原來的數(shù)字醫(yī)療健康事業(yè)部正式升級為螞蟻健康事業(yè)群

從事業(yè)部升級為事業(yè)群,這意味著醫(yī)療健康不再是螞蟻的補充業(yè)務,而是正式成為與支付寶、數(shù)字支付、財富保險、信貸并列的核心板塊。

可以預見的是,螞蟻未來會將更多資源和精力傾向給AI醫(yī)療,而AntAngelMed還只是螞蟻正式入局的開端。

那么為什么要選擇做醫(yī)療AI呢?

歸根結(jié)底在于通用大模型和專業(yè)場景存在鴻溝,缺乏相關領域的知識、難以進行復雜任務的決策,以及對話交互不等同于有效協(xié)同。

而專業(yè)智能體是把通用智能拆解、工程化,本質(zhì)上是將不確定性約束在具體的產(chǎn)業(yè)里,只有這樣才能實現(xiàn)大模型的生產(chǎn)價值最大化。



醫(yī)療則是其中最具代表性的練兵場,醫(yī)療的核心不是操作,而是智能密度最高的認知、推理和決策。

對于大模型來說,這是一塊試金石,能倒逼大模型完成深度優(yōu)化,推動模型向其它基礎領域遷移。

而這個領域恰好還剛剛起步,有足夠大的藍??梢蕴剿鳌?/p>

與此同時,螞蟻也有做醫(yī)療AI的底氣,多年來螞蟻深耕支付、醫(yī)保領域,為打通醫(yī)療AI提供了堅實的數(shù)據(jù)基礎。

由此,在這條隱秘的醫(yī)療戰(zhàn)線里,螞蟻無疑會成為走得最久、也最深的先行者。

P.S.目前AntAngelMed模型系列已在平臺開源,可訪問官方開源倉庫下載使?:

HuggingFace:https://huggingface.co/MedAIBase/AntAngelMed
ModelScope:https://modelscope.cn/models/MedAIBase/AntAngelMed
GitHub: https://github.com/MedAIBase/AntAngelMed

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
拜合拉木遭針對!與曼聯(lián)新星沖突,連遭中衛(wèi)推搡,前國腳支招

拜合拉木遭針對!與曼聯(lián)新星沖突,連遭中衛(wèi)推搡,前國腳支招

奧拜爾
2026-01-11 19:58:15
陳幸同橫掃蒯曼晉級決賽!前三局全逆轉(zhuǎn),主動求變正手太穩(wěn)!

陳幸同橫掃蒯曼晉級決賽!前三局全逆轉(zhuǎn),主動求變正手太穩(wěn)!

籃球資訊達人
2026-01-11 18:50:04
U23國足首球誕生!彭嘯爆射世界波,對手解圍失誤,王鈺棟策動

U23國足首球誕生!彭嘯爆射世界波,對手解圍失誤,王鈺棟策動

奧拜爾
2026-01-11 20:17:38
上海今晨多個郊區(qū)氣溫跌破冰點,下周將有嚴重冰凍周末或迎“小陽春”氣溫直沖 17℃

上海今晨多個郊區(qū)氣溫跌破冰點,下周將有嚴重冰凍周末或迎“小陽春”氣溫直沖 17℃

縱相新聞
2026-01-11 15:57:08
伊朗警察總長:騷亂主要參與者已被逮捕

伊朗警察總長:騷亂主要參與者已被逮捕

界面新聞
2026-01-11 17:15:03
單親媽媽,只身闖電詐園區(qū)

單親媽媽,只身闖電詐園區(qū)

中國新聞周刊
2026-01-11 17:41:03
德國雜志“惡意抓拍”?樊振東封面照被批“認不出”,球迷怒懟:辜負他的治愈微笑

德國雜志“惡意抓拍”?樊振東封面照被批“認不出”,球迷怒懟:辜負他的治愈微笑

最愛乒乓球
2026-01-11 08:21:43
死了么APP發(fā)文回應:將把主要精力投入到產(chǎn)品打磨中,對新名稱的積極建議,會認真研究和考慮

死了么APP發(fā)文回應:將把主要精力投入到產(chǎn)品打磨中,對新名稱的積極建議,會認真研究和考慮

大風新聞
2026-01-11 15:26:05
半場壓哨破門!彭嘯轟世界波,媒體人熱議:8位數(shù)身價還得漲

半場壓哨破門!彭嘯轟世界波,媒體人熱議:8位數(shù)身價還得漲

奧拜爾
2026-01-11 20:26:14
特朗普剛說中俄懼怕美國,央視就公開“南天門計劃”,信號不簡單

特朗普剛說中俄懼怕美國,央視就公開“南天門計劃”,信號不簡單

歷史有些冷
2026-01-10 20:20:03
三亞4菜1868元后續(xù)!涉事司機被罰1.5萬,涉事海鮮店被立案調(diào)查

三亞4菜1868元后續(xù)!涉事司機被罰1.5萬,涉事海鮮店被立案調(diào)查

奇思妙想草葉君
2026-01-10 15:02:59
徹底清零!緬甸KK園區(qū)635棟涉賭詐建筑全數(shù)炸毀

徹底清零!緬甸KK園區(qū)635棟涉賭詐建筑全數(shù)炸毀

看看新聞Knews
2026-01-11 12:45:02
鰲太線2死1墜崖事件完整經(jīng)過梳理:19歲高顏女大學生被活活凍死!

鰲太線2死1墜崖事件完整經(jīng)過梳理:19歲高顏女大學生被活活凍死!

不二表姐
2026-01-10 22:29:28
死傷抗議者過多,伊朗醫(yī)院系統(tǒng)被壓垮!醫(yī)護連做心肺復蘇的時間都沒有

死傷抗議者過多,伊朗醫(yī)院系統(tǒng)被壓垮!醫(yī)護連做心肺復蘇的時間都沒有

互聯(lián)網(wǎng)大觀
2026-01-11 14:31:51
林詩棟不敵張禹珍,林昀儒擊敗張本智和,都很有把握

林詩棟不敵張禹珍,林昀儒擊敗張本智和,都很有把握

子水體娛
2026-01-11 17:12:27
國運來了誰也擋不??!100年前北洋政府隨手簽的條約,如今贏麻了

國運來了誰也擋不?。?00年前北洋政府隨手簽的條約,如今贏麻了

云霄紀史觀
2026-01-09 09:55:07
被大家猜中了!洗碗機的女主角起號成功,直播間人數(shù)超過3000…

被大家猜中了!洗碗機的女主角起號成功,直播間人數(shù)超過3000…

火山詩話
2026-01-10 15:13:33
頭號種子出局!林詩棟2-4不敵張禹珍,無緣多哈冠軍賽男單決賽

頭號種子出局!林詩棟2-4不敵張禹珍,無緣多哈冠軍賽男單決賽

全景體育V
2026-01-11 19:55:41
葉文斌媽媽被傳限制出境,惡意尋子的陰謀論來了

葉文斌媽媽被傳限制出境,惡意尋子的陰謀論來了

映射生活的身影
2026-01-11 14:33:05
燒光500億的“中國寶馬”,引爆2026年第一顆雷

燒光500億的“中國寶馬”,引爆2026年第一顆雷

金錯刀
2026-01-10 20:09:00
2026-01-11 21:08:49
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
12001文章數(shù) 176358關注度
往期回顧 全部

科技要聞

“我們與美國的差距也許還在拉大”

頭條要聞

零度天母親罰女兒在街頭跪地行走 還對勸阻者出言不遜

頭條要聞

零度天母親罰女兒在街頭跪地行走 還對勸阻者出言不遜

體育要聞

詹皇曬照不滿打手沒哨 裁判報告最后兩分鐘無誤判

娛樂要聞

留幾手為閆學晶叫屈?稱網(wǎng)友自卑敏感

財經(jīng)要聞

外賣平臺"燒錢搶存量市場"迎來終局?

汽車要聞

2026款宋Pro DM-i長續(xù)航補貼后9.98萬起

態(tài)度原創(chuàng)

教育
時尚
數(shù)碼
本地
家居

教育要聞

孩子沉迷手機沉迷游戲怎么辦?

當一個57歲的女人,決定從零開始

數(shù)碼要聞

ECS精英推出Liva Z系列迷你主機,多CPU可選

本地新聞

云游內(nèi)蒙|“包”你再來?一座在硬核里釀出詩意的城

家居要聞

木色留白 演繹現(xiàn)代自由

無障礙瀏覽 進入關懷版