国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

世界最強(qiáng)醫(yī)療模型百川M3發(fā)布:AI醫(yī)療,奇點(diǎn)已至

0
分享至


新智元報(bào)道

編輯:艾倫

【新智元導(dǎo)讀】百川發(fā)布并開源全球最強(qiáng)醫(yī)療模型 Baichuan-M3,各項(xiàng)指標(biāo)均已 SOTA!同時(shí) M3 也超越了人類醫(yī)生的平均水平。它最大的進(jìn)步是告別了機(jī)械的「背醫(yī)書」,學(xué)會(huì)了像真人醫(yī)生一樣主動(dòng)追問、排查病因,主打「嚴(yán)肅問診」,不僅能把模糊的病情問清楚,更解決了 AI「胡說八道」的頑疾,準(zhǔn)確度超越 GPT-5.2-High。這是 AI 從「聊天機(jī)器人」向「專業(yè)醫(yī)生」進(jìn)化的關(guān)鍵一步。AI醫(yī)療,奇點(diǎn)已至。

在很長一段時(shí)間里,人們習(xí)慣了這樣一種人機(jī)交互:你在搜索框或聊天窗口輸入「頭痛怎么辦?」,屏幕對(duì)面會(huì)瞬間拋回幾千字關(guān)于腦瘤、高血壓或頸椎病的百科知識(shí),最后附上一句正確的廢話——「建議您及時(shí)就醫(yī)」。

這不僅是搜索引擎時(shí)代的頑疾,也是目前大模型的通病。

它們像是一個(gè)博聞強(qiáng)記但缺乏臨床經(jīng)驗(yàn)的醫(yī)學(xué)生,背下了所有醫(yī)書,卻不懂得如何面對(duì)一個(gè)活生生的人。

就在今天,這個(gè)僵局要被打破了。

百川智能發(fā)布并開源了新一代醫(yī)療增強(qiáng)大語言模型 Baichuan-M3。

在百川創(chuàng)始人王小川看來,這絕非僅僅是模型參數(shù)的升級(jí),更是一次對(duì)「AI 醫(yī)療」的重新定義。

M3 不再滿足于做一個(gè)被動(dòng)的答題者,它試圖掌握一種人類醫(yī)生最核心的職業(yè)本能——嚴(yán)肅問診。

數(shù)據(jù)顯示,Baichuan-M3 在全球權(quán)威醫(yī)療 AI 評(píng)測 HealthBench 及其高難度子集 HealthBench Hard 上雙雙奪冠!


甚至在 OpenAI 最引以為傲的低幻覺領(lǐng)域,Baichuan-M3 也以 3.5% 的幻覺率擊敗了 GPT-5.2,實(shí)現(xiàn)全面 SOTA!


真正的變化體現(xiàn)在「百小應(yīng)」App 里:當(dāng)患者描述模糊的癥狀時(shí),AI 不再急于給出結(jié)論,而是像一位經(jīng)驗(yàn)豐富的老大夫一樣,開始了一場抽絲剝繭的「偵探游戲」。


百小應(yīng)網(wǎng)頁端:https://ying.baichuan-ai.com/chat

從「被動(dòng)答題」

到「主動(dòng)追問」

醫(yī)療的本質(zhì),是信息不對(duì)稱的博弈。

患者往往無法準(zhǔn)確描述自己的痛苦,「肚子疼」在醫(yī)學(xué)上可能對(duì)應(yīng)著從胃痙攣到急性胰腺炎等數(shù)十種可能。

之前,大多數(shù)醫(yī)療大模型的訓(xùn)練邏輯是「完形填空」——盡力補(bǔ)全用戶話語中的缺失。

OpenAI 發(fā)布的 HealthBench 評(píng)測集,本質(zhì)上考查的也是這種「單輪靜態(tài)問答」能力。

然而,百川的技術(shù)團(tuán)隊(duì)發(fā)現(xiàn),這種邏輯在真實(shí)臨床中是危險(xiǎn)的。

醫(yī)生看病,第一件事永遠(yuǎn)是排除危急重癥。

但在傳統(tǒng)的提示詞工程下,AI 往往因?yàn)榧庇诒憩F(xiàn)「博學(xué)」,而忽略了對(duì)「紅旗征」(指危險(xiǎn)信號(hào))的排查。

Baichuan-M3 的核心突破,在于它首次具備了原生的「端到端」嚴(yán)肅問診能力。

這種能力源于百川獨(dú)創(chuàng)的 SCAN 全新問診原則。

在百小應(yīng)的實(shí)際體驗(yàn)中,如果用戶說「頭暈」,M3 不會(huì)立刻列舉頭暈的原因,而是會(huì)啟動(dòng)一套縝密的追問邏輯:

  • 安全分層(Safety Stratification):「是一陣一陣的暈,還是天旋地轉(zhuǎn)?有沒有伴隨惡心嘔吐?」(排查中風(fēng)或耳石癥風(fēng)險(xiǎn))

  • 信息澄清(Clarity Matters):「最近有沒有熬夜或測量過血壓?」(量化誘因)

  • 關(guān)聯(lián)追問(Association & Inquiry):基于初步回答,像偵探一樣鎖定嫌疑病因。

在以往,長輪次的對(duì)話訓(xùn)練容易讓模型「迷路」,導(dǎo)致邏輯破碎。

百川新的SPAR 算法通過分步懲罰機(jī)制,讓 AI 學(xué)會(huì)了在有限的對(duì)話輪次中,精準(zhǔn)地問出最關(guān)鍵的信息。

在百小應(yīng)上,這意味著 AI 能將患者口中「有點(diǎn)痛」、「不舒服」等主觀體感,轉(zhuǎn)化為醫(yī)生看得懂的、結(jié)構(gòu)化的臨床數(shù)據(jù)。

攻克「AI 的痼疾」:幻覺

如果說「不會(huì)問診」只是讓 AI 顯得笨拙,那么「幻覺」則意味著安全風(fēng)險(xiǎn)。

在嚴(yán)肅醫(yī)療場景下,大模型一本正經(jīng)地胡說八道(即 AI 幻覺)是不可接受的。

2025 年,盡管 DeepSeek 等國產(chǎn)模型讓 AI 普及到了千家萬戶,但大多數(shù)通用模型公司并未將「降幻覺」提升到與寫代碼、做數(shù)學(xué)題同等的高度。

百川選擇了一條更難的路:將醫(yī)療幻覺抑制前移。

不同于行業(yè)通用的「外掛知識(shí)庫」(RAG)模式,Baichuan-M3 試圖從「基因」里剔除幻覺。

技術(shù)團(tuán)隊(duì)構(gòu)建了一套事實(shí)感知強(qiáng)化學(xué)習(xí)(Fact-Aware RL)架構(gòu)。


簡單來說,就是在模型訓(xùn)練的每一次獎(jiǎng)懲中,都加入對(duì)醫(yī)學(xué)事實(shí)的嚴(yán)苛校驗(yàn)。

這相當(dāng)于在 AI 的大腦里植入了一個(gè)實(shí)時(shí)的「審稿人」。

當(dāng)模型試圖為了讓答案看起來通順而編造一個(gè)藥物劑量時(shí),懲罰機(jī)制會(huì)立刻介入。

這種「內(nèi)化」的訓(xùn)練方法效果顯著。

在不依賴任何外部搜索工具的情況下,M3 的醫(yī)療幻覺率降至 3.5%!

這一數(shù)據(jù)不僅優(yōu)于 GPT-5.2,更是刷新了全球的最好成績。

對(duì)于百小應(yīng)的用戶來說,這意味著 AI 給出的每一條建議,是基于嚴(yán)謹(jǐn)醫(yī)學(xué)邏輯的「負(fù)責(zé)任表達(dá)」。

在遇到自身知識(shí)邊界外的復(fù)雜病例時(shí),M3 更傾向于引導(dǎo)就醫(yī),而不是盲目自信地開方。

誰來給「AI 醫(yī)生」監(jiān)考?

如何評(píng)價(jià)一個(gè)醫(yī)生的水平?看他背了多少書,還是看他治好了多少人?

過去,以 HealthBench 為代表的評(píng)測集,更像是醫(yī)學(xué)院的筆試題。

它考核的是 AI「會(huì)不會(huì)回答問題」。

但在百川看來,這遠(yuǎn)遠(yuǎn)不夠。

臨床如戰(zhàn)場,醫(yī)生面對(duì)的是動(dòng)態(tài)的、混亂的、信息不全的真實(shí)世界。

醫(yī)療模型必須要能夠帶著診療目標(biāo),完整的收集患者信息。

為了給 M3 一場真正的「臨床大考」,百川聯(lián)合 150 多位一線醫(yī)生,借鑒醫(yī)學(xué)教育中經(jīng)典的 OSCE(客觀結(jié)構(gòu)化臨床考試)方法,搭建了 SCAN-bench 評(píng)測體系。

這是一個(gè)包含病史采集、輔助檢查、精準(zhǔn)診斷全流程的動(dòng)態(tài)考場。

AI 不僅要答對(duì)最后的病名,還要被考核「問診思路是否清晰」、「檢查開得是否合理」、「有沒有漏掉高危風(fēng)險(xiǎn)」。

在實(shí)驗(yàn)過程中百川發(fā)現(xiàn),問診準(zhǔn)確度每增加 2%,最終診療結(jié)果的準(zhǔn)確度就會(huì)提升 1%。評(píng)測結(jié)果顯示,M3 在SCAN的四個(gè)維度均顯著高于人類醫(yī)生基線水平,并大幅領(lǐng)先于國內(nèi)外頂尖模型。


分?jǐn)?shù)超越人類醫(yī)生平均值并非意味著 AI 已經(jīng)全面超越了名醫(yī),但在標(biāo)準(zhǔn)化的問診流程、知識(shí)的廣度以及對(duì)指南的絕對(duì)遵循上,AI 展現(xiàn)出了人類難以比擬的穩(wěn)定性。

醫(yī)療 AI 的「最后一公里」

技術(shù)的高低,最終要落回到具體的應(yīng)用場景中。

隨著 M3 的發(fā)布,百川智能旗下的醫(yī)療應(yīng)用「百小應(yīng)」正在經(jīng)歷一場靜悄悄的質(zhì)變。

在過去,患者去醫(yī)院就像是一場「盲盒游戲」。

排隊(duì)三小時(shí),看病三分鐘,面對(duì)醫(yī)生時(shí)語無倫次,把關(guān)鍵病史忘得一干二凈。

而接入 M3 后的百小應(yīng),正在試圖成為醫(yī)患之間的「翻譯官」。

在患者端,它是一個(gè) 24 小時(shí)在線的「全科醫(yī)生助理」。

當(dāng)你感到不適,它通過多輪專業(yè)的追問,幫你理清病情,生成一份專業(yè)的病情摘要。

在醫(yī)生端,這可能意味著工作流的重塑。

當(dāng)患者坐到診室時(shí),醫(yī)生看到的將會(huì)是一份已經(jīng)排除了基礎(chǔ)風(fēng)險(xiǎn)、羅列了關(guān)鍵癥狀的結(jié)構(gòu)化報(bào)告。

醫(yī)生可以跳過機(jī)械的信息收集環(huán)節(jié),直接進(jìn)入高價(jià)值的診斷與治療決策。

這就是百川強(qiáng)調(diào)的「強(qiáng)推理、低幻覺的醫(yī)療服務(wù)能力」的真實(shí)落地。

它不試圖取代醫(yī)生,而是試圖通過提升問診能力、準(zhǔn)確性,來幫助醫(yī)生決策。

披荊斬棘的 AI 醫(yī)療先鋒

2026 年初,全球 AI 醫(yī)療的競爭已進(jìn)入深水區(qū)。

從 OpenAI 的 ChatGPT Health 到 Anthropic 的 Claude for Healthcare,巨頭們都在爭奪這塊最難啃的骨頭。

在這場競速中,Baichuan-M3 的出現(xiàn)具有特殊的標(biāo)本意義。

它標(biāo)志著中國 AI 醫(yī)療從「跟隨者」轉(zhuǎn)身為「定義者」。

百川證明了,通過對(duì)醫(yī)療決策過程的深度建模,大模型可以走出「聊天機(jī)器人」的舒適區(qū),進(jìn)入嚴(yán)肅、嚴(yán)謹(jǐn)且充滿敬畏的臨床世界。

技術(shù)是冰冷的,但醫(yī)療永遠(yuǎn)關(guān)乎人性的溫度。

AI 無法替代醫(yī)生握住患者顫抖的手,但它可以讓醫(yī)生在握手之前,看得更清楚、判得更準(zhǔn)確。

針對(duì)人口老齡化,AI 是最靠譜的解決優(yōu)質(zhì)醫(yī)療資源短缺的幾乎唯一的方案。

百川作為國內(nèi)最早一批開始探索 AI 醫(yī)療的公司,在迷霧中努力探索出一條可落地的 AI 賦能醫(yī)療的道路。

參考資料:

百川開源全球最強(qiáng)醫(yī)療大模型M3,「嚴(yán)肅問診」定義AI醫(yī)療新能力

百小應(yīng)網(wǎng)頁端:https://ying.baichuan-ai.com/chat

開源鏈接:

Hugging Face 地址:

https://huggingface.co/baichuan-inc/Baichuan-M3-235B

GitHub 地址:

https://github.com/baichuan-inc/Baichuan-M3-235B


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
特朗普“威脅”古巴等國,中方表態(tài)

特朗普“威脅”古巴等國,中方表態(tài)

新京報(bào)政事兒
2026-01-05 18:03:03
曹丕"荒淫無度"在位7年就駕崩?以他的玩法,40歲實(shí)屬是高壽!

曹丕"荒淫無度"在位7年就駕崩?以他的玩法,40歲實(shí)屬是高壽!

沈言論
2026-01-07 18:55:03
輸給青島隊(duì)16分!揪出3大“廢柴”,坑慘了遼寧隊(duì)

輸給青島隊(duì)16分!揪出3大“廢柴”,坑慘了遼寧隊(duì)

體育哲人
2026-01-13 22:22:44
舞蹈家劉巖近況,癱瘓17年后有了新身份,曾令張藝謀深感慚愧

舞蹈家劉巖近況,癱瘓17年后有了新身份,曾令張藝謀深感慚愧

老范談史
2026-01-02 11:37:59
又一個(gè)巨頭崛起!年入8715億,超越華為,成第三民營企業(yè)!

又一個(gè)巨頭崛起!年入8715億,超越華為,成第三民營企業(yè)!

牛牛叨史
2025-12-23 23:07:38
為什么感覺美國在走向衰落?那是因?yàn)槟闶侵袊?>
    </a>
        <h3>
      <a href=扶蘇聊歷史
2025-12-19 10:02:54
千牛衛(wèi)是多大的官,怎么李元芳總是顯擺,擱今天是什么職務(wù)?

千牛衛(wèi)是多大的官,怎么李元芳總是顯擺,擱今天是什么職務(wù)?

銘記歷史呀
2026-01-12 13:45:10
合川殺豬宴火到央視!人民日?qǐng)?bào)點(diǎn)名,惡心事發(fā)生,網(wǎng)名呆呆難保住

合川殺豬宴火到央視!人民日?qǐng)?bào)點(diǎn)名,惡心事發(fā)生,網(wǎng)名呆呆難保住

李健政觀察
2026-01-13 14:55:06
A股:一季度樂觀,2026年有望進(jìn)一步上行

A股:一季度樂觀,2026年有望進(jìn)一步上行

和訊網(wǎng)
2026-01-13 22:29:03
出圈了!代旭兒子小名叫代勁,妻子尹雨航被稱女版鹿晗

出圈了!代旭兒子小名叫代勁,妻子尹雨航被稱女版鹿晗

愛吃冰棍的小痞子
2026-01-13 12:02:06
新加坡不許收臺(tái),話音剛落,央視公布“南天門計(jì)劃”,信號(hào)不尋常

新加坡不許收臺(tái),話音剛落,央視公布“南天門計(jì)劃”,信號(hào)不尋常

小虎新車推薦員
2026-01-13 00:47:54
0.7秒三分壓哨絕殺!CBA又現(xiàn)死亡絕殺:男籃天才后衛(wèi)太橫了!

0.7秒三分壓哨絕殺!CBA又現(xiàn)死亡絕殺:男籃天才后衛(wèi)太橫了!

籃球快餐車
2026-01-13 03:10:19
貝克漢姆和貝嫂沒向兒媳道歉,兒子表示:你們以后別跟我聯(lián)系了

貝克漢姆和貝嫂沒向兒媳道歉,兒子表示:你們以后別跟我聯(lián)系了

民間平哥
2026-01-13 10:12:39
收評(píng):三大指數(shù)均漲超1% 兩市成交額3.6萬億創(chuàng)歷史新高

收評(píng):三大指數(shù)均漲超1% 兩市成交額3.6萬億創(chuàng)歷史新高

財(cái)聯(lián)社
2026-01-12 15:04:34
男子自述先后被4家醫(yī)院誤診癌癥,當(dāng)?shù)匦l(wèi)健局回應(yīng):將進(jìn)行核查,男子:不是博流量,接受任何公平公正調(diào)查

男子自述先后被4家醫(yī)院誤診癌癥,當(dāng)?shù)匦l(wèi)健局回應(yīng):將進(jìn)行核查,男子:不是博流量,接受任何公平公正調(diào)查

觀威海
2026-01-12 14:30:06
終于知道為啥要抓馬杜羅的夫人了!知道她厲害,沒想到這么厲害!

終于知道為啥要抓馬杜羅的夫人了!知道她厲害,沒想到這么厲害!

今日養(yǎng)生之道
2026-01-06 20:07:20
戴笠霸占胡蝶3年?胡蝶晚年坦言:戴笠對(duì)我很好,我不會(huì)忘記他的

戴笠霸占胡蝶3年?胡蝶晚年坦言:戴笠對(duì)我很好,我不會(huì)忘記他的

雍親王府
2026-01-12 16:30:03
百萬粉絲網(wǎng)紅去世,知情人:系熬夜猝死

百萬粉絲網(wǎng)紅去世,知情人:系熬夜猝死

魯中晨報(bào)
2026-01-13 20:25:04
張水華身體損耗遠(yuǎn)超想象,血槽還沒有滿,下一場比賽可能無限延期

張水華身體損耗遠(yuǎn)超想象,血槽還沒有滿,下一場比賽可能無限延期

楊華評(píng)論
2026-01-13 20:49:44
此人曾任南寧市委書記,連續(xù)兩屆當(dāng)選中央候補(bǔ)委員,卻在1985年被降職為處長

此人曾任南寧市委書記,連續(xù)兩屆當(dāng)選中央候補(bǔ)委員,卻在1985年被降職為處長

寄史言志
2026-01-13 21:53:10
2026-01-13 23:03:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
14326文章數(shù) 66456關(guān)注度
往期回顧 全部

科技要聞

每年10億美元!谷歌大模型注入Siri

頭條要聞

員工被辭退索賠89萬遭公司反訴索賠214萬 歷時(shí)2年判了

頭條要聞

員工被辭退索賠89萬遭公司反訴索賠214萬 歷時(shí)2年判了

體育要聞

他帶出國乒世界冠軍,退休后為愛徒返場

娛樂要聞

蔡卓妍承認(rèn)新戀情,與男友林俊賢感情穩(wěn)定

財(cái)經(jīng)要聞

"天量存款"將到期 資金會(huì)否搬入股市?

汽車要聞

限時(shí)9.99萬元起 2026款啟辰大V DD-i虎鯨上市

態(tài)度原創(chuàng)

藝術(shù)
手機(jī)
旅游
健康
軍事航空

藝術(shù)要聞

書法爭議再起:拙與妍孰優(yōu)孰劣引發(fā)熱議

手機(jī)要聞

iPhone18會(huì)漲價(jià)嗎?漲了,又好像沒漲......

旅游要聞

肇慶最大落羽杉群進(jìn)入最佳觀賞期,不妨乘一艘玻璃船入畫游

血常規(guī)3項(xiàng)異常,是身體警報(bào)!

軍事要聞

美媒:美對(duì)伊朗行動(dòng)選項(xiàng)"遠(yuǎn)超傳統(tǒng)空襲"

無障礙瀏覽 進(jìn)入關(guān)懷版