国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

首創(chuàng)證據(jù)錨定技術(shù),百川推出最低幻覺循證增強醫(yī)療大模型M3 Plus

0
分享至

勇礪商業(yè)評論 阿桶觀察 白麗

1月22日,百川智能正式發(fā)布 Baichuan-M3 Plus,嚴肅醫(yī)療場景下的問答準確性、可靠性,再次刷新了剛剛推出的M3所創(chuàng)下的世界紀錄。憑借獨創(chuàng)的六源循證技術(shù)與M3基座結(jié)合,M3 Plus將幻覺率降低至2.6%,低于 Open Evidence,達到全球最低水平;首創(chuàng)“證據(jù)錨定”技術(shù),不僅給出引文來源,還能將模型生成的每一句醫(yī)學結(jié)論,精確錨定到原始論文中的對應(yīng)證據(jù)段落,使 AI 的醫(yī)學判斷真正做到可核驗、可追責、可教學。

更具意義的是,百川宣布推出「海納百川」計劃,將全球最低幻覺的循證增強醫(yī)療大模型以API形式,免費開放給中國醫(yī)療服務(wù)機構(gòu),共同繁榮國內(nèi)的AI醫(yī)療生態(tài),推動中國AI醫(yī)療的變革,讓每一位中國醫(yī)務(wù)工作者都能擁有可靠、好用的AI助手。

低幻覺率再次刷新世界紀錄,讓AI具備邁向臨床的診療能力

對于中國的醫(yī)生而言,擁抱AI的先決條件,是AI真實具備了足夠優(yōu)秀的診療能力。當患者頻繁使用DeepSeek、豆包等通用大模型的AI產(chǎn)品去尋求診療建議,大量的誤判、幻覺,不僅讓醫(yī)生不勝其煩,更逐漸演變?yōu)橐粓鰧χ袊t(yī)療AI技術(shù)的信任危機。

隨著上周百川M3大模型的正式開源,這一局面已被徹底打破。M3不僅在 Healthbench、Healthbench Hard 等多個權(quán)威評測中登頂榜首,實現(xiàn)了對 GPT-5.2的全面超越,更在 OpenAI 引以為傲的低幻覺領(lǐng)域完成超越,以3.5%的幻覺率領(lǐng)跑全球。



作為百川拓展低幻覺技術(shù)路線的成功實踐,M3首創(chuàng)的 Fact-Aware RL的強化學習范式,使底座模型在無工具的設(shè)定下,幻覺也能大幅降低到SOTA水平。在此基礎(chǔ)上,M3 Plus 將 M2 Plus 模型已驗證有效的六源循證范式,引入模型訓(xùn)練和推理過程,確保模型的每條建議都有專業(yè)醫(yī)學證據(jù)支持。最終,M3 Plus的事實性幻覺降低到新的SOTA,僅2.6%,相較GPT-5.2大幅下降超30%。即便與行業(yè)標桿 Open Evidence相比,M3 Plus 也完成了超越。

首創(chuàng)“證據(jù)錨定”技術(shù):讓 AI 的每一句醫(yī)學結(jié)論,都能被逐句核驗

在循證醫(yī)學體系中,真正決定醫(yī)生是否信任一條結(jié)論的,從來不是語言是否流暢,而是結(jié)論背后的證據(jù)是否權(quán)威、是否準確、是否可追溯。相比“說得像不像醫(yī)生”,臨床更關(guān)心的是:這句話,究竟依據(jù)哪篇論文、哪條指南、哪一段原文。

當前行業(yè)中,無論是通用大模型還是醫(yī)療模型,大多已支持“文獻引用”——在結(jié)論后標注論文或指南來源。但在實際使用中,醫(yī)生往往會發(fā)現(xiàn):點開引文,依然無法判斷 AI 的這句結(jié)論究竟源自哪一段證據(jù)。更常見的問題是兩類:一是“張冠李戴”,引用編號存在,但文獻內(nèi)容對不上;二是“內(nèi)容沖突”,文獻本身正確,但被引用的段落與結(jié)論并不匹配,甚至存在拼接、誤讀。

百川 M3 Plus 首創(chuàng)“證據(jù)錨定(Evidence Anchoring)”技術(shù),不是簡單標注“引用自哪篇文獻”,而是要求模型生成的每一句醫(yī)學結(jié)論,都必須精確對應(yīng)到原始論文或指南中的具體證據(jù)段落。每一句判斷,都能被逐字溯源、逐條核驗。

為實現(xiàn)這一目標,百川將“證據(jù)錨定”作為獨立訓(xùn)練目標,引入 Citation Reward Model,對錯誤引用進行明確懲罰,讓模型只能在“確實有證據(jù)支持”的空間中推理與生成。最終,結(jié)論與證據(jù)段落的匹配準確率超過 95%,真正讓 AI 的醫(yī)學判斷做到可核驗、可追責、可教學。



M3 Plus API 調(diào)用價格較上一代模型大幅降低70%

在大模型快速演進的當下,能力越強的模型,調(diào)用成本往往越高,許多優(yōu)秀的應(yīng)用因此難以規(guī)?;涞兀y真正走進臨床一線。百川認為,只有持續(xù)降低智力成本,AI 才能覆蓋臨床、教學等真實場景,成為醫(yī)生和患者“用得起、用得好”的基礎(chǔ)能力。

為此,M3 Plus 在系統(tǒng)層面進行了全面的工程重構(gòu),通過 MoE 架構(gòu)優(yōu)化、模型量化以及 Gated Eagle-3 投機解碼等關(guān)鍵技術(shù),在嚴格保證模型能力與可靠性的前提下,實現(xiàn)了 API 調(diào)用成本較上一代降低 70%,為 AI 在醫(yī)療場景的規(guī)模化應(yīng)用掃清了關(guān)鍵障礙。

百川全面開放M3 Plus的技術(shù)能力,API限時免費體驗15天,所有開發(fā)者均可申請使用。

「海納百川」計劃開啟,M3 Plus 向行業(yè)伙伴免費開放

隨著人工智能開始進入門診、病房和醫(yī)學教學等真實場景,越來越多醫(yī)生在工作中接觸到 AI:查資料、看指南、對照證據(jù)、推敲診療方案。但在高強度、強責任的臨床環(huán)境中,AI 能在多大程度上真正幫到醫(yī)生,仍需要在真實使用中不斷探索。

醫(yī)生“用好 AI”的新局面,要靠足夠多的行業(yè)伙伴在真實場景里一起打磨——怎么嵌入醫(yī)療流程、怎么做證據(jù)呈現(xiàn)、怎么做風險提示、怎么支持年輕醫(yī)生成長。

為此,百川發(fā)起 「海納百川」計劃:面向所有服務(wù)醫(yī)務(wù)工作者的機構(gòu),免費提供全球幻覺最低循證增強醫(yī)療大模型 M3 Plus 的 API,把服務(wù)醫(yī)生的AI能力直接交到生態(tài)伙伴手里。

從核心技術(shù)的持續(xù)突破,到面向行業(yè)生態(tài)的免費開放,「海納百川」不僅是一個名字,更是一份推動中國AI+醫(yī)療發(fā)展的承諾。百川愿與行業(yè)伙伴一道,圍繞醫(yī)生、面向患者,推動醫(yī)療 AI 更安全、更可及、更有溫度地發(fā)展,讓技術(shù)進步真正轉(zhuǎn)化為人民健康的長期福祉。

「海納百川」計劃|參與條件:

適用對象:

為醫(yī)務(wù)工作者提供服務(wù)的機構(gòu)

醫(yī)務(wù)工作者包括醫(yī)生、藥劑師、醫(yī)技師、護士、健管師、醫(yī)學生等

適用場景僅限于:

臨床輔助決策、醫(yī)學教育

用途限制:

僅用于真實服務(wù)場景、不得用于數(shù)據(jù)生產(chǎn)

使用要求:

產(chǎn)品需明確展示 Powered by 百川、不得對模型輸出進行影響準確性的修改。(白麗)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
被震撼到了!哈梅內(nèi)伊一死普京馬上下令,俄羅斯全體高層緊急到場

被震撼到了!哈梅內(nèi)伊一死普京馬上下令,俄羅斯全體高層緊急到場

諾諾談史
2026-03-01 20:29:12
姚明隊友回憶往事:被火箭交易有點生氣 弗朗西斯后來直接崩了

姚明隊友回憶往事:被火箭交易有點生氣 弗朗西斯后來直接崩了

羅說NBA
2026-03-02 06:25:24
燕梳樓:如果日本驅(qū)逐薛劍,就是向中國宣戰(zhàn)!

燕梳樓:如果日本驅(qū)逐薛劍,就是向中國宣戰(zhàn)!

燕梳樓頻道
2025-11-13 12:44:36
特朗普稱同意與伊朗新領(lǐng)導(dǎo)層對話

特朗普稱同意與伊朗新領(lǐng)導(dǎo)層對話

極目新聞
2026-03-02 01:05:56
意媒:特奧狀態(tài)出現(xiàn)斷崖式下跌,若這樣下去恐難參加世界杯

意媒:特奧狀態(tài)出現(xiàn)斷崖式下跌,若這樣下去恐難參加世界杯

懂球帝
2026-03-01 14:11:10
美國警方承認谷愛凌曾遭毆打,手臂抓傷嚴重,未來人身安全存隱患

美國警方承認谷愛凌曾遭毆打,手臂抓傷嚴重,未來人身安全存隱患

削桐作琴
2026-03-01 14:27:41
陳麗君新增開庭公告

陳麗君新增開庭公告

雷達財經(jīng)
2026-02-28 14:51:38
男人的長壽密碼:心里那團火,比任何補藥都管用

男人的長壽密碼:心里那團火,比任何補藥都管用

青蘋果sht
2026-03-01 17:46:39
一人睡遍整個娛樂圈?司曉迪打響了2026年第一炮

一人睡遍整個娛樂圈?司曉迪打響了2026年第一炮

閱毒君
2026-01-05 07:05:06
我們瞧不起漂亮國也不是一天兩天了

我們瞧不起漂亮國也不是一天兩天了

霹靂炮
2026-02-08 22:17:59
美女行長落馬

美女行長落馬

資本董事局
2026-03-01 19:15:48
2100枚核彈24小時待命,張召忠曾發(fā)出警告:一旦開戰(zhàn),將無處可逃

2100枚核彈24小時待命,張召忠曾發(fā)出警告:一旦開戰(zhàn),將無處可逃

近史博覽
2026-01-22 12:52:47
中國那些所謂專家在伊朗問題上又一次出糗,接下來看他們再叭叭啥

中國那些所謂專家在伊朗問題上又一次出糗,接下來看他們再叭叭啥

壹家言
2026-03-01 21:05:09
成龍代言又添“受害者”:老牌空調(diào)巨頭宣布破產(chǎn)

成龍代言又添“受害者”:老牌空調(diào)巨頭宣布破產(chǎn)

帥真商業(yè)
2026-02-28 19:08:58
剛剛,中國AI打破醫(yī)療天花板!杭州團隊再放大招,頂尖“三甲醫(yī)生”人人可用!

剛剛,中國AI打破醫(yī)療天花板!杭州團隊再放大招,頂尖“三甲醫(yī)生”人人可用!

智藥局
2026-03-01 18:49:37
怪不得伊朗不慌!在特朗普眼皮底下,中伊悄悄搞起了導(dǎo)彈大交易

怪不得伊朗不慌!在特朗普眼皮底下,中伊悄悄搞起了導(dǎo)彈大交易

南權(quán)先生
2026-02-26 15:41:29
伊朗局勢致中東多國領(lǐng)空關(guān)閉 有中國游客轉(zhuǎn)機四趟耗時48小時回國

伊朗局勢致中東多國領(lǐng)空關(guān)閉 有中國游客轉(zhuǎn)機四趟耗時48小時回國

封面新聞
2026-03-01 18:53:22
為了掏空老百姓的口袋、故意捏造出來的5大騙局,早知道早好

為了掏空老百姓的口袋、故意捏造出來的5大騙局,早知道早好

貓叔東山再起
2026-02-28 10:00:03
伊朗發(fā)動大規(guī)模襲擊:已襲擊27個美軍基地和以軍總司令部等地;伊方公布導(dǎo)彈擊中以軍總參謀部圖

伊朗發(fā)動大規(guī)模襲擊:已襲擊27個美軍基地和以軍總司令部等地;伊方公布導(dǎo)彈擊中以軍總參謀部圖

極目新聞
2026-03-01 13:09:32
林俊杰們用行動證明:男人的終極審美,真的很一致

林俊杰們用行動證明:男人的終極審美,真的很一致

橙星文娛
2026-01-03 21:41:06
2026-03-02 07:32:49
曾憲勇 incentive-icons
曾憲勇
有趣的科技互聯(lián)網(wǎng)原創(chuàng)自媒體
694文章數(shù) 62關(guān)注度
往期回顧 全部

科技要聞

榮耀發(fā)布機器人手機、折疊屏、人形機器人

頭條要聞

伊朗多位軍事指揮官確認死亡 名單公布

頭條要聞

伊朗多位軍事指揮官確認死亡 名單公布

體育要聞

火箭輸給熱火:烏度卡又輸斯波教練

娛樂要聞

黃景瑜 李雪健坐鎮(zhèn)!38集犯罪大劇來襲

財經(jīng)要聞

中東局勢升級 如何影響A股、黃金和原油

汽車要聞

理想汽車2月交付26421輛 歷史累計交付超159萬輛

態(tài)度原創(chuàng)

教育
房產(chǎn)
家居
數(shù)碼
軍事航空

教育要聞

寧夏大學外國語學院揭秘!96.2%高落實率

房產(chǎn)要聞

濱江九小也來了!集齊海僑北+哈羅、寰島...江東教育要炸了!

家居要聞

素色肌理 品意式格調(diào)

數(shù)碼要聞

曝蘋果WWDC 26將推Core AI框架取代Core ML并公布多項AI功能

軍事要聞

伊朗前總統(tǒng)內(nèi)賈德遇襲身亡

無障礙瀏覽 進入關(guān)懷版