国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

王小川批醫(yī)療AI“假東西太多”!新模型幻覺率僅2.6%,兩周免費(fèi)

0
分享至


智東西
作者 陳駿達(dá)
編輯 李水青

智東西1月22日報道,今天,百川智能發(fā)布了Baichuan-M3-Plus詢證增強(qiáng)醫(yī)療大模型,這一模型采用了M2-Plus同款的“六源詢證”方法,再次刷新行業(yè)SOTA,幻覺率僅為2.6%。

此外,Baichuan-M3-Plus還首創(chuàng)了“證據(jù)錨定”技術(shù),讓AI回答中的每個結(jié)論和證據(jù)都能精準(zhǔn)匹配到原文獻(xiàn)的具體位置,據(jù)稱匹配率高達(dá)95%,遠(yuǎn)超行業(yè)40%-50%的平均水準(zhǔn)。

這一模型采用API模式對外提供服務(wù),價格較前代模型下降70%,并在發(fā)布后兩周內(nèi)免費(fèi),為醫(yī)務(wù)工作者提供服務(wù)的機(jī)構(gòu)可通過“海納百川計劃”長期免費(fèi)使用。

Baichuan-M3-Plus發(fā)布之際,智東西等媒體來到百川總部與百川智能創(chuàng)始人兼CEO王小川和百川智能模型技術(shù)負(fù)責(zé)人鞠強(qiáng)面對面溝通,他們分享了M3 Plus背后的技術(shù)細(xì)節(jié),以及對行業(yè)熱點(diǎn)議題的看法。


在交流中,王小川多次強(qiáng)調(diào),醫(yī)療AI的核心目標(biāo)應(yīng)始終指向患者利益本身。他主動回應(yīng)了近期張文宏關(guān)于“拒絕在病歷系統(tǒng)中引入AI、擔(dān)心影響年輕醫(yī)生成長”的觀點(diǎn),直言如果因?yàn)閾?dān)憂AI影響醫(yī)生訓(xùn)練而限制其應(yīng)用,本質(zhì)上就是將當(dāng)下的患者作為醫(yī)生成長的成本。

在他看來,“AI+醫(yī)生”已在多個場景中展現(xiàn)出優(yōu)于單純依靠醫(yī)生的潛力,而醫(yī)生同樣存在判斷偏差與“幻覺”,從客觀數(shù)據(jù)看,當(dāng)前醫(yī)療AI的幻覺率并不高于人類醫(yī)生。

與此同時,王小川還談到,中國醫(yī)生對AI工具接納度偏低,并非模型能力不足,而是醫(yī)療系統(tǒng)高強(qiáng)度運(yùn)轉(zhuǎn)與行業(yè)風(fēng)氣的影響。

一方面,國內(nèi)醫(yī)生單日接診量遠(yuǎn)高于海外,幾乎沒有時間真正使用和驗(yàn)證AI工具;另一方面,醫(yī)療AI領(lǐng)域缺乏求真的狀態(tài),“假的東西太多了”,真正有技術(shù)突破的產(chǎn)品反而難以快速建立信任。

他呼吁,國內(nèi)行業(yè)應(yīng)該良性競爭,把醫(yī)療行業(yè)做得更真實(shí),這樣發(fā)展速度才會加快,否則就會有很多“皇帝的新衣”。

當(dāng)智東西問及百川目前API客戶群體的畫像時,王小川回應(yīng)道,M3發(fā)布前百川已經(jīng)擁有一批機(jī)構(gòu)用戶,包括醫(yī)院和為醫(yī)院提供科研輔助能力的中小企業(yè)。M3模型發(fā)布后,伴隨著近期價格調(diào)整和合作伙伴關(guān)系的推進(jìn),客戶結(jié)構(gòu)預(yù)計會發(fā)生較大變化。

體驗(yàn)鏈接:https://www.baichuan-ai.com

一、從六源詢證到證據(jù)錨定,如何把醫(yī)療AI“拉回白盒”

上周,百川智能正式開源了當(dāng)前業(yè)界醫(yī)學(xué)能力最出色的開源模型Baichuan-M3。該模型在權(quán)威醫(yī)療AI基準(zhǔn)測試HealthBench中位列全球第一,表現(xiàn)超越了OpenAI最強(qiáng)模型。

Baichuan-M3-Plus以M3底座為基礎(chǔ),結(jié)合百川首創(chuàng)的“六元循證系統(tǒng)”,在M3原有抗幻覺能力之上進(jìn)一步降低了幻覺發(fā)生率。


百川對“降低幻覺率”的執(zhí)著,源于當(dāng)前醫(yī)療AI領(lǐng)域中一些較為突出的問題,F(xiàn)場演示中,鞠強(qiáng)揭示了部分醫(yī)療AI產(chǎn)品存在的幻覺現(xiàn)象:AI生成的答案表面看來專業(yè)性強(qiáng),引用了論文、指南、藥品說明書等來源,但實(shí)際內(nèi)容錯誤率可能高達(dá)90%。這種“看似專業(yè)”的幻覺,對于經(jīng)驗(yàn)尚淺的醫(yī)生或普通用戶而言,潛藏的風(fēng)險更為顯著。

此類幻覺往往源于一個常見問題:AI引用的內(nèi)容與其所要支持的表述之間缺乏實(shí)質(zhì)關(guān)聯(lián)。

對醫(yī)生和用戶來說,核驗(yàn)這些引用的正確性過程繁瑣,需要耗費(fèi)大量時間逐條核對,反而可能增加工作負(fù)擔(dān)。

為此,百川創(chuàng)新性地引入“證據(jù)錨定技術(shù)”,確保模型引用的段落與表述嚴(yán)格對應(yīng),并可精確定位至原文位置,使證據(jù)具備可核驗(yàn)、可追溯的特性,最終實(shí)現(xiàn)診療輔助過程的“白盒化”。


本次Baichuan-M3-Plus將采用低成本API的模式對外提供服務(wù)。通過模型架構(gòu)、Infra等層面的工程優(yōu)化,Baichuan-M3-Plus的API價格較前代模型下降70%。

發(fā)布后兩周內(nèi),Baichuan-M3-Plus將完全免費(fèi)。此外,百川智能創(chuàng)始人兼CEO王小川還宣布了“海納百川計劃”,將面向所有為醫(yī)務(wù)工作者提供服務(wù)的機(jī)構(gòu)免費(fèi)提供詢證增強(qiáng)的M3-Plus API服務(wù),以促進(jìn)行業(yè)的協(xié)作和發(fā)展。王小川稱,這項(xiàng)免費(fèi)服務(wù)的成本最高可能達(dá)到1億元左右。

新模型API價格的大幅下調(diào)背后有多重驅(qū)動因素。鞠強(qiáng)介紹,上一代M2模型仍是稠密模型,而M3架構(gòu)已經(jīng)切換為MoE,這一變化本身就能帶來不少成本收益。

此外,百川還對業(yè)內(nèi)廣受采用的投機(jī)采樣技術(shù)Eagle3進(jìn)行了升級,加入了門控機(jī)制,進(jìn)一步提升推理效率。

二、王小川回應(yīng)“AI影響醫(yī)生成長”言論:患者不該為醫(yī)生成長買單

日前,張文宏拒絕把AI引入醫(yī)院病歷系統(tǒng),認(rèn)為其會影響年輕醫(yī)生成長的言論,引發(fā)廣泛討論。

王小川在采訪中主動提到了這一討論,并做出全面的回應(yīng)。

他認(rèn)為,患者利益應(yīng)置于首位,當(dāng)前“AI+醫(yī)生”模式已顯示出優(yōu)于單純依靠醫(yī)生的潛力,符合醫(yī)學(xué)發(fā)展規(guī)律。若因擔(dān)憂AI可能影響醫(yī)生成長而限制其應(yīng)用,實(shí)則可能阻礙對患者有益的技術(shù)進(jìn)步——“醫(yī)生的成長不能以當(dāng)下的患者作為成本”。醫(yī)生也有幻覺,而目前AI的幻覺率其實(shí)比醫(yī)生更低。

在應(yīng)用方法上,王小川認(rèn)為尚有探索空間。若擔(dān)心醫(yī)生能力因AI而退化,可調(diào)整使用方式,例如讓AI輔助年輕醫(yī)生,在診療過程中提供實(shí)時提醒與校驗(yàn)。

王小川還談到了許多醫(yī)院做大模型的現(xiàn)象,他認(rèn)為:“醫(yī)生不是造模型的,醫(yī)生是用模型的,AlphaGo也不是圍棋選手造的,而是谷歌造的!彪p方應(yīng)做好專業(yè)分工。

其實(shí),百川與醫(yī)生群體有較為密切的合作。鞠強(qiáng)提到,百川與其它通用大模型公司的一個核心區(qū)別是,他們擁有一支專業(yè)的專職醫(yī)生團(tuán)隊(duì)。

這個團(tuán)隊(duì)的成員擁有豐富的一線醫(yī)療經(jīng)驗(yàn)。有曾在國內(nèi)三甲醫(yī)院任職的醫(yī)生以全職身份加入百川,此外百川還與合作的醫(yī)院建立了深度協(xié)作,有醫(yī)生長期駐場,提供醫(yī)學(xué)指導(dǎo)。

第二部分的支持來自一個更為廣泛的專家網(wǎng)絡(luò)。百川內(nèi)部的專職醫(yī)生團(tuán)隊(duì)組建并管理著一個覆蓋所有主要臨床學(xué)科的兼職醫(yī)學(xué)專家團(tuán),規(guī)模達(dá)數(shù)百人。他們?yōu)榘俅ǖ哪P脱邪l(fā)提供高質(zhì)量的專業(yè)知識輸入和數(shù)據(jù)支持。

三、察言觀色的醫(yī)療AGI三年內(nèi)實(shí)現(xiàn),國內(nèi)采用率低不是模型原因

王小川還給出了他對AGI(通用人工智能)級別AI醫(yī)生何時到來的預(yù)判。他認(rèn)為,在具身智能領(lǐng)域,能完成做手術(shù)這類操作的AI可能還較遠(yuǎn),但進(jìn)行表達(dá)、察言觀色的AGI級別AI醫(yī)生,有望在3年內(nèi)實(shí)現(xiàn)。

采訪中,有一組數(shù)據(jù)被反復(fù)提及,在美國醫(yī)療AI工具OpenEvidence在醫(yī)生群體中的滲透率已經(jīng)達(dá)到45%,但中國醫(yī)生對AI工具接納度、使用率仍不高。

王小川認(rèn)為,這一現(xiàn)象不是由模型能力導(dǎo)致的,而是與國內(nèi)的醫(yī)療系統(tǒng)現(xiàn)狀和醫(yī)療AI行業(yè)的風(fēng)氣有關(guān)。

一方面,中國醫(yī)生的工作壓力很大,美國醫(yī)生可能一天需要看10個病人,而中國醫(yī)生可能是50-100人,平均到每個患者身上只有3-5分鐘。這導(dǎo)致國內(nèi)醫(yī)生沒有時間好好地使用AI產(chǎn)品。

另一方面,王小川認(rèn)為國內(nèi)的醫(yī)療AI產(chǎn)品并沒有真實(shí)地表達(dá)技術(shù)進(jìn)展,虛假的產(chǎn)品過多,而真東西發(fā)布后也難以快速取得信任。他呼吁行業(yè)真誠地評價、表達(dá)技術(shù)進(jìn)展,推動良性競爭,把醫(yī)療行業(yè)做得更真實(shí),這樣速度才會加快,否則就會有很多“皇帝的新衣”。

圍繞AI醫(yī)療的責(zé)任邊界、商業(yè)模式和未來方向,王小川認(rèn)為,在現(xiàn)行法規(guī)下,AI模型不能直接給出最終診斷,權(quán)力和責(zé)任仍由醫(yī)生承擔(dān),AI只是輔助工具;同時,美國已在部分地區(qū)允許AI直接開處方,這為中國未來制度探索提供了參考。

在商業(yè)模式上,百川不會簡單復(fù)制美國OpenEvidence通過藥企營銷變現(xiàn)的路徑,而是堅(jiān)持符合中國國情,在合規(guī)前提下通過學(xué)術(shù)體系等方式參與醫(yī)療生態(tài)建設(shè)。相比美國醫(yī)院提效帶來的巨大市場空間,中國醫(yī)療AI必須尋找不同的價值回報方式。

在AI制藥領(lǐng)域,百川目前的重點(diǎn)不在早期分子發(fā)現(xiàn)或患者招募,而是通過藥效評價、藥物伴隨和數(shù)字化伴隨(Digital Companion)體系,提高真實(shí)世界中的藥物療效,本質(zhì)上屬于精準(zhǔn)醫(yī)療方向。

針對醫(yī)療AI“幻覺”的可接受閾值問題,王小川指出,是否接受由醫(yī)院和醫(yī)療體系決定,而非由企業(yè)單方面設(shè)定;百川的定位是先輔助醫(yī)生,再服務(wù)患者。隨著醫(yī)生對AI工具的逐步適應(yīng),未來兩到三年內(nèi),醫(yī)療行業(yè)對AI的接受度有望顯著提升,這需要政策、行業(yè)伙伴與技術(shù)共同推動。

結(jié)語:醫(yī)療AI熱度攀升,落地與信任成關(guān)鍵因素

近幾周,AI醫(yī)療健康領(lǐng)域迎來多個新玩家,國外的OpenAI、Anthropic,國內(nèi)的京東等大廠與多家創(chuàng)企都相繼發(fā)布了新品,賽道熱度不斷攀升。

不過,正如今天采訪中反復(fù)提到的那樣,影響醫(yī)療AI落地的因素不只是模型能力本身。如何獲取用戶和專業(yè)醫(yī)生群體的信賴,如何與真實(shí)場景結(jié)合并解決具體問題,或許比發(fā)布模型和產(chǎn)品本身更為關(guān)鍵,也更考驗(yàn)企業(yè)的長期投入。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
海外華人回國后態(tài)度集體轉(zhuǎn)變!斬殺線開始蔓延,崇洋媚外者被打臉

海外華人回國后態(tài)度集體轉(zhuǎn)變!斬殺線開始蔓延,崇洋媚外者被打臉

墨印齋
2026-01-21 16:08:39
賈國龍適合辦機(jī)關(guān)食堂

賈國龍適合辦機(jī)關(guān)食堂

次元君情感
2026-01-22 04:03:48
你見過最暖的撿奶茶現(xiàn)場嗎?一車奶茶傾瀉,路人集體變身“撿購俠”;網(wǎng)友:陜西人“嫽咋咧”!

你見過最暖的撿奶茶現(xiàn)場嗎?一車奶茶傾瀉,路人集體變身“撿購俠”;網(wǎng)友:陜西人“嫽咋咧”!

大風(fēng)新聞
2026-01-22 10:57:04
島內(nèi)投票結(jié)果公布,賴清德犯大錯,送給鄭麗文機(jī)會,盧秀燕失算了

島內(nèi)投票結(jié)果公布,賴清德犯大錯,送給鄭麗文機(jī)會,盧秀燕失算了

近史談
2026-01-22 09:50:08
大海慟哭,渤海二號石油鉆井平臺沉沒,事故背后隱藏著悲慘真相

大海慟哭,渤海二號石油鉆井平臺沉沒,事故背后隱藏著悲慘真相

丞丞故事匯
2026-01-22 06:09:45
女人釋放這6種暗示,別猶豫!主動擁抱她,十拿九穩(wěn)不被拒

女人釋放這6種暗示,別猶豫!主動擁抱她,十拿九穩(wěn)不被拒

大熊歡樂坊
2026-01-21 06:42:55
京東外賣加熱餐箱覆蓋11城:升溫20℃!全職騎手免費(fèi)配

京東外賣加熱餐箱覆蓋11城:升溫20℃!全職騎手免費(fèi)配

快科技
2026-01-23 00:04:32
你知道哪些毀人三觀的事情?網(wǎng)友:雖然有點(diǎn)辣眼睛,但確實(shí)愛看哦

你知道哪些毀人三觀的事情?網(wǎng)友:雖然有點(diǎn)辣眼睛,但確實(shí)愛看哦

帶你感受人間冷暖
2026-01-19 00:05:09
要是世上真有后悔藥,34歲的秦俊杰指定第一個沖上去搶!

要是世上真有后悔藥,34歲的秦俊杰指定第一個沖上去搶!

小光侃娛樂
2026-01-22 08:00:09
利物浦領(lǐng)跑沃頓爭奪戰(zhàn),水晶宮標(biāo)價6500萬英鎊

利物浦領(lǐng)跑沃頓爭奪戰(zhàn),水晶宮標(biāo)價6500萬英鎊

樂道足球
2026-01-22 19:36:54
北京網(wǎng)約車司機(jī)一天跑了74單,同行直呼“突破想象”

北京網(wǎng)約車司機(jī)一天跑了74單,同行直呼“突破想象”

數(shù)讀網(wǎng)約車
2026-01-22 11:12:46
滾出去!中國不是“撿破爛”的:日本混不下去,就想回中方撈金?

滾出去!中國不是“撿破爛”的:日本混不下去,就想回中方撈金?

比利
2026-01-20 14:37:21
家長反映成都為什么不能按照慣例放假,教育局回復(fù)來了

家長反映成都為什么不能按照慣例放假,教育局回復(fù)來了

天府觀察
2026-01-21 15:03:44
韓媒:打進(jìn)決賽后信心爆棚!中國媒體放話日本比越南更好打

韓媒:打進(jìn)決賽后信心爆棚!中國媒體放話日本比越南更好打

星耀國際足壇
2026-01-22 22:32:15
中紀(jì)委明確飯局紅線:公職人員,這5類飯局別碰

中紀(jì)委明確飯局紅線:公職人員,這5類飯局別碰

娛樂督察中
2026-01-16 16:25:33
2025年中國GDP將超20萬億美元,占美國64%

2025年中國GDP將超20萬億美元,占美國64%

翡翠清泉
2026-01-21 22:33:21
大寒過后,建議女人多吃它,簡單一煮,一周吃3回,補(bǔ)氣血不上火

大寒過后,建議女人多吃它,簡單一煮,一周吃3回,補(bǔ)氣血不上火

Lily美食談
2026-01-22 22:52:17
瑤瑤被殺案二審結(jié)果來了:維持原判,“金毛”家要后繼無人了

瑤瑤被殺案二審結(jié)果來了:維持原判,“金毛”家要后繼無人了

江山揮筆
2026-01-22 10:39:37
云南首家山姆會員商店將在官渡區(qū)落地

云南首家山姆會員商店將在官渡區(qū)落地

8099999街頭巷尾
2026-01-22 18:07:04
2026年高考全國統(tǒng)考時間確定!四大趨勢值得關(guān)注

2026年高考全國統(tǒng)考時間確定!四大趨勢值得關(guān)注

大象新聞
2026-01-22 10:53:02
2026-01-23 01:32:49
智東西 incentive-icons
智東西
聚焦智能變革,服務(wù)產(chǎn)業(yè)升級。
11107文章數(shù) 116942關(guān)注度
往期回顧 全部

科技要聞

幾千億只是開胃菜,AI基建還得再砸?guī)兹f億

頭條要聞

猝死程序員底薪3千24小時待命 公司前三季度營收180億

頭條要聞

猝死程序員底薪3千24小時待命 公司前三季度營收180億

體育要聞

跑個步而已,他們在燃什么?

娛樂要聞

車銀優(yōu)賺800億 涉嫌逃稅200億!

財經(jīng)要聞

西貝拿到“救命錢”,然后呢

汽車要聞

配備多塊娛樂屏 極氪8X內(nèi)飾曝光

態(tài)度原創(chuàng)

時尚
教育
手機(jī)
本地
家居

這些才是最日常的冬季穿搭!不露腿、不扮嫩,簡約舒適又保暖

教育要聞

32歲程序員倒在客廳:請告訴孩子,這3條底線比考滿分重要!

手機(jī)要聞

20周年版iPhone或依然難以實(shí)現(xiàn)“真全面屏”設(shè)計

本地新聞

云游中國|格爾木的四季朋友圈,張張值得你點(diǎn)贊

家居要聞

法式風(fēng)情 南洋中古居

無障礙瀏覽 進(jìn)入關(guān)懷版