国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

對話夸克團(tuán)隊:能考醫(yī)生正高級職稱的AI,是怎么做到的?

0
分享至



說起 AI+醫(yī)療,很多人第一反應(yīng)是:會不會不靠譜?

然而,現(xiàn)在的 AI,已經(jīng)具備考醫(yī)生正高級職稱的能力了。

7月23日,夸克健康大模型成功通過了中國 12 門核心學(xué)科( 包括全科醫(yī)學(xué)、普通內(nèi)科學(xué)等 )的主任醫(yī)師( 正高級職稱 )筆試評測,成為國內(nèi)首個完成這一挑戰(zhàn)的大模型。



在醫(yī)療資源分布不均、全科醫(yī)生供給仍顯不足的背景下,如何借助科技手段緩解基層壓力、提升初診效率,一直是當(dāng)前行業(yè)關(guān)注的焦點。

《 中國全科醫(yī)生培養(yǎng)和使用發(fā)展報告( 2022 )》統(tǒng)計顯示,截至 2022 年,我國全國全科醫(yī)生數(shù)量約 46 萬人,人均配置僅為每萬人口 3.3 名,距離 2030 年 “ 5 名每萬人 ” 的目標(biāo)仍有顯著差距。

資源壓力催生出對可信的醫(yī)療智能系統(tǒng)的迫切需求,各個廠商紛紛入局,夸克也是其中之一。

武漢大學(xué)人民醫(yī)院腫瘤中心副主任醫(yī)師汪晶對此事評價道:“ 不管是對醫(yī)生還是患者來說,這種幫助都是一個非常大的進(jìn)步 ”。

一方面,大模型能有效改善盲目就醫(yī)現(xiàn)象,另一方面,也能提高醫(yī)療資源的匹配精準(zhǔn)度。這使得大眾能更早期發(fā)現(xiàn)病因,也會有助于減少醫(yī)院漏診、誤診的情況。

為了更深入了解相關(guān)細(xì)節(jié),知危就行業(yè)和技術(shù)兩個層面與夸克團(tuán)隊進(jìn)行了交流。

以下是知危與夸克專家團(tuán)隊的對話內(nèi)容,經(jīng)過了不改變原意的編輯。

知危:即便評測中夸克健康大模型各項能力已經(jīng)是最強(qiáng),但距離 100% 準(zhǔn)確率還很遠(yuǎn),特別是高級職稱醫(yī)生級別的問題。在這個準(zhǔn)確率下將其投入 C 端應(yīng)用,如何保證內(nèi)容質(zhì)量和安全性?

夸克:一個可供參考的角度是,在實際主任醫(yī)師職稱考試中,擁有多年經(jīng)驗的醫(yī)生的通過率在 60% 左右?淇私】荡竽P椭魅吾t(yī)師考試測試中正確率為 67.7% 。

為保障內(nèi)容質(zhì)量,我們建立了龐大的專家標(biāo)注運營體系,擁有 10 名三級醫(yī)院主治醫(yī)師以上專職醫(yī)師和簽約合作的 400 余名三甲醫(yī)院副主任醫(yī)師以上專家。他們會嚴(yán)格按照真實診療場景定義樣本構(gòu)建策略,進(jìn)行多層次審核與質(zhì)檢,確保訓(xùn)練數(shù)據(jù)和模型輸出的專業(yè)性和規(guī)范性。此外,模型內(nèi)部通過一致性驗證器校驗推理路徑與答案的一致性,并有 “ 對抗作弊 ” 機(jī)制,盡可能避免模型生成誤導(dǎo)性內(nèi)容。

知危:據(jù)稱 “ 夸克健康大模型實現(xiàn)了從初級到副高級職稱的兩級跳 ”,請問初級醫(yī)生和副高級職稱、高級職稱醫(yī)生分別需要哪些關(guān)鍵維度的能力?

夸克:夸克健康大模型在職稱考試中能力的躍升,體現(xiàn)了醫(yī)生不同層級所需的關(guān)鍵能力遞進(jìn)。

初級醫(yī)生: 核心是基礎(chǔ)醫(yī)學(xué)知識的廣度與準(zhǔn)確性,能正確解答常規(guī)疾病的單選題,掌握標(biāo)準(zhǔn)化診療流程?荚囈詥芜x題為主,案例分析占比較低。

副高級職稱醫(yī)生: 要求更強(qiáng)的專業(yè)知識深度、多選判斷和初步案例分析能力。需清晰把握正確邊界,應(yīng)對多選題比重攀升。

高級職稱醫(yī)生: 需具備卓越的綜合知識、高難度多選題判斷及深度臨床推理與綜合分析能力?荚囍卸噙x題和案例分析題比重極高,對模型在“慢思考”下結(jié)合綜合知識解決細(xì)微辯證問題的能力提出極高要求。

大模型本質(zhì)是概率模型,概率模型做單選題的時候相對容易,因為只要讓大模型選擇概率最大的選項當(dāng)作正確答案就可以。

但是多選題很不一樣,不單需要模型知道各個選項的概率,還需要知道多大的概率可以達(dá)到正確性的邊界,所以在多選題上,模型對正確答案穩(wěn)定的邊界需要非常清楚,否則容易選漏或選錯,甚至答不全。為解決這一難題,需要非常重視正確性對齊的技術(shù)。

夸克大模型在多選題和案例分析題上的表現(xiàn)遠(yuǎn)超通用模型,是 “ 慢思考 ” 深度推理能力和正確性對齊技術(shù)的體現(xiàn)。

知危:你們在醫(yī)療、健康相關(guān)搜索中索引來源是否包括了內(nèi)部知識庫和外部來源?如果有外部來源,這些內(nèi)容如何保證質(zhì)量?內(nèi)部和外部來源都允許用戶進(jìn)行來源驗證嗎?

夸克:夸克健康大模型在搜索中融合了內(nèi)部構(gòu)建的百萬級醫(yī)學(xué)知識圖譜、術(shù)語集與四大類外部權(quán)威資料,包括網(wǎng)頁數(shù)據(jù)、書籍、指南、藥品說明書、中英文文獻(xiàn)及公開病歷數(shù)據(jù)。

為保證外部內(nèi)容質(zhì)量,我們建立了 A-D 分級且細(xì)分 5-9 級的循證體系,依據(jù)出版時間、出版社權(quán)威性及臨床研究證據(jù)( 如 PubMed、臨床試驗數(shù)據(jù)庫 )對知識進(jìn)行優(yōu)先級排序和沖突消解。

模型采用 “ 邊想邊搜 ” 機(jī)制,在輸出答案時會針對每個觀點給出依據(jù)來源,方便用戶進(jìn)行論證和驗證,確保信息的透明度和可信度。

知危:你們建立了很龐大的專家標(biāo)注運營體系,這對于數(shù)據(jù)質(zhì)量和規(guī)模特別重要,也是醫(yī)療

AI 領(lǐng)域的痛點,請問你們團(tuán)隊如何實現(xiàn)這一點,在合作對象篩選上有什么原則?

夸克:我們組建了醫(yī)學(xué)運營團(tuán)隊,與超 400 位權(quán)威專家和 1000 余位專職醫(yī)生共建知識庫。合作標(biāo)準(zhǔn)以專業(yè)背景、臨床經(jīng)驗和數(shù)據(jù)處理能力為核心,優(yōu)先選擇三甲醫(yī)院資深醫(yī)生及具備科研能力的專家,確保數(shù)據(jù)專業(yè)度與一致性。

知危:過程獎勵設(shè)計和分配在學(xué)術(shù)、工程領(lǐng)域還是普遍的難題,夸克健康大模型的技術(shù)報告中講解了相關(guān)的方法,可否補(bǔ)充說明一下當(dāng)前方案的合理性和研發(fā)過程的關(guān)鍵點?

夸克:過程獎勵是構(gòu)建高可信推理模型的關(guān)鍵?淇私】荡竽P偷暮侠硇栽谟谟(xùn)練 AI 學(xué)會整體的診療思維。為此,我們團(tuán)隊構(gòu)建了獨特的 “ 可驗證強(qiáng)化學(xué)習(xí)范式 ”,通過 “ 假定模型 ” 提供過程反饋,引導(dǎo)模型形成符合臨床規(guī)范的安全思維鏈。

研發(fā)關(guān)鍵點在于:

  • 構(gòu)建符合臨床思維的高質(zhì)量思維鏈數(shù)據(jù);
  • 引入一致性驗證器模型二次校驗推理與答案一致性;
  • 有效對抗模型在訓(xùn)練中的 “ 作弊 ” 行為,即模型生成結(jié)構(gòu)合理但本質(zhì)錯誤或欺騙性的推理過程?淇送ㄟ^人工標(biāo)注負(fù)面案例和迭代訓(xùn)練驗證器,逐步壓縮模型 “ 作弊 ” 空間。

當(dāng)然,思考思維和真實醫(yī)生的能力對齊還需要一個過程。以及在復(fù)雜的延續(xù)性情景,也還需要做對齊,比如不僅要能處理病人的診斷和治療,在病情發(fā)生細(xì)微變化的時候,模型要獲取微變化的邏輯,并進(jìn)行合理決策。

知危:合成數(shù)據(jù)的應(yīng)用目前看已越來越成為共識,包括醫(yī)療行業(yè)和其它許多領(lǐng)域,請問大規(guī)模使用合成數(shù)據(jù)為夸克健康大模型研發(fā)帶來了多大的降本提效作用?

夸克:確實有顯著的降本提效作用。醫(yī)療數(shù)據(jù)高度稀缺且人工標(biāo)注成本極高。我們通過利用 SOTA LLM 生成原始思考數(shù)據(jù)( CoT ),并結(jié)合多階段訓(xùn)練中的篩選機(jī)制,極大緩解了醫(yī)療數(shù)據(jù)人工標(biāo)注的成本。

合成數(shù)據(jù)系統(tǒng)能規(guī);蓸颖,使專家精力更集中于處理核心痛點數(shù)據(jù)( 如冷啟標(biāo)注、關(guān)鍵可驗證數(shù)據(jù) ),提升整體數(shù)據(jù)生產(chǎn)效率。

另一方面,合成數(shù)據(jù)的使用對模型訓(xùn)練也有其必要性。舉一個例子,醫(yī)療專業(yè)資料里有很多圖和表,大量信息涵蓋在表格里,但表格對訓(xùn)練來說相對不是那么友好,所以需要進(jìn)行一些數(shù)據(jù)合成,把通順的自然語言匯入到底模里。

知危:夸克健康大模型的循證等級劃分體系,看起來是一個很

嚴(yán)謹(jǐn)有序的質(zhì)量驗證體系,請問如何理解目前確立的循證等級的合理性?

夸克:其合理性在于對傳統(tǒng)循證醫(yī)學(xué)原則的創(chuàng)新性適應(yīng)與拓展。

傳統(tǒng)的循證醫(yī)學(xué)標(biāo)準(zhǔn)( 如系統(tǒng)評價到未形成共識的實驗 )雖嚴(yán)謹(jǐn),但難以直接覆蓋如 WHO 資料、專業(yè)書籍等 “ 表外 ” 且非結(jié)構(gòu)化的權(quán)威醫(yī)學(xué)內(nèi)容。

為此,我們團(tuán)隊對其進(jìn)行了 “ 影射 ”,重新劃分為 ABCD 四個大等級,并進(jìn)一步細(xì)分為 5-9 個子級別。這一多層級體系的核心目的在于:

  • 沖突知識的精準(zhǔn)判別: 當(dāng)模型遇到相互沖突的知識時,該分級體系能指導(dǎo)模型根據(jù)知識來源的循證等級,優(yōu)先采納最權(quán)威、最可靠的信息,確保輸出結(jié)論的醫(yī)學(xué)嚴(yán)謹(jǐn)性。
  • 強(qiáng)調(diào)權(quán)威性與時效性: 體系高度關(guān)注知識的 “ 權(quán)威性 ” 和 “ 時效性 ”。例如,在檢索不同年份的診療指南( 如 2024 年與 2022 年的高血壓指南 )時,模型會明確優(yōu)先使用最新且更具權(quán)威性的版本,這對于快速迭代的醫(yī)學(xué)知識至關(guān)重要。
  • 保障內(nèi)容生產(chǎn)質(zhì)量: 這一體系也是大規(guī)模 AIGC 科普內(nèi)容準(zhǔn)確性的底層保障。它確保了模型在生成個性化健康科普內(nèi)容時,其背后引用的知識是經(jīng)過嚴(yán)格循證、具備高可信度的。

這套體系保障了夸克健康大模型所輸出內(nèi)容的權(quán)威性、及時性和準(zhǔn)確性,是其 “ 正確性對齊 ” 技術(shù)策略的核心組成部分。

內(nèi)容質(zhì)量對醫(yī)療領(lǐng)域的重要性不言而喻,實際上我們觀察到,很多通用大模型在輸出藥品相關(guān)用法的時候,錯誤非常分散并且非常細(xì)微。很多模型經(jīng)常把藥品名字輸錯,在某些情況下可能是致命的。比如孕婦發(fā)燒的時候,能否吃布洛芬?有些模型就會回答是能吃的。但實際上,布洛芬在 FDA 的等級是 C 類,這種情況下應(yīng)該禁用。

知危:當(dāng)前版本除了圖片,沒有引入對更多多模態(tài)信息( 比如聲音、面部表情等 )的處理,背后的原因是什么?未來是否有相關(guān)規(guī)劃?

夸克:夸克健康大模型目前支持語音轉(zhuǎn)文本后作為輸入,目前還不支持語音作為直接輸入。文本和圖像在醫(yī)療數(shù)據(jù)中更為主流且標(biāo)準(zhǔn)化。

其他模態(tài)在診斷可靠性、標(biāo)準(zhǔn)化及技術(shù)成熟度上仍面臨挑戰(zhàn),整個行業(yè)都在持續(xù)推動多模態(tài)在醫(yī)療領(lǐng)域的探索,我們也將繼續(xù)努力。

( 對話全文完 )

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
中國乘客被趕下飛機(jī)!委內(nèi)瑞拉機(jī)組回應(yīng)拒載操作:去看新聞吧!

中國乘客被趕下飛機(jī)!委內(nèi)瑞拉機(jī)組回應(yīng)拒載操作:去看新聞吧!

阿鳧愛吐槽
2026-01-07 02:10:10
TOP14位身高170以上的女神,有顏有燈有演技

TOP14位身高170以上的女神,有顏有燈有演技

素然追光
2026-01-02 02:45:02
安徽小伙在小國家創(chuàng)業(yè),“享受”一夫多妻、開放生活的他如今怎樣

安徽小伙在小國家創(chuàng)業(yè),“享受”一夫多妻、開放生活的他如今怎樣

牛牛叨史
2026-01-06 12:59:43
被壓制!火箭三分16中3落后10分:杜蘭特苦撐,楊瀚森3分3板

被壓制!火箭三分16中3落后10分:杜蘭特苦撐,楊瀚森3分3板

體壇小李
2026-01-08 12:19:06
中方是否計劃采取行動幫助馬杜羅夫婦獲釋?外交部回應(yīng)

中方是否計劃采取行動幫助馬杜羅夫婦獲釋?外交部回應(yīng)

新京報政事兒
2026-01-07 15:41:25
“流氓作家”賈平凹語出驚人:跟睡過的女人比曖昧的女人更有感覺

“流氓作家”賈平凹語出驚人:跟睡過的女人比曖昧的女人更有感覺

百態(tài)人間
2026-01-04 16:18:53
四國混血の顏值核彈!被雪藏3年回歸,她憑啥成FC2頂流女神?

四國混血の顏值核彈!被雪藏3年回歸,她憑啥成FC2頂流女神?

素然追光
2026-01-07 04:40:03
王石的體面,被田樸珺扯得干干凈凈

王石的體面,被田樸珺扯得干干凈凈

言叔財經(jīng)視角
2026-01-05 13:50:10
馮提莫瘦50斤變紙片人,自曝肚皮松成“沙皮狗”:這是減肥送的?

馮提莫瘦50斤變紙片人,自曝肚皮松成“沙皮狗”:這是減肥送的?

湘村大余
2026-01-07 16:31:08
阿莫林在曼聯(lián)多次想不干,拉爵約喝酒安撫!索帥高情商吸引管理層

阿莫林在曼聯(lián)多次想不干,拉爵約喝酒安撫!索帥高情商吸引管理層

羅米的曼聯(lián)博客
2026-01-08 11:58:00
神權(quán)支柱動搖:哈梅內(nèi)伊密擬逃亡莫斯科預(yù)案,革命衛(wèi)隊陷忠誠危機(jī)

神權(quán)支柱動搖:哈梅內(nèi)伊密擬逃亡莫斯科預(yù)案,革命衛(wèi)隊陷忠誠危機(jī)

老馬拉車莫少裝
2026-01-05 23:23:48
專家臉被打腫!2025年油車銷量逆勢暴漲,車主:終于明白了!

專家臉被打腫!2025年油車銷量逆勢暴漲,車主:終于明白了!

老特有話說
2026-01-07 00:30:03
U23亞洲杯剛剛開打,第一位下課主帥已經(jīng)誕生,中國隊漁翁得利

U23亞洲杯剛剛開打,第一位下課主帥已經(jīng)誕生,中國隊漁翁得利

綠茵舞著
2026-01-07 20:57:07
72%煙草倒掛逼哭零售戶!寧可不訂也不賠錢,市場根基正在爛根

72%煙草倒掛逼哭零售戶!寧可不訂也不賠錢,市場根基正在爛根

老特有話說
2026-01-07 00:40:03
膚色T恤搭配牛仔褲太好看了,盡顯女人的成熟美

膚色T恤搭配牛仔褲太好看了,盡顯女人的成熟美

灼灼小齊
2026-01-08 11:07:59
楊冪藍(lán)色鏤空裙照瘋傳!雪白肌膚若隱若現(xiàn),這腰臀比太頂了?

楊冪藍(lán)色鏤空裙照瘋傳!雪白肌膚若隱若現(xiàn),這腰臀比太頂了?

娛樂領(lǐng)航家
2026-01-04 22:00:03
不到48小時,特朗普或下臺,印度多500%關(guān)稅,美國又搶千萬石油

不到48小時,特朗普或下臺,印度多500%關(guān)稅,美國又搶千萬石油

藍(lán)色海邊
2026-01-08 07:10:37
南京“一混凝土攪拌車撞電動兩輪車致3死1傷”事故,調(diào)查報告公布

南京“一混凝土攪拌車撞電動兩輪車致3死1傷”事故,調(diào)查報告公布

澎湃新聞
2026-01-07 16:30:26
攤牌了?中企陸續(xù)收到光刻機(jī),外媒:ASML公司不“乖”了

攤牌了?中企陸續(xù)收到光刻機(jī),外媒:ASML公司不“乖”了

豐譚筆錄
2026-01-08 00:11:38
項立剛再次鼓吹戰(zhàn)爭之思:最可怕的是,邪惡靈魂裹上愛國外衣

項立剛再次鼓吹戰(zhàn)爭之思:最可怕的是,邪惡靈魂裹上愛國外衣

讀鬼筆記
2026-01-06 19:42:20
2026-01-08 12:48:49
知危 incentive-icons
知危
投資不立危墻之下
517文章數(shù) 1829關(guān)注度
往期回顧 全部

科技要聞

雷軍:現(xiàn)在聽到營銷這兩個字都有點惡心

頭條要聞

委內(nèi)瑞拉外長:感謝中方支持

頭條要聞

委內(nèi)瑞拉外長:感謝中方支持

體育要聞

約基奇倒下后,一位故人邪魅一笑

娛樂要聞

2026春節(jié)檔將有六部電影強(qiáng)勢上映

財經(jīng)要聞

微軟CTO韋青:未來人類會花錢"戒手機(jī)"

汽車要聞

不談顛覆與奇跡,智駕企業(yè)還能聊點什么?

態(tài)度原創(chuàng)

數(shù)碼
手機(jī)
親子
家居
游戲

數(shù)碼要聞

CES微星攜手英特爾硬核升級,第三代Ultra重塑AI PC

手機(jī)要聞

雷軍:小米終端今年有望實現(xiàn)自研芯片、OS、AI大模型“大會師”

親子要聞

你別做飯了,讓孩子放學(xué)啃綠化帶!寶媽抱怨女兒挑食,曬照后被懟

家居要聞

理性主義 冷調(diào)自由居所

《星際裂變》EA評測:老工廠游戲迷哈氣了

無障礙瀏覽 進(jìn)入關(guān)懷版