国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

36.4萬(wàn)超聲圖文對(duì)!中國(guó)團(tuán)隊(duì)構(gòu)建首個(gè)大規(guī)模超聲專屬數(shù)據(jù)集

0
分享至

Ultrasound-CLIP團(tuán)隊(duì) 投稿
量子位 | 公眾號(hào) QbitAI

超聲領(lǐng)域也有大模型了!

超聲影像憑借實(shí)時(shí)、無(wú)輻射的優(yōu)勢(shì),成為臨床各場(chǎng)景的一線診斷手段。

但異質(zhì)的解剖結(jié)構(gòu)、多樣的診斷屬性,讓通用視覺(jué)語(yǔ)言預(yù)訓(xùn)練模型難以直接適配,且現(xiàn)有醫(yī)療跨模態(tài)數(shù)據(jù)中超聲樣本占比不足5%,成為領(lǐng)域研究的核心瓶頸。

△超聲圖像統(tǒng)計(jì)數(shù)據(jù)跨越主要基準(zhǔn)點(diǎn)的分布情況。



上圖紅色區(qū)域和內(nèi)部百分比顯示了超聲圖像所占的比例,而藍(lán)色區(qū)域則展示了其余模態(tài)的占比情況。頂部標(biāo)簽表示絕對(duì)數(shù)量(以千為單位)。論文中所提出的US-365K是首個(gè)大規(guī)模、100%專用于超聲影像的數(shù)據(jù)集。

針對(duì)這一問(wèn)題,浙大城市學(xué)院聯(lián)合浙江大學(xué)、香港城市大學(xué)、香港浸會(huì)大學(xué)、浙江大學(xué)醫(yī)學(xué)院附屬第一醫(yī)院、浙江大學(xué)醫(yī)學(xué)院附屬婦產(chǎn)科醫(yī)院等團(tuán)隊(duì),構(gòu)建了首個(gè)大規(guī)模通用超聲圖像-文本數(shù)據(jù)集US-365K,并提出專為超聲場(chǎng)景設(shè)計(jì)的語(yǔ)義感知對(duì)比學(xué)習(xí)框架Ultrasound-CLIP,讓模型真正理解超聲的臨床診斷語(yǔ)義,相關(guān)成果被CVPR 2026接收,數(shù)據(jù)集及代碼已開(kāi)源。



核心痛點(diǎn):超聲跨模態(tài)學(xué)習(xí)的三重障礙

現(xiàn)有視覺(jué)語(yǔ)言模型在超聲領(lǐng)域的應(yīng)用,始終面臨三個(gè)關(guān)鍵問(wèn)題:

1. 數(shù)據(jù)缺口顯著:主流醫(yī)療跨模態(tài)數(shù)據(jù)集以CT、MRI等為主,超聲樣本占比極低,缺乏大規(guī)模、標(biāo)準(zhǔn)化的專屬訓(xùn)練數(shù)據(jù);

2. 語(yǔ)義模糊難對(duì)齊:超聲診斷報(bào)告的表述多樣,相同病變存在不同描述方式,傳統(tǒng)對(duì)比學(xué)習(xí)難以精準(zhǔn)界定正負(fù)樣本,易產(chǎn)生語(yǔ)義偏差;

3. 缺乏臨床結(jié)構(gòu)先驗(yàn):超聲診斷依賴病灶與診斷屬性的復(fù)雜關(guān)聯(lián),通用模型無(wú)法建模這類專業(yè)的臨床推理邏輯,僅能實(shí)現(xiàn)簡(jiǎn)單的關(guān)鍵詞匹配。

△UDT和Ultrasound-CLIP概述。



上圖中(a) UDT作為語(yǔ)義基礎(chǔ),通過(guò)標(biāo)準(zhǔn)化解剖層次結(jié)構(gòu)(UHAT)和定義9個(gè)關(guān)鍵診斷屬性(UDAF)來(lái)形式化超聲知識(shí)。(b) Ultrasound-CLIP利用UDT的方式有兩種:(1)基于UDAF的異構(gòu)圖編碼器通過(guò)交叉注意力將屬性關(guān)系融合到文本嵌入中,以建模結(jié)構(gòu)化推理。(2)構(gòu)建基于UDAF的語(yǔ)義先驗(yàn),以實(shí)現(xiàn)雙目標(biāo)優(yōu)化,從而解決歧義。該框架將視覺(jué)特征與這些圖增強(qiáng)的、語(yǔ)義感知的文本表示對(duì)齊。

為從根本上解決上述問(wèn)題,研究團(tuán)隊(duì)立足超聲臨床診斷的專業(yè)邏輯,從標(biāo)準(zhǔn)化數(shù)據(jù)構(gòu)建和定制化模型設(shè)計(jì)兩大維度出發(fā),打造全鏈路適配超聲場(chǎng)景的跨模態(tài)學(xué)習(xí)體系,實(shí)現(xiàn)雙重核心技術(shù)突破。

第一步:構(gòu)建UDT知識(shí)框架,打造標(biāo)準(zhǔn)化US-365K數(shù)據(jù)集

團(tuán)隊(duì)率先建立超聲診斷分類體系(UDT),為超聲數(shù)據(jù)的標(biāo)準(zhǔn)化標(biāo)注和模型學(xué)習(xí)確立統(tǒng)一的專業(yè)依據(jù),該體系包含兩大核心模塊,實(shí)現(xiàn)超聲診斷知識(shí)的結(jié)構(gòu)化、形式化:

超聲層級(jí)解剖分類(UHAT):按臨床診斷原則,系統(tǒng)梳理9大人體系統(tǒng)、52個(gè)器官的層級(jí)解剖結(jié)構(gòu),明確各器官的層級(jí)歸屬與上下文關(guān)聯(lián),徹底解決不同數(shù)據(jù)源中解剖分類混亂的問(wèn)題,實(shí)現(xiàn)超聲解剖標(biāo)注的標(biāo)準(zhǔn)化;

超聲診斷屬性框架(UDAF):凝練臨床醫(yī)生解讀超聲影像時(shí)核心關(guān)注的9大診斷維度,包括身體系統(tǒng)、器官、診斷結(jié)果、形狀、邊緣、回聲性、內(nèi)部特征、后方聲學(xué)現(xiàn)象、血流信號(hào),為每個(gè)維度定制臨床有效描述詞匯表,形成標(biāo)準(zhǔn)化的超聲診斷描述體系。

△基于UHAT的US-365K解剖層次結(jié)構(gòu)可視化。



基于UDT標(biāo)準(zhǔn)化框架,團(tuán)隊(duì)從5個(gè)國(guó)際權(quán)威醫(yī)療數(shù)據(jù)庫(kù)收集體量超聲數(shù)據(jù),經(jīng)多步驟精細(xì)化處理:先過(guò)濾非超聲內(nèi)容,將超聲視頻按0.5秒間隔分解為靜態(tài)幀,平衡數(shù)據(jù)多樣性與冗余性;再基于UDAF框架,通過(guò)大模型+結(jié)構(gòu)化提示的混合流水線,提取標(biāo)準(zhǔn)化診斷標(biāo)簽;最后經(jīng)醫(yī)療專家逐例審核、篩選,剔除模糊、不一致樣本,最終構(gòu)建出US-365K數(shù)據(jù)集。

該數(shù)據(jù)集包含36.4萬(wàn)對(duì)超聲圖像-文本樣本、11676個(gè)臨床真實(shí)病例,覆蓋全解剖區(qū)域,是業(yè)內(nèi)首個(gè)100%專屬超聲的大規(guī)模圖文數(shù)據(jù)集,數(shù)據(jù)有效率超90%,填補(bǔ)了超聲跨模態(tài)大規(guī)模標(biāo)準(zhǔn)化數(shù)據(jù)的行業(yè)空白,為超聲AI研究奠定高質(zhì)量數(shù)據(jù)基礎(chǔ)。

第二步:提出Ultrasound-CLIP框架,實(shí)現(xiàn)超聲語(yǔ)義的精準(zhǔn)建模與對(duì)齊

針對(duì)超聲場(chǎng)景的語(yǔ)義模糊和結(jié)構(gòu)缺失難題,團(tuán)隊(duì)設(shè)計(jì)出Ultrasound-CLIP語(yǔ)義感知對(duì)比學(xué)習(xí)框架,在經(jīng)典雙編碼器(圖像+文本)基礎(chǔ)上,創(chuàng)新融入UDAF引導(dǎo)的異質(zhì)圖編碼器基于UDAF的語(yǔ)義軟標(biāo)簽兩大核心模塊,并采用雙目標(biāo)優(yōu)化策略,讓模型具備超聲領(lǐng)域的結(jié)構(gòu)化臨床推理能力,突破通用模型的局限:

(1)UDAF引導(dǎo)的異質(zhì)圖編碼器,建模臨床屬性結(jié)構(gòu)化關(guān)聯(lián)

團(tuán)隊(duì)將每個(gè)超聲樣本的文本標(biāo)注,轉(zhuǎn)化為樣本專屬的異質(zhì)圖:基于UDAF框架定義診斷節(jié)點(diǎn)和屬性節(jié)點(diǎn)兩類核心節(jié)點(diǎn),根據(jù)樣本的標(biāo)準(zhǔn)化診斷標(biāo)簽確定激活節(jié)點(diǎn)集,并在診斷節(jié)點(diǎn)與屬性節(jié)點(diǎn)間構(gòu)建全二分連接,形成病灶-屬性的關(guān)聯(lián)圖結(jié)構(gòu)。

通過(guò)輕量級(jí)異質(zhì)圖神經(jīng)網(wǎng)絡(luò)(GNN)對(duì)異質(zhì)圖進(jìn)行編碼,得到包含節(jié)點(diǎn)關(guān)聯(lián)信息的節(jié)點(diǎn)嵌入,再經(jīng)注意力池化生成圖匯總向量,最后通過(guò)多頭交叉注意力將圖嵌入與原始文本嵌入融合,并通過(guò)門(mén)控殘差連接實(shí)現(xiàn)穩(wěn)定融合,得到圖增強(qiáng)的文本嵌入。這一過(guò)程讓文本嵌入融入超聲診斷標(biāo)簽與屬性的結(jié)構(gòu)化臨床關(guān)聯(lián),突破單純關(guān)鍵詞匹配的局限,讓模型能捕捉超聲診斷的專業(yè)語(yǔ)義邏輯。

(2)基于UDAF的語(yǔ)義軟標(biāo)簽,實(shí)現(xiàn)細(xì)粒度語(yǔ)義相似度度量

摒棄傳統(tǒng)二進(jìn)制硬標(biāo)簽,團(tuán)隊(duì)基于UDAF的9大診斷維度,構(gòu)建連續(xù)語(yǔ)義相似度軟標(biāo)簽:為每個(gè)診斷維度預(yù)定義標(biāo)準(zhǔn)化標(biāo)簽相似度矩陣,計(jì)算樣本對(duì)在各維度的語(yǔ)義親和力,再加權(quán)聚合得到樣本對(duì)的整體語(yǔ)義先驗(yàn)相似度,形成B×B的軟先驗(yàn)矩陣(B為批次大。,實(shí)現(xiàn)細(xì)粒度的語(yǔ)義重疊識(shí)別,解決超聲診斷報(bào)告表述多樣帶來(lái)的語(yǔ)義模糊問(wèn)題。

(3)雙目標(biāo)優(yōu)化策略,實(shí)現(xiàn)跨模態(tài)精準(zhǔn)對(duì)齊與語(yǔ)義正則化

框架采用對(duì)比損失+語(yǔ)義損失的雙目標(biāo)優(yōu)化策略,讓模型同時(shí)實(shí)現(xiàn)圖像-文本跨模態(tài)精準(zhǔn)對(duì)齊和語(yǔ)義特征的正則化:

對(duì)比損失(L(CLIP)):采用經(jīng)典對(duì)稱對(duì)比損失,最大化正樣本對(duì)(圖像-對(duì)應(yīng)文本)的相似度,最小化負(fù)樣本對(duì)的相似度,實(shí)現(xiàn)圖像與文本的基礎(chǔ)跨模態(tài)對(duì)齊;

語(yǔ)義損失(L(semantic)):融合均方誤差(MSE)和KL散度,讓模型預(yù)測(cè)的相似度矩陣與UDAF基語(yǔ)義軟先驗(yàn)矩陣匹配,既實(shí)現(xiàn)相似度的數(shù)值匹配,又保證分布一致性,讓語(yǔ)義相似的樣本在特征空間中有效聚類。

通過(guò)雙目標(biāo)聯(lián)合優(yōu)化,模型既能實(shí)現(xiàn)超聲圖像與文本的精準(zhǔn)跨模態(tài)對(duì)齊,又能精準(zhǔn)捕捉超聲診斷的細(xì)粒度語(yǔ)義特征,真正理解超聲的臨床語(yǔ)言。

實(shí)驗(yàn)驗(yàn)證:全任務(wù)性能領(lǐng)先,泛化能力適配多臨床場(chǎng)景

團(tuán)隊(duì)以US-365K為基礎(chǔ),在多任務(wù)分類、圖像-文本檢索任務(wù)中開(kāi)展實(shí)驗(yàn),并在4個(gè)公開(kāi)的超聲下游數(shù)據(jù)集上驗(yàn)證模型泛化能力,結(jié)果顯示Ultrasound-CLIP全面優(yōu)于現(xiàn)有醫(yī)療CLIP基線模型:

多任務(wù)分類:平均準(zhǔn)確率達(dá)59.61%,其中病灶邊緣、診斷結(jié)果等核心臨床屬性的識(shí)別準(zhǔn)確率分別達(dá)84.44%、64.05%,能精準(zhǔn)捕捉超聲診斷的關(guān)鍵信息。



圖像-文本檢索:圖像到文本檢索(I2T)@10達(dá)37.45%,文本到圖像檢索(T2I)@50達(dá)80.22%,實(shí)現(xiàn)超聲圖文的高效雙向匹配。



下游泛化:在乳腺、胃腸超聲等4個(gè)數(shù)據(jù)集的零樣本、線性探測(cè)、全微調(diào)任務(wù)中均取得最優(yōu)性能,可適配不同超聲臨床診斷場(chǎng)景。

資源開(kāi)源:助力超聲AI領(lǐng)域共同研究

為推動(dòng)超聲跨模態(tài)學(xué)習(xí)領(lǐng)域的發(fā)展,團(tuán)隊(duì)已將研究相關(guān)的代碼和US-365K數(shù)據(jù)集公開(kāi),為后續(xù)研究者提供可直接復(fù)用的基礎(chǔ)資源。

論文標(biāo)題:
Ultrasound-CLIP: Semantic-Aware Contrastive Pre-training for Ultrasound Image-Text Understanding
作者:
Jiayun Jin, Haolong Chai, Xueying Huang, Xiaoqing Guo, Zengwei Zheng, Zhan Zhou, Junmei Wang, Xinyu Wang, Jie Liu*, Binbin Zhou*
單位:
浙大城市學(xué)院、香港浸會(huì)大學(xué)、浙江大學(xué)、浙江大學(xué)醫(yī)學(xué)院附屬第一醫(yī)院、浙江大學(xué)醫(yī)學(xué)院附屬婦產(chǎn)科醫(yī)院、香港城市大學(xué)
發(fā)表:
CVPR 2026
arxiv論文地址:
http://arxiv.org/abs/2604.01749
項(xiàng)目地址:
https://github.com/ZJUDataIntelligence/Ultrasound-CLIP
數(shù)據(jù)集地址:
https://huggingface.co/datasets/JJY-0823/US-365K
作者簡(jiǎn)介:
本文第一作者為金佳云,浙大城市學(xué)院碩士生,研究方向?yàn)槎嗄B(tài)大模型。本文在周斌彬副教授和劉潔博士的指導(dǎo)下完成。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
浙江一對(duì)老夫妻收廢品,在河邊撿到奇特“鐵疙瘩”,果斷上交!民警一查:竟是千年寶貝

浙江一對(duì)老夫妻收廢品,在河邊撿到奇特“鐵疙瘩”,果斷上交!民警一查:竟是千年寶貝

臺(tái)州交通廣播
2026-04-11 15:00:56
又?jǐn)厥滓蝗,;鹨呀?jīng)不可能了

又?jǐn)厥滓蝗耍;鹨呀?jīng)不可能了

深度報(bào)
2026-04-11 22:31:22
估價(jià)2600萬(wàn)元翡翠原石亮相中國(guó)國(guó)際珠寶展,參展商:能切出五六條價(jià)值超300萬(wàn)元手鐲,另可制作多個(gè)平安扣等掛件

估價(jià)2600萬(wàn)元翡翠原石亮相中國(guó)國(guó)際珠寶展,參展商:能切出五六條價(jià)值超300萬(wàn)元手鐲,另可制作多個(gè)平安扣等掛件

極目新聞
2026-04-10 19:25:32
開(kāi)國(guó)上將鬧離婚:結(jié)發(fā)40年竟遭發(fā)妻死命舉報(bào),六名子女為何如釋重負(fù)

開(kāi)國(guó)上將鬧離婚:結(jié)發(fā)40年竟遭發(fā)妻死命舉報(bào),六名子女為何如釋重負(fù)

睡前講故事
2026-04-07 14:43:34
41歲男子威脅女鄰居發(fā)生關(guān)系,事后女子為自證清白,讓他再來(lái)一次

41歲男子威脅女鄰居發(fā)生關(guān)系,事后女子為自證清白,讓他再來(lái)一次

丫頭舫
2026-04-10 21:54:02
羅梅羅被換下時(shí)難掩情緒落淚,距離世界杯還有兩個(gè)月

羅梅羅被換下時(shí)難掩情緒落淚,距離世界杯還有兩個(gè)月

懂球帝
2026-04-12 23:09:00
人口大遷徙已悄然開(kāi)啟!未來(lái)幾年,無(wú)數(shù)中國(guó)人命運(yùn)或?qū)氐赘膶?xiě)!

人口大遷徙已悄然開(kāi)啟!未來(lái)幾年,無(wú)數(shù)中國(guó)人命運(yùn)或?qū)氐赘膶?xiě)!

小陸搞笑日常
2026-04-12 17:54:18
緊急叫停!提醒:服用瑞舒伐他汀的人,身體出現(xiàn)這5癥狀注意

緊急叫停!提醒:服用瑞舒伐他汀的人,身體出現(xiàn)這5癥狀注意

垚垚分享健康
2026-04-12 08:55:10
中超形勢(shì):蓉城2分領(lǐng)跑 3強(qiáng)不敗1隊(duì)不勝 4隊(duì)仍負(fù)分 下輪3場(chǎng)焦點(diǎn)戰(zhàn)

中超形勢(shì):蓉城2分領(lǐng)跑 3強(qiáng)不敗1隊(duì)不勝 4隊(duì)仍負(fù)分 下輪3場(chǎng)焦點(diǎn)戰(zhàn)

我愛(ài)英超
2026-04-12 22:08:44
特朗普在伊朗戰(zhàn)爭(zhēng)中犯下的7個(gè)致命錯(cuò)誤

特朗普在伊朗戰(zhàn)爭(zhēng)中犯下的7個(gè)致命錯(cuò)誤

史政先鋒
2026-04-12 18:27:18
美國(guó)副總統(tǒng)萬(wàn)斯延長(zhǎng)在巴基斯坦停留時(shí)間

美國(guó)副總統(tǒng)萬(wàn)斯延長(zhǎng)在巴基斯坦停留時(shí)間

新京報(bào)
2026-04-12 08:38:11
易中天:現(xiàn)在最喜歡講“中國(guó)邏輯”的主要是三種人

易中天:現(xiàn)在最喜歡講“中國(guó)邏輯”的主要是三種人

尚曦讀史
2026-04-12 09:53:07
14公斤火藥被引爆,炸掉7米高內(nèi)塔尼亞胡塑像,人群爆發(fā)出歡呼聲!以方譴責(zé)西班牙:展現(xiàn)出駭人的反猶仇恨

14公斤火藥被引爆,炸掉7米高內(nèi)塔尼亞胡塑像,人群爆發(fā)出歡呼聲!以方譴責(zé)西班牙:展現(xiàn)出駭人的反猶仇恨

每日經(jīng)濟(jì)新聞
2026-04-12 20:30:04
落魄鳳凰不如雞! 離開(kāi)黃曉明四年后,楊穎終究還是走上了怪圈老路

落魄鳳凰不如雞! 離開(kāi)黃曉明四年后,楊穎終究還是走上了怪圈老路

LULU生活家
2026-04-11 18:00:05
蜜雪冰城南美首店在巴西開(kāi)業(yè),大批民眾排隊(duì)2小時(shí)購(gòu)買,設(shè)置200%糖度,檸檬水8元一杯,海外華人:在當(dāng)?shù)睾鼙阋?>
    </a>
        <h3>
      <a href=極目新聞
2026-04-12 13:37:16
人怎么能美成這樣:我終于不再問(wèn)別人,而是問(wèn)自己

人怎么能美成這樣:我終于不再問(wèn)別人,而是問(wèn)自己

疾跑的小蝸牛
2026-04-12 23:13:28
缺兵少將廣東憑啥還能掀翻廣廈!數(shù)據(jù)一目了然,最大功臣是這4人

缺兵少將廣東憑啥還能掀翻廣廈!數(shù)據(jù)一目了然,最大功臣是這4人

后仰大風(fēng)車
2026-04-12 21:41:54
整天為印第安人叫屈,不如去黑龍江看看!海蘭泡先民更值得共情

整天為印第安人叫屈,不如去黑龍江看看!海蘭泡先民更值得共情

談史論天地
2026-04-11 14:10:03
2-1!北京國(guó)安轟然倒下,韋世豪逃脫紅牌+補(bǔ)時(shí)絕殺,成都蓉城登頂

2-1!北京國(guó)安轟然倒下,韋世豪逃脫紅牌+補(bǔ)時(shí)絕殺,成都蓉城登頂

汪星人喲
2026-04-12 21:35:46
巴基斯坦傳來(lái)重大喜訊!剛剛,美伊達(dá)成首個(gè)協(xié)議

巴基斯坦傳來(lái)重大喜訊!剛剛,美伊達(dá)成首個(gè)協(xié)議

安安說(shuō)
2026-04-12 10:46:45
2026-04-13 04:08:49
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
12463文章數(shù) 176449關(guān)注度
往期回顧 全部

科技要聞

理想稱遭惡意拉踩,東風(fēng)日產(chǎn):尊重同行

頭條要聞

伊媒:美驅(qū)逐艦遭革命衛(wèi)隊(duì)鎖定 距離被摧毀僅差幾分鐘

頭條要聞

伊媒:美驅(qū)逐艦遭革命衛(wèi)隊(duì)鎖定 距離被摧毀僅差幾分鐘

體育要聞

創(chuàng)造歷史!五大聯(lián)賽首位女性主教練誕生

娛樂(lè)要聞

賭王女兒何超蕸病逝,常年和乳癌斗爭(zhēng)

財(cái)經(jīng)要聞

美伊談判破裂的三大癥結(jié)

汽車要聞

煥新極氪007/007GT上市 限時(shí)19.39萬(wàn)起

態(tài)度原創(chuàng)

藝術(shù)
教育
房產(chǎn)
時(shí)尚
公開(kāi)課

藝術(shù)要聞

揭開(kāi)她筆下女人的神秘面紗,豪放灑脫的魅力令人驚嘆!

教育要聞

小班教學(xué),9月開(kāi)校,樹(shù)德派校長(zhǎng)!這所中學(xué),正在招老師

房產(chǎn)要聞

土地供應(yīng)突然暴跌!2026?跇鞘,格局大變!

被周冬雨、林更新戴上熱搜的珠寶,究竟有多驚艷?

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版