国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

NeurIPS 2025 Spotlight | 條件表征學習:一步對齊表征與準則

0
分享至



本文第一作者為四川大學博士研究生劉泓麟,郵箱為tristanliuhl@gmail.com,通訊作者為四川大學李云帆博士后與四川大學彭璽教授。

一張圖片包含的信息是多維的。例如下面的圖 1,我們至少可以得到三個層面的信息:主體是大象,數(shù)量有兩頭,環(huán)境是熱帶稀樹草原(savanna)。然而,如果由傳統(tǒng)的表征學習方法來處理這張圖片,比方說就將其送入一個在 ImageNet 上訓練好的 ResNet 或者 Vision Transformer,往往得到的表征只會體現(xiàn)其主體信息,也就是會簡單地將該圖片歸為大象這一類別。這顯然是不合理的。



圖 1:傳統(tǒng)表征學習(上)與條件表征學習(下)的比較。傳統(tǒng)的表征學習方法只能學習到一種通用的表征,忽略了其他有意義的信息;文章提出的條件表征學習能夠基于指定準則,得到該準則下表現(xiàn)力更強的條件表征,適應多種下游任務。

此外,在各大電商平臺,用戶通常根據(jù)不同的標準(例如顏色、材質或場合)搜索商品。例如,用戶今天可能搜索 “紅色連衣裙”,明天搜索 “正裝”,后天搜索某個全新的關鍵詞。這對于擁有龐大規(guī)模商品的平臺來說,手動打標簽是不現(xiàn)實的,而傳統(tǒng)的表征學習也僅僅只能獲取到 “連衣裙” 這個層面的信息。

要獲取圖片中除了 “大象”、“連衣裙” 之外的信息,一個很容易想到的方法就是進行針對性的有監(jiān)督訓練:基于不同的準則比如環(huán)境,進行額外的標注,再從頭訓練或者基于已有表征訓練一個額外的線性層。但是基于這種方式,顯然是 “治標不治本” 的。因為一旦有了新的需求,便又需要進行針對性的數(shù)據(jù)收集、標注和訓練,需要付出大量的時間和人力成本。

很幸運的,我們處在多模態(tài)大模型的時代,這個在以前可能會很困難的問題在今天是有很多解法的。我們可以直接通過詢問 LLaVA,它便會告訴我們圖片在指定準則下的信息。但這種方式也還不夠高效,至少在 2025 年的今天,多模態(tài)大模型的使用成本還是需要考慮的。如果需要處理 ImageNet 之類的大規(guī)模數(shù)據(jù)集或者電商平臺繁雜的商品,得到其在指定準則下的信息,這個開銷就比較大了。所以對大多數(shù)人來說,現(xiàn)如今要獲取圖片的多維信息,還是需要找到一個更加高效的方法。



  • 論文標題:Conditional Representation Learning for Customized Tasks
  • 論文鏈接:https://arxiv.org/abs/2510.04564
  • 代碼鏈接:https://github.com/XLearning-SCU/2025-NeurIPS-CRL

方法


我們知道,對于三維直角坐標系,一組基,比如 [(1, 0, 0), (0, 1, 0), (0, 0, 1)],其線性組合即可構建出該坐標系中的任何向量。類似的,對于顏色體系,只需要 “紅”、“綠”、“藍” 三原色即可調出所有的顏色。

受此啟發(fā),我們想到,是否對于任意一個給定的準則,也存在著一個對應的 “概念空間” 及其基?如果能在這個空間中找到一組基,那么我們只需要將原始表征投影到該空間上,理論上就能獲得在該準則下更具表現(xiàn)力和判別性的特征。

找到給定準則對應的基,這聽起來有些困難。但沒關系,我們不需要很準確地找到,只需要接近它就好。

基于這個想法,論文提出了一種即插即用的條件表征學習方法。如圖 2 所示,給定準則(例如 “顏色”),CRL 首先讓大語言模型 LLM 生成該準則相關的描述文本(例如 “紅色”,“藍色” 和 “綠色” 等)。隨后,CRL 將由 VLM 得到的通用圖片表征,投影到由描述文本張成的空間中,得到該準則下的條件表征。該表征在指定的準則下表達更充分,并且具有更優(yōu)的可解釋性,能有效適應下游定制化任務。



圖 2:所提出的條件表征學習(CRL)的總體框架。圖中以通用表征空間(準則為隱式的 “形狀”)轉換到 “顏色” 準則空間為例。

直白地說,只需要將對齊的圖片和文本表征,做個矩陣乘法就好了,甚至不需要訓練。復現(xiàn)難度約等于:



實驗


分類和檢索任務是衡量表征學習性能的兩個經典下游任務。論文在兩個分類任務(少樣本分類、聚類)和兩個檢索任務(相似度檢索、服裝檢索)上進行了充分的實驗驗證,部分實驗結果如下:



圖 3:分類任務



表 1:所提出的 CRL 在少樣本分類任務上的性能。



表 2:所提出的 CRL 在聚類任務上的性能。





圖 4:相似度檢索任務。上為 “Focus on an object”(Focus),下為 “Change an Object”(Change)。



表 3:所提出的 CRL 在相似度檢索任務上的性能。



圖 5:服裝檢索任務。



表 4:所提出的 CRL 在服裝檢索任務上的性能。

從上述結果中可以看出, CRL 可以作為一個即插即用的模塊,與現(xiàn)有多模態(tài)方法相結合,在不同準則下,其得到的條件表征在下游任務中都取得了比原表征更加優(yōu)異的表現(xiàn),性能甚至超過了對應領域的專用方法。更多實驗可參見論文。

總結

與傳統(tǒng)的表征學習只得到單一的通用表征不同,本文提出了條件表征學習,通過獲取指定準則下的文本基,并將圖像表征投影到該文本基張成的空間中,即可得到該準則下表現(xiàn)力更強的條件表征,以更好地適應各種下游任務。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
所有發(fā)達國家都有一個共性:人工很貴,勞動很值錢。

所有發(fā)達國家都有一個共性:人工很貴,勞動很值錢。

流蘇晚晴
2026-01-27 18:18:22
2萬余名旅客滯留 阿聯(lián)酋政府將承擔因此產生費用

2萬余名旅客滯留 阿聯(lián)酋政府將承擔因此產生費用

看看新聞Knews
2026-03-01 18:15:18
美國警方承認谷愛凌曾遭毆打,手臂抓傷嚴重,未來人身安全存隱患

美國警方承認谷愛凌曾遭毆打,手臂抓傷嚴重,未來人身安全存隱患

削桐作琴
2026-03-01 14:27:41
詹皇轟24+5迎里程碑!湖人24分勝國王,威少14+5遭東契奇小里嘲笑

詹皇轟24+5迎里程碑!湖人24分勝國王,威少14+5遭東契奇小里嘲笑

你的籃球頻道
2026-03-02 12:53:02
航母無損成焦點!特朗普改口,伊朗擊中法塔赫-2了嗎?

航母無損成焦點!特朗普改口,伊朗擊中法塔赫-2了嗎?

起喜電影
2026-03-02 12:09:40
凌晨5點半火光沖天!昆明一老舊小區(qū)柴房突發(fā)火情,多輛消防車緊急出動

凌晨5點半火光沖天!昆明一老舊小區(qū)柴房突發(fā)火情,多輛消防車緊急出動

8099999街頭巷尾
2026-03-01 13:27:21
偉大的9-5!名將打破3年冠軍荒,鎖定2站紅包賽,追平趙心童成就

偉大的9-5!名將打破3年冠軍荒,鎖定2站紅包賽,追平趙心童成就

劉姚堯的文字城堡
2026-03-02 06:40:19
為了巴結英日,撕毀中國百億投資項目,被耍后還想和中國再續(xù)前緣

為了巴結英日,撕毀中國百億投資項目,被耍后還想和中國再續(xù)前緣

流史歲月
2026-02-26 16:45:04
洗草莓時,有人放食鹽,有人放面粉,果農:都不對,教你正確做法

洗草莓時,有人放食鹽,有人放面粉,果農:都不對,教你正確做法

阿龍美食記
2026-02-28 10:49:43
電影院抓小三后續(xù)!為求刺激上演燈下黑?孩子也不是丈夫親生的

電影院抓小三后續(xù)!為求刺激上演燈下黑?孩子也不是丈夫親生的

社會醬
2026-03-01 20:43:29
“吸血”親爹、寵妾滅妻,侄女再曝大瓜,楊議徹底活成全網笑話!

“吸血”親爹、寵妾滅妻,侄女再曝大瓜,楊議徹底活成全網笑話!

手工制作阿殲
2026-03-02 00:53:35
3月2日A股猛料:美伊沖突烈度超預期!美國林肯號航母被襲!

3月2日A股猛料:美伊沖突烈度超預期!美國林肯號航母被襲!

有范又有料
2026-03-02 10:28:29
什么調料最易致癌?是蠔油嗎?提醒:這3種調料做飯時盡量少放

什么調料最易致癌?是蠔油嗎?提醒:這3種調料做飯時盡量少放

冷眼看世界728
2026-03-02 10:00:13
伊朗用血淚換來的教訓:一旦中美開戰(zhàn),中國必須首先鎖定這一點

伊朗用血淚換來的教訓:一旦中美開戰(zhàn),中國必須首先鎖定這一點

冷峻視角下的世界
2026-02-20 07:45:35
江西女子用公驢器官泡酒,三個月后給丈夫喝,不料發(fā)生意外

江西女子用公驢器官泡酒,三個月后給丈夫喝,不料發(fā)生意外

古怪奇談錄
2025-06-28 13:49:02
第九波打擊!伊朗襲擊美軍航母,美英油輪被炸,特朗普急了

第九波打擊!伊朗襲擊美軍航母,美英油輪被炸,特朗普急了

全球熱點大揭秘
2026-03-02 13:38:50
男子因鉀過低不幸離世!醫(yī)生提醒:平時寧愿少吃點肉,要多吃幾物

男子因鉀過低不幸離世!醫(yī)生提醒:平時寧愿少吃點肉,要多吃幾物

神奇故事
2025-11-27 22:13:57
大量食用油被檢測出致癌物!自查廚房是否有這3種油,可別再吃了

大量食用油被檢測出致癌物!自查廚房是否有這3種油,可別再吃了

讀懂世界歷史
2026-03-01 18:09:06
成都無縫鋼管廠的那些事兒

成都無縫鋼管廠的那些事兒

寶哥精彩賽事
2026-03-02 00:58:40
賀希寧曬合影慶祝男籃勝利,胡明軒評論:樂邦詹士先生

賀希寧曬合影慶祝男籃勝利,胡明軒評論:樂邦詹士先生

懂球帝
2026-03-02 10:09:20
2026-03-02 15:16:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12388文章數(shù) 142574關注度
往期回顧 全部

科技要聞

榮耀發(fā)布機器人手機、折疊屏、人形機器人

頭條要聞

牛彈琴:伊朗之戰(zhàn)比俄烏之戰(zhàn)更生猛 給世界5個深刻教訓

頭條要聞

牛彈琴:伊朗之戰(zhàn)比俄烏之戰(zhàn)更生猛 給世界5個深刻教訓

體育要聞

卡里克主場5連勝!隊史第2人通過最大考驗

娛樂要聞

美伊以沖突爆發(fā),多位明星被困中東

財經要聞

中東局勢影響如何?十大券商策略來了

汽車要聞

預售11.28萬起 狐全新阿爾法S5標配寧德時代

態(tài)度原創(chuàng)

家居
手機
教育
藝術
軍事航空

家居要聞

萬物互聯(lián) 享科技福祉

手機要聞

最高暴漲3000元!史上最猛安卓漲價潮來了 2026年手機出貨量將創(chuàng)13年來新低

教育要聞

【張捷雜談】對涉考舞弊處罰過輕與幕后潛規(guī)則

藝術要聞

2025北京青年美術作品展 | 油畫作品選刊

軍事要聞

美軍動用新型武器:山寨伊朗的

無障礙瀏覽 進入關懷版