国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

Nano Banana不會應試!指標拉垮,視覺效果驚艷,實測14個任務

0
分享至


新智元報道

編輯:LRST

【新智元導讀】最新報告探討了生成式模型Nano Banana Pro在低層視覺任務中的表現(xiàn),如去霧、超分等,傳統(tǒng)上依賴PSNR/SSIM等像素級指標。研究發(fā)現(xiàn),Nano Banana Pro在視覺效果上更佳,但傳統(tǒng)指標表現(xiàn)欠佳,因生成式模型更追求語義合理而非像素對齊。報告還提出改進方向和新評測范式的思考,強調生成式模型雖有潛力,但與專用模型仍有差距。

過去幾年,文本生成圖像(T2I)與多模態(tài)生成式模型的能力突飛猛進,已經能穩(wěn)定地產生高質量、具備細節(jié)與語義一致性的圖像內容。

報告關注的核心矛盾在于:這些「擅長生成」的模型,是否也能在傳統(tǒng)低層視覺任務中充當通用求解器(generalist)?

低層視覺(low-level vision)通常強調對圖像退化的「精確逆過程」:例如去霧、超分、去噪、去雨、去模糊、去反射、去光暈等。

這類任務的經典評價方式往往依賴 PSNR/SSIM 等參考指標,強調像素級一致性。但生成式模型天生帶有「補全/重建」的傾向:它們可能會依據先驗去「合理地編造」高頻細節(jié),從人眼觀感看更清晰、更「像真的」,卻在像素對齊意義上偏離GT。

華中科技大學的研究人員最近發(fā)布了一篇報告,把這種沖突概括為「人類感知偏好 vs. 傳統(tǒng)指標導向」的張力。


項目主頁:https://lowlevelbanana.github.io

論文鏈接:https://arxiv.org/abs/2512.15110

開源倉庫:https://huggingface.co/datasets/jlongzuo/LowLevelEval

報告中提出一個非常直接的問題:Nano Banana Pro能否成為低層視覺全能選手?

報告采用了一個刻意「極簡」的使用范式:不訓練、不微調,只用「輸入圖 + 簡單文本 prompt」直接讓Nano Banana Pro輸出結果,對其進行zero-shot基準評測。

零樣本+文本提示

14個低層任務的系統(tǒng)基準

研究人員把評測擴展到14個低層視覺任務、40個數據集,覆蓋三大類能力:圖像恢復(restoration)、圖像增強(enhancement)、圖像融合(fusion)。


任務清單包括:Dehazing、Super-Resolution、Deraining、Deshadowing、Motion Deblur、Defocus Deblur、Denoising、Reflection Removal、Flare Removal、Low-Light Enhancement、Underwater Enhancement、HDR Imaging、Multi-focus Fusion、Infrared-Visible Fusion;

圖中用顏色區(qū)分了restoration / enhancement / fusion三類任務。

保守估測性能

報告特別強調:當前結論是對模型能力的保守估計,即研究人員沒有做精細 prompt tuning,也沒有用多輪推理去「挑選最好看的輸出」,而是用固定、簡單的提示詞來模擬一種更接近「普通用戶上手」的用法。

閉源模型的評測約束

在一些任務章節(jié)里,研究人員也說明了評測工程細節(jié):由于模型以API方式調用且閉源,無法做任務定制訓練;并且生成輸出分辨率可能固定在約1024尺度,因此需要將輸出resize回與GT一致的分辨率再計算指標,以保證定量比較盡量公平。

視覺「更好看」

但指標「更差」

報告最重要的結論可以概括為一句話:

Nano Banana Pro在主觀視覺質量上往往更討好,但在PSNR/SSIM等傳統(tǒng)參考指標上整體落后于專用模型。

研究人員將其歸因于生成式模型的內在屬性:生成式模型更傾向于追求「語義可信/感知合理」,而非嚴格的像素級對齊;同時模型輸出帶有隨機性(stochasticity),使得穩(wěn)定性與可復現(xiàn)性也成為部署障礙。

系統(tǒng)性現(xiàn)象:感知質量與指標不一致

以Flare Removal為例,研究人員觀察到一種非常典型的現(xiàn)象:有些樣本視覺上已經「挺干凈、挺舒服」,但因為亮度/顏色等與GT存在偏差,量化分數依然不高,這反映了像素級指標對生成式增強的懲罰機制。


同時,研究人員也指出生成模型存在「高上限、低下限」的特征:在合適輸入上,它可能在細節(jié)恢復上超過 SOTA,但這種優(yōu)勢會被擴散/生成模型的隨機性與語義漂移所抵消,出現(xiàn)明顯方差與語義幻覺,prompt 工程也只能部分緩解,難以保證工業(yè)級確定性。

穩(wěn)健但不極致:生成式模型有時會選擇更保守的輸出

在低光增強(Low-Light Enhancement)的分析中,研究人員給出另一個視角:

Nano Banana Pro可能不太會引入顯著的光暈、結構破壞、嚴重色偏等「災難性偽影」,這使得它在某些實際應用中具備吸引力;

但它也會出現(xiàn)亮度控制不一致、對prompt敏感、以及與benchmark的GT定義不完全匹配等問題,因此整體仍難以與專用方法競爭。


更進一步,報告還給出可能的改進方向:更具體的prompt設計、few-shot示例對齊、輕量適配/微調、以及把統(tǒng)一多模態(tài)模型與任務模塊結合的混合范式。

報告貢獻與意義:它不只是在「打分」,而是在推動重新定義評測與目標

這份報告的價值不止在于給Nano Banana Pro下結論,更在于它把一個長期存在但常被忽略的問題擺到臺面上:

  • 當生成式模型進入低層視覺后,「像素一致性」是否仍是唯一目標?

  • 傳統(tǒng)指標是否在系統(tǒng)性地誤導我們對生成式恢復/增強的判斷?

  • 是否需要能同時刻畫「感知質量 + 結構/語義穩(wěn)定性 + 像素保真」的新評測范式?

報告明確指出:Nano Banana Pro作為零樣本低層視覺求解器,已經是一個很強的 baseline,并展示出跨任務的「泛化潛力」;但要達到專用模型那種高保真、可控、穩(wěn)定的水準仍有明顯鴻溝。

參考資料:

https://arxiv.org/abs/2512.15110

秒追ASI

?點贊、轉發(fā)、在看一鍵三連?

點亮星標,鎖定新智元極速推送!

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
回顧許家印被抓捕現(xiàn)場,奮力反抗,怒吼不已,被抓捕人員抬出去

回顧許家印被抓捕現(xiàn)場,奮力反抗,怒吼不已,被抓捕人員抬出去

干史人
2026-01-08 22:47:00
沖4連勝!快船3人缺席,奇才特雷楊賽前決定,盧談祖巴茨需要時間

沖4連勝!快船3人缺席,奇才特雷楊賽前決定,盧談祖巴茨需要時間

一登侃球
2026-01-13 20:00:13
報復史無前例,72小時內,伊朗全國沉痛哀悼,特朗普發(fā)布戰(zhàn)爭講話

報復史無前例,72小時內,伊朗全國沉痛哀悼,特朗普發(fā)布戰(zhàn)爭講話

通文知史
2026-01-12 20:50:03
申花官宣馬克塔·蓋伊加盟!

申花官宣馬克塔·蓋伊加盟!

五星體育
2026-01-13 20:51:59
500萬拆遷款全給兒子,女兒跪求30萬救命,10年后他們的報應來了

500萬拆遷款全給兒子,女兒跪求30萬救命,10年后他們的報應來了

濤哥講堂
2024-08-09 13:58:23
金球獎這一夜,國際女星個個風情萬種,但都被一位中國女星艷壓了

金球獎這一夜,國際女星個個風情萬種,但都被一位中國女星艷壓了

八卦南風
2026-01-12 16:25:50
臉都不要了!格力新空調的箱子正面直接印著“全銅管”這幾個字

臉都不要了!格力新空調的箱子正面直接印著“全銅管”這幾個字

忠于法紀
2026-01-13 20:43:38
“堅決反對像Tarriela這樣的人,不管他找多少幫手——1個、10個還是100個,中方隨時奉陪,而且奉陪到底”

“堅決反對像Tarriela這樣的人,不管他找多少幫手——1個、10個還是100個,中方隨時奉陪,而且奉陪到底”

新京報政事兒
2026-01-13 11:31:36
不要再說開除閆學晶軍籍,取消正師級干部待遇了

不要再說開除閆學晶軍籍,取消正師級干部待遇了

杰絲聊古今
2026-01-13 00:41:06
李顯龍喊話臺海:新加坡反對武力統(tǒng)臺,若爆發(fā)沖突, 中美都會麻煩

李顯龍喊話臺海:新加坡反對武力統(tǒng)臺,若爆發(fā)沖突, 中美都會麻煩

文史旺旺旺
2026-01-12 19:38:40
美論壇直言:不管中國承不承認,中國其實已經輸掉了這場關稅戰(zhàn)?

美論壇直言:不管中國承不承認,中國其實已經輸掉了這場關稅戰(zhàn)?

老范談史
2026-01-13 20:41:22
竇靖童在西班牙溜達,寸頭配5串珠子超有個性,模樣超像王菲。

竇靖童在西班牙溜達,寸頭配5串珠子超有個性,模樣超像王菲。

付老師種植技術團隊
2026-01-13 16:56:26
去年上海結婚登記125102對,比2024年增長38.7%,2025年上海全市初婚平均年齡29.7歲

去年上海結婚登記125102對,比2024年增長38.7%,2025年上海全市初婚平均年齡29.7歲

縱相新聞
2026-01-13 00:09:04
中方是否仍然建議中國公民前往伊朗旅游?外交部回應

中方是否仍然建議中國公民前往伊朗旅游?外交部回應

澎湃新聞
2026-01-13 15:26:26
柬埔寨鐵籠拉人當地辟謠翻車,騙不了尋子媽媽的眼淚和公眾的眼睛

柬埔寨鐵籠拉人當地辟謠翻車,騙不了尋子媽媽的眼淚和公眾的眼睛

你食不食油餅
2026-01-12 15:32:08
稀碎!遼籃新援瘋狂打鐵 7中1和4中0 楊鳴怎么選的外援

稀碎!遼籃新援瘋狂打鐵 7中1和4中0 楊鳴怎么選的外援

胖子噴球
2026-01-13 21:24:54
0-1大爆冷!1-0絕殺!U23亞洲杯太瘋狂:東道主沙特隊轟然出局

0-1大爆冷!1-0絕殺!U23亞洲杯太瘋狂:東道主沙特隊轟然出局

大秦壁虎白話體育
2026-01-13 07:06:22
小米二手車開始血崩,雷軍坐不住了!

小米二手車開始血崩,雷軍坐不住了!

鳴金網
2026-01-12 12:40:42
澳大利亞U23后衛(wèi):中國隊是一支很好的球隊,組織力非常好

澳大利亞U23后衛(wèi):中國隊是一支很好的球隊,組織力非常好

懂球帝
2026-01-13 11:05:09
3大信號已發(fā)出,美軍要突襲伊朗,戰(zhàn)斗隨時打響,不走就來不及了

3大信號已發(fā)出,美軍要突襲伊朗,戰(zhàn)斗隨時打響,不走就來不及了

小陳講史
2026-01-13 11:20:04
2026-01-13 21:39:00
新智元 incentive-icons
新智元
AI產業(yè)主平臺領航智能+時代
14326文章數 66456關注度
往期回顧 全部

科技要聞

每年10億美元!谷歌大模型注入Siri

頭條要聞

李在明訪日與高市早苗會談 提到中國

頭條要聞

李在明訪日與高市早苗會談 提到中國

體育要聞

他帶出國乒世界冠軍,退休后為愛徒返場

娛樂要聞

蔡卓妍承認新戀情,與男友林俊賢感情穩(wěn)定

財經要聞

"天量存款"將到期 資金會否搬入股市?

汽車要聞

限時9.99萬元起 2026款啟辰大V DD-i虎鯨上市

態(tài)度原創(chuàng)

游戲
數碼
旅游
藝術
房產

2026年首個開放世界二游:高完成度的首測,熟練得不像第一次

數碼要聞

英特爾和AMD盤前走強 KeyBanc因服務器CPU需求強勁上調兩家公司評級

旅游要聞

已達42000萬只!昆明進入最佳觀鷗期,持續(xù)至……

藝術要聞

書法爭議再起:拙與妍孰優(yōu)孰劣引發(fā)熱議

房產要聞

又一新校開建!??谶@一片區(qū),迎來教育重磅升級!

無障礙瀏覽 進入關懷版