国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

深度體驗(yàn)谷歌Nano Banana后,我們發(fā)現(xiàn)了它的AB面

0
分享至

文 / 道哥

上線不到兩周,谷歌旗下的Nano Banana已在全球生產(chǎn)超2億張圖片,亞太地區(qū)用戶熱情度居首。

這個(gè)圖片編輯模型界的“新星”,上個(gè)月在全球人工智能社區(qū)里還是一個(gè)不知出處的神秘代號(hào)。在AI模型匿名對(duì)戰(zhàn)平臺(tái)LMArena上,它以驚人的表現(xiàn)迅速登頂排行榜,在處理復(fù)雜指令、保持角色連貫性和理解上下文細(xì)節(jié)方面的能力,輕松擊敗了包括OpenAI和Midjourney在內(nèi)的所有知名對(duì)手。一時(shí)間,關(guān)于“Nano Banana”究竟是何方神圣的猜測(cè)甚囂塵上。

謎底很快揭曉,谷歌正式宣布這匹黑馬正是其最新升級(jí)的圖像生成與編輯模型——Gemini 2.5 Flash Image,它作為一項(xiàng)重大更新被集成到了谷歌的AI應(yīng)用Gemini之中,由Google DeepMind提供技術(shù)支持。

《智百道》認(rèn)為,“Nano Banana”的問世,并非僅僅是圖像模型的又一次迭代,它預(yù)示著谷歌正試圖將AI轉(zhuǎn)變?yōu)橐粋€(gè)深度嵌入工作流程的“創(chuàng)意協(xié)作者”,意在打破當(dāng)前市場(chǎng)上由Midjourney主導(dǎo)的藝術(shù)美學(xué)和由OpenAI主導(dǎo)的文本生產(chǎn)力工具之間的二元格局,開辟一條以“工作流”為核心的全新賽道。

01 重新定義“P圖”,像對(duì)話一樣編輯現(xiàn)實(shí)

傳統(tǒng)AI圖像工具的交互模式,往往是“一問一答”式的,用戶需要絞盡腦汁設(shè)計(jì)出完美的提示詞(prompt),模型則一次性生成結(jié)果。后續(xù)的修改,無論是通過Midjourney的“Vary”功能還是DALL-E的局部重繪,都感覺像是獨(dú)立的、離散的操作。

“Nano Banana”則引入了一種“創(chuàng)意伙伴”(creative partner)的新模式,用戶可以發(fā)起一個(gè)初始指令,然后通過連續(xù)的自然語言對(duì)話,對(duì)生成的圖像進(jìn)行迭代式優(yōu)化。這種多輪編輯能力,使得AI能夠記憶上下文,理解用戶的連續(xù)意圖,從而實(shí)現(xiàn)漸進(jìn)式的、精細(xì)化調(diào)整。

《智百道》嘗試讓模型生成一個(gè)“空蕩蕩的房間”,接著說“把墻壁刷成鵝黃色”,然后是“在墻邊加一個(gè)書架”,最后“放置吊燈、沙發(fā)和地毯”。在整個(gè)過程中,“Nano Banana”始終保持著對(duì)場(chǎng)景的整體認(rèn)知,每一次修改都在前一次的基礎(chǔ)上進(jìn)行,而不是推倒重來。

《智百道》認(rèn)為,這種交互方式極大地降低了使用門檻,讓復(fù)雜的視覺構(gòu)想得以通過最自然的對(duì)話形式逐步實(shí)現(xiàn)。讓用戶的角色從一個(gè)“提示詞工程師”轉(zhuǎn)變?yōu)橐粋€(gè)真正的“創(chuàng)意總監(jiān)”,其價(jià)值不再僅僅是提出最初的構(gòu)想,更在于通過與AI的持續(xù)互動(dòng)來打磨和完善最終的作品,也更貼近人類創(chuàng)作者的自然思維過程。

對(duì)話式體驗(yàn)的背后,建立在模型的四大核心技術(shù)之上,它們共同構(gòu)成了“Nano Banana”顛覆性的能力矩陣。

首先是角色與風(fēng)格一致性,之前的模型很難在多張圖片中保持同一個(gè)角色的面部特征、服裝或特定風(fēng)格?!癗ano Banana”在這一點(diǎn)上取得了突破,能夠確保一個(gè)人物、寵物甚至是一個(gè)品牌產(chǎn)品,在不同的場(chǎng)景、姿態(tài)和服裝下,依然保持其核心外觀的連貫性。

其次是多圖像融合,該功能允許用戶上傳多張不同的圖片,讓模型理解并將其中的元素、主體或風(fēng)格無縫地融合到一個(gè)全新的、邏輯自洽的場(chǎng)景中。

第三是精準(zhǔn)的局部編輯,用戶無需使用復(fù)雜的選區(qū)或蒙版工具,只需通過簡(jiǎn)單的文字描述,就能對(duì)圖像的特定區(qū)域進(jìn)行修改。無論是“移除T恤上的污漬”、“模糊照片的背景”,還是“改變?nèi)宋锏淖藙?shì)”,模型都能精準(zhǔn)定位并執(zhí)行操作,同時(shí)保持圖像其他部分的完整性和協(xié)調(diào)性。

最后是設(shè)計(jì)與風(fēng)格遷移,模型能夠從一張圖片中提取顏色、紋理或圖案等設(shè)計(jì)元素,并將其應(yīng)用到另一張圖片中的對(duì)象上。谷歌官方演示的例子包括“用花瓣的顏色和紋理設(shè)計(jì)一雙雨靴”,或是“用蝴蝶翅膀的圖案設(shè)計(jì)一條連衣裙”,展現(xiàn)了其在跨概念創(chuàng)意組合方面的潛力。

正如一些科技媒體所評(píng)論的,“Nano Banana”正在成為“每個(gè)人的Photoshop”。它將過去需要數(shù)年學(xué)習(xí)才能掌握的專業(yè)圖像處理技術(shù),轉(zhuǎn)化為普通人通過日常語言就能使用的工具。對(duì)于廣大普通用戶而言,這意味著他們可以輕松地為社交媒體創(chuàng)作更具個(gè)性化的內(nèi)容,為個(gè)人項(xiàng)目制作獨(dú)特的視覺材料,或者僅僅是為了娛樂而實(shí)現(xiàn)各種天馬行空的想象。

對(duì)于平面設(shè)計(jì)師、插畫師和視覺藝術(shù)家等專業(yè)創(chuàng)作者而言,“Nano Banana”可以把他們從大量重復(fù)、繁瑣的執(zhí)行性任務(wù)中解放出來。比如,為一個(gè)廣告活動(dòng)制作15個(gè)尺寸略有不同的版本,或者為一系列產(chǎn)品圖更換不同的背景,這些過去耗時(shí)耗力的工作現(xiàn)在可以交由AI自動(dòng)完成。這使得專業(yè)人士能將更多精力投入到更高層次的品牌戰(zhàn)略、復(fù)雜的版式設(shè)計(jì)以及決定作品優(yōu)劣的最終細(xì)節(jié)打磨上。

該模型也很快被專業(yè)人士買單,全球最大的廣告?zhèn)鞑ゼ瘓F(tuán)WPP的全球創(chuàng)意與創(chuàng)新主管Daniel Barak指出,該模型在零售業(yè)和消費(fèi)品行業(yè)中展現(xiàn)了強(qiáng)大的應(yīng)用范例,并計(jì)劃將其整合到WPP的AI營(yíng)銷服務(wù)平臺(tái)WPP Open中。

02 谷歌做對(duì)了什么?

在正式揭曉身份之前,“Nano Banana”已經(jīng)在匿名的LMArena對(duì)戰(zhàn)平臺(tái)上證明了自己。它在人類偏好測(cè)試中,尤其是在圖像編輯任務(wù)上,以高達(dá)1362的Elo分?jǐn)?shù)高居榜首,顯著領(lǐng)先于競(jìng)爭(zhēng)對(duì)手。

除了模型本身的技術(shù)創(chuàng)新,谷歌還巧妙地利用了其龐大的生態(tài)系統(tǒng)優(yōu)勢(shì)。“Nano Banana”繼承了Gemini大模型的“原生世界知識(shí)”,這意味著它不僅僅是一個(gè)圖像生成器,更是一個(gè)具備常識(shí)和推理能力的系統(tǒng)。它能夠理解和生成具有深層語義準(zhǔn)確性的圖像,例如,它可以讀懂手繪的圖表并回答相關(guān)問題,或者根據(jù)用戶所在的地理位置,生成符合當(dāng)?shù)匚幕?xí)慣的圖片。

在商業(yè)策略上,谷歌采取了極具競(jìng)爭(zhēng)力的定價(jià),通過API調(diào)用,每生成一張圖片的成本約為0.039美元,低價(jià)策略極大地降低了開發(fā)者和企業(yè)進(jìn)行大規(guī)模、高頻次圖像生成的門檻。《智百道》認(rèn)為,這是一種典型的平臺(tái)戰(zhàn)略,旨在通過價(jià)格優(yōu)勢(shì)快速搶占市場(chǎng)份額,鼓勵(lì)開發(fā)者圍繞其API構(gòu)建應(yīng)用生態(tài)。

谷歌的戰(zhàn)略也清晰可見,它并非要在所有維度上都做到極致。Midjourney在藝術(shù)美學(xué)上依然是王者,而OpenAI則憑借其龐大的ChatGPT用戶基礎(chǔ)在通用性上占優(yōu)。谷歌選擇的突破口是工作流,通過打造一款在專業(yè)人士最常遇到的80%任務(wù)(如保持一致性、反復(fù)修改、快速出圖)上表現(xiàn)卓越、且成本低廉的工具,它精準(zhǔn)地切入了對(duì)實(shí)用性和集成度要求極高的企業(yè)級(jí)市場(chǎng)。

這是一種典型的用“更好用、更便宜”的產(chǎn)品來滿足主流市場(chǎng)需求的策略,即便它在某些頂尖的藝術(shù)性指標(biāo)上并非最佳,但其在商業(yè)應(yīng)用上的綜合價(jià)值卻可能更高。

03 香蕉的“另一面”,不完美現(xiàn)實(shí)與未解的倫理題

盡管“Nano Banana”在功能和理念上帶來了諸多突破,但它遠(yuǎn)非完美,用戶的實(shí)際體驗(yàn)和深入的審視揭示了其在技術(shù)層面的一系列短板。

首先是分辨率和細(xì)節(jié)的損失。科技媒體CNET的評(píng)測(cè)指出,該模型在處理用戶上傳的高質(zhì)量照片后,輸出的圖像分辨率常常會(huì)降低,導(dǎo)致原始照片中的精細(xì)細(xì)節(jié)變得模糊。這對(duì)于追求畫質(zhì)的攝影師和專業(yè)設(shè)計(jì)師來說,是一個(gè)難以接受的硬傷。

其次是僵化的格式限制,目前,該模型強(qiáng)制輸出正方形(1:1)的圖像,并且會(huì)忽略用戶提出的更改寬高比的指令。這一限制極大地束縛了其在不同媒介上的應(yīng)用。盡管一些高級(jí)用戶已經(jīng)找到了通過特定指令“欺騙”模型輸出不同比例圖像的“黑客”方法,但這無疑增加了使用成本和不確定性。

此外,其性能并不穩(wěn)定,在某些看似簡(jiǎn)單的任務(wù)上,如移除玻璃上的反光,模型可能會(huì)反復(fù)失敗,并且每一次嘗試都可能進(jìn)一步降低圖像質(zhì)量,甚至扭曲畫面中的人臉。一些Reddit用戶甚至抱怨,公開發(fā)布的版本感覺比之前在LMArena上測(cè)試的匿名版本性能有所下降,在一致性和指令遵循方面打了折扣。

值得注意的是,為了避免陷入安全與倫理性爭(zhēng)議,新版的“Nano Banana”似乎走向了另一個(gè)極端:過度審查。大量用戶反映,模型內(nèi)置了極其嚴(yán)格的安全過濾器,常常會(huì)拒絕執(zhí)行完全無害、符合社區(qū)規(guī)范的指令。這種“寧可錯(cuò)殺一千,不可放過一個(gè)”的策略,雖然在一定程度上避免了政治不正確的風(fēng)險(xiǎn),

此外,所有由“Nano Banana”生成或編輯的圖像,都會(huì)被打上可見的水印和一種名為SynthID的不可見數(shù)字水印。這項(xiàng)由Google DeepMind開發(fā)的技術(shù),旨在從源頭上明確內(nèi)容的AI生成屬性,以幫助對(duì)抗虛假信息和惡意濫用。

近期,谷歌也公布了Gemini各層級(jí)服務(wù)的具體使用限制,免費(fèi)用戶每天可生成100張圖片,Google AI Pro訂閱用戶每天可生成1000張圖片,Google AI Ultra訂閱用戶每天同樣可生成1000張圖片,但享有其他Gemini功能的更高配額。

“Nano Banana”的發(fā)布,也帶來了一個(gè)關(guān)于未來的深刻問題:這究竟是標(biāo)志著人機(jī)交互進(jìn)入新紀(jì)元的“iPhone時(shí)刻”,還是科技巨頭之間又一輪愈演愈烈的軍備競(jìng)賽?

《智百道》認(rèn)為,從核心貢獻(xiàn)來看,它的真正突破在于將視覺創(chuàng)作的交互范式從“編寫指令”轉(zhuǎn)向了“進(jìn)行對(duì)話”。這種以工作流為中心、強(qiáng)調(diào)迭代和精煉的模式,無疑比以往任何工具都更貼近人類的自然創(chuàng)作思維。就像iPhone的多點(diǎn)觸控技術(shù)讓復(fù)雜的計(jì)算變得直觀易用一樣,“Nano Banana”的對(duì)話式編輯也極大地降低了高級(jí)視覺創(chuàng)作的門檻,改變了人與AI之間的協(xié)作關(guān)系。

然而,也必須把這一創(chuàng)新置于生成式AI領(lǐng)域白熱化的競(jìng)爭(zhēng)格局中。谷歌憑借“Nano Banana”在圖像編輯和工作流整合上扳回一城,但其競(jìng)爭(zhēng)對(duì)手并未停歇,OpenAI正繼續(xù)將其圖像能力深度整合進(jìn)ChatGPT龐大的生態(tài)系統(tǒng),而Midjourney在藝術(shù)風(fēng)格化的賽道上依舊一騎絕塵。

“Nano Banana”的長(zhǎng)期意義或許并不在于它是否是當(dāng)前“最好”的模型,而在于它所代表的戰(zhàn)略方向——將AI作為一種無縫、直觀、深度嵌入日常工作流程的協(xié)作工具。這場(chǎng)風(fēng)暴過后,創(chuàng)意產(chǎn)業(yè)的圖景已然改變。它加速了創(chuàng)意的民主化進(jìn)程,重塑了專業(yè)人士的角色定位。

谷歌的“香蕉”可能不是戰(zhàn)爭(zhēng)的終點(diǎn),但它無疑是改變了戰(zhàn)場(chǎng)規(guī)則的那顆信號(hào)彈,創(chuàng)意工作者與AI“副駕駛”共生的時(shí)代,已經(jīng)到來。

*題圖由AI生成

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
幾乎無短板的iPhone價(jià)格跳水超6000元1500元入手備用機(jī)性價(jià)比拉滿

幾乎無短板的iPhone價(jià)格跳水超6000元1500元入手備用機(jī)性價(jià)比拉滿

小柱解說游戲
2026-03-25 16:08:49
薩拉赫賽季末離隊(duì),克洛普時(shí)代結(jié)束。安菲爾德也開啟重建之路

薩拉赫賽季末離隊(duì),克洛普時(shí)代結(jié)束。安菲爾德也開啟重建之路

K唐伯虎
2026-03-26 07:07:42
邁巴赫S級(jí)轎車全球首秀,李德思任奔馳銷售公司總裁后首次亮相

邁巴赫S級(jí)轎車全球首秀,李德思任奔馳銷售公司總裁后首次亮相

新京報(bào)
2026-03-24 23:40:10
湖北30畝油菜被毀最新進(jìn)展:賠償談妥后,問責(zé)程序已啟動(dòng)

湖北30畝油菜被毀最新進(jìn)展:賠償談妥后,問責(zé)程序已啟動(dòng)

吃貨的分享
2026-03-26 01:39:03
1-3又爆冷!溫瑞博無緣世乒賽,3次決賽全輸球,王皓的算盤落空了

1-3又爆冷!溫瑞博無緣世乒賽,3次決賽全輸球,王皓的算盤落空了

體育就你秀
2026-03-26 05:00:03
A股:股民準(zhǔn)備好,主力已明牌!周四是反彈尾聲,還是新升浪開啟

A股:股民準(zhǔn)備好,主力已明牌!周四是反彈尾聲,還是新升浪開啟

云鵬敘事
2026-03-26 00:00:06
涉嫌嚴(yán)重違紀(jì)違法,姚啟生被查

涉嫌嚴(yán)重違紀(jì)違法,姚啟生被查

都市快報(bào)橙柿互動(dòng)
2026-03-25 20:00:35
車險(xiǎn)改革落地!42%車主棄車損險(xiǎn),2026這樣投保最省錢

車險(xiǎn)改革落地!42%車主棄車損險(xiǎn),2026這樣投保最省錢

三農(nóng)老歷
2026-03-26 02:19:11
悄悄拿下7連勝,甩開哈登追平塔圖姆!被忽視的爭(zhēng)冠熱門殺回來了

悄悄拿下7連勝,甩開哈登追平塔圖姆!被忽視的爭(zhēng)冠熱門殺回來了

鍋?zhàn)踊@球
2026-03-25 11:39:08
中美衛(wèi)星導(dǎo)航用戶數(shù)量懸殊:GPS用戶數(shù)超60億,中國(guó)北斗令人意外

中美衛(wèi)星導(dǎo)航用戶數(shù)量懸殊:GPS用戶數(shù)超60億,中國(guó)北斗令人意外

混沌錄
2026-03-18 23:54:31
拉里賈尼身亡,其繼任者有伊斯蘭革命衛(wèi)隊(duì)背景

拉里賈尼身亡,其繼任者有伊斯蘭革命衛(wèi)隊(duì)背景

上觀新聞
2026-03-25 04:06:47
這輩子走不出牢門,尹錫悅報(bào)復(fù)李在明的手段,就只剩下折磨獄警了

這輩子走不出牢門,尹錫悅報(bào)復(fù)李在明的手段,就只剩下折磨獄警了

共工之錨
2026-03-26 01:03:20
王曼昱看到一定會(huì)難過!張雪峰曾許諾:我早晚請(qǐng)你做公司代言人

王曼昱看到一定會(huì)難過!張雪峰曾許諾:我早晚請(qǐng)你做公司代言人

游戲收藏指南
2026-03-25 20:31:14
放下“舊怨”,兩大省域副中心這次不爭(zhēng)了

放下“舊怨”,兩大省域副中心這次不爭(zhēng)了

城市進(jìn)化論
2026-03-24 23:25:15
考研導(dǎo)師張雪峰因跑步心臟聚停離世?網(wǎng)傳特殊治療知情同意書也被流傳出。

考研導(dǎo)師張雪峰因跑步心臟聚停離世?網(wǎng)傳特殊治療知情同意書也被流傳出。

貼小君
2026-03-24 20:41:23
冠中冠已定8席!趙心童吳宜澤入圍,80后2虎75雙雄紅包賽搶門票!

冠中冠已定8席!趙心童吳宜澤入圍,80后2虎75雙雄紅包賽搶門票!

劉姚堯的文字城堡
2026-03-26 07:00:38
錯(cuò)過能建別再錯(cuò)過它!9元低價(jià)+算電協(xié)同+圓弧底 主力底部搶籌5億

錯(cuò)過能建別再錯(cuò)過它!9元低價(jià)+算電協(xié)同+圓弧底 主力底部搶籌5億

元芳說投資
2026-03-26 07:00:11
北京房?jī)r(jià)反彈,居民看房忙碌

北京房?jī)r(jià)反彈,居民看房忙碌

阿離家居
2026-03-26 02:05:35
CPO光通信最新8大核心龍頭梳理,一篇文章全看懂

CPO光通信最新8大核心龍頭梳理,一篇文章全看懂

新浪財(cái)經(jīng)
2026-03-25 20:23:57
女子赴發(fā)小婚禮穿瑜伽褲,打扮過于火辣,網(wǎng)友直呼跟沒穿似的

女子赴發(fā)小婚禮穿瑜伽褲,打扮過于火辣,網(wǎng)友直呼跟沒穿似的

一盅情懷
2026-03-16 17:28:45
2026-03-26 07:35:00
節(jié)點(diǎn)AI incentive-icons
節(jié)點(diǎn)AI
專注于人工智能領(lǐng)域的產(chǎn)業(yè)媒體
107文章數(shù) 2關(guān)注度
往期回顧 全部

科技要聞

紅極一時(shí)卻草草收?qǐng)?,Sora宣布正式關(guān)停

頭條要聞

伊朗軍方稱擊落美軍F-18戰(zhàn)機(jī) 現(xiàn)場(chǎng)畫面披露

頭條要聞

伊朗軍方稱擊落美軍F-18戰(zhàn)機(jī) 現(xiàn)場(chǎng)畫面披露

體育要聞

35歲替補(bǔ)門將,憑什么入選英格蘭隊(duì)?

娛樂要聞

張雪峰遺產(chǎn)分割復(fù)雜!是否立遺囑成關(guān)鍵

財(cái)經(jīng)要聞

管濤:中東局勢(shì)如何影響人民幣匯率走勢(shì)?

汽車要聞

智己LS8放大招 30萬內(nèi)8系旗艦+全線控底盤秀實(shí)力

態(tài)度原創(chuàng)

藝術(shù)
游戲
健康
親子
軍事航空

藝術(shù)要聞

原來唐朝貴婦的生活,比我們還會(huì)享受!

PS6升級(jí)動(dòng)力遭質(zhì)疑!玩家或當(dāng)“PS5釘子戶”

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

親子要聞

從食材到餐盤,全鏈條守護(hù)幼兒舌尖安全 | 新京報(bào)快評(píng)

軍事要聞

伊朗重申非交戰(zhàn)國(guó)家船只可安全通過霍爾木茲海峽

無障礙瀏覽 進(jìn)入關(guān)懷版