国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

萬字長(zhǎng)文|邁向電商大模型時(shí)代,從虛擬試穿聊到電商AIGC

0
分享至


演講嘉賓|李巖博士,京東零售視覺與 AIGC 部負(fù)責(zé)人

策劃|李忠良

2025 年,虛擬試衣已成為電商行業(yè)不可或缺的核心環(huán)節(jié),從技術(shù)落地到商業(yè)變現(xiàn),全行業(yè)都在加速布局這一賽道。那什么是虛擬試衣?其背后的核心技術(shù)方案有哪些?國(guó)內(nèi)外電商大廠又有哪些典型實(shí)踐案例?如何突破技術(shù)瓶頸,打造更貼合用戶需求的試穿體驗(yàn)?電商平臺(tái)又該如何構(gòu)建完整的 AIGC 能力矩陣?

本文中,我們特別邀請(qǐng)到京東零售視覺與 AIGC 部負(fù)責(zé)人李巖博士,帶來《邁向電商大模型時(shí)代,從虛擬試穿到電商 AIGC》的深度分享,為你拆解虛擬試衣的技術(shù)邏輯、行業(yè)實(shí)踐與未來趨勢(shì),解鎖電商 AIGC 的全域布局思路。以下是根據(jù)李巖博士在 AICon2025 北京場(chǎng)的演講整理成的文字。


各位同學(xué),大家上午好,我是來自京東零售的李巖,目前負(fù)責(zé)京東電商 AIGC 相關(guān)業(yè)務(wù)的產(chǎn)品、研發(fā)與算法。今天,我想和大家分享的主題是《邁向電商大模型時(shí)代,從虛擬試穿到電商 AIGC》。這個(gè)話題,相信在座很多深耕電商領(lǐng)域,尤其是聚焦服飾時(shí)尚賽道的朋友會(huì)格外關(guān)注,也希望我今天的分享能給大家?guī)硪恍﹩l(fā)與收獲。


這是我今天分享的核心內(nèi)容。首先,我會(huì)為大家講解什么是虛擬試穿;緊接著,帶大家回顧虛擬試穿的技術(shù)發(fā)展歷程,這里也建議在座做生成技術(shù)的同學(xué)重點(diǎn)關(guān)注。

之后,我會(huì)深度拆解行業(yè)內(nèi)幾家主流虛擬試衣產(chǎn)品的核心能力;再為大家介紹京東在虛擬試穿領(lǐng)域的探索,以及我們?cè)趯?shí)踐中沉淀的經(jīng)驗(yàn)與教訓(xùn)。在此基礎(chǔ)上,我還會(huì)分享京東零售 AIGC 布局的全景圖;最后,和大家聊聊我個(gè)人對(duì)整個(gè)行業(yè)未來發(fā)展的觀點(diǎn)與展望。

我們現(xiàn)在開始進(jìn)入第一部分,什么是虛擬試穿。


虛擬試衣的底層邏輯其實(shí)很簡(jiǎn)單,就是 A+B=AB。這里的 A 指的是模特的圖片或視頻,B 則是服飾圖。我們通過視覺生成技術(shù),把服飾“穿”到模特身上,最終以靜態(tài)或動(dòng)態(tài)的效果呈現(xiàn)給用戶。整個(gè)過程的核心要求,就是必須保證模特與服飾的關(guān)鍵信息不被破壞、不被篡改。這個(gè)原理相信大家都能輕松理解,接下來,我會(huì)從不同維度為大家梳理虛擬試衣的分類。


首先,我們從服飾呈現(xiàn)形式來看分類。服飾的素材形態(tài)主要有三種:一是平鋪的白底服飾圖,二是真人模特上身的服飾圖,三是假人臺(tái)模特上身的服飾圖。其次,我們以服飾數(shù)量為劃分標(biāo)準(zhǔn),這一類可以分為單件服飾和多件服飾兩類。

單件服飾涵蓋上裝、下裝、長(zhǎng)款連衣裙以及單件內(nèi)衣等;多件服飾則是多種單件服飾的組合搭配,這里鞋子、包包、配飾等,也都在虛擬試衣的服務(wù)范疇之內(nèi)。以上就是從服飾的不同維度對(duì)虛擬試衣進(jìn)行的分類。


接下來,我們換個(gè)角度,從模特的視角來拆解虛擬試衣的分類。從模特類型來看,可分為全身模特、半身模特、多人模特以及視頻模特;從輸出形態(tài)來看,則可以分為靜態(tài)圖像模特和動(dòng)態(tài)視頻模特兩類。

講到這里大家不難發(fā)現(xiàn),虛擬試衣任務(wù)的輸入條件其實(shí)是相當(dāng)豐富且復(fù)雜的。因此,一個(gè)優(yōu)質(zhì)的虛擬試穿算法,需要對(duì)上述所有的組合矩陣都具備良好的適配能力。而截至目前,要實(shí)現(xiàn)這一點(diǎn),依然存在不小的技術(shù)挑戰(zhàn)。


接下來我們聊聊為什么我們要做虛擬試衣,我打算從三個(gè)不同的視角,給大家展開說明。首先看大環(huán)境,三年的口罩,直接推動(dòng)了服飾行業(yè)從線下向線上的轉(zhuǎn)移。

2019 年中國(guó)服飾的線上銷售額占整體零售額的 25%~30%,到 2023~2024 年,這個(gè)比例已經(jīng)提升至 40%,而 2025 年更是突破了 50%。這意味著,如今人們已經(jīng)越來越習(xí)慣在線上購(gòu)買服飾。

再?gòu)南M(fèi)者的視角來看,很多用戶都十分在意購(gòu)物的便捷性和私密性。有調(diào)研顯示,65% 的女性和 54% 的男性對(duì)傳統(tǒng)實(shí)體試衣間感到不自在、不方便。大家可以想象,消費(fèi)者要在狹小的空間里完成脫衣、穿衣甚至換鞋的操作,到了冬天,衣服厚重繁瑣,體驗(yàn)只會(huì)更差;同時(shí),公共試衣區(qū)域還存在疾病交叉感染的風(fēng)險(xiǎn)。

這類弊端還有很多,我就不一一列舉了。而用戶天然就有看到服裝上身效果的需求,所以相比于線下場(chǎng)景,AI 試穿堪稱服飾線上零售在體驗(yàn)上的“最后一公里”。

最后我們站在商家的視角分析,這里有一張圖,可能經(jīng)常網(wǎng)購(gòu)的女生會(huì)了解這個(gè)梗,現(xiàn)在有不少無良買家會(huì)做“穿完即退”的操作,尤其是禮服類服飾,穿著新衣服拍照打卡、出席活動(dòng)后,就無理由退貨,導(dǎo)致衣服沾染污漬異味,商家根本無法二次銷售。

為此,商家想出了用“大尺寸 + 硬質(zhì)材料”的“巨型吊牌”,來對(duì)這種惡意退貨進(jìn)行物理防御。拋開這個(gè)梗不談,高退貨率一直是服飾電商商家的痛點(diǎn)。普通電商平臺(tái)的服飾退貨率普遍在 25%~60%,而內(nèi)容電商的直播場(chǎng)景退貨率更高,有時(shí)甚至能達(dá)到 80%~90%。商家每處理一件退貨,平均要付出 15~30 元的成本,涵蓋物流、包裝、折舊、倉(cāng)儲(chǔ)以及人工處理等多個(gè)方面,如果是跨境電商業(yè)務(wù),這個(gè)成本還會(huì)更高。

所以,作為技術(shù)人員,行業(yè)需要我們提供穩(wěn)定、可靠的線上試穿技術(shù)與產(chǎn)品能力,這也是我今天站在這里的原因。


那我們接下來聊聊,虛擬試穿到底好不好做,行業(yè)的核心難點(diǎn)又在哪里?這里我們只聚焦 C 端場(chǎng)景,核心難點(diǎn)其實(shí)集中在用戶對(duì)這項(xiàng)技術(shù)的預(yù)期上,而這種預(yù)期可以分為三個(gè)不同的層次。

首先是基礎(chǔ)型需求,用戶這個(gè)階段最關(guān)注的是服裝上身效果,包括顏色、款式、版型和面料質(zhì)感的精準(zhǔn)還原。

這一層面的難點(diǎn)主要有四個(gè):第一,用戶相冊(cè)里往往缺乏直接可用的素材,尤其是男性用戶,別說全身清晰人像,就連頭肩部位的合格肖像都很難找到;第二,試衣算法必須保證服裝上身之后模特自身的關(guān)鍵信息不能被篡改,尤其是臉部特征,試穿前是什么樣子,試穿后核心的面部 ID 信息必須保持一致;第三,真實(shí)還原與美學(xué)增強(qiáng)是一對(duì)很難平衡的“矛盾體”,算法初期往往優(yōu)先追求信息的最大程度還原,但用戶,尤其是女性用戶,對(duì)美有著強(qiáng)烈訴求,不少女性用戶甚至表示,只要能變好看,輕微修改肖像完全可以接受;第四,試衣模型大多基于擴(kuò)散模型搭建,試穿效果直接取決于模型所儲(chǔ)備的世界知識(shí)。

這就是基礎(chǔ)型需求的核心,讓用戶直觀看到服裝穿在身上的基本樣子。

第二個(gè)層面的需求是尺碼合身,其實(shí)這才是大眾認(rèn)知里,虛擬試穿最核心的剛需,同時(shí)也是所有需求中實(shí)現(xiàn)難度最高的一個(gè),直到現(xiàn)在行業(yè)內(nèi)都還沒有成熟的技術(shù)方案。

從算法層面來看,核心瓶頸在于尺碼錯(cuò)配的訓(xùn)練數(shù)據(jù)極度匱乏。大家可以想想,電商平臺(tái)的買家秀里,曬出的都是用戶穿著合身尺碼的照片,根本找不到“小體型穿大碼”“大體型穿小碼”這類尺碼 mismatch 的完整數(shù)據(jù)。除此之外,還有兩個(gè)關(guān)鍵問題:一是大量長(zhǎng)尾服飾本身就存在尺碼信息缺失的情況;二是不同品牌、品類的服飾,尺碼設(shè)定標(biāo)準(zhǔn)并不統(tǒng)一,這也是為什么有些店家會(huì)建議用戶拍大一碼或拍小一碼。

更重要的是,用戶對(duì)尺碼還存在個(gè)性化偏好,有人偏愛寬松的大碼版型,有人則更傾向于合身的小碼版型。所以說,尺碼合身這個(gè)需求,是目前虛擬試穿技術(shù)實(shí)現(xiàn)中最大的難題。

第三個(gè)層面的需求是突破型需求,也就是我們所說的穿搭推薦。這一層,用戶的核心訴求是基于自身身材與具體場(chǎng)景,獲得智能穿搭建議,甚至進(jìn)行個(gè)性化的風(fēng)格探索。

給大家舉幾個(gè)例子:用戶可以輸入自身情況,提出“要參加朋友婚禮該怎么穿搭”“出席孩子家長(zhǎng)會(huì)適合穿什么”這類場(chǎng)景化需求;也可以針對(duì)已有單品提問,比如“我有一件這個(gè)顏色的上衣,搭什么下裝最合適”“這條裙子配哪種外套更好看”。這些都是用戶在穿搭推薦上的典型訴求。

而這一需求的實(shí)現(xiàn),同樣存在不少技術(shù)難點(diǎn)。第一,模型必須精準(zhǔn)理解用戶的身材特征,比如不能給體型偏胖的用戶推薦短款顯壯的衣服。第二,要做好用戶歷史偏好的建模,準(zhǔn)確捕捉用戶過往的服飾品味,讓推薦更貼合其個(gè)人喜好,不能給穿衣風(fēng)格偏保守的用戶推薦過多潮流品牌。第三,需要獲取并理解“時(shí)空人”信息,就像現(xiàn)在 12 月的北京已經(jīng)入冬,天氣寒冷,推薦時(shí)就應(yīng)該優(yōu)先考慮羽絨服這類御寒衣物。

最后,既然要做風(fēng)格探索,就必須持續(xù)投入穿搭知識(shí)庫(kù)的構(gòu)建,同時(shí)積極追蹤最新的時(shí)尚潮流,這樣才能給用戶提供前沿且合適的穿搭建議。

接下來,我來給大家介紹一下虛擬試穿的技術(shù)發(fā)展歷程。


首先,我們來看它的學(xué)術(shù)起源。通過文獻(xiàn)梳理可以發(fā)現(xiàn) Virtual Try On 這一學(xué)術(shù)概念,最早是在 2001 年由日內(nèi)瓦大學(xué)的研究人員正式提出的。這項(xiàng)早期研究,給出了網(wǎng)絡(luò)環(huán)境下基于人體克隆的服裝試穿解決方案。

我這里展示了這篇二十多年前論文里的一些截圖,大家能很直觀地看到,當(dāng)時(shí)采用的是高度定制化的技術(shù)方法,不僅需要從特定角度對(duì)人體進(jìn)行拍照取樣,還高度依賴流程化、模塊化的操作,以及關(guān)鍵節(jié)點(diǎn)的一些定位技術(shù)。這就是虛擬試穿技術(shù)的學(xué)術(shù)開端。


了解了起源,我們?cè)夙樦鴷r(shí)間軸看過去二十多年里,學(xué)術(shù)界對(duì)這項(xiàng)技術(shù)的框架演進(jìn)脈絡(luò)。這條時(shí)間軸的起點(diǎn)是 2001 年,終點(diǎn)就是當(dāng)下的 2025 年。整體來看,技術(shù)發(fā)展可以劃分為三個(gè)核心階段:第一階段是 2001 年到 2013 年,主流方案以 3D 建模、物理仿真,以及 AR(Augmented Reality)相關(guān)技術(shù)為核心;到了 2017 年至 2022 年,技術(shù)路徑則逐漸轉(zhuǎn)向基于 CNN 與生成對(duì)抗網(wǎng)絡(luò) GAN(Generative Adversarial Networks)的框架;從 2023 年開始,擴(kuò)散模型(Diffusion Model)異軍突起,此后絕大多數(shù)研究都聚焦于這一技術(shù)方向,直到現(xiàn)在擴(kuò)散模型依然是虛擬試穿領(lǐng)域的最主流技術(shù)方案。


與此同時(shí),我也為大家梳理了虛擬試穿技術(shù)在學(xué)術(shù)界“繞不開”的四類核心研究文獻(xiàn),大家如果感興趣可以自行查閱,今天分享的這份材料也會(huì)提交給組織方,方便大家后續(xù)下載。第一類是生成對(duì)抗網(wǎng)絡(luò)(GAN)方向,相關(guān)研究主要集中在 2017 到 2022 年,核心都是基于 GAN 技術(shù)來實(shí)現(xiàn)虛擬試穿。

第二類是擴(kuò)散模型方向,正如之前提到的,2023 年之后這類研究開始爆發(fā),不同的網(wǎng)絡(luò)結(jié)構(gòu)和試穿任務(wù)場(chǎng)景,都能在這個(gè)方向找到具有行業(yè)影響力的論文。


另外兩類分別是視頻試穿方向和套裝試穿方向。隨著單件服飾圖像試穿技術(shù)逐漸成熟,學(xué)術(shù)界開始朝著不同維度拓展研究邊界,一個(gè)是從靜態(tài)圖像延伸到動(dòng)態(tài)視頻,一個(gè)則是從單件服飾試穿升級(jí)到多件搭配的套裝試穿。


接下來,我也帶大家回顧一下京東零售虛擬試穿技術(shù)的演進(jìn)脈絡(luò)。京東是從 2023 年左右啟動(dòng)虛擬試穿項(xiàng)目研發(fā),至今已有兩年多的積累,期間歷經(jīng)了四代大的技術(shù)框架迭代。

第一代是非常早期的架構(gòu),以 U-Net 作為擴(kuò)散模型主體,搭配 Reference Net 來實(shí)現(xiàn)參考服飾的信息注入。這個(gè)框架大家應(yīng)該比較熟悉,屬于 Stable Diffusion 時(shí)代的產(chǎn)物,它的擴(kuò)散模型參數(shù)規(guī)模不算大,對(duì)應(yīng)的圖像生成效果也相對(duì)有限。


到了第二代,我們將擴(kuò)散模型的主體結(jié)構(gòu)從 U-Net 升級(jí)為了 DiT,服飾信息的特征表示則同時(shí)借助 ViT 與 VAE 來完成。這次升級(jí)其實(shí)和行業(yè)趨勢(shì)同步,2024 年年初 Sora 橫空出世,讓大家看到了 DiT 作為擴(kuò)散模型框架的先進(jìn)性,因此大部分行業(yè)機(jī)構(gòu)都在 2024 年上半年完成了從 U-Net 到 DiT 的技術(shù)切換。

基于第二代技術(shù)框架的實(shí)踐,我們也沉淀了三個(gè)比較重要的認(rèn)知分享給大家。第一,基座模型的架構(gòu)和容量對(duì)試穿效果起到?jīng)Q定性作用。這一點(diǎn)也印證了擴(kuò)散模型的 Scaling Law,從最初的 1B 模型,到 3B、10B、20B,再到融入 VL 框架后升級(jí)至 30B 乃至更大參數(shù)規(guī)模,模型的生成效果有著肉眼可見的提升。

第二,利用 VAE 對(duì)參考圖像進(jìn)行編碼,能極大提升生成結(jié)果的一致性。ViT 的表征更偏語義層面,而 VAE 的訓(xùn)練以重構(gòu)殘差最小為優(yōu)化目標(biāo),更擅長(zhǎng)捕捉圖像細(xì)節(jié)。在實(shí)際試穿中,若遇到衣服 logo 等細(xì)節(jié)還原不佳的問題,往往就是因?yàn)闆]有正確使用 VAE 編碼器來做服飾特征表征。

第三,在這套框架的試穿任務(wù)中,無需對(duì)參考圖進(jìn)行 prompt 描述,如強(qiáng)行加入文本描述,反而很可能引發(fā)圖文沖突與對(duì)抗。不過這個(gè)結(jié)論并非絕對(duì),要結(jié)合具體技術(shù)框架來看,在當(dāng)前的 DiT+ViT+VAE 框架下,我們是可以剝離文本模塊的,但后續(xù)融入 VL 模型表征后,文本側(cè)的信息也能發(fā)揮相應(yīng)的價(jià)值。


京東零售的第三代虛擬試穿技術(shù),核心完成了從圖像試穿到視頻試穿的模態(tài)升級(jí)。目前行業(yè)內(nèi)的視頻生成框架尚未形成統(tǒng)一標(biāo)準(zhǔn),我們可以分享一套可供參考的技術(shù)方案:首先將原始視頻解析為帶 mask 的視頻幀序列,以及類似 OpenPose 的“火柴棍”姿態(tài)幀序列;再分別對(duì)這兩類序列進(jìn)行編碼、建模、,最終通過 MM-DiT 完成去噪,生成服飾上身的視頻試穿效果。


接下來,為大家介紹京東零售最新的第四代虛擬試穿技術(shù),這一代框架最顯著的變化,就是完全摒棄了 Mask 模塊,全面擁抱 Mask Free 的通用技術(shù)架構(gòu)。與此同時(shí),參考圖的表征方式也從原來的純視覺維度,進(jìn)化為融合文本模態(tài)的多模態(tài)統(tǒng)一表征,這里我們引入了 Vision Language Model 視覺語言模型來專門完成參考圖的特征提取。

基于第四代框架的實(shí)踐,我們也沉淀了幾個(gè)關(guān)鍵認(rèn)知:第一,Mask Free 框架對(duì)人物的身份特征、肢體姿態(tài)、服飾細(xì)節(jié)以及配飾元素,都能實(shí)現(xiàn)更好的保留效果;第二,該框架徹底擺脫了 Mask 模塊可能帶來的誤差累積,同時(shí)大幅降低了工程研發(fā)的復(fù)雜度。畢竟從研發(fā)角度來說,系統(tǒng)模塊越簡(jiǎn)潔,引入連帶問題的概率就越低,而 Mask 模塊本身會(huì)因不同應(yīng)用場(chǎng)景產(chǎn)生各種 badcase,容易引發(fā)新問題;第三,Mask Free 框架可以更好地兼容套裝試穿,以及服裝與配飾的同步試穿需求。

舉個(gè)簡(jiǎn)單的例子:在傳統(tǒng) Mask 方案中,需要先 mask 掉用戶原有的衣物,再疊加新服飾,可如果用戶原本還斜挎著小包,這個(gè)包包大概率會(huì)隨舊衣被 mask 掉,相當(dāng)于破壞了用戶的原始信息,而通過 Mask Free 的技術(shù)框架,就能實(shí)現(xiàn)“新衣上身,配飾保留”的效果。


最后,我們對(duì)虛擬試穿技術(shù)這一部分做個(gè)小結(jié),同時(shí)分享幾點(diǎn)我們的觀點(diǎn)。首先,給正在做或?qū)⒁鎏摂M試穿的研發(fā)人員一個(gè)建議,啟動(dòng)項(xiàng)目前一定要拿到最好的圖像生成基座模型,因?yàn)槟P偷氖澜缰R(shí)和基礎(chǔ)能力,直接決定了整個(gè)項(xiàng)目的起跑線。

請(qǐng)大家始終相信 Scaling Law,至少在 30B 參數(shù)規(guī)模以內(nèi),這種效應(yīng)的驗(yàn)證效果是非常清晰的。第二,Mask Free 技術(shù)框架會(huì)成為未來的主流方向,大道至簡(jiǎn),越簡(jiǎn)潔的技術(shù)路線越正確,如果現(xiàn)在還有同學(xué)在 Mask based 方案里摸索,建議果斷舍棄那些冗余的模塊,盡快擁抱 Mask Free 的通用技術(shù)框架。第三,從單件試穿到多件試穿是必然的技術(shù)趨勢(shì),而且必須要兼顧配飾。在我們看來,“試穿 + 穿搭”才是更具想象力的產(chǎn)品形態(tài)。我們現(xiàn)在聊的更多是“穿”的環(huán)節(jié),但從產(chǎn)品層面來說,更關(guān)鍵的其實(shí)是“搭”的能力。第四,試穿結(jié)果的視頻化,是用戶的核心訴求,這一點(diǎn)毋庸置疑。

畢竟線下試衣時(shí),大家都會(huì)對(duì)著鏡子轉(zhuǎn)身、擺動(dòng),動(dòng)態(tài)效果才更貼近真實(shí)體驗(yàn)。但這需要我們長(zhǎng)期攻克推理效率的難題,目前生成一段 10 秒的試穿視頻,耗時(shí)基本還是分鐘級(jí),這樣的速度對(duì)線上用戶體驗(yàn)的影響是比較大的。最后想聊的是數(shù)據(jù)的價(jià)值,用于試穿的訓(xùn)練數(shù)據(jù),會(huì)成為各大電商平臺(tái)的核心資產(chǎn)。極致的試穿效果,主要依賴于企業(yè)的 in-house 數(shù)據(jù)。

我們都知道,數(shù)據(jù)是大模型的核心,雖然有些從業(yè)者為了凸顯技術(shù)深度,會(huì)刻意回避甚至弱化數(shù)據(jù)的重要性,但事實(shí)就是如此。尤其是虛擬試穿這類賽道,每個(gè)企業(yè)都會(huì)建立自己的數(shù)據(jù)壁壘。同時(shí),隨著 AIGC 能力的提升,模型訓(xùn)練早期可以借助 AIGC 數(shù)據(jù)快速收斂到任務(wù)需求,后續(xù)再用真實(shí)數(shù)據(jù)校正,就能有效規(guī)避 AIGC 生成內(nèi)容帶來的失真。以上,就是我們?cè)诩夹g(shù)側(cè)想和大家分享的幾個(gè)觀點(diǎn)。


接下來,我為大家介紹虛擬試穿的行業(yè)實(shí)踐方案。首先來看整個(gè)行業(yè)的發(fā)展概況,這里有三組關(guān)鍵數(shù)據(jù)和大家分享。第一組數(shù)據(jù)是 200 億美元,2025 年全球虛擬試穿平臺(tái)的市場(chǎng)規(guī)模預(yù)計(jì)將突破 200 億美元,這其中涵蓋圖像生成、增強(qiáng)現(xiàn)實(shí)(AR)以及 3D 虛擬試衣等多個(gè)細(xì)分技術(shù)方向,而中國(guó)市場(chǎng)的規(guī)模,預(yù)計(jì)將占到其中的 50 億美元左右。

第二組數(shù)據(jù)是 60 余個(gè)品牌,截至今年 12 月,國(guó)內(nèi)已有超過 60 家服裝品牌對(duì)外宣稱具備虛擬試穿能力,覆蓋快時(shí)尚、運(yùn)動(dòng)等多個(gè)品類,這些品牌的核心分布區(qū)域,也集中在歐美中日韓等時(shí)尚消費(fèi)的核心地帶,像 Zara、Nike、Gap、H&M,以及中國(guó)的李寧、安踏等,都在其列。第三組數(shù)據(jù)是 60%,有機(jī)構(gòu)預(yù)測(cè),到 2026 年,全球?qū)⒂谐?60% 的服裝品牌采用不同形式的虛擬試穿解決方案,屆時(shí),這項(xiàng)技術(shù)將從當(dāng)前的“可選配置”,正式升級(jí)為整個(gè)行業(yè)的“標(biāo)配能力”。

此外,我也在上方列出了目前國(guó)內(nèi)外在虛擬試穿領(lǐng)域具備技術(shù)儲(chǔ)備的部分機(jī)構(gòu)和企業(yè),供大家參考。


接下來,我?guī)Т蠹抑饌€(gè)拆解虛擬試穿行業(yè)里幾家互聯(lián)網(wǎng)大廠的典型實(shí)踐方案。要介紹的第一個(gè)案例是阿里的 Lookie,用一句話概括,它是一款主打虛擬形象搭配試穿的 AI 娛樂工具。

這款產(chǎn)品的核心特點(diǎn)有兩個(gè):一是玩法豐富、搭配自由度高,而且自帶很強(qiáng)的分享屬性;二是“電子衣櫥”的概念很有新意,精準(zhǔn)命中了用戶多件服飾試穿搭配的潛在需求。當(dāng)然,我們也客觀地分析一下它當(dāng)前存在的局限性。第一,Lookie 目前僅支持套裝試穿,不支持單件試穿。

套裝試穿在娛樂場(chǎng)景下確實(shí)很有吸引力,但電商平臺(tái)的用戶購(gòu)買行為更多集中在單件服飾,這就形成了一個(gè)明顯的場(chǎng)景缺口。第二,它作為淘寶的一款中心化小程序,入口相對(duì)較深,導(dǎo)致產(chǎn)品的購(gòu)物屬性偏弱。如何從“好玩”迭代到“好用”,最終實(shí)現(xiàn)商業(yè)變現(xiàn),是 Lookie 團(tuán)隊(duì)需要重點(diǎn)回答的問題。第三,從試穿效果來看,生成的形象和用戶真實(shí)身材仍存在一定差異,大家可以去淘寶小程序里親自體驗(yàn)感受。第四,Lookie 的人物形象建模,在一定程度上依賴于 LoRA 數(shù)字分身技術(shù)。

熟悉這個(gè)技術(shù)的朋友應(yīng)該知道,早期的妙鴨也是這樣,需要用戶上傳十幾張個(gè)人照片,付費(fèi)后等待模型訓(xùn)練,才能生成專屬數(shù)字分身,后續(xù)試穿也都基于這個(gè)數(shù)字分身來完成。但這種技術(shù)方案對(duì)訓(xùn)練資源的要求較高,算不上是行業(yè)內(nèi) ROI 最優(yōu)的選擇。不過值得一提的是,Lookie 目前已經(jīng)開始嘗試支持單張圖像建模,在降低用戶使用門檻上往前又邁出了一步。


第二個(gè)要介紹的,依舊是阿里旗下的一款產(chǎn)品,淘寶 AI 試穿。用一句話來概括,它是一款入口布局激進(jìn)、功能設(shè)計(jì)清爽的購(gòu)物助手。這款產(chǎn)品的核心特點(diǎn)有兩個(gè):第一,它的入口直接設(shè)置在搜索雙列的商卡上,這個(gè)位置的選擇相當(dāng)大膽激進(jìn),能最大程度觸達(dá)購(gòu)物鏈路中的用戶;第二,它的推理速度較快,試穿效果穩(wěn)定,產(chǎn)品功能也足夠聚焦,整體使用體驗(yàn)十分清爽。

當(dāng)然,它也存在兩處明顯的局限性:其一,目前淘寶 AI 試穿僅支持上傳用戶相冊(cè)里的全身正面站立照,這個(gè)要求對(duì)不少用戶來說存在使用門檻,而且產(chǎn)品缺乏虛擬形象定制能力,畢竟從相冊(cè)里找出完全符合要求的照片,并不是一件容易的事。而虛擬形象定制恰恰是降低使用門檻的有效方式。其二,它現(xiàn)階段只具備單品試穿能力,沒有搭載穿搭推薦功能。我們之前提到過,穿搭是試穿場(chǎng)景中非常重要的延展環(huán)節(jié)。

不難發(fā)現(xiàn),阿里的這兩款試穿產(chǎn)品在一定程度上形成了互補(bǔ):淘寶 AI 試穿專注于單件試穿場(chǎng)景,深度嵌入核心購(gòu)物鏈路;而它所欠缺的穿搭能力,正好可以由 Lookie 小程序來補(bǔ)齊。


介紹完國(guó)內(nèi)電商平臺(tái)的試穿產(chǎn)品,我們?cè)侔涯抗廪D(zhuǎn)向海外,看看海外的虛擬試穿技術(shù)能力。這里我們以 Google Shopping Try On 為例展開介紹。用一句話來描述它,這是一款主打高真實(shí)性的購(gòu)物決策工具。

它的核心特點(diǎn)有三個(gè):第一,具備跨端覆蓋的試穿能力,同時(shí)支持移動(dòng)端與桌面端,能滿足不同用戶的使用習(xí)慣;第二,服飾覆蓋率極高,幾乎涵蓋了 Google Shopping 平臺(tái)上的全量服飾品類;第三,支持用戶上傳個(gè)人照片或使用 AI 模特,而且對(duì)用戶上傳素材的包容度很高,要知道,通常模特姿態(tài)越簡(jiǎn)單,試穿效果越容易把控,但 Google Shopping Try On 即便是面對(duì)坐姿、非標(biāo)準(zhǔn)站立等有難度的姿態(tài),也能處理得比較好。

當(dāng)然,它也存在明顯的局限性,這點(diǎn)和淘寶 AI 試穿有些類似,即僅支持單品試穿,暫未開放穿搭組合的試穿功能。


介紹完貨架電商場(chǎng)景下的典型 AI 試穿能力,我們?cè)侔涯抗廪D(zhuǎn)向內(nèi)容電商,這里以抖音的 AI 試穿為例來分析。

抖音的 AI 試穿,是一款主打“直播 + 試穿”的新體驗(yàn)產(chǎn)品。它的核心特點(diǎn)有三個(gè):第一,與直播場(chǎng)景緊密結(jié)合,用戶從看到商品到完成試穿的鏈路快捷又易用;第二,同時(shí)支持上傳用戶真實(shí)照片和使用 AI 模特,在一定程度上降低了用戶的使用門檻;第三,除了當(dāng)前入口的商品,還能支持同店鋪內(nèi)的穿搭推薦,正好契合了我們之前提到的試穿延展需求。

這款產(chǎn)品也存在兩處局限性:其一,雖然配備了 AI 模特,但這些模特的肖像和用戶本人沒有關(guān)聯(lián),更像是一張“平均臉”,用戶會(huì)覺得是陌生人在試穿,而非自己,體驗(yàn)上會(huì)有割裂感;其二,它的其中一個(gè)試穿入口設(shè)置在商品詳情頁的尺碼助手附近,而目前行業(yè)內(nèi)并沒有成熟的技術(shù)能支持尺碼合身效果的試穿,這就容易給用戶造成誤導(dǎo),用戶本以為點(diǎn)進(jìn)來能看尺碼是否合適,實(shí)際卻只能看到服飾上身的基礎(chǔ)效果,從產(chǎn)品入口設(shè)計(jì)的角度來看,還有進(jìn)一步優(yōu)化的空間。


聊完面向 C 端的試穿產(chǎn)品方案,接下來我們看一個(gè) B 端的典型案例,同樣來自阿里的繪蛙,這是一個(gè)專門服務(wù)服飾電商商家的 AI 內(nèi)容生成平臺(tái)。核心特點(diǎn)有三個(gè):第一,自帶海量素材庫(kù),涵蓋參考圖與模特素材,為商家提供了充足的選擇空間;第二,同時(shí)支持單件與多件服飾上身生成,而且輸出素材的分辨率較高,清晰度能滿足電商展示、內(nèi)容種草等多類場(chǎng)景的需求;第三,試穿功能可與平臺(tái)內(nèi)其他 AI 工具無縫聯(lián)動(dòng),比如用試穿能力生成效果圖后,能直接在平臺(tái)內(nèi)調(diào)用圖像編輯功能進(jìn)行二次優(yōu)化,操作流程十分順暢。

當(dāng)然,繪蛙也存在一些局限性:一方面,作為 B 端生成式服務(wù)平臺(tái),它目前的生產(chǎn)效率相對(duì)偏低,推理耗時(shí)基本是分鐘級(jí),暫不支持大量素材的批量生成,這對(duì)于有規(guī)?;a(chǎn)需求的商家來說是個(gè)不小的遺憾;另一方面,受 B 端的產(chǎn)品定位所限,平臺(tái)缺少 C 端用戶的使用場(chǎng)景,畢竟普通消費(fèi)者更習(xí)慣在手機(jī)購(gòu)物鏈路中使用試穿功能,而繪蛙的核心用戶群體始終是電商商家,主要用于制作商品相關(guān)素材。

介紹完這么多行業(yè)實(shí)踐案例,接下來我們對(duì)整個(gè)虛擬試穿行業(yè)做個(gè)小結(jié),主要從四個(gè)方面展開。

第一,B 端與 C 端的定位分化清晰,PC 端或 Web 端聚焦服務(wù) B 端商家,提供模特生成、AI 試穿、素材二次編輯等能力,批量化、低成本生產(chǎn)是商家的核心訴求。如果平臺(tái)能打通“素材生產(chǎn)—投放—效果驗(yàn)證”的閉環(huán),并將驗(yàn)證結(jié)果反饋給模型輔助進(jìn)化,會(huì)成為中小商家的一大福音。

而 APP 端或小程序端則瞄準(zhǔn) C 端用戶,主打簡(jiǎn)化操作流程,聯(lián)動(dòng)購(gòu)物閉環(huán)以適配移動(dòng)端的碎片化體驗(yàn);再次強(qiáng)調(diào),對(duì)于 C 端而言,“穿”是剛需,但“搭”才蘊(yùn)藏著更多產(chǎn)品機(jī)會(huì)。

第二,入口形態(tài)決定產(chǎn)品定位。電商平臺(tái)的 AI 試穿入口無非兩種:第一種是非中心化入口,將試穿能力嵌入購(gòu)物全流程,比如直接放在每個(gè)商品的商卡上,實(shí)現(xiàn)“見品即試穿”,核心目標(biāo)是強(qiáng)化用戶的及時(shí)決策;第二種是中心化入口,類似阿里 Lookie 的小程序單入口,不依附于具體 sku,能打造獨(dú)立場(chǎng)景,延伸穿搭推薦、社交分享等功能,讓產(chǎn)品從購(gòu)物工具升級(jí)為內(nèi)容娛樂的社交載體。

第三,通過多元方案降低用戶使用門檻。針對(duì)用戶相冊(cè)難以找到合格全身照的痛點(diǎn),行業(yè)內(nèi)普遍采用多種路徑打破傳圖依賴:一是虛擬捏人;二是非標(biāo)圖像兼容,提升算法能力,支持半身照等非標(biāo)準(zhǔn)素材試穿,比如用半身照試穿上衣;三是“大頭照 + 身材參數(shù)”實(shí)現(xiàn)數(shù)字形象,以此降低 C 端用戶的試穿啟動(dòng)門檻,這些都是值得肯定的產(chǎn)品嘗試。

第四,尺碼破局需要技術(shù)與策略雙重保障。單純依靠算法模型,很難解決尺碼合身的試穿問題。行業(yè)的可行思路是聯(lián)動(dòng)尺碼助手、用戶試穿報(bào)告等策略工具,用“技術(shù)生成效果 + 策略輔助決策”的雙重模式降低用戶購(gòu)物決策風(fēng)險(xiǎn),最終實(shí)現(xiàn)退貨率的下降。


介紹完這么多行業(yè)案例,接下來我為大家分享京東在虛擬試穿領(lǐng)域的實(shí)踐經(jīng)驗(yàn)。首先,給大家看一個(gè)視頻,它直觀展示了京東零售虛擬試穿的核心產(chǎn)品功能??偨Y(jié)來說,我們的產(chǎn)品主要有四大特點(diǎn):精準(zhǔn)的身材識(shí)別、逼真的材質(zhì)渲染、高效快速的生成、智能的搭配推薦,這也是我們一直持續(xù)打磨的產(chǎn)品目標(biāo)。

目前,京東零售的虛擬試衣能力還處于小流量測(cè)試階段,所以在座的各位暫時(shí)還很難直接體驗(yàn)。這里和大家分享幾組核心數(shù)據(jù):我們的虛擬試穿能力已覆蓋超百萬服飾 SKU,實(shí)驗(yàn)階段的用戶量也突破了 100 萬,同時(shí)覆蓋 70 多個(gè)服飾類目,合作的頭部服飾品牌超過 500 家,這就是我們現(xiàn)階段的產(chǎn)品現(xiàn)狀。


再給大家拆解一下具體功能,最左側(cè)是商詳主圖的試穿入口。目前這個(gè)入口的設(shè)置比較保守,沒有像淘寶 AI 試穿那樣直接嵌入搜推雙列商卡,我們認(rèn)為在實(shí)驗(yàn)階段,還是盡量避免影響用戶原有的購(gòu)物體驗(yàn),后續(xù)會(huì)根據(jù)測(cè)試效果考慮提升入口優(yōu)先級(jí)。

中間的三張圖是我們重點(diǎn)探索的同款不同色服裝試穿,用戶從某一款顏色的服飾(比如圖中的粉色羽絨服)進(jìn)入試穿頁面后,可以一鍵切換同 SPU 下的白色、黑色等其他配色,便捷完成多色試穿對(duì)比。最右側(cè)的功能則是我們正在積極推進(jìn)的上下裝搭配試穿,系統(tǒng)會(huì)為入口服飾,比如這件羽絨服,匹配同店鋪內(nèi)的褲子、裙子等下裝,讓用戶直觀感受不同搭配的視覺效果。當(dāng)前我們把搭配候選池限定在同店鋪內(nèi),從消費(fèi)者視角來看,打破店鋪限制可能會(huì)更有吸引力。

從技術(shù)層面來講,跨店鋪搭配的實(shí)現(xiàn)難度也并不大,核心在于業(yè)務(wù)邏輯的梳理,這需要我們與商家做更深入的調(diào)研溝通,明確背后的商業(yè)價(jià)值后,再考慮進(jìn)一步的功能升級(jí)。


這里我也和大家分享一下京東在虛擬試穿項(xiàng)目實(shí)踐中沉淀下來的三點(diǎn)核心經(jīng)驗(yàn),這些觀點(diǎn)其實(shí)在前面的內(nèi)容里也有所涉及,這里再集中回顧一下。第一,想盡一切辦法降低用戶使用門檻。

我們有一組數(shù)據(jù)可以佐證這個(gè)觀點(diǎn),目前線上使用虛擬試穿的用戶中,超過半數(shù)無法上傳符合要求的試穿照片。即便我們?cè)谏蟼黜撁孀隽嗽敿?xì)的規(guī)則引導(dǎo),用戶從相冊(cè)里找到合規(guī)照片的難度依然很高。

為此,我們果斷加入了數(shù)字人模式,采用“真實(shí)照片上傳 + 虛擬數(shù)字人形象”的雙軌方案,用戶如果找不到合適的照片,或者不愿上傳個(gè)人照片,就可以輸入身高、體重等參數(shù)打造專屬數(shù)字人;若能提供肖像照,數(shù)字人會(huì)更貼近用戶本人,沒有肖像照也可以使用默認(rèn)形象,這是降低用戶使用門檻非常行之有效的方法。第二,穿搭場(chǎng)景中,“搭”大于“穿”。

正如之前提到的,“穿”是用戶的基礎(chǔ)性剛需,而“搭”屬于突破性需求。但在電商場(chǎng)景下,用戶對(duì)穿搭的期待其實(shí)很高,所以我們一直在積極探索為用戶提供多樣化的搭配可能性,以此挖掘更多產(chǎn)品價(jià)值。第三,試穿效果要兼顧“像”與“美”,二者缺一不可。這一點(diǎn)往往被很多項(xiàng)目組忽略。用戶對(duì)試穿效果的核心要求是“真、像、美”:“真”是衣服和人物的真實(shí)感,不能有明顯的 AI 痕跡;“像”是人物 ID、服飾細(xì)節(jié)、環(huán)境背景的精準(zhǔn)保留;而“美”常常被忽視,但其實(shí)至關(guān)重要。

我們?cè)谒惴▊?cè)也把評(píng)測(cè)標(biāo)準(zhǔn),從最開始的“衣服還原不出錯(cuò)”,升級(jí)為“可用率 + 美觀度”的多維度評(píng)估體系。這里可以舉個(gè)例子:大家做虛擬試穿,都是希望提升轉(zhuǎn)化率、降低退貨率,但如果忽略了“美”的需求,很可能連轉(zhuǎn)化率都會(huì)受影響。沒有試穿時(shí),用戶看商詳主圖覺得衣服不錯(cuò)就會(huì)下單,但 AI 試穿后發(fā)現(xiàn)效果不好看,反而會(huì)直接放棄購(gòu)買。

這其實(shí)是大模型在落地原生 AI 場(chǎng)景時(shí)會(huì)遇到的陣痛,所以我也呼吁行業(yè)同仁,面對(duì)這類問題要保持長(zhǎng)期心態(tài),用戶心智的培養(yǎng)和行業(yè)的迭代,都需要一個(gè)過程。


最后,我想和大家分享幾個(gè)我們認(rèn)為未來值得探索的虛擬試穿產(chǎn)品形態(tài)。第一個(gè)是萬物成套的試穿試戴系統(tǒng),正如我們之前提到的,服飾試穿已經(jīng)從單件升級(jí)到多件,但對(duì)于注重 OOTD 的用戶來說,鞋子、配飾、包包甚至手機(jī)殼,都是穿搭的重要組成部分。

我們希望未來能實(shí)現(xiàn)全品類的組合式穿搭,打造真正的“萬物穿搭”試穿效果。第二個(gè)是數(shù)字人虛擬試穿 +AI 導(dǎo)購(gòu),想象一下,每個(gè)用戶都有專屬的數(shù)字人形象,它既可以是你的分身,也可以是你的 AI 導(dǎo)購(gòu)助手。你在逛商品流的時(shí)候,輕觸商卡就能把衣服“穿”到數(shù)字人身上,同時(shí)還能和這個(gè)數(shù)字人對(duì)話,讓它幫你推薦搭配,實(shí)現(xiàn) 7×24 小時(shí)的購(gòu)物陪伴。

這其實(shí)也是電商 2.0 時(shí)代追求的極致沉浸式個(gè)性化體驗(yàn),我們甚至?xí)诚脒^一個(gè)更極端的場(chǎng)景:用戶瀏覽服飾商卡時(shí),卡面展示的就是自己穿著這件衣服的形象,滑一屏都是專屬的上身效果,選款會(huì)更直觀。不過這種形態(tài)需要充分尊重用戶意愿,避免造成冒犯,同時(shí)也面臨著推理資源、生成效率等工程側(cè)的巨大挑戰(zhàn)。

第三個(gè)是電子衣櫥。這個(gè)概念雖然已有部分產(chǎn)品提及,但我們認(rèn)為還有很大的深挖空間。用戶可以把已購(gòu)、收藏的服飾都放進(jìn)這個(gè)虛擬衣櫥,系統(tǒng)根據(jù)天氣、出席場(chǎng)合等場(chǎng)景,為用戶提供交互式、陪伴式的試穿搭配建議,真正實(shí)現(xiàn)“衣隨場(chǎng)景搭”。以上就是我們看好的幾個(gè)未來產(chǎn)品方向,分享給大家。


關(guān)于虛擬試衣的內(nèi)容,我們就先介紹到這里。回顧今天的分享主題,我們是想從虛擬試衣切入,聊一聊更大范疇的電商 AIGC。接下來,我就快速為大家介紹京東在電商 AIGC 領(lǐng)域的能力布局,整體可以分為八大能力板塊。

第一,商品智能摳圖。這是所有電商平臺(tái)最關(guān)鍵、最基礎(chǔ)的技術(shù)能力,摳圖效果的優(yōu)劣,直接影響后續(xù)整條素材制作鏈路的最終呈現(xiàn)質(zhì)量。第二,商品素材生成。我們依托 AIGC 技術(shù),實(shí)現(xiàn)主圖、商詳圖、廣告素材的自動(dòng)化生成。在技術(shù)加持下,內(nèi)容制作周期大幅縮短,素材迭代效率提升了數(shù)十倍。第三,視頻生成。從 2024 年開始,視頻生成技術(shù)的效果已經(jīng)被大家廣泛認(rèn)可,國(guó)內(nèi)相關(guān)技術(shù)也實(shí)現(xiàn)了大幅躍升。

我們主要聚焦主圖視頻和營(yíng)銷視頻兩大場(chǎng)景:主圖視頻時(shí)長(zhǎng)較短、鏡頭單一,主打快速展示商品核心賣點(diǎn);營(yíng)銷視頻則篇幅更長(zhǎng)、內(nèi)容更豐富,通常會(huì)搭配劇本與口播,用于深度種草和品牌宣傳。第四,AI 模特。這項(xiàng)能力不僅服務(wù)于服飾場(chǎng)景,也覆蓋了眾多非服飾品類的素材生成需求。

傳統(tǒng)模式下,頭部商家會(huì)邀請(qǐng)明星代言,中型商家則需要對(duì)接外部服務(wù)商拍攝,不僅成本高昂,還會(huì)拖慢商品上新節(jié)奏。而 AI 模特能力通過 AIGC 技術(shù),為商家快速生成適配不同場(chǎng)景、不同風(fēng)格的模特素材,有效降本增效。


第五,虛擬試穿。這項(xiàng)能力不過多贅述了,今天的分享主題基本都圍繞它展開,核心是通過 AIGC 技術(shù)實(shí)現(xiàn)服飾的虛擬上身與搭配,降低用戶決策成本。第六,AI 設(shè)計(jì)家。也可以稱之為“放我家”功能,主要服務(wù)于家具等大件商品場(chǎng)景。用戶上傳自家房屋照片后,AI 就能將目標(biāo)家具植入到真實(shí)家居環(huán)境中,直觀呈現(xiàn)擺放效果;同時(shí)還能針對(duì)毛坯房、清水房,按照用戶需求設(shè)計(jì)出對(duì)應(yīng)的裝修風(fēng)格,解決家居選購(gòu)與裝修設(shè)計(jì)的可視化難題。第七,3D 立影。這是京東零售自研的 AIGC 裸眼 3D 技術(shù),能讓商品從商卡中“跳脫”出來,以 3D 形態(tài)呈現(xiàn)。這項(xiàng)技術(shù)能顯著提升品牌商品的點(diǎn)擊率,以及直播場(chǎng)景下的用戶互動(dòng)率。第八,數(shù)字人。

相信大家對(duì)京東數(shù)字人并不陌生,目前已有超 2 萬個(gè)品牌在使用這項(xiàng)能力,相關(guān)場(chǎng)景的轉(zhuǎn)化率提升了 30%。它最直接的價(jià)值是實(shí)現(xiàn) 7×24 小時(shí)數(shù)字人直播賣貨,打破傳統(tǒng)直播的時(shí)間限制,持續(xù)為商家創(chuàng)造收益。接下來,我會(huì)選取其中幾項(xiàng)能力,展開分享我們?cè)跇I(yè)務(wù)側(cè)取得的實(shí)際成果。


接下來,我挑選幾個(gè)能力項(xiàng),和大家分享我們?cè)跇I(yè)務(wù)側(cè)取得的實(shí)際成果。第一個(gè)是商品素材 AIGC 生成。這里展示的是一款起泡酒的案例,覆蓋商品主圖、商詳圖、賣點(diǎn)圖和廣告圖等全類型素材。

目前這項(xiàng)能力已經(jīng)改變了京東超 100 萬商家的內(nèi)容設(shè)計(jì)模式,既大幅提升了素材制作效率,又顯著降低了制作成本。


第二個(gè)是 AI 模特。模特圖生成技術(shù)正逐步在頭部品牌中批量落地,我們過去已與 Nike、阿迪達(dá)斯、海瀾之家三大時(shí)尚品牌達(dá)成深度合作。在批量應(yīng)用階段,合作品牌的商品轉(zhuǎn)化率提升 29%,商品上架速度提升 90%,同時(shí)商品素材制作成本大幅下降。大家現(xiàn)在在這些品牌店鋪里看到的部分模特圖,正是由我們的 AIGC 技術(shù)生成,再結(jié)合虛擬試穿能力完成服飾上身的。


第三個(gè)是 AIGC 裸眼 3D 技術(shù),立影。這里有 SK-II 和華為耳機(jī)兩組合作案例,這項(xiàng)技術(shù)能明顯帶動(dòng)品牌點(diǎn)擊率與銷售轉(zhuǎn)化率的提升。目前它主要應(yīng)用于廣告投放、家具搭配、直播互動(dòng)、互動(dòng)游戲以及試裝試戴等場(chǎng)景,感興趣的朋友可以去京東 APP 里體驗(yàn)這項(xiàng)能力。


介紹完了這些單項(xiàng)能力,接下來我要給大家介紹一個(gè)集成化的平臺(tái),它整合了我剛才提到的大部分能力,也就是京東零售的電商 AIGC 內(nèi)容生成平臺(tái),我們管它叫京點(diǎn)點(diǎn)。

這里有幾組數(shù)據(jù),帶大家快速了解這個(gè)平臺(tái)的能力:第一,京點(diǎn)點(diǎn)已經(jīng)在京東零售的業(yè)務(wù)場(chǎng)景中,支持了超過 30 多種業(yè)務(wù)場(chǎng)景,覆蓋商品發(fā)品、運(yùn)營(yíng)、營(yíng)銷等多個(gè)環(huán)節(jié);第二,平臺(tái)每天的能力調(diào)用量超過 1000 萬次;第三,它已經(jīng)服務(wù)了超過 100 萬的京東商家。依托這個(gè)平臺(tái),商家的內(nèi)容生產(chǎn)成本降低了 90%,內(nèi)容生產(chǎn)效率更是提升了 95%。


今天,我更想和大家分享一個(gè)新進(jìn)展:在過去幾個(gè)月里,我們對(duì)京點(diǎn)點(diǎn)平臺(tái)完成了一次系統(tǒng)性升級(jí),全新的版本我們命名為煥新版京點(diǎn)點(diǎn)平臺(tái),也就是 Oxygen Vision 平臺(tái)。

這個(gè)新版平臺(tái)和老版最大的差別,一方面是集成了更多的 AIGC 能力項(xiàng),另一方面則是把交互形式從原來的純 GUI 交互,升級(jí)為 Linguistic UI+GUI 的混合模式。具體來說,新版平臺(tái)具備四大核心特點(diǎn):第一,對(duì)話式人機(jī)交互,支持純自然語言的交互方式,操作更便捷;第二,大模型驅(qū)動(dòng)的任務(wù)規(guī)劃與執(zhí)行,能夠擬人式地分步驟、有序完成各項(xiàng)操作;第三,強(qiáng)一致性且不失多樣性的商品素材生成能力,確保生成內(nèi)容既貼合商品屬性,又能滿足多樣化需求;第四,無縫接入京東 AB 實(shí)驗(yàn)平臺(tái)的能力。

正如我們之前所說,一個(gè)合格的 B 端 AIGC 內(nèi)容生成平臺(tái),必須打通“素材生產(chǎn)—投放—實(shí)驗(yàn)回收—模型迭代”的完整閉環(huán),而這一點(diǎn),新版京點(diǎn)點(diǎn)平臺(tái)已經(jīng)完全具備。接下來,我們來看一段視頻,更直觀地了解這個(gè)煥新版的京點(diǎn)點(diǎn)平臺(tái)。



最后是未來展望,聊聊電商 AIGC 的技術(shù)縱深與商業(yè)價(jià)值。我想結(jié)合這段時(shí)間做 AIGC 的實(shí)踐,分享一些個(gè)人觀點(diǎn)和認(rèn)知層面的思考。首先,大家來看這張圖,我把 AIGC 的應(yīng)用分成了三個(gè)層次。

最底層的是創(chuàng)意類應(yīng)用,這類應(yīng)用的自由度高、約束少,核心是滿足用戶的個(gè)性化表達(dá)需求,比如短視頻平臺(tái)的魔法表情特效,運(yùn)營(yíng)活動(dòng)需要的 banner 海報(bào)、插畫設(shè)計(jì),都屬于這個(gè)范疇。往上一層是影視類應(yīng)用。

如果大家了解即夢(mèng)、可靈、海螺這些視頻生成工具,應(yīng)該會(huì)有體感,這類應(yīng)用的核心是通過 AIGC 實(shí)現(xiàn)角色和場(chǎng)景的一致性保持,技術(shù)難點(diǎn)也集中在這里。不過說實(shí)話,普通消費(fèi)者對(duì)于這類內(nèi)容的細(xì)節(jié)一致性,敏感度其實(shí)沒那么高。

而最上層的,就是我們今天一直在聊的電商類 AIGC,這個(gè)方向,需要解決海量 SKU 的適配問題,要確保商品信息的準(zhǔn)確傳遞,還要滿足實(shí)時(shí)轉(zhuǎn)化的業(yè)務(wù)訴求,同時(shí)還要應(yīng)對(duì)嚴(yán)格的合規(guī)風(fēng)險(xiǎn)。

如果從技術(shù)復(fù)雜度排序,創(chuàng)意類最簡(jiǎn)單,影視類次之,電商類堪稱地獄級(jí)難度。為什么這么說?因?yàn)殡娚?AIGC 對(duì)商品一致性的要求是極致嚴(yán)苛的,哪怕是一個(gè)細(xì)節(jié)的偏差,比如裙子本該沒有花邊,生成的素材里卻加了花邊,用戶收到貨發(fā)現(xiàn)“貨不對(duì)版”,就可能引發(fā)客訴,甚至是官司。

這和影視類的一致性要求完全不是一個(gè)量級(jí),更別說創(chuàng)意類的開放創(chuàng)作模式了。但有意思的是,這三類應(yīng)用里,電商類 AIGC 恰恰是距離商業(yè)化、距離“錢”最近的。做了這么久的 AIGC 應(yīng)用,我有一個(gè)很直觀的體感:有兩類應(yīng)用場(chǎng)景是可以直接實(shí)現(xiàn)變現(xiàn)的。

第一類,就是影視類 AIGC。這個(gè)很好理解,舉個(gè)例子,拍攝《速度與激情 XX》時(shí),要呈現(xiàn)蘭博基尼和法拉利相撞的畫面,在沒有 AIGC 技術(shù)之前,這樣一個(gè)鏡頭的成本可能高達(dá)上百萬;而現(xiàn)在,依托可靈、即夢(mèng)這類視頻生成工具,成本有可能直接降到幾百美金。無論是文本生成視頻、圖像生成視頻,還是首尾幀驅(qū)動(dòng)的視頻生成技術(shù),都能支撐這類特效鏡頭的制作。更值得一提的是,現(xiàn)在很多視頻生成能力還疊加了音畫直出功能,這讓電影級(jí)別的多媒體內(nèi)容高效輸出,變得越來越有可能。

第二類,就是電商與商業(yè)化 AIGC。這里我們暫時(shí)不做細(xì)致區(qū)分,核心邏輯很簡(jiǎn)單:我們用 AIGC 生成的電商素材,是直接供商家用于商品運(yùn)營(yíng)和投放的,最終指向的就是 GMV 的增長(zhǎng),這是最直接的收益。商業(yè)化場(chǎng)景也是同理,通過 AIGC 制作廣告素材,直接面向廣告主和用戶,素材投放后帶來的廣告消耗,直接對(duì)應(yīng)著平臺(tái)的營(yíng)收。所以在我看來,電商與商業(yè)化 AIGC,是現(xiàn)階段離“錢”最近的應(yīng)用方向。這就是我對(duì)整個(gè) AIGC 行業(yè)應(yīng)用落地的一些理解。


最后,我再分享三個(gè)總結(jié)性的觀點(diǎn)。第一,從技術(shù)角度來看,像虛擬試穿這類垂直業(yè)務(wù),未來不會(huì)再依賴專屬定制模型。一個(gè)明確的技術(shù)趨勢(shì)是,越來越多的電商 AIGC 任務(wù),會(huì)統(tǒng)一到通用大模型框架之下,就像 nano banana pro 這類架構(gòu)一樣,用戶只需要在 prompt 層面定義好業(yè)務(wù)需求,就能完成相應(yīng)任務(wù)。

只不過現(xiàn)在還有不少虛擬試穿方案,還停留在定制化思路上,這個(gè)轉(zhuǎn)變需要一個(gè)過程。第二,想和所有 AIGC 創(chuàng)業(yè)者、以及大廠里做 AI 提效的同學(xué)聊一句:不是所有業(yè)務(wù)都需要升級(jí)到 LUI(對(duì)話式交互)的形式。有些功能用 GUI(圖形界面)來承載,體驗(yàn)反而會(huì)更好。

不要覺得套上 LUI 的殼,就是做了 AI native 的升級(jí),很多時(shí)候這種做法反而屬于“故弄玄虛”。這兩年大家應(yīng)該也見過不少“AI 小助手”“智能 XX 工具”,本質(zhì)上就是把原來的 GUI 功能強(qiáng)行改成對(duì)話式,看似用上了大模型和 Agent,實(shí)際體驗(yàn)反而不如從前。

尤其是編輯類需求,圖形化的交互方式往往更直接高效。而超級(jí)京點(diǎn)點(diǎn)平臺(tái)之所以選擇 LUI+GUI 的混合模式,核心是看服務(wù)對(duì)象,我們主要服務(wù)的是京東的采銷同學(xué)。他們每個(gè)人負(fù)責(zé)的 SKU 數(shù)量極多,不可能針對(duì)每個(gè)商品去定制化制作素材,更需要“一句話指令”就能自動(dòng)生成內(nèi)容的傻瓜式操作。這樣才能讓采銷把精力聚焦在拿貨、議價(jià)、倉(cāng)儲(chǔ)運(yùn)營(yíng)這些核心工作上,而不是耗費(fèi)在素材制作上。

最后一點(diǎn)想跟大家分享的,是關(guān)于電商 2.0 的核心方向,極致的沉浸式與個(gè)性化購(gòu)物體驗(yàn)。今天我們介紹的虛擬試穿功能,就是在沉浸式體驗(yàn)上的重要探索。而個(gè)性化購(gòu)物的底層支撐,離不開“千人千面”的商品素材生成能力。這也是京東在探索大模型時(shí)代電商 2.0 形態(tài)的一條核心技術(shù)路線。

大家對(duì)“千人千面”并不陌生,過去我們的搜索推薦就是如此,同樣搜索一個(gè)關(guān)鍵詞,不同用戶看到的結(jié)果頁截然不同。但到了商品素材層面,目前還是“千人一面”的狀態(tài),商家只維護(hù)了一套主圖、商詳圖和賣點(diǎn)介紹。

而“千人千面”的商品素材生成,就是要打破這種單一性。我給大家舉個(gè)簡(jiǎn)單的例子:一款中性款沖鋒衣,面對(duì)三類不同需求的買家,我們可以用算法提煉出他們各自關(guān)注的核心賣點(diǎn),定制差異化的素材,既精準(zhǔn)吸引用戶,又提升購(gòu)物體驗(yàn)。

第一類是戶外功能型買家,他們最關(guān)心面料科技、防風(fēng)防水、透氣耐磨這些專業(yè)指標(biāo),我們就在商品圖上重點(diǎn)呈現(xiàn)這些性能參數(shù);第二類是外觀穿搭型買家,他們不糾結(jié)材質(zhì),只在意設(shè)計(jì)風(fēng)格、版型潮流和穿搭適配,我們就主打 OOTD 相關(guān)的素材,突出顏值和搭配感;第三類是價(jià)格敏感型買家,他們不關(guān)注功能和顏值,只看價(jià)格、優(yōu)惠和贈(zèng)品,我們就直接在商卡上展示最低價(jià)標(biāo)識(shí)、優(yōu)惠券、贈(zèng)品信息等內(nèi)容。

通過這個(gè)案例,大家應(yīng)該能更直觀地理解什么是“千人千面”的商品素材能力。當(dāng)然這個(gè)話題還有很多細(xì)節(jié)可以展開,我在 10 月份也做過一次相關(guān)分享,感興趣的朋友可以去網(wǎng)上查閱,里面有更詳盡的介紹。好了,那今天我的分享就到這里,謝謝大家!

演講嘉賓介紹

李巖,中科院計(jì)算所博士,現(xiàn)任京東零售視覺與 AIGC 部負(fù)責(zé)人,京東 AIGC 內(nèi)容生成平臺(tái) -“京點(diǎn)點(diǎn)”產(chǎn)研算負(fù)責(zé)人,在京東主導(dǎo)構(gòu)建全場(chǎng)景 AI 內(nèi)容生成能力,推動(dòng) AIGC 技術(shù)在電商多場(chǎng)景的深度融合。此前,李巖是快手可靈 AI·可圖大模型負(fù)責(zé)人,同時(shí)負(fù)責(zé)圖像生成大模型的基座研發(fā)與應(yīng)用落地。早年是微信視頻號(hào)內(nèi)容理解團(tuán)隊(duì)負(fù)責(zé)人,負(fù)責(zé)視頻號(hào)全場(chǎng)景的內(nèi)容理解業(yè)務(wù)。主要研究方向?yàn)槎嗄B(tài)內(nèi)容理解與生成技術(shù),在人臉識(shí)別、圖像理解、圖像生成、視頻生成等領(lǐng)域有 15 年以上的算法研發(fā)、業(yè)務(wù)落地及管理經(jīng)驗(yàn)。多次榮獲 AICon 全球人工智能開發(fā)與應(yīng)用大會(huì)明星講師。

技術(shù)人的年度儀式感! 年度盤點(diǎn)與趨勢(shì)洞察 啟動(dòng)!

《2025 年度盤點(diǎn)與趨勢(shì)洞察》由 InfoQ 技術(shù)編輯組策劃。覆蓋大模型、Agent、具身智能、AI Native 開發(fā)范式、AI 工具鏈與開發(fā)、AI+ 傳統(tǒng)行業(yè)等方向,通過長(zhǎng)期跟蹤、與業(yè)內(nèi)專家深度訪談等方式,對(duì)重點(diǎn)領(lǐng)域進(jìn)行關(guān)鍵技術(shù)進(jìn)展、核心事件和產(chǎn)業(yè)趨勢(shì)的洞察盤點(diǎn)。

力求以體系化視角幫助讀者理解年度技術(shù)演化的底層邏輯、創(chuàng)新方向與落地價(jià)值,并為新一年決策提供參考。內(nèi)容將在 InfoQ 媒體矩陣陸續(xù)放出,歡迎大家持續(xù)關(guān)注。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
蔣孝嚴(yán)帶著兒子蔣萬安去給他的奶奶上墳,蔣萬安手里還拿著黃紙

蔣孝嚴(yán)帶著兒子蔣萬安去給他的奶奶上墳,蔣萬安手里還拿著黃紙

大江
2026-01-08 14:50:15
獨(dú)生女不愿接班,天津老板套現(xiàn)7.2億,把家族產(chǎn)業(yè)賣給了安徽國(guó)資

獨(dú)生女不愿接班,天津老板套現(xiàn)7.2億,把家族產(chǎn)業(yè)賣給了安徽國(guó)資

素衣讀史
2025-12-23 17:03:03
外交部:無論委內(nèi)瑞拉政局如何變化,中方深化兩國(guó)各領(lǐng)域務(wù)實(shí)合作意愿不會(huì)改變

外交部:無論委內(nèi)瑞拉政局如何變化,中方深化兩國(guó)各領(lǐng)域務(wù)實(shí)合作意愿不會(huì)改變

新京報(bào)政事兒
2026-01-09 15:32:35
降維打擊?芬蘭公司宣布固態(tài)電池進(jìn)入量產(chǎn),成本比普通鋰電池還低

降維打擊?芬蘭公司宣布固態(tài)電池進(jìn)入量產(chǎn),成本比普通鋰電池還低

小柱解說游戲
2026-01-07 02:12:43
縱覽原創(chuàng)|東莞市衛(wèi)健局回應(yīng)“男子稱被4家醫(yī)院誤診癌癥”:將進(jìn)行調(diào)查核實(shí);當(dāng)事男子回應(yīng)“不是博流量,愿接受任何公平公正的調(diào)查”

縱覽原創(chuàng)|東莞市衛(wèi)健局回應(yīng)“男子稱被4家醫(yī)院誤診癌癥”:將進(jìn)行調(diào)查核實(shí);當(dāng)事男子回應(yīng)“不是博流量,愿接受任何公平公正的調(diào)查”

縱覽新聞
2026-01-09 17:44:03
“北京最難約的自助,69元任吃!”

“北京最難約的自助,69元任吃!”

北京吃貨小分隊(duì)
2026-01-08 11:47:31
“牡丹花下死,做鬼也風(fēng)流”,這一次,74歲的張紀(jì)中徹底成了笑話

“牡丹花下死,做鬼也風(fēng)流”,這一次,74歲的張紀(jì)中徹底成了笑話

洲洲影視娛評(píng)
2025-12-08 19:52:00
《家庭的覺醒》:一個(gè)家要往上走,最靠譜的20條建議

《家庭的覺醒》:一個(gè)家要往上走,最靠譜的20條建議

洞見
2026-01-08 21:27:06
天呢!燙碼?沒想到香煙買賣會(huì)壟斷到如此程度,難怪這么暴利…

天呢!燙碼?沒想到香煙買賣會(huì)壟斷到如此程度,難怪這么暴利…

慧翔百科
2026-01-07 09:07:26
梁靜茹微博突設(shè)不可見,身材發(fā)福成導(dǎo)火索,自我療愈能否重拾勇氣

梁靜茹微博突設(shè)不可見,身材發(fā)福成導(dǎo)火索,自我療愈能否重拾勇氣

明星爆料客
2026-01-09 17:18:19
劉曉慶擔(dān)心的事發(fā)生了!意外摔倒、分不清人,75歲不服老不行了?

劉曉慶擔(dān)心的事發(fā)生了!意外摔倒、分不清人,75歲不服老不行了?

楠楠自語
2025-12-03 15:57:03
亞運(yùn)冠軍舉報(bào)訓(xùn)練基地負(fù)責(zé)人“索要獎(jiǎng)金”續(xù):云南體育局稱“很快會(huì)有結(jié)論”

亞運(yùn)冠軍舉報(bào)訓(xùn)練基地負(fù)責(zé)人“索要獎(jiǎng)金”續(xù):云南體育局稱“很快會(huì)有結(jié)論”

澎湃新聞
2026-01-08 16:04:29
一光年有多遠(yuǎn)?為什么它會(huì)讓科學(xué)家絕望,答案出乎你的意料

一光年有多遠(yuǎn)?為什么它會(huì)讓科學(xué)家絕望,答案出乎你的意料

觀察宇宙
2026-01-08 20:10:26
脆弱的頭號(hào)種子:林詩(shī)棟險(xiǎn)勝,是懸崖邊的救贖還是光環(huán)下的裂痕?

脆弱的頭號(hào)種子:林詩(shī)棟險(xiǎn)勝,是懸崖邊的救贖還是光環(huán)下的裂痕?

曹老師評(píng)球
2026-01-09 17:24:09
海港官宣冬窗首簽!或連簽4內(nèi)援,劉祝潤(rùn)回歸,官方:按計(jì)劃推進(jìn)

海港官宣冬窗首簽!或連簽4內(nèi)援,劉祝潤(rùn)回歸,官方:按計(jì)劃推進(jìn)

奧拜爾
2026-01-09 17:23:05
不可輕敵!武統(tǒng)臺(tái)灣的難度遠(yuǎn)大于俄烏戰(zhàn)爭(zhēng),畢竟我們比俄羅斯文明

不可輕敵!武統(tǒng)臺(tái)灣的難度遠(yuǎn)大于俄烏戰(zhàn)爭(zhēng),畢竟我們比俄羅斯文明

大道無形我有型
2025-09-01 15:02:03
胡明軒要交易?現(xiàn)身基地,曝胡明軒爸爸幫搬行李,誰注意杜鋒表態(tài)

胡明軒要交易?現(xiàn)身基地,曝胡明軒爸爸幫搬行李,誰注意杜鋒表態(tài)

樂聊球
2026-01-09 13:32:22
王石和田樸珺都挺尷尬的

王石和田樸珺都挺尷尬的

江湖人稱艾掌門
2026-01-09 16:19:08
林強(qiáng)涉案989億被抓!生活奢華超過中東富豪,超5萬百姓血本無歸

林強(qiáng)涉案989億被抓!生活奢華超過中東富豪,超5萬百姓血本無歸

千言?shī)蕵酚?/span>
2025-12-27 20:07:06
山東一小學(xué)走標(biāo)線列隊(duì)入校,視頻曝光后,全網(wǎng)吵翻了!

山東一小學(xué)走標(biāo)線列隊(duì)入校,視頻曝光后,全網(wǎng)吵翻了!

眼光很亮
2026-01-09 01:11:52
2026-01-09 19:11:00
InfoQ incentive-icons
InfoQ
有內(nèi)容的技術(shù)社區(qū)媒體
11920文章數(shù) 51689關(guān)注度
往期回顧 全部

科技要聞

市場(chǎng)偏愛MiniMax:開盤漲42%,市值超700億

頭條要聞

特朗普稱美必須"擁有"整個(gè)格陵蘭 英法德迅速統(tǒng)一戰(zhàn)線

頭條要聞

特朗普稱美必須"擁有"整個(gè)格陵蘭 英法德迅速統(tǒng)一戰(zhàn)線

體育要聞

金元時(shí)代最后的外援,來中國(guó)8年了

娛樂要聞

關(guān)曉彤鹿晗風(fēng)波后露面 不受影響狀態(tài)佳

財(cái)經(jīng)要聞

投資必看!瑞銀李萌給出3大核心配置建議

汽車要聞

助跑三年的奇瑞 接下來是加速還是起跳?

態(tài)度原創(chuàng)

時(shí)尚
教育
藝術(shù)
手機(jī)
公開課

60+女性穿搭“高級(jí)感”秘訣:4個(gè)日常技巧,輕松美出優(yōu)雅氣質(zhì)

教育要聞

北航首位,以實(shí)踐成果獲授博士學(xué)位

藝術(shù)要聞

Sean Yoro:街頭藝術(shù)界的“沖浪高手”

手機(jī)要聞

京東“游戲愛好者每周手機(jī)銷量榜”上線 華為Mate 80位列榜首

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版