国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

CVPR 2026 | BiMotion:用 B 樣條曲線重新定義 3D 角色運動生成

0
分享至





圖 1:同一文本描述下,AnimateAnyMesh(上)與 BiMotion(下)的生成結(jié)果對比。離散幀采樣導(dǎo)致動作語義中途斷裂,而連續(xù) B 樣條曲線則將完整動作保留至序列末尾。



  • 論文標題:BiMotion: B-spline Motion for Text-guided Dynamic 3D Character Generation
  • 論文:https://arxiv.org/abs/2602.18873
  • 項目主頁:https://wangmiaowei.github.io/BiMotion.github.io/
  • 代碼:https://github.com/wangmiaowei/BiMotion
  • 數(shù)據(jù)集(Hugging Face):https://huggingface.co/datasets/miaoweiwang/BiMotion
  • 第一作者主頁:https://wangmiaowei.github.io/

當你希望 AI 將 "士兵舉起手臂,向后傾身,然后身體向前撲倒" 這段文字轉(zhuǎn)化為一段 3D 角色動畫,現(xiàn)有大多數(shù)方法給出的答案是:一段搖搖晃晃、語義殘缺的短片段。這并非模型能力不足,問題的根源在于將運動表達為逐幀離散序列這一根本性的設(shè)計決策。

來自愛丁堡大學(xué)、康奈爾大學(xué)和密歇根大學(xué)的研究團隊提出了 BiMotion:一種基于 B 樣條曲線的文本驅(qū)動 3D 角色運動生成框架,即將在 CVPR 2026 正式發(fā)表,三位審稿人均給出 5/6 的高分評價。其核心主張只有一句話:運動是連續(xù)的,就應(yīng)該用連續(xù)的方式來表達。

離散幀的困境:

為什么現(xiàn)有方法總在 "丟情節(jié)"

目前主流 3D 運動生成方法大多采用 VAE–潛在擴散模型架構(gòu),該架構(gòu)具有固定的輸入窗口,每次只能處理固定幀數(shù)的運動序列。面對長度各異的真實運動數(shù)據(jù),現(xiàn)有方法只有兩條路:

  • 裁剪(Cropping):將長序列切割為短片段,模型僅能學(xué)到局部子動作,而非完整語義。如文本描述 "轉(zhuǎn)圈后停步",模型最終只能生成 "向右轉(zhuǎn)"。
  • 均勻降采樣(Downsampling):將 200 幀壓縮至 16 幀再復(fù)原,導(dǎo)致動作卡頓抖動,如同一份低幀率的 GIF。

問題的本質(zhì)在于:幀數(shù)僅代表時間采樣密度,與動作語義本身無關(guān)。一只龍扇翅膀的動作,用 24 幀記錄還是 120 幀記錄,語義始終是 "扇翅膀"。逐幀離散表示,是這一領(lǐng)域長期忽視的根本性瓶頸。

B 樣條:用少數(shù)控制點,刻畫完整軌跡

BiMotion 的核心思路是將每個頂點隨時間的運動軌跡,用一條連續(xù)可微的 B 樣條曲線來表達。B 樣條是計算機圖形學(xué)中的經(jīng)典參數(shù)曲線,僅用少量 "控制點" 便可描述一條光滑連續(xù)的軌跡;修改其中一個控制點只影響局部區(qū)域,不會破壞整體形狀。

具體實現(xiàn)上,BiMotion 將任意長度 T 的頂點位移序列,通過帶 Laplacian 正則化的最小二乘擬合,壓縮為固定數(shù)量(默認 16 個)控制點。該壓縮具有閉合解,在普通消費級 CPU 上,對 5 萬頂點、200 幀的網(wǎng)格,不到一秒即可完成。Laplacian 正則專門處理序列極短時的欠定義問題,相比 Ridge 正則,其生成的插值更自然、過渡更流暢,消融實驗對此給出了明確驗證。

模型架構(gòu):從控制點到可生成的運動潛空間



圖 2:BiMotion 整體架構(gòu)。訓(xùn)練時(紅色箭頭)頂點差異轉(zhuǎn)化為 B 樣條控制點后編碼為運動潛碼;推理時(黑色箭頭)從噪聲采樣得到控制點,經(jīng) B 樣條重投影還原為任意長度的動畫序列。

BiMotion 整體采用 VAE 加 Rectified Flow Matching 的兩階段架構(gòu)。

B 樣條 VAE

編碼器將初始網(wǎng)格形狀與控制點一并壓縮為緊湊的運動潛碼,其中包含兩項關(guān)鍵設(shè)計:

  • 法線融合(Normal Fusion):將頂點法線信息以余弦相似度加權(quán)的方式融入點特征,有效解決網(wǎng)格上空間相近但內(nèi)在結(jié)構(gòu)屬于不同部位(如手指關(guān)節(jié))難以區(qū)分的問題,且無需依賴網(wǎng)格特定的拓撲結(jié)構(gòu),對任意拓撲均表現(xiàn)穩(wěn)健。
  • 多層級控制點嵌入(Multi-level Control Point Embedding):受小波包分解啟發(fā),將控制點逐層分解為從粗到細的多級殘差并分別編碼。相比標準頻率位置編碼,這種方式能同時捕捉運動的全局節(jié)奏與局部細節(jié)(如獅子尾巴的微小擺動),重建誤差大幅降低。



圖 3:B 樣條 VAE 架構(gòu)。編碼器(橙色區(qū)域)將初始形狀與控制點壓縮為潛碼;解碼器(綠色區(qū)域)重建控制點后通過 B 樣條重投影得到頂點差異序列。

損失函數(shù)設(shè)計

VAE 訓(xùn)練采用三項聯(lián)合損失:擬合損失(直接對齊控制點)、對應(yīng)損失(通過 B 樣條重投影對齊原始軌跡,早期訓(xùn)練收斂更快)、局部剛性損失(約束相鄰頂點間距在各幀保持一致,防止形變時產(chǎn)生表面 "融化" 的視覺偽影)。三項損失各司其職、互為補充,共同保證運動的精度、連續(xù)性與形狀一致性。

運動生成(Flow Matching DiT)

生成階段基于 Rectified Flow 與 Diffusion Transformer(DiT),以初始網(wǎng)格的潛碼和 CLIP 文本嵌入為條件,從高斯噪聲中逐步去噪并采樣出運動潛碼,再經(jīng) VAE 解碼器還原為完整動畫序列。由于 B 樣條重投影對幀數(shù)完全自由,推理時可按需輸出任意長度的動畫,如慢動作或子彈時間鏡頭。單張 A100 上平均推理時間僅為 4.4 秒。

BIMO 數(shù)據(jù)集:約 3.9 萬條帶文本標注的動態(tài)網(wǎng)格序列

為訓(xùn)練 BiMotion,團隊整理并將開放 BIMO 數(shù)據(jù)集,包含約 39,000 條動態(tài)網(wǎng)格運動序列、總計逾 368 萬幀,涵蓋動物、機器人、人體、道具等多種類別。每條序列配有 3 條高質(zhì)量文本描述,全部展開為 16 個 B 樣條控制點存儲,便于直接使用。

DeformingThings4D 部分來自 OmniMotionGPT 的人工標注;Objaverse 部分則通過基于 GPT-5 的自動標注流水線生成,配備生成器與質(zhì)檢器兩個環(huán)節(jié),確保描述的準確性和風(fēng)格一致性。

實驗結(jié)果:全面領(lǐng)先,效率顯著提升



圖 4:定性對比。左列:機器人與鹿的動作對比;右列:老虎與行走機器人的動作對比。紅圈標注基線方法產(chǎn)生的形變偽影,BiMotion 均表現(xiàn)清晰自然。

團隊在 20 個靜態(tài)網(wǎng)格上與三類代表性方法展開全面對比:前饋生成方法 AnimateAnyMesh、動態(tài)高斯生成方法 GVFDiffusion,以及基于視頻優(yōu)化重建的 V2M4。網(wǎng)格來源涵蓋 Meshy 生成資產(chǎn)與現(xiàn)有 3D 內(nèi)容庫,屬于所有基線中最為嚴格的評測設(shè)置之一。

在 VBench 自動評估的 5 項指標中,BiMotion 在整體一致性、時序穩(wěn)定性、美學(xué)質(zhì)量和動作豐富度四項均居最優(yōu)。其主體一致性略低于 AnimateAnyMesh,但消融實驗已揭示該差距為虛高:后者生成的動作幅度極小、近乎靜止,相鄰幀高度相似,致使該指標人為偏高。

20 位參與者的用戶研究中,BiMotion 在 "文本與動作匹配度"、"動作合理性"、"動作表現(xiàn)力" 三個維度的平均得分均超過 4.0/5.0,遠高于所有對比方法。效率方面,網(wǎng)格頂點規(guī)模從 9K 增至 24K 時,BiMotion 生成時間僅從 3.7 秒微增至 4.6 秒,峰值顯存從 1.1 GB 小幅升至 1.3 GB;而 AnimateAnyMesh 在同等條件下時間與顯存均翻倍以上,充分體現(xiàn) BiMotion 面向大規(guī)模網(wǎng)格的更強可擴展性。

局限性與未來展望

BiMotion 目前固定使用 16 個控制點,對高頻、極復(fù)雜運動細節(jié)的表達能力仍有提升空間;同時基于固定網(wǎng)格拓撲的假設(shè),暫不支持拓撲變化(如角色分裂、融合)的動畫生成。當前 BIMO 數(shù)據(jù)集規(guī)模(約 3.9 萬條)相較于視頻或圖像領(lǐng)域仍偏小,引入更大規(guī)模數(shù)據(jù)有望進一步提升質(zhì)量與泛化能力。代碼與 BIMO 數(shù)據(jù)集現(xiàn)已全部開源,歡迎社區(qū)共同建設(shè)。

作者簡介:

Miaowei Wang, 目前是愛丁堡大學(xué)信息學(xué)院的博士研究生(2023年10月入學(xué)),研究方向為計算機視覺與計算機圖形學(xué)中的可控運動表征(controllable motion representation)。他的博士研究由Amir Vaxman教授和Oisin Mac Aodha教授共同指導(dǎo)。 在此之前,他曾就讀于密歇根大學(xué)電氣工程與計算機科學(xué)系,在Jason Corso教授的指導(dǎo)下完成研究生學(xué)習(xí)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
“房坐空亡,家敗人亡”,不是迷信!“空亡”到底指的什么

“房坐空亡,家敗人亡”,不是迷信!“空亡”到底指的什么

三農(nóng)雷哥
2026-03-18 14:17:21
東契奇NBA生涯第60次單場得分40+,位列現(xiàn)役所有球員第5

東契奇NBA生涯第60次單場得分40+,位列現(xiàn)役所有球員第5

懂球帝
2026-03-26 11:45:09
張水華為賺錢拼了!7天2賽沖連冠:獎金3萬+出場費10萬+一輛車

張水華為賺錢拼了!7天2賽沖連冠:獎金3萬+出場費10萬+一輛車

念洲
2026-03-26 13:14:49
干翻埃爾法?尊界MPV實車曝光,前臉照搬S800

干翻埃爾法?尊界MPV實車曝光,前臉照搬S800

泡泡網(wǎng)
2026-03-26 11:21:11
特朗普據(jù)悉將請扎克伯格、 埃里森和黃仁勛加入 科技委員會

特朗普據(jù)悉將請扎克伯格、 埃里森和黃仁勛加入 科技委員會

每日經(jīng)濟新聞
2026-03-25 23:07:37
炸毀美雷達和直升機后,伊拉克官方下令:民兵可放開打美以

炸毀美雷達和直升機后,伊拉克官方下令:民兵可放開打美以

阿芒娛樂說
2026-03-26 13:16:54
32.29萬起!全新一代A6L正式上市,華為乾崑智駕上車!

32.29萬起!全新一代A6L正式上市,華為乾崑智駕上車!

小南看車
2026-03-25 22:59:29
50℃高溫鎖住國運!電不夠水沒有,印度的未來,徹底沒希望了?

50℃高溫鎖住國運!電不夠水沒有,印度的未來,徹底沒希望了?

Hi科普啦
2026-03-25 14:57:31
上海警方發(fā)布警情通報:左某某已被警方依法刑事拘留

上海警方發(fā)布警情通報:左某某已被警方依法刑事拘留

新京報
2026-03-25 20:46:14
特朗普被曝希望“快速”結(jié)束對伊朗戰(zhàn)爭

特朗普被曝希望“快速”結(jié)束對伊朗戰(zhàn)爭

界面新聞
2026-03-26 12:37:58
爆料廣東隊教練組大調(diào)整,杜鋒面臨下課,替代者現(xiàn)身,球迷支持

爆料廣東隊教練組大調(diào)整,杜鋒面臨下課,替代者現(xiàn)身,球迷支持

宗介說體育
2026-03-25 10:31:37
穆雷轟53+6+4無緣今日最佳!對不起,東契奇暴走創(chuàng)神級紀錄

穆雷轟53+6+4無緣今日最佳!對不起,東契奇暴走創(chuàng)神級紀錄

世界體育圈
2026-03-26 13:01:23
76人最多領(lǐng)先47分大勝公牛 恩比德復(fù)出35+6+7喬治解禁28分

76人最多領(lǐng)先47分大勝公牛 恩比德復(fù)出35+6+7喬治解禁28分

醉臥浮生
2026-03-26 09:25:57
癡呆癥的風(fēng)險降低35%!哈佛追蹤13萬人:每天2-3杯,讓大腦衰老踩剎車

癡呆癥的風(fēng)險降低35%!哈佛追蹤13萬人:每天2-3杯,讓大腦衰老踩剎車

王二哥老搞笑
2026-03-26 13:56:44
張召忠預(yù)言或?qū)⒊烧妫好绹坏┑瓜拢瑏喼捱@2國將會打起來?

張召忠預(yù)言或?qū)⒊烧妫好绹坏┑瓜拢瑏喼捱@2國將會打起來?

紀中百大事
2026-03-26 09:44:20
石油危機爆發(fā)?普京徹底醒悟,美財長通告全球:對中國根本沒用

石油危機爆發(fā)?普京徹底醒悟,美財長通告全球:對中國根本沒用

閱識
2026-03-26 11:25:47
沖突加劇,日本援兵趕到,中方直接封海四天,越南警告中國別造島

沖突加劇,日本援兵趕到,中方直接封海四天,越南警告中國別造島

云上烏托邦
2026-03-24 14:50:45
國民黨大亂!馬英九緊急發(fā)聲,鄭麗文下場開罵:扯破臉、斗到底

國民黨大亂!馬英九緊急發(fā)聲,鄭麗文下場開罵:扯破臉、斗到底

小小科普員
2026-03-25 19:25:13
臺灣最先倒下?陷入斷油斷氣危機,大陸給出承諾,指了一條明路

臺灣最先倒下?陷入斷油斷氣危機,大陸給出承諾,指了一條明路

照亮你的前行之路
2026-03-23 00:17:18
南京女教師停職風(fēng)波反轉(zhuǎn)!大批家長發(fā)聲力挺,懇請恢復(fù)崗位與聲譽

南京女教師停職風(fēng)波反轉(zhuǎn)!大批家長發(fā)聲力挺,懇請恢復(fù)崗位與聲譽

火山詩話
2026-03-26 06:37:23
2026-03-26 15:11:00
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12604文章數(shù) 142593關(guān)注度
往期回顧 全部

科技要聞

Meta高管狂分百億期權(quán),700名員工卻下崗

頭條要聞

擔(dān)心特朗普突然停戰(zhàn) 以總理下令48小時盡力摧毀伊設(shè)施

頭條要聞

擔(dān)心特朗普突然停戰(zhàn) 以總理下令48小時盡力摧毀伊設(shè)施

體育要聞

35歲替補門將,憑什么入選英格蘭隊?

娛樂要聞

張雪峰家人首發(fā)聲 不設(shè)追思會喪事從簡

財經(jīng)要聞

黃仁勛:芯片公司的時代已經(jīng)結(jié)束了

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

本地
教育
親子
藝術(shù)
軍事航空

本地新聞

救命,這只醬板鴨已經(jīng)在我手機復(fù)仇了一萬遍

教育要聞

高考地理中的花海經(jīng)濟

親子要聞

躺平的孩子意外覺醒了,在父母學(xué)會當“烏龜”!

藝術(shù)要聞

哪一座橋不是風(fēng)景?

軍事要聞

擔(dān)心特朗普突然停戰(zhàn) 以總理下令48小時盡力摧毀伊設(shè)施

無障礙瀏覽 進入關(guān)懷版