国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

對話影眸科技 CTO 張啟煊:大力不會永遠出奇跡

0
分享至



3D 生成行業(yè)很大,但剛剛到GPT-2 的水平,國內(nèi)團隊要領先海外團隊,大廠與創(chuàng)業(yè)公司在同一起跑線。

撰文|藍洞商業(yè) 趙衛(wèi)衛(wèi)

消費級的生成式AI屢見不鮮,工業(yè)級的生成式AI亟待新突破,繼騰訊混元入局3D生成模型之后,字節(jié)跳動最近也發(fā)布了3D生成大模型Seed3D 1.0。

工業(yè)級的3D生成意味著更高的精度和質(zhì)量,而且適用的行業(yè)也主要集中在B端行業(yè)。騰訊混元3D生成模型已經(jīng)進化到了3.0版本,主要用于游戲開發(fā),而字節(jié)跳動展示的3D生成大模型使用場景,主要瞄準仿真環(huán)境中的具身智能大模型訓練。

衡量一個3D生成模型的能力,目前沒有絕對標準,只有相對質(zhì)量的對比。

在字節(jié)跳動Seed3D 1.0的測試圖中,還原度、透視與結(jié)構(gòu)、幾何質(zhì)量等多個維度都優(yōu)于同行對手,而它選取的國內(nèi)對手中,表現(xiàn)較好的分別是影眸科技的Rodin Gen-1.5、騰訊Hunyuan 3D-2.1和VAST的Tripo 2.5。



影眸科技團隊,后排左一為CEO吳迪,前排左一為CTO張啟煊

尤其是影眸科技,這家專注于3D大模型技術的創(chuàng)業(yè)公司由吳迪、張啟煊等人于2020年創(chuàng)立,去年A輪融資時,影眸科技的主要產(chǎn)品Rodin用45天就拿到了100萬美元ARR,字節(jié)跳動和美團龍珠領投,在今年的A+輪中,字節(jié)跳動繼續(xù)追加投資。

值得注意的是,過去一年間,字節(jié)在自身AI業(yè)務上飛速發(fā)展,但戰(zhàn)略投資很少出手AI項目,影眸科技是為數(shù)不多的一家。

如今,字節(jié)跳動親自下場布局3D生成模型,不難看出對這一賽道的重視,這也意味著3D生成市場會迎來更快發(fā)展。

9月,影眸科技上新了Rodin Gen-2.0版本的模型,相比上一代模型,生成的3D模型有了更加銳利和平直的邊緣,這一代模型在交互上增加了分件功能,讓用戶通過指定顆粒度來控制和重新拆分零件,增加了用戶可用性的同時領先于同類產(chǎn)品。

與此同時,網(wǎng)易游戲的《蛋仔派對》、3D打印行業(yè)的拓竹等公司和產(chǎn)品,都已經(jīng)用上了影眸科技的Rodin,他們通過Rodin的3D生成開發(fā)產(chǎn)品,這大大提升了3D內(nèi)容生產(chǎn)的規(guī)模和效率。

但3D生成的ChatGPT時刻尚未到來,影眸科技CTO張啟煊認為,當下行業(yè)差不多剛剛發(fā)展到GPT-2的水平,而未來進化的方向,是要滿足不同行業(yè)的具體使用場景,更需要互聯(lián)網(wǎng)大廠和創(chuàng)業(yè)公司們齊頭并進。

在騰訊、字節(jié)紛紛下場布局3D生成模型的當下,影眸科技作為創(chuàng)業(yè)公司如何思考未來的發(fā)展?「藍洞商業(yè)」對話了影眸科技CTO張啟煊,以下為內(nèi)容精編:

藍洞:你看到大廠相繼入局3D生成的產(chǎn)品之后,第一反應是什么?

張啟煊:這更像是一個信號,表示愿意投入3D生成這件事。

騰訊混元3D大模型真正的飛躍,是今年三四月份,混元3D把模型參數(shù)量上到了百億級規(guī)模,這種嘗試需要一次性投入巨大的算力成本,對初創(chuàng)公司來說風險很大,但幸運的是混元成功了,后面的公司再去Scaling(規(guī)模化)就比較有信心了。

藍洞:大廠在3D生成的場景上各有側(cè)重,比如騰訊主要是游戲,字節(jié)主要是具身智能和電商,你們呢?

張啟煊:具身智能的幾家頭部公司也都在用我們的產(chǎn)品,包括上海交大的穆堯老師有一個Robo Twin項目,通過結(jié)合現(xiàn)實世界的遙操作數(shù)據(jù)與數(shù)字孿生的合成數(shù)據(jù),為雙臂機器人的研究提供強有力的支持,他們就選擇我們Rodin去生成具身智能的3D資產(chǎn),因為生成的模型橫平豎直規(guī)整度很高。

具身智能領域的數(shù)據(jù)來源有兩個,一個是真實數(shù)據(jù),另一個是虛擬數(shù)據(jù)。

如果你要在仿真環(huán)境中做虛擬數(shù)據(jù)的話,肯定需要3D資產(chǎn)在仿真環(huán)境中使用,那這個3D資產(chǎn)不可能靠掃描,也不太能夠雇人去建,靠現(xiàn)有的數(shù)據(jù)集的話又太少了,這時候3D生成就是很好的方向。

消費級的文字、音頻、圖片或是視頻內(nèi)容生成,都是往社交媒體走的,但3D生成不是這種模態(tài),它不是直接跟大眾接觸,從網(wǎng)易游戲到3D打印行業(yè)的拓竹,都是我們的客戶,但不同行業(yè)對3D的要求是不一樣的,差異非常巨大。

比如3D打印行業(yè)更關注模型的水密性,而游戲行業(yè)是一個很長的工業(yè)管線,我們在逐步攻破布線、UV和綁定動畫等問題,因為表面的平整度和曲面規(guī)范性非常重要。

藍洞:對于一個普通用戶來說,現(xiàn)在接觸你們的3D生成最普遍的形式是什么?

張啟煊:一個是3D打印,另外一個就是網(wǎng)易的游戲《蛋仔派對》?!兜白信蓪Α飞系摹窤I模型生成」功能,讓玩家輸出文字或上傳圖片就可以生成高質(zhì)量模型,然后在樂園工坊中直接使用,這意味著3D?成技術已經(jīng)進?了?規(guī)模商業(yè)應?階段。

能夠跟大廠合作,是因為我們團隊在國內(nèi)的圖形學中是領先的,在國際圖形學頂級會議上斬獲過「最佳論文獎」和「TOP10技術論文速覽」雙料榮譽。

對于很多游戲公司來說,選擇第三方模型是現(xiàn)階段最穩(wěn)妥的方案,因為各家模型有各自的特點,語言模型上GPT-5更好還是Claude更好?視頻生成上Sora-2跟VEO-3.1哪個更好?大家都很難說絕對領先,我們只能說第一梯隊是誰。

藍洞:現(xiàn)階段國內(nèi)3D生成的第一梯隊是誰?

張啟煊:我認為是我們Rodin-2跟騰訊混元3D。我們不擔心競爭,最擔心的是大廠沒有加入這個游戲。

目前海外市場,基本占了我們收入的百分之七八十。海外主要在布局這一塊的是Roblox,它是一個在線游戲創(chuàng)建平臺,讓用戶通過免費工具來創(chuàng)作內(nèi)容,Roblox最早做了3D Control Net,能夠產(chǎn)生高質(zhì)量的輸出。

一年前發(fā)布1.0版本的時候,我們的一個賣點就是可控性很高,用3D的Control Net把設計產(chǎn)品的長寬高比例等固定下來,而不是讓AI胡亂生成, 這對游戲和工業(yè)設計是非常重要的剛需。上個月,混元3D也發(fā)布了原生3D組件生成模型的可控功能。

藍洞:上個月發(fā)布的新版本,相比去年的1.5版本,行業(yè)有哪些新變化?外界有哪些新的反饋?

張啟煊:現(xiàn)在跟去年相比,總的來說3D生成整個行業(yè)最大的變化就是參數(shù)量上去了。

比如去年年底,我們發(fā)布Rodin Gen-1.5版本的時候,參數(shù)量是超過40億,而現(xiàn)在整個3D生成行業(yè)第一梯隊中的模型,標配已經(jīng)是百億參數(shù)了,百億參數(shù)也就意味著你背后的數(shù)據(jù)量,已經(jīng)到百萬級別了。

所以行業(yè)飛速發(fā)展,一方面創(chuàng)業(yè)公司有了資本和資源去收集大量3D數(shù)據(jù),渠道已經(jīng)打通,也不再擔心3D數(shù)據(jù)從哪里來,而另外一方面,第一波做3D生成的公司已經(jīng)賺錢了,所以互聯(lián)網(wǎng)大廠也注意到了這個方向,開始跟游戲業(yè)務做協(xié)同,后面包括初創(chuàng)公司和大廠的競爭會更激烈。

我們影眸的特點是模型側(cè)各種功能性上的改進,比如將模型快速拆解為多個獨立部件,這些功能性和底層框架上比較領先。

上個月發(fā)布的新版本,我們已經(jīng)提前把基座模型給到一些用戶體驗,主打的功能就是分件,用戶體驗感覺很不錯。

但意想不到的反饋是,很多人覺得我們貼圖質(zhì)量變差了,其實我們做過AB test,換回原來的貼圖模型會更差,背后原因是模型質(zhì)量提升了之后,大家對貼圖的要求更高了,顯得貼圖質(zhì)量變差了。

我們每個版本的迭代都是朝著用戶需求展開,比如國內(nèi)一家知名智能硬件科技企業(yè),他們設計師都在用我們的產(chǎn)品,給我們的反饋是需要3D生成邊緣銳利,我們回去就在1.5版本中把這個特性做出來了。如今到2.0版本,我們分件功能也是來自設計行業(yè)的需求,讓設計變得更可控,使用面更廣了。

對于3D打印行業(yè)來說,現(xiàn)在小紅書上很多案例,都是用我們的產(chǎn)品生成3D設計之后拼裝的案例。現(xiàn)在還需要下載之后在三維軟件中進一步操作,但后面我們會把這一套流程集成在我們網(wǎng)站中,不再需要用戶二次操作。



藍洞:從你們的產(chǎn)品UI設計上,能感覺你們的審美超過很多大廠,這是怎么來的?

張啟煊:我們團隊很多藝術家,幾個創(chuàng)始成員都喜歡拍電影,都會自己用三維動畫軟件Blender做3D渲染,所以很多產(chǎn)品宣傳片讓外界以為是專業(yè)團隊做的,其實都是我們自己設計的。在交互上的設計也是,與其說滿足自己的審美偏好,不如說幫用戶做到足夠方便,否則效果不會好。

藍洞:就目前3D生成來說,大廠比創(chuàng)業(yè)公司的優(yōu)勢大很多嗎?

張啟煊:大模型最重要的還是數(shù)據(jù)。至少目前,大廠跟創(chuàng)業(yè)公司在3D生成上是站在同一起跑線的。比如說,我們現(xiàn)在的數(shù)據(jù)量級已經(jīng)超出騰訊這樣級別的大廠在做的游戲數(shù)據(jù)量。

舉個例子,一般中小型游戲有幾百到上千個模型,中大型游戲則是幾千到上萬個。假設頂級游戲公司有100個游戲,每個游戲有1萬個模型,那么它最多有100萬個模型,而我們現(xiàn)在有的數(shù)量級已經(jīng)遠遠超過這個數(shù)量了。

大廠可以大力出奇跡,一次兩次可以,但第三次可能就難了。大家能看出GPT-5和GPT-4o的巨大差別嗎?所以要的是在體驗和場景使用上的新突破。

3D是個很大的行業(yè),但3D生成現(xiàn)在其實差不多剛剛到GPT-2的水平,而且國內(nèi)的團隊要領先海外團隊,我們私下開玩笑說,最聰明的那批人全都沒在做3D生成,海外的聰明人都去做AI視頻生成,都去做AGI了。

藍洞:制約3D生成下一步發(fā)展的條件,除了巨大的算力消耗還有什么?如何找到新的突破方向?

張啟煊:之前是有了模型之后去定制產(chǎn)品,比如從GPT-3.5到GPT- 4,而其實一個新的方向是為了一個產(chǎn)品去定制一個模型,比如最新的Sora 2。

它是為了社交媒體玩法,設計了可以植入人物多人合拍的功能,這些功能都是需要在網(wǎng)絡側(cè)引入的。再比如Google的AI圖像生成和編輯工具Nano Banana,也是從產(chǎn)品角度出發(fā)設計了一個新的網(wǎng)絡結(jié)構(gòu)。

那對應到3D生成領域,我們很早就意識到為了用戶需求要在功能上進行設計,比如之前的3D Control Net和現(xiàn)在的分件,都是因為要滿足不同行業(yè)的具體使用場景,而不是加大數(shù)據(jù)和參數(shù)讓絕對質(zhì)量變高。

3D生成行業(yè)剛剛起步,因為3D行業(yè)不同行業(yè)對3D模型需求差異遠要比圖像跟視頻高很多。比如工業(yè)設計都要CAD模型,需要的是曲面模型而不是網(wǎng)格化的,那就要求我們把模型變成曲面參數(shù)表達,每完成一個新的里程碑,就會在新的領域里發(fā)現(xiàn)新的客戶去使用你的東西,這就是后面大家整個AI生成行業(yè)去迭代的方向。

藍洞:最近美國李飛飛團隊也發(fā)布了全新實時生成式世界模型RTFM,一張H100就可以運行,他們主導的3D生成方向本質(zhì)是學會了渲染的AI,而你之前也提到未來看好的方向是用生成式的方式去做渲染,這其中有什么不同?

張啟煊:我們其實不是一個賽道。李飛飛老師功成名就,她要考慮的是人類未來10年或20年后的東西,所以很前衛(wèi),他們的產(chǎn)品有點像視頻生成,是顛覆現(xiàn)在圖形渲染管線的事,其實不是為了這一代游戲和這一代的CG去做的,所以周期肯定更長。

而我們作為一家小初創(chuàng)公司,要先解決現(xiàn)階段的生存問題。3D生成是基于Mesh表達, 所謂Mesh表達就是由大量三角形面拼接而成的3D模型表達形式,它跟現(xiàn)在的CG還有游戲的工業(yè)是接軌的。

我看好未來生成式的方式去做渲染,我們也確實在布局,但跟我們現(xiàn)在的Rodin產(chǎn)品不太相關。之前大家想要呈現(xiàn)一個精致的視頻畫面,背后有3D模型、光照和材質(zhì)等等要求,然后通過渲染引擎去得到最后的圖像。而生成式AI改變了這個規(guī)則,圖像可以直接降噪生成視頻,但做不到非常精準,我們就希望把視頻生成變成一個渲染器,去完成妥當?shù)匿秩尽?/p>

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
馬杜羅被捕現(xiàn)場細節(jié)流出:古巴硬漢貼身安保,戰(zhàn)至最后盡忠職守

馬杜羅被捕現(xiàn)場細節(jié)流出:古巴硬漢貼身安保,戰(zhàn)至最后盡忠職守

裝甲鏟史官
2026-01-04 15:14:32
特朗普突然發(fā)動戰(zhàn)爭,中國代表團還在委內(nèi)瑞拉!

特朗普突然發(fā)動戰(zhàn)爭,中國代表團還在委內(nèi)瑞拉!

勝研集
2026-01-03 17:14:34
委內(nèi)瑞拉變天,俄智庫痛心疾首:無人機神話被破,中俄武器沒反應

委內(nèi)瑞拉變天,俄智庫痛心疾首:無人機神話被破,中俄武器沒反應

鐵錘簡科
2026-01-04 13:22:26
馬杜羅被抓,特朗普道出真實目的,不到24小時,中方3句話回應

馬杜羅被抓,特朗普道出真實目的,不到24小時,中方3句話回應

時時有聊
2026-01-04 10:12:40
42歲金莎商演3首歌35萬,敬業(yè)凍紅胳膊堅持掙干凈錢

42歲金莎商演3首歌35萬,敬業(yè)凍紅胳膊堅持掙干凈錢

車窗起霧q
2026-01-04 11:37:31
就在周四!黃金白銀將迎新年“第一劫”:數(shù)十億美元拋單已在路上

就在周四!黃金白銀將迎新年“第一劫”:數(shù)十億美元拋單已在路上

財聯(lián)社
2026-01-04 12:38:04
美國全面接管委內(nèi)瑞拉石油,連鎖反應開始了

美國全面接管委內(nèi)瑞拉石油,連鎖反應開始了

販財局
2026-01-04 08:43:54
HarmonyOS的2025:從“可用”到“好用”,鴻蒙生態(tài)從突破走向成熟

HarmonyOS的2025:從“可用”到“好用”,鴻蒙生態(tài)從突破走向成熟

鈦媒體APP
2025-12-24 13:31:42
“最美新生兒”火了,似乎在娘胎整容化妝一般,全網(wǎng)都想沾喜氣

“最美新生兒”火了,似乎在娘胎整容化妝一般,全網(wǎng)都想沾喜氣

菁媽育兒
2026-01-03 12:44:30
美國抓走馬杜羅更多細節(jié):5000萬美元懸賞與神秘“哨兵”

美國抓走馬杜羅更多細節(jié):5000萬美元懸賞與神秘“哨兵”

澎湃新聞
2026-01-04 16:06:24
突發(fā)! 大批澳洲華人無法使用國內(nèi)app, Optus回應: 已阻斷和澳洲之間的全部聯(lián)網(wǎng)

突發(fā)! 大批澳洲華人無法使用國內(nèi)app, Optus回應: 已阻斷和澳洲之間的全部聯(lián)網(wǎng)

澳微Daily
2026-01-04 15:00:01
離婚2個月,54歲的李亞鵬再迎“噩耗”,海哈金喜一個字都沒說錯

離婚2個月,54歲的李亞鵬再迎“噩耗”,海哈金喜一個字都沒說錯

洲洲影視娛評
2026-01-04 16:17:19
2026年韓國最低時薪10320韓元!最低月薪是…

2026年韓國最低時薪10320韓元!最低月薪是…

奮斗在韓國
2026-01-04 14:03:39
“i茅臺”連續(xù)4天秒空,茅臺批發(fā)價再度跌破1499元

“i茅臺”連續(xù)4天秒空,茅臺批發(fā)價再度跌破1499元

第一財經(jīng)資訊
2026-01-04 10:48:26
魯比奧:馬杜羅于2020年在美國被起訴,他不是委內(nèi)瑞拉的合法總統(tǒng)

魯比奧:馬杜羅于2020年在美國被起訴,他不是委內(nèi)瑞拉的合法總統(tǒng)

偵姐有料
2026-01-04 01:32:40
特朗普威脅古巴、哥倫比亞

特朗普威脅古巴、哥倫比亞

界面新聞
2026-01-04 07:16:33
累計交付超百萬輛,鴻蒙智行加速全品類產(chǎn)品矩陣落地

累計交付超百萬輛,鴻蒙智行加速全品類產(chǎn)品矩陣落地

晚點LatePost
2025-12-30 12:17:26
大跳水!暴跌近40%!最近深圳人買爆了...

大跳水!暴跌近40%!最近深圳人買爆了...

深圳好玩
2026-01-04 12:50:13
新加坡科學院院士國大教授陳小元,被指涉及性不端行為遭校方解雇

新加坡科學院院士國大教授陳小元,被指涉及性不端行為遭校方解雇

知社學術圈
2026-01-04 15:47:09
演都不演了!田樸珺刪光合影,怒斥對方自私,王石徹底成“笑話”

演都不演了!田樸珺刪光合影,怒斥對方自私,王石徹底成“笑話”

查爾菲的筆記
2026-01-04 15:08:02
2026-01-04 18:08:49
藍洞商業(yè)
藍洞商業(yè)
原創(chuàng)、深度的新經(jīng)濟人物和事件
663文章數(shù) 772關注度
往期回顧 全部

科技要聞

獨家|宇樹科技上市綠色通道被叫停

頭條要聞

2026年新年首個工作日 中紀委連打4“虎”

頭條要聞

2026年新年首個工作日 中紀委連打4“虎”

體育要聞

球隊陷入危難,一名44歲教練選擇復出打球

娛樂要聞

《小城大事》上星央八 熱血筑夢正當時

財經(jīng)要聞

委內(nèi)瑞拉變局對原油美元黃金的連鎖沖擊

汽車要聞

最高續(xù)航310km 嵐圖泰山8或?qū)⑸习肽臧l(fā)布

態(tài)度原創(chuàng)

親子
藝術
本地
時尚
公開課

親子要聞

姥姥奶奶陪孩子玩可開心了

藝術要聞

故宮一級文物:和珅送給乾隆的80大壽賀禮

本地新聞

即將過去的2025年,對重慶的影響竟然如此深遠

伊姐元旦熱推:電視劇《剝繭》;電視劇《玉茗茶骨》......

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版