国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

像素時代的黃昏和“淘寶叛軍”

0
分享至

淺友們好~我是史中,我的日常生活是開撩五湖四海的科技大牛,我會嘗試各種姿勢,把他們的無邊腦洞和溫情故事講給你聽。如果你想和我做朋友,不妨加微信(shizhongmax)。

像素時代的黃昏和“淘寶叛軍”

文 | 史中

如果我們的后代站在未來回望,很可能會把60后、70后、80后、90后、00后、10后,都歸為“同一代人”,這個時代就叫“像素時代”。

而從“20后”開始,新一代人出現(xiàn)了,他們的時代叫作“體素時代”。

此時此刻,我們也許正站在歷史的轉(zhuǎn)折點上,少數(shù)人歡欣鼓舞,而多數(shù)人懵然無知。

我厚顏無恥地希望,這篇文章也許能成為大家理解未來的一個小小扳手。

(一)像素時代的“黃昏”

用輕松的方式開場吧,來回顧一下俺們的共同回憶。

比如,我們一起經(jīng)歷過戰(zhàn)爭與和平。

體驗過愛與死。

見證了榮耀與夢想。

也品嘗過柴米油鹽、江湖恩怨。

但是,你有沒有發(fā)現(xiàn)一個問題——無論如何努力回想,這些經(jīng)典的畫面都只能以 “平面” 的方式在我們腦海里放映:


魂斗羅、坦克大戰(zhàn)當然本身就是平面游戲; 《大話西游》、“奧運開幕”也是同樣,我們只能站在攝影師的角度去還原當時的場景,至于鏡頭里恰好背對我們的人,當時他們有怎樣的表情、狀態(tài),將成為一個謎,重溫者永遠不得而知。 網(wǎng)頁就更是平面的了,一般人根本不會提出“網(wǎng)頁的背面長什么樣”這種蛇精病問題——它就沒有背面。

平面信息是如此深刻地滲入我們的生活,以至于萬物都離不開一個關(guān)鍵詞:“像素”。

屏幕要看像素,攝像頭要看像素,照片、視頻都要看像素。仔細想想,世界上沒有任何一個專業(yè)技術(shù)詞匯能像“像素”這樣被普通大眾所理解,普及到一個農(nóng)村阿姨也能脫口而出。

看到這兒,你也許有點摸不著頭腦——像素有啥不好?我從小喝到大,生活中一切需求都能滿足啊。。。

你看,有人把電影的演職員表展開,就是一大張圖片。

這里按下暫停鍵,我必須強行問你一句:真的是這樣么?

如果把“像素”換成“體素”呢?

1、防止有淺友不知道,我先解釋一下什么是“體素”。

其實很容易理解:在平面空間組成信息的元素叫像素,在立體空間里組成信息的元素就叫體素。(一個像素包含xy兩個參數(shù),而一個體素包含xyz三個參數(shù)。)

比如:《仙劍奇?zhèn)b傳》里李逍遙就是用“像素”拼成的,而在《我的世界》里,主角史蒂夫就是由體素組成的。

2、再解釋一下什么是“體素時代”。

當日常生活中的大多數(shù)信息都以體素來“標記”和“傳遞”的時候,我們就四舍五入邁進了體素時代。

舉個簡單的例子:

你拼了一個很好看的汽車模型,想跟朋友顯擺一下。 今天的操作是,你選一個(或幾個)角度拍 “照片” 發(fā)到朋友圈,大家可以放大、縮小,隨便看; 但未來很可能是,你用手機環(huán)繞模型拍一圈,它就會在三維世界自動生成一個立體的模型,你把這個 “影像” 發(fā)到朋友圈,大家就可以隨意轉(zhuǎn)動,相當于從無數(shù)個角度無死角欣賞你的作品。

當然,你有沒有勇氣讓別人無死角欣賞自己的作品是另一個問題,但這里我想說明的是:

“體素時代”能夠傳遞的信息,比“像素時代”要完整和豐富得多。

就像這樣↓↓↓

你還記得《三體》的結(jié)尾有一個經(jīng)典情節(jié)不?

太陽系被未知文明的二向箔從3D狀態(tài)“拍”成2D狀態(tài)。“程心旅行團”一行在冥王星上目睹了地球“躺平”的全過程。

文中描述,三維世界的地球內(nèi)部有豐富的結(jié)構(gòu),在不損失信息的情況下變成二維的,面積就會變得巨大,像一張宇宙烙餅。

難以想象么?沒關(guān)系,在B站上有同學(@Ele實驗室)用數(shù)學方法模擬了這個過程,就如下圖:

(鏈接附后,感興趣淺友可以移步看完整版)

地球的故事告訴我們,如果“體素時代”的信息量是“弱水三千”,像素時代就只是“取了一瓢飲”。那,有沒有一種可能:踏進體素時代,就像一個人住過別墅花園,再也回不去鴿籠蝸居?

體素時代早有征兆:

比如,《黑客帝國》開創(chuàng)的“子彈時間”和《阿凡達》開創(chuàng)的“3D 電影”;比如,以《絕地求生》《堡壘之夜》為代表的第一人稱游戲;

比如,Oculus VR 眼鏡、正在趕來的蘋果 AR 眼鏡和各路牛鬼蛇神的元宇宙雛形。

Meta 的“VR 社交平臺”Horizon Worlds

這些嘗試的意義在于,它們?yōu)槭澜绶e累了“3D建模系統(tǒng)”、“虛擬渲染引擎”、“頭顯硬件”等諸多技術(shù)。這些技術(shù),可以看做是涓滴細水,而它們終究會匯在一起,成為“時代的泥石流”。

現(xiàn)在,泥石流近在眼前。

最先進入體素時代的將會是我們生活的哪個部分呢?

我盲猜有三個:電商、社交、搜索。

這三個領(lǐng)域,熟不熟悉?夢回2000年,互聯(lián)網(wǎng)的流金歲月,我們的生活不恰恰也是從這三個領(lǐng)域開始變革的嗎?

如果,我們20年前經(jīng)歷的那一波以“像素”為代表的的科技浪潮,在今天以同樣摧枯拉朽的姿勢重新席卷一遍——我們也許將看到體素時代的淘寶、微信和百度。

這不是在憑空想象,端倪已經(jīng)出現(xiàn)。

就在前兩天,我和淘寶的幾個前沿技術(shù)團隊聊了聊。在他們眼里,體素時代正如黎明一般迫近。而這群技術(shù)理想主義者,趁其他人還沒睡醒,就已經(jīng)背上行囊向星辰大海進發(fā)了。

(二)前輩們留下的“兩把鑰匙”

說實話,現(xiàn)在為“體素時代”擂鼓助威,我心里也有點發(fā)虛。

為啥呢?因為歷史上,這個時代四舍五入已經(jīng)“來”過一次,而且又走了。。。

那是遙遠的2016年,還沒有國際形勢的劍拔弩張,只有人們對愛與科技的幻想。

那一年,谷歌地球的創(chuàng)始人,整天幻想怪物出沒的老男孩漢克搞出了《PokémonGo》(寶可夢Go),人們拿著手機對準無趣的草叢和平常巷陌,就能發(fā)現(xiàn)寵物小精靈隱藏其中,一個精靈球甩過去,捕獲神獸,爽點爆棚。

《PokémonGo》和漢克

VR/AR 的熱潮就這么出現(xiàn)了。

彼時尚未嗅到命運血腥的暴風影音信心滿懷推出 VR 眼鏡;光線傳媒、愛奇藝這樣的頂級內(nèi)容制作商也開始重金制作 VR 影片;明星初創(chuàng)公司 MagicLeap 在網(wǎng)上強推了一個短片——籃球場的木地板上,一只鯨魚騰空躍起,收獲四座尖叫。

當時的淘寶也深受鼓舞,在2016年的“淘寶造物節(jié)”上推出了VR購物模塊——“Buy+”。人們不用買VR眼鏡,也能在手機屏幕上體驗到“3D購物”的樂趣。

現(xiàn)在說起“Buy+”,其實很多人都不太記得。

這是因為,Buy+本身就是實驗性的。雖然大家第一感覺很驚艷,但在那個技術(shù)尚不成熟的世界里,要把“腦袋”轉(zhuǎn)到對準地上的箭頭才能走路,可以說“舉步維艱”;好不容易走到貨架前,商品種類也是有限的,還不能享受和店家講價的快感。體驗并不完善。

所以,嘗鮮之后,大多數(shù)人也就淡忘了。

但從歷史的角度看,Buy+ 意義重大。

因為它證明了“體素時代”雖好,但沒辦法跑步進入。而且,它還用自己的經(jīng)驗教訓給后人留下了進入體素時代的“兩把鑰匙”:

第一把鑰匙:人人都得用得起;

這里的人人包括兩個,賣家和買家。 當時為一套洗發(fā)水3D建模所花的錢,恨不得能買半車洗發(fā)水,除了大廠,又有幾家公司用得起呢?而且,如果模型稍微精細一點,一般的手機就跑不起來,得用上專業(yè)的“頭顯設備”,這又有幾個用戶愿意用呢? 所以, 大幅降低“建模建設”和“模型渲染”的成本, 就是必要條件。

第二把鑰匙:體驗不能凹造型。

還拿洗發(fā)水舉例,這類生活用品人人都熟悉,連質(zhì)感氣味形狀都知道,好像不必通過3D模型了解。。。這樣的場景就很難給人提供新的刺激。 所以, 找到能發(fā)揮3D模型功能的獨特場景 ,也是必要條件。

2016年的那波 AR/VR 熱潮很快就過去了。但“降低成本”和“尋找場景”這兩把鑰匙卻傳給了后來人。(這兩把鑰匙我用綠色字體表示,后面說到鑰匙的時候,我還會用綠色標注。)

灰燼之下,開始有了新芽。

(三)體素時代的“商品詳情頁”

不妨把進度條拉到2021年,也就是我們今天故事的前夜。

你會發(fā)現(xiàn),那時的“淘寶App”就像一個大逃殺戰(zhàn)場:很多當年大開大合的 VR/AR 功能都已殘血進入了蟄伏期,而一些實用的小功能,反而因為用戶的支持“茍”住了。

比如,“AR試”。

也就是通過攝像頭來試鞋、試妝、試表和試眼鏡。

“AR試”之所以能通過大逃殺活下來,恰恰是因為手握那兩把鑰匙:1)一目了然就能看到商品上身的效果,給用戶提供了很實在的參考,這是場景合適;2)運用了一種名叫 WebXR 的輕量化技術(shù),幾乎所有手機都能無壓力地運行3D計算,這是成本低廉。

注意,剛才我提到一個生詞,WebXR。

多介紹幾句,WebXR 最早是2016年由 Mozilla(就是做火狐瀏覽器那個)的幾位技術(shù)宅提出的框架,它的理想就是:手機上不用下載任何軟件,僅僅打開瀏覽器就能進入3D世界。(XR的意思就是AR、VR、MR,什么R都行)

那幾年,雖然 XR 產(chǎn)業(yè)遭遇了血雨腥風,但 WebXR 技術(shù)本身卻在社區(qū)的貢獻之下日益精進,越來越輕量化,越來越親民。

好了,有了這些鋪墊,現(xiàn)在請上我們今天第一位主角,承越。

承越是個資深 XR 愛好者,2016年的時候就吃了螃蟹——當時他看完 HTC Vive 頭顯的發(fā)布會,直接上頭,下單剁手。

(和我打視頻電話中的)承越

2021年時,他在淘寶的技術(shù)團隊負責會場、頻道的開發(fā),一方面看到“AR試”很受歡迎,一方面看到 WebXR 在互動技術(shù)上有了新進步,他又有點上頭:

既然手表、鞋,這種東西能在線試,那么更復雜的東西,例如小家電的拆裝和使用,能不能在線試呢?

想到這,他坐不住了,帶著幾位同學成立了一個“f(x)團隊”,嘗試把 WebXR 這幾年的最新技術(shù)推進實戰(zhàn)。

調(diào)研了半天,他們決定先做一個“商品說明書”。

啥是說明書?

我們分析發(fā)現(xiàn)了一個有趣的現(xiàn)象:人們?yōu)g覽淘寶商品的時候,通常會在“物品+場景”那張圖上停留很長時間,這說明人們不止關(guān)心商品本身,更關(guān)心商品和環(huán)境在一起的信息。也就是,“商品應該用在哪里”。 比如一個吸塵器,有很多組件、吸頭,它們怎么裝配才能吸地毯,怎么裝配才能吸瓷磚呢? 這些信息雖然在家電說明書里都有記載,但人們看上去不直觀,我們就把這些組件都做成3D模型,用戶在3D空間里拆裝、使用,很快就能明白它的用法,這就是“商品說明書”啦。

承越說。

我仔細體會了一下,這么說來,要想做出一個好的“商品說明書”,承越他們不僅需要把“商品本身”變成“可拆裝的3D模型”,還得把“商品使用的場景”變成“3D空間”。

但這件事兒沒有說起來那么容易——在商品過剩的時代,用戶是很挑剔的,你這說明書但凡“不流暢”或者“不真實”,大家就會覺得沒必要在這浪費時間,轉(zhuǎn)頭就走。。。

于是,第一個坑來了。

悖論擺在面前:要保證流暢,3D模型就要精簡;可模型一精簡,就會失真,變成五毛特效。

思來想去,承越他們只好對模型分情況“雕刻”——用戶可以互動的地方,模型就盡量做得精細,用戶不互動的地方,就盡量把模型做小。

說到互動,第二個坑來了。

如果想實現(xiàn)“互動”功能,就必須往這些模型里注入“靈魂”,也就是“功能代碼”。但這些代碼也會占很大一部分空間。。。

承越告訴我,標準的 WebXR 框架包括很細致的交互動作。比如,你的手放到一個物體上,可以觸發(fā)一個命令;手指移動,也會觸發(fā)命令;移動停止也能觸發(fā)命令,抬起手指還會觸發(fā)一個命令。

作為一個框架,設計的時候當然要考慮所有情況,無可厚非。但如果直接拿來就用,就會讓最終的成品充滿無用代碼,變得很臃腫。直接表現(xiàn)就是——用戶點開之后,要看著進度條加載半天。

所以,要想做出好東西,精簡“WebXR”的框架是不可省略的動作。

承越說,為了搞清楚一堆代碼之間的調(diào)用關(guān)系,他們把所有功能都畫在墻上,然后用“連連看”把不同模塊的關(guān)系搞清楚,最后,再一根根剪斷。

有點像拆彈部隊,面對一堆雜亂無章的線,卻不能犯錯誤。一旦把有用的功能給剪掉,就會“爆炸”。

他笑。

從2022年春節(jié)開始,雕刻了兩個月,成果斐然,f(x)團隊總算把這套 Demo 從最初的幾百M精簡到了10M以內(nèi)。這就已經(jīng)相當于一個短視頻的大小了,普通手機、普通網(wǎng)速下載起來也沒壓力。

至此,不妨再跟著我想象一下這個說明書的樣子:

1)一個3D小房間,里面有一個(或多個)商品。 2)你可以進入這個房間,仔細研究商品的功能,而商品各個部位的屬性、參數(shù),也都用懸浮泡泡的方式展示在旁邊。 3)賽博空間里,這樣的3D小房間還可以有很多,無窮無盡,他們之間相互連通,你可以走來走去。

你有沒有發(fā)現(xiàn):這個商品的3D小房間,有點像我們熟悉的“商品詳情頁”。而如果布置妥當,小房間能給你傳達的信息,其實比詳情頁更多、更直接。

也就是說,“3D商品說明書”只是這個設想的初級階段,未來它很有可能成為新一代的“3D商品詳情頁”。

說到這,你可能就明白了, 承越他們正是在為“體素時代”的到來尋找那把鑰匙——合適的場景。(注意,是綠色字體)

承越幫我設想了一個標準場景:

未來朋友分享給我一個商品,很可能不是商品詳情頁,而是一個“3D房間”的鏈接,我只要點擊,一秒就能進入這個3D房間,在里面體驗過商品的詳細功能,如果覺得好,就能直接下單購買!

這聽上去還挺酷的。

好,我們繼續(xù)。如果你接受了“體素時代會有很多3D房間”這個設定,就一定會想到:未來這些房間里恐怕需要大量的“3D商品”來填充。

于是,這些3D商品怎么才能“低成本”、“大量地”建模制作出來,就成了迫切需要解決的問題。

巧了,在淘寶技術(shù)團隊,恰好有一群大牛在研究這個問題。

(四)“侵略者”和“造物者”

2021年春天,友聞開心地一蹦三尺。

纏繞在他心頭的一團亂麻,被一把利劍劈開。

這團“亂麻”是啥呢?

多介紹一句背景:友聞帶領(lǐng)一群技術(shù)宅,服務于“每平每屋”。應該有不少人用過“每平每屋”,就是阿里巴巴旗下的家居平臺,可以在上面買家具,也可以請設計師幫你搞家居設計和裝修。

然鵝,賣家居是個很費勁的事兒,因為家具款式和裝修風格各有不同,顧客很難想象出一個沙發(fā)放到一種裝修風格里的樣子。。。想象不出來,就不敢買嘛。

所以,最好的辦法就是“先嘗后買”——下單之前,讓設計師先幫你做出一套“3D設計圖”瞧瞧。

就像這樣???

但設計師干活兒是要錢的。一個裝修方案的3D設計最少也得1000塊,一個沙發(fā)的手繪3D模型最便宜也要200塊。一般人看到這么貴,就打退堂鼓了,我還不如去線下家具店看看實物呢。。。

所以,友聞和團隊的任務就是:找到一種方法,用計算機來代替人類進行“建?!焙汀霸O計”,大大降低“試”的成本。

但是這件事兒談何容易。2020年,友聞和團隊研究了一年,嘗試了三種不同的技術(shù)路線,全都沒能成功。。。

友聞

就在這時,那支“利劍”橫空出世。

這就是谷歌發(fā)表在機器視覺頂級會議 ECCV 上的一種算法:NeRF。

看到這,可能有的淺友心中一驚:頂級會議的學術(shù)研究,估計完全看不懂吧。。。放心,后面我會用特別簡單的例子來給你說明白。

NeRF 的核心奧義就是一句話:原本需要“手繪”的3D建模,用“拍照”的方式來實現(xiàn)。

NeRF 建模就像這樣???

當然,建模的話,用一張照片肯定不夠,得從不同角度多拍幾張(或是繞著主體拍一段視頻)——只要角度足夠豐富,就能靠“想象力”把平面上的“像素”還原成空間里的“體素”。

這個想象的過程,靠的當然不是人腦,而是人工智能。

NeRF 有牛呢?它被技術(shù)宅們形容為:人工智能對圖形渲染的一次“侵略”。

還是用實力說話吧。你看,給我?guī)讖埞雀杞志暗恼掌湍苓€你一個3D世界的舊金山。。。

連一座城市都能還原出來,還原一個椅子和柜子,還不是小菜一碟么?淘寶商家自己繞著椅子拍一段視頻,就能還原出椅子的3D模型,這簡直是生產(chǎn)力的史詩級飛躍啊。。。

想到這里,友聞激動萬分。

但很快,問題出現(xiàn)了:

NeRF的論文只是理論上可行,但真按照論文的方法做出來一個模型,要消耗大量計算力,渲染一幀就要20多秒; 有一種叫做 FastNeRF 的改良技術(shù)可以解決這個問題,但做出來的模型大小超過1G,完全沒辦法大規(guī)模實戰(zhàn)。。。

但作為算法界的老炮,他是不會輕易認輸?shù)摹?/p>

一個三維模型,只有表面這一層體素是最有意義的,至于物體的內(nèi)部和外部的體素,其實并不包含重要信息。

舉個例子:西瓜之所以看上去是西瓜,不是因為“西瓜瓤”,而是因為“西瓜皮”。你看不到西瓜內(nèi)部,并不影響你判斷它是個西瓜。

所以,在3D建模過程中,內(nèi)部體素就可以大幅刪減。

當然,舉西瓜的例子只是為了說明模型精簡的思路。整個2021年春天,團隊都在研究一件事情,怎么像修剪樹木一樣,既不影響模型表達效果,又能把 NeRF 算法的計算量簡化到最小。

兩個月后,他們成功地把模型的大小從1G壓縮到了70M,計算效率也比論文中提升了10000倍。

技術(shù)宅們趕緊找來一堆桌椅板凳,準備自己用手機拍的視頻渲染一個模型。

新問題很快出現(xiàn)了:這套系統(tǒng)要求拍攝者必須是人肉三腳架、人肉穩(wěn)定儀。稍微手抖一下,人工智能就會“想象不出來”,換句話說,就是建模失敗。。。

即便建模成功,也有可能出現(xiàn)一個詭異的情況,那就是:從某個刁鉆的角度看,3D物體會出現(xiàn)缺損。。。

就像這樣???

這是為啥呢?

說到這,看來我還得科普一下 NeRF 進行“想象”時候的基本原理。

首先,系統(tǒng)會射出無數(shù)根“光線”穿過物體;

然后,通過不同光線上同一個點的坐標,反推計算,就能還原出3D模型中體素的準確位置。

在 NeRF 原版的設計中,從一個點射出的光線都是平行的,就像電影《英雄》里,秦國士兵射出的箭那樣。結(jié)果,就會造成前文所說的“刁鉆角度”下模型缺損的問題。

就像這樣???

友聞他們眉頭一皺,計上心來,做了一個小改動,把平行的箭改成了“亂箭”——讓每一條光線隨機選擇角度。這樣,在完全沒有增加計算量的前提下,卻一下子解決了建模質(zhì)量的問題。

就像這樣???

當然,類似這樣的改進,他們還做了好多,就不一一詳解了。這些改進綜合起來,就大大提高了建模的成功率。

就像這樣???

到了2021年10月,他們已經(jīng)能做到:一個普通人,用普通手機,學習拍攝10次就能學會建模。

這時,友聞他們才覺得時機成熟了。

他們給這套系統(tǒng)起名叫做“Object Drawer”,在淘寶內(nèi)部正式發(fā)布。

說到這,這個故事就和我們今天的主題聯(lián)系起來了:因為友聞他們做的,恰恰就是尋找“體素時代”的那一把鑰匙——“降低成本”。

你看,視頻抖成這樣也沒問題。

說到這我還得提醒你注意:要想真正進入“體素時代”,降低成本絕不能靠粗制濫造的“五毛特效”,華麗逼真的模型是首要前提。

這不,“Object Drawer” 剛剛發(fā)布,就有一些商家申請內(nèi)測,但是他們用過之后,給出了“吐槽”:

“形狀嘛倒是還原得還可以,但是表面紋理為啥有點模糊啊。。?!?/p>

友聞有點撓頭:“紋理”二字,可擊中了人工智能的軟肋。

因為人工智能的運算過程的本質(zhì)是概率推理,這必然會造成相鄰體素的參數(shù)有一定的相似性。換句話說,模糊就是人工智能甩不掉的內(nèi)在缺陷。。。

但眼看萬里長征已經(jīng)走了一大半,不能功敗垂成。友聞他們只好研究了另一種方案,把傳統(tǒng)算法生成的紋理疊加在 NeRF 的模型之上。這樣一來,在計算成本不提升的前提下,一下子就讓表面紋理從“模棱兩可”變成了“高清畫質(zhì)”。

至此,“Object Drawer” 被封裝成了一個非常好用的“攝像頭建模工具”。

雖然在友聞他們看來,Object Drawer 還有很大的進步空間,但不可否認,一個虛擬世界的“模型生產(chǎn)線”已經(jīng)雛形初現(xiàn)!

注意,3D模型生產(chǎn)線和實物生產(chǎn)線有所不同:

一個以原子為基礎的“物理商品”會隨著時間損壞、變質(zhì);但以代碼為基礎的“3D模型”一旦被制作出來,就永遠光鮮如初。

這些模型會成為賽博世界里的“基石”,永遠堅硬,而且不斷堆壘。

你有沒有發(fā)現(xiàn),這個過程很像淘寶過去的發(fā)展歷程。無數(shù)商家們不斷把自己的商品拍照上傳,這些數(shù)以億計的照片積累起來,就成為蘊含數(shù)據(jù)價值的金礦——可以通過人工智能學習服務商家,也可以用于未來虛擬空間的設計和搭建。

從這個角度理解,3D模型的價值,比圖片的價值只多不少。

當然,這些設想都是后話。眼下,在這些模型積累的過程中,它們能發(fā)揮什么價值呢?

起碼有一條路,已經(jīng)能走通了:一群技術(shù)大牛,正在把這些3D模型塞進主播們的帶貨直播間,把“普通直播間”升級成“3D直播間”。

(五)3D直播間

經(jīng)??粗辈ベ徫锏臏\友可能知道,現(xiàn)在的直播已經(jīng)非常“卷”了,主播們光是在鏡頭前耍嘴皮子已經(jīng)遠遠不夠了。

他們得搞些大場面。

比如李佳琦,他的直播間就會在大促的時候,租下一個巨大的演播室,然后聘請晚會級的燈光、舞美團隊。幾百號人共同協(xié)作,才能完成一場直播狂歡。

這是李佳琦日常直播,也需要40-60人的團隊。

但講真,這樣的大場面確實費錢,沒個幾百萬是搞不下來的,不是頭部主播根本不敢這樣玩。

在長孫泰眼里,這樣的實景直播好是好。。。但也。。。不是很有必要。。。

因為他和團隊可以用一整套3D技術(shù),實現(xiàn)虛擬場景直播——人只要站在綠幕前,就可以被傳送到一個盛大的舞臺中央。

這個舞臺可以在深山老林,也可以在古堡花園,可以漫天飛著鯨魚,也可以建在月球的環(huán)形山里,總之,壓根不用受物理定律的限制。。。

這不,2021年的“618 大促”,小米在天貓進行了一場盛大的帶貨直播。

他們使用的技術(shù)就是“3D直播間”。

注意,這些舞臺元素不是隨便“Ctrl+V”過來的妖艷賤貨,而是專門為這場直播從頭設計的。但即便是專門團隊制作了整套舞臺3D形象,成本也只是幾萬元量級,比搭建實景舞臺便宜得多。

這是小米的直播間

長孫泰伸出三個指頭,給我科普:“凡是賣貨的場景,都分為三個要素:人、貨、場?!?/p>

所謂人,就是主播,用綠幕摳圖的方法來捕捉影像。(當然也可以是數(shù)字人,這里篇幅有限不討論了。) 所謂貨,就是要賣的東西,它可以是主播手上拿著實物,也可以以“3D模型”的方式出現(xiàn)在主播身邊的“虛空”中。 所謂場,就是舞臺。

對于“3D直播間”來說,場,也就是舞臺是最復雜的。

之所以復雜,還是因為要求高。由于直播效果是要和專業(yè)的舞臺相對標的,所以這些背景模型沒辦法做到像友聞他們用 Object Drawer 掃描出來的模型那么小。

這就造成兩個結(jié)果:

1、舞臺目前還需要專業(yè)團隊來制作; 2、要想把這個舞臺運行起來,需要一個配置非常好的電腦。(手機暫時不行)

退回到2021年夏天,如果你想搞一個3D直播,需要有一個小團隊去到你家輔助你:

一部分人負責支綠幕、打光;一部分人操作電腦,在旁邊把人物影像和虛擬背景合成起來。

估計你也感受到了,這樣的操作臨時搞一兩次還可以,但好像不能作為標準方法大量推廣。

原因就是——這樣的成本太高。

這么高昂的成本,是無法帶領(lǐng)廣大主播進入“體素時代”的。

于是,整個2021年下半年,長孫泰和團隊就在嘗試把這一整套系統(tǒng)搬到云端。

他們要達到的目標就是:

1、主播只需要像平常一樣直播,可以有綠幕也可以沒有綠幕,打光更好不打光也行,系統(tǒng)都能自動把他們的人像摳出來。 2、3D舞臺和3D商品的計算全部在云端運行。主播的人像傳到云端,和背景疊加之后,直接傳輸?shù)角f剁手黨的手機上。

這樣一來,不用專人去現(xiàn)場輔助直播,成本直接大幅降低——無論是大主播還是小主播,就都能方便地搞出自己的“3D直播間”。

這是云上XR直播的全流程

長孫泰提醒我:“虛擬商品”這樣的資產(chǎn)可以積累,“虛擬舞臺”這樣的資產(chǎn)也是可以積累的。

不妨拿樂高積木打比方:

樂高積木生產(chǎn)的過程固然比較復雜,需要在工廠里實現(xiàn); 但是一旦生產(chǎn)出來,再用這些積木拼插出無數(shù)有趣的場景,就變得簡單了,普通人也能玩得轉(zhuǎn)。

主播可以買來“積木”自己拼搭,這就是它私有的直播間(不與別人分享);主播也可以選擇在淘寶上直接使用公共3D直播間,在上面做個性化微調(diào)。

這樣,使用“公共3D直播間”的主播越多,平攤下來,制作成本就越低。

假如制作一個精美的舞臺用了5萬塊,結(jié)果有5萬個主播都選擇共用,那就相當于每人眾籌1塊錢。

長孫泰

說到這兒,我們不妨回到歷史的上空,俯視現(xiàn)在這個時間點已有的一切:

我們正在擁有價格低廉的“3D模型”,也有了價格低廉的“3D房間”和“3D直播間”,它們共同構(gòu)成了“體素世界”的雛形。

接下來,終于到了靈魂拷問:

普通人(也就是你和我)目前只能隔著手機屏幕*觀察*和*控制*這個世界,但不能方便地“置身其中”。

之所以這樣,是因為我們還缺乏一個成本低廉,表現(xiàn)穩(wěn)定的“任意門”,這個任意門,就是“XR 眼鏡”。

當然,無數(shù)技術(shù)人曾經(jīng)和正在嘗試造出這扇門,比如“先烈” Google Glass,當紅小生 Meta 的 VR 眼鏡 Oculus,微軟的 VR眼鏡 Hololens,國產(chǎn) VR 眼鏡 Pico,還有萬眾期待的“蘋果眼鏡”。(哦還有羅永浩老師即將推出的AR眼鏡)

看架勢,這將是一個史詩級的科技賽道。

從左至右:Hololens、Oculus、Google Glass

但問題在于:在殺手級的“XR 眼鏡”普及之前,寫軟件代碼的技術(shù)宅們不能閑著。他們必須提前“搶跑”,一旦硬件具備,軟件要馬上能安裝進去。

豪贊,就是搶跑的大牛中的一位。

(六)兩個世界間的“掛鉤”

很多人應該都用過淘寶里的“拍立淘”功能。

你對著一個東西拍張照片,立刻就能搜索到相關(guān)商品。

2019年的拍立淘

在普通人眼里,這只是一個輔助購物的小特性,可是在豪贊眼里,這卻是通往未來的絕佳入口。

因為“拍立淘”這個場景,把“現(xiàn)實世界”和“體素世界”聯(lián)系起來了。(注意,我用了綠色字體,說明這是一個合適的場景。)

為什么這么說呢?最近,豪贊他們?yōu)榕牧⑻陨壛艘粋€“XR看世界”的新功能,從中可以看出端倪。

過去你需要拍一張照片上傳,它才啟動搜索;現(xiàn)在不用了,你只要拿攝像頭對著世界,系統(tǒng)就實時工作,幫你識別視野里一切物品,然后跳轉(zhuǎn)到商品詳情。(這個光說你感受不強,你可以現(xiàn)在就打開拍立淘感受一下。)

“XR看世界”,從本質(zhì)上來講,就相當于做出了很多包含信息的“3D泡泡”,追蹤在實體物品之上。

你想想看,如果這時把“手機”換成“XR 眼鏡”,會發(fā)生什么呢?

沒錯,你眼前世界的一切物體,都可以被附加上“3D泡泡”:“

路邊不認識的花,上面有泡泡會顯示它的名稱、習性。 路邊不認識的車,上面有泡泡會顯示它的品牌、價格。 路人穿的衣服很好看, 系統(tǒng)也能在淘寶商品庫里給你找出來一模一樣的。

怎么樣,瞬間有了科幻電影里的感覺了吧?

這一整套技術(shù),有一個名字——XR 互動技術(shù)。

豪贊就是這方面的專家。

人們通過拍立淘找到了想要的商品,就會購買。在我看來,這些購買就是對我們 “XR 互動技術(shù)” 的認可,是“點贊”。將來,大家不僅可以通過 AR 買東西,還可以通過 AR 看世界,我們就會得到更多的贊,所以我的花名就是“豪贊”!

豪贊老師有理有據(jù)給我解釋。

豪贊

你有沒有發(fā)現(xiàn),XR互動技術(shù)就像“物理世界”和“體素世界”的掛鉤,把兩個原本沒有關(guān)系的世界給聯(lián)系起來了。

不過,要獲得“豪贊”并不是那么容易的事情,因為這個“掛鉤”背后的技術(shù)還是挺復雜的。

我們來拆解一下步驟:

1、要把攝像頭采集的視頻切分為一幀一幀的靜態(tài)圖片; 2、用人工智能找到靜態(tài)圖片里究竟包含哪些物體; 3、去云端的數(shù)據(jù)庫里找到和這些物體相關(guān)的信息,然后顯示在物體旁邊的“泡泡”上; 4、運用影像追蹤技術(shù),識別出相鄰兩幀畫面中“同一個物體”,就可以讓“泡泡”在動態(tài)視頻中跟隨同一個主體移動了。

這一套流程跑下來,計算量可小不了。

實際上,這么大的計算量,靠手機或AR眼鏡中的小芯片來搞定,確實是力不從心。。。

所以,豪贊他們處理這個問題的核心思路就是:在整個流程中適當?shù)奈恢每车舨槐匾挠嬎氵壿嫛?/p>

比如,我們發(fā)現(xiàn)人們經(jīng)常會把A物體放在大腿上。畫面實際上出現(xiàn)了兩個東西:“A物體”和“大腿”。但人工智能會老老實實進行一系列的計算,然后給出答案:畫面里有“A物體”和“大腿”。 但你有沒有發(fā)現(xiàn),整個流程里,識別大腿的計算完全是不需要的?

豪贊解釋。

所以,更好的做法是,畫面里對“桌面、大腿、手、墻壁”之類的識別動作根本不應該被拉起,這個計算流越早被“壓制”掉,就能越省計算力。

但是,靠技術(shù)宅們手動定義哪些東西不應該被識別,這既不準確,效率也不高。

這里涉及到人工智能改進的一個通用方法,就是:通過用戶對每次搜索的點擊行為,來修正系統(tǒng)的行為。

比如,最開始系統(tǒng)經(jīng)常都能搜出“大腿”,但絕大多數(shù)用戶不會點擊“大腿”,更不會購買“大腿”(也就是不給“大腿”點贊),這個動作就被稱為“負樣本”。

在人們使用“XR 看世界”的功能時,“負樣本”會源源不斷傳送給人工智能用來學習。

很快,系統(tǒng)就知道大腿是不用識別的,從而越來越精簡,計算量不斷變小。

這就是系統(tǒng)“剪枝”的過程。

不過,僅僅靠“剪枝”,剩下的“主干”還是太大,沒辦法把計算量控制在設備的能力范圍。

于是,豪贊他們必須做得更多:能不能在不影響AI模型效果的前提下,把“模型的主干”變小呢?

目測,這種既讓馬兒跑又不讓馬吃草的操作還真能實現(xiàn)。這里給你隆重介紹一個逆天的“推理引擎”——MNN。

啥是“推理引擎”呢?

我們不妨拿汽車引擎來類比。

同樣是98號汽油,用A引擎就能跑到200km每小時,且油耗很低;用B引擎只能跑到100km每小時,且油耗很高。

這里的汽油就是前文所說的“AI模型”,用同樣的模型,卻能跑得更快,更省計算力,就是“推理引擎”的職責了。

“用 MNN 引擎,不損失精度的情況下,至少可以把模型減小一半。如果把精度犧牲一點,還可以小得多。”豪贊說。

這么神奇的嘛?我趕緊給 MNN 的負責人呂行打電話,請他幫我科普其中的黑科技。

呂行

呂行驕傲地告訴我,MNN 的絕招簡單來說可以分為三層:

1、向上看,市面上存在很多人工智能訓練框架,他們訓練出來的模型各不相同,但是 MNN 可以把這些模型都統(tǒng)一成 MNN 格式。 2、向下看,市面上存在很多手機芯片類型,MNN 為不同的芯片類型搞出了最適合的算子運行模式。提前預制好。 3、在中間,人工智能模型運行時,程序會自動探測自己跑在哪一類芯片上,然后就切換到最合適的預制模式來運行。

這張圖詳細解釋了 MNN 面臨的挑戰(zhàn),點擊可以放大。

聽完他的介紹,我感覺 MNN 有點像一個自動駕駛汽車:走平路就用高檔位,遇到上坡就自動切換成低檔位,路滑就不急踩剎車。

和發(fā)動機一樣,推理引擎背后的技術(shù)細節(jié)是極其精細的,精細到 MNN 團隊已經(jīng)有很多世界級的論文產(chǎn)出,被頂級會議收錄。限于篇幅,今天我們沒辦法展開了,后面我會找機會專門寫文章討論。

呂行自豪地告訴我,目前阿里巴巴已經(jīng)有30多個 App 都內(nèi)置了 MNN 的模塊。

目前,MNN加持的輕量級人工智能可以進行語音識別、視頻內(nèi)容理解,當然也幫助把“XR 看世界”這把鉤子做得更小巧堅固;未來,如果出現(xiàn)殺手級的“XR 眼鏡”,MNN 肯定也會第一時間適配,把更多普通人拉進體素世界。

(七)數(shù)字資產(chǎn)和“淘寶叛軍”

因為正處疫情期間,所以和這些淘寶技術(shù)大牛的聊天都是在線上進行的。

掛斷和大牛們的視頻電話,從“體素世界”的想象中抽離回來,我看看窗外熟悉到有些膩味的風景,總有一種肉身沉重的感覺。

估計很多淺友也開始質(zhì)疑:

你說得這么熱鬧,但我們現(xiàn)在不還活在無聊的現(xiàn)實中么?體素時代到底什么時候來呢?

我必須承認,客觀上來說,沒有人能精確預言一個時代的到來。

而且,對于一項技術(shù)的過度關(guān)注,反而會消磨大家對它的善意,2016年的”VR熱潮”和如今如出一轍的“元宇宙騙局”已經(jīng)證明了這一點。

所以,我只想小心翼翼地客觀呈現(xiàn)這些大牛們的努力:

他們只是從自己熟悉的家園出發(fā),用各自的方式開始了遠征,為體素時代悄悄準備“磚石”——一旦未來降臨,我們手中不至于赤手空拳。

承越告訴我,他們的“3D說明書”正在努力從“小家電”拓展出去,很快,大家就能看到冰箱、洗衣機這樣大家電的3D說明書。他們也在嘗試做出3D世界的“穿鞋帶說明書”,甚至還有美妝產(chǎn)品的說明書——讓大家在虛擬世界就能體會到各種化妝品的使用順序和使用效果。

“這些嘗試未必都能成功,但值得嘗試。”他說。

長孫泰告訴我,他希望不久的將來,每個大小商家,甚至夫妻店都能擁有自己的3D直播間。

商家可以像裝修房子那樣,不斷修改、豐富云上直播間的樣子,還可以添加新的3D擺件。不僅如此,還能根據(jù)直播的主題在各個直播間之間切換,就像一個人在全國每個城市都有別墅,想住哪套住哪套,土豪得不要不要的。

就像這樣,每個商家都可以有好多不同主題的直播間。

友聞告訴我,他們還在奮力改進算法,讓 Object Drawer 繪制出來的 3D模型平均大小從20m縮小到5m。

未來,商家上架一個商品,就像現(xiàn)在拍一張照片那么簡單。每一個淘寶上的商品都可以有配套的3D模型。?

他說。

這樣一來,我們買一個椅子,就同時在虛擬世界得到一個“數(shù)字椅子”,買一個水壺,就在虛擬世界得到一個“數(shù)字水壺”。

于是,我們裝點自己家的時候,也能裝點自己數(shù)字世界的另一個家:

我們在真實的家里,得到的是真實生活品質(zhì)的提升,而在虛擬房間里,得到的是突破物理定律的自由想象——我們可以讓水杯懸在半空,我們可以讓屋頂閃耀璀璨銀河。 我們可以邀請朋友到真實的家,也可以邀請朋友的數(shù)字分身到我們的數(shù)字莊園。

數(shù)字藝術(shù)家 Krista Kim 做了一個 Mars House(火星屋)。他把一片豪宅建設在了荒涼的火星上,使之充滿了對于物理定律的挑釁。

所以,我愿意把這些淘寶大牛稱為“叛軍”。他們反叛的不是任何人,而是像素時代的種種限制,種種無趣。他們相信,人們的3D數(shù)字世界里不應一片荒蕪,而創(chuàng)造必須始于今天,始于腳下。

也許未來的某一天,我們回望那個像素時代的黃昏,也許會對當年的先行者們致以微笑。

因為他們曾堅信,對未來最大的慷慨,就是把一切獻給現(xiàn)在。

參考文章:

《一種降維打擊的可視化方案》

https://www.bilibili.com/video/BV1Sf4y147J9?share_source=copy_web

Eyes Wide Shut

再自我介紹一下吧。我叫史中,是一個傾心故事的科技記者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmax。

哦對了,如果喜歡文章,請別吝惜你的“在看”“分享”。讓有趣的靈魂有機會相遇,會是一件很美好的事情。

Thx with in Beijing

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
小伙騎車撞特斯拉后賠償1.5萬修車費,4S店發(fā)票咋只開了9000元?多方回應

小伙騎車撞特斯拉后賠償1.5萬修車費,4S店發(fā)票咋只開了9000元?多方回應

大風新聞
2026-01-22 12:09:03
最低-14℃!江蘇下一輪降雪又在路上了

最低-14℃!江蘇下一輪降雪又在路上了

魯中晨報
2026-01-22 08:59:40
嘲笑川普的人該補歷史課:美國購買格陵蘭是150年的國家戰(zhàn)略

嘲笑川普的人該補歷史課:美國購買格陵蘭是150年的國家戰(zhàn)略

斌聞天下
2026-01-22 06:20:03
永遠不可能被抹殺的歷史:四野部隊里的那三萬日籍士兵

永遠不可能被抹殺的歷史:四野部隊里的那三萬日籍士兵

深度報
2026-01-21 21:25:16
湖北省農(nóng)業(yè)事業(yè)中心副主任姜衛(wèi)東接受審查調(diào)查

湖北省農(nóng)業(yè)事業(yè)中心副主任姜衛(wèi)東接受審查調(diào)查

界面新聞
2026-01-22 17:14:47
車市內(nèi)卷嚴重怎么辦?遇事不決,學豐田!

車市內(nèi)卷嚴重怎么辦?遇事不決,學豐田!

電動邦
2026-01-22 14:32:58
當江青還不叫江青時,她是這樣的

當江青還不叫江青時,她是這樣的

深度報
2026-01-21 22:36:36
歐洲資金開始大規(guī)模撤離

歐洲資金開始大規(guī)模撤離

販財局
2026-01-21 22:18:11
炸裂!中糧集團春招公告,學歷從大專起步,外語水平居然不設限…

炸裂!中糧集團春招公告,學歷從大專起步,外語水平居然不設限…

火山詩話
2026-01-22 10:40:46
歐洲打死也不會想到,這場戰(zhàn)爭徹底打掉了歐洲五十年的國運

歐洲打死也不會想到,這場戰(zhàn)爭徹底打掉了歐洲五十年的國運

揭秘歷史的真相
2026-01-19 21:05:12
暴雷!廣東知名董事長跳樓,公司停業(yè)破產(chǎn)清算,近百家門店全關(guān)閉

暴雷!廣東知名董事長跳樓,公司停業(yè)破產(chǎn)清算,近百家門店全關(guān)閉

南宗歷史
2026-01-22 14:32:06
人民日報,救西貝一命!

人民日報,救西貝一命!

鈞言堂
2026-01-22 09:38:41
臺軍女飛行員郭文靜:只要長官敢下令,我會毫不猶豫的擊落殲20!

臺軍女飛行員郭文靜:只要長官敢下令,我會毫不猶豫的擊落殲20!

顧史
2026-01-21 21:04:39
葉某斌供述:一天騙五六個人應該差不多

葉某斌供述:一天騙五六個人應該差不多

大風新聞
2026-01-22 14:34:05
性蕭條是怎么造成的?以前穿小吊帶的女性大把,MV全是比基尼小姐姐

性蕭條是怎么造成的?以前穿小吊帶的女性大把,MV全是比基尼小姐姐

六子吃涼粉
2026-01-22 09:12:09
突發(fā)!知名網(wǎng)紅“一栗小莎子”確診癌癥,疑熬夜導致,兒子才兩歲

突發(fā)!知名網(wǎng)紅“一栗小莎子”確診癌癥,疑熬夜導致,兒子才兩歲

裕豐娛間說
2026-01-22 08:56:07
馬克龍犯了什么???

馬克龍犯了什么?。?/a>

新民周刊
2026-01-22 09:08:59
美媒昭告全球: 中國不償還100年前的債務,美國將不承認欠中國的

美媒昭告全球: 中國不償還100年前的債務,美國將不承認欠中國的

墨印齋
2026-01-22 06:05:46
900萬粉絲網(wǎng)紅到株洲一村莊辦殺豬宴,稱村民收場地費還分肉,村干部:他們未報備且破壞村里聲譽,已報警

900萬粉絲網(wǎng)紅到株洲一村莊辦殺豬宴,稱村民收場地費還分肉,村干部:他們未報備且破壞村里聲譽,已報警

極目新聞
2026-01-22 13:53:44
首進澳網(wǎng)32強!王欣瑜2-1爆冷險勝前法網(wǎng)冠軍 將戰(zhàn)13號種子

首進澳網(wǎng)32強!王欣瑜2-1爆冷險勝前法網(wǎng)冠軍 將戰(zhàn)13號種子

醉臥浮生
2026-01-22 13:21:34
2026-01-22 17:28:49
淺黑科技官方 incentive-icons
淺黑科技官方
科技有溫情
284文章數(shù) 22967關(guān)注度
往期回顧 全部

藝術(shù)要聞

一場雪,飄進了唐詩

頭條要聞

浙江有人領(lǐng)走88888888馬年紀念鈔 銀行員工:隨機分配

頭條要聞

浙江有人領(lǐng)走88888888馬年紀念鈔 銀行員工:隨機分配

體育要聞

跑個步而已,他們在燃什么?

娛樂要聞

鐘麗緹土耳其高空落淚 與張倫碩擁吻

財經(jīng)要聞

申通快遞創(chuàng)始人被前夫索要股份

科技要聞

幾千億只是開胃菜,AI基建還得再砸?guī)兹f億

汽車要聞

配備多塊娛樂屏 極氪8X內(nèi)飾曝光

態(tài)度原創(chuàng)

游戲
家居
藝術(shù)
親子
本地

科幻生存新爆款!《星際裂變》兩周銷量超50萬

家居要聞

法式風情 南洋中古居

藝術(shù)要聞

一場雪,飄進了唐詩

親子要聞

家長因孩子發(fā)燒,深夜帶老師cosplay“大薩滿”,評論區(qū)太精彩了

本地新聞

云游中國|格爾木的四季朋友圈,張張值得你點贊

無障礙瀏覽 進入關(guān)懷版