網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

Z Waves｜對(duì)話陳佳玉：AtomVLA 刷爆基準(zhǔn)，真機(jī)完成高難度柔性物體操作，具身智能長(zhǎng)程任務(wù)進(jìn)入深水區(qū)

2026-03-20 16:59:36　來(lái)源: ZFinance

北京舉報(bào)

分享至

具身智能的長(zhǎng)程任務(wù)天花板，正在被捅破。

就在近日，大模型圈和機(jī)器人圈被一個(gè)名為AtomVLA的模型刷屏了。這個(gè)由原力無(wú)限團(tuán)隊(duì)發(fā)布的最新戰(zhàn)果，不僅直接在 LIBERO 權(quán)威基準(zhǔn)上刷出了97.0%的驚人成功率，更是在真機(jī)演示中，絲滑地完成了疊 T 恤、折毛巾等“地獄級(jí)難度”的柔性物體操作。

圍繞‘為機(jī)器人打造真正理解世界的大腦’這一核心方向，原力無(wú)限當(dāng)前正以端到端 VLA 多模態(tài)大模型與因果世界模型為技術(shù)底座，并以全棧 AI Infra 構(gòu)建數(shù)據(jù)與模型飛輪，推動(dòng)機(jī)器人在虛擬世界學(xué)習(xí)、在真實(shí)世界進(jìn)化。

帶隊(duì)人，正是原力無(wú)限資深研究科學(xué)家——陳佳玉教授。

論文傳送門： https://arxiv.org/pdf/2603.08519 ）

更重要的是，AtomVLA開(kāi)創(chuàng)性地提出了“原子子任務(wù)分解 + 預(yù)測(cè)型世界模型離線評(píng)估 + 離線GRPO后訓(xùn)練”的完整范式，實(shí)現(xiàn)了不依賴昂貴真機(jī)在線交互的高效策略優(yōu)化。

在全球VLA后訓(xùn)練研究競(jìng)爭(zhēng)日趨白熱化的當(dāng)下，這一框架提供了一條兼顧性能、效率與可擴(kuò)展性的全新技術(shù)路徑，標(biāo)志著VLA后訓(xùn)練正在從“依賴真機(jī)試錯(cuò)”走向“世界模型驅(qū)動(dòng)的離線進(jìn)化”新范式。

AtomVLA 的驚艷成績(jī)，源于陳佳玉教授對(duì)“復(fù)雜控制”十余年的深耕。從自動(dòng)駕駛到核聚變等離子體控制，再到如今的具身智能，這位 ISTJ 科學(xué)家始終在追問(wèn)：如何用數(shù)學(xué)和邏輯，讓機(jī)器擁有類人的進(jìn)化能力？

以下是ZF對(duì)于陳佳玉教授的深度訪談實(shí)錄。

Jane：這期節(jié)目我們邀請(qǐng)到了一位非常年輕的科學(xué)家——陳佳玉陳老師。陳老師現(xiàn)在是原力無(wú)限資深研究科學(xué)家，歡迎陳老師！先簡(jiǎn)單一兩句話介紹一下自己吧。

陳佳玉：好的。我是陳佳玉，目前是香港大學(xué)數(shù)據(jù)與系統(tǒng)工程系的助理教授，研究方向是應(yīng)用強(qiáng)化學(xué)習(xí)到復(fù)雜控制，目前專注于具身智能方向的研究。

Jane：陳老師雖然很年輕，但在機(jī)器人、自動(dòng)駕駛、強(qiáng)化學(xué)習(xí)相關(guān)的研究上已經(jīng)非常資深了。那接下來(lái)進(jìn)入我們的快問(wèn)快答環(huán)節(jié)——你的星座和MBTI是什么？

陳佳玉：星座是天秤座，MBTI 好像是一個(gè)叫"物流師"的類型，ISTJ 之類的。

Jane：如果不用"助理教授"和"強(qiáng)化學(xué)習(xí)"這些標(biāo)簽，你一般會(huì)怎么向一個(gè)不懂AI的朋友介紹自己？

陳佳玉：我會(huì)說(shuō)，我做的方向是解決一些比較復(fù)雜的控制問(wèn)題。比如人形機(jī)器人控制，還有核聚變中等離子體的控制?？偨Y(jié)來(lái)說(shuō)，我是一個(gè)專注于復(fù)雜控制問(wèn)題的人，可能用數(shù)學(xué)方法去解，也可能用人工智能方法去解。

Jane：復(fù)雜系統(tǒng)的控制問(wèn)題。最近一兩周你刷得比較多的論文，或者看得最多的相關(guān)項(xiàng)目是什么？

陳佳玉：最近看得比較多的是多模態(tài)大模型，還有基于應(yīng)用的世界模型這一塊。

Jane：如果不做科研，你現(xiàn)在有可能在做什么？

陳佳玉：如果不做科研，我可能做一個(gè)體育新聞?dòng)浾甙伞?/p>

Jane：同行！你覺(jué)得自己最大的非學(xué)術(shù)型能力是什么？

陳佳玉：我覺(jué)得我最強(qiáng)的是邏輯能力，做梳理的工作會(huì)比較好。其實(shí)這個(gè)能力有點(diǎn)類似 AI——你給我一個(gè)問(wèn)題，我大量閱讀相關(guān)的東西，然后把它梳理成一個(gè)像報(bào)告一樣的東西。我最強(qiáng)的是邏輯部分，最強(qiáng)的非學(xué)術(shù)性能力可能就是這種總結(jié)和協(xié)作能力。但這個(gè)好像也偏學(xué)術(shù)，所以我也不太清楚怎么回答這個(gè)問(wèn)題。

第一部分：個(gè)人經(jīng)歷與強(qiáng)化學(xué)習(xí)的十年流變

Jane：好，那我們直接切到個(gè)人經(jīng)歷這塊吧。先聊一下你整個(gè)研究經(jīng)歷，包括小時(shí)候是什么時(shí)候?qū)χ悄軝C(jī)器人這些產(chǎn)生興趣的，最終又是怎么一步步開(kāi)始自己的研究的。

陳佳玉：我的研究經(jīng)歷應(yīng)該具體是從大學(xué)二年級(jí)開(kāi)始。那時(shí)候選擇研究方向，其實(shí)也比較討巧——當(dāng)時(shí) ImageNet 和 AlphaGo 都剛出來(lái)，深度學(xué)習(xí)的一些成果引起了很大的轟動(dòng)，所以我就萌生了做人工智能的想法。

但人工智能涉及很多領(lǐng)域，比如計(jì)算機(jī)視覺(jué)、智能決策、自然語(yǔ)言處理。我比較喜歡那些具象化的東西，所以一開(kāi)始選了自動(dòng)駕駛這個(gè)方向，在北大做自動(dòng)駕駛相關(guān)的研究。剛開(kāi)始做的是感知層的工作，就是怎么讓自動(dòng)駕駛汽車?yán)斫庵車沫h(huán)境——明白它看到的這一塊是灌木叢，那一塊是行人。

后來(lái)我接觸到了自動(dòng)駕駛汽車決策層的東西。決策就是說(shuō)，依據(jù)你的觀測(cè)，你要做自動(dòng)駕駛汽車油門的控制或方向的控制，這涉及到一些決策算法。我漸漸發(fā)現(xiàn)，結(jié)合我在北大和博士期間兩段經(jīng)歷來(lái)看，我其實(shí)更喜歡的是比較抽象的決策算法這一部分。

具體用到的算法是兩大類：一類是模仿學(xué)習(xí)，從示例數(shù)據(jù)中學(xué)習(xí)；一類是強(qiáng)化學(xué)習(xí)，從仿真中學(xué)習(xí)。到了博士階段，我就開(kāi)始研究這種比較抽象的決策算法，不再依賴于具體的應(yīng)用了。做了很多理論研究和算法設(shè)計(jì)，這些算法和理論雖然抽象，但應(yīng)用范圍比較廣，也奠定了我對(duì)這種技術(shù)更深層次的理解。因?yàn)榧夹g(shù)到更深層次的話，其實(shí)就是數(shù)學(xué)——一種依據(jù)數(shù)學(xué)、依據(jù)場(chǎng)景以及一些直覺(jué)所做出來(lái)的東西。這段經(jīng)歷讓我對(duì)決策算法，特別是對(duì)強(qiáng)化學(xué)習(xí)有了更本質(zhì)的認(rèn)識(shí)。

等到做博后的時(shí)候，我又意識(shí)到，純理論的強(qiáng)化學(xué)習(xí)研究已經(jīng)做得七七八八了。從 AlphaGo 之后強(qiáng)化學(xué)習(xí)熱潮就開(kāi)始了，等我2024年畢業(yè)的時(shí)候，其實(shí)都已經(jīng)做得差不多了。大家的研究興趣慢慢轉(zhuǎn)向了強(qiáng)化學(xué)習(xí)在其他領(lǐng)域的應(yīng)用。比較耀眼的應(yīng)用有兩個(gè)：一個(gè)是在大模型上的應(yīng)用，大模型的后訓(xùn)練依賴于強(qiáng)化學(xué)習(xí)；另一個(gè)是在人形機(jī)器人或其他物理過(guò)程上應(yīng)用強(qiáng)化學(xué)習(xí)。

我想，如果我要繼續(xù)做強(qiáng)化學(xué)習(xí)研究，就得給它找一個(gè)應(yīng)用。相比大語(yǔ)言模型，我選擇了物理控制這個(gè)領(lǐng)域，但我并沒(méi)有直接去做人形機(jī)器人，而是選擇了復(fù)雜的物理過(guò)程——具體講就是核聚變里的等離子體控制，應(yīng)用強(qiáng)化學(xué)習(xí)的方法去做。等到博后結(jié)束，開(kāi)始做自己實(shí)驗(yàn)室的時(shí)候，我依然沿著這個(gè)思路——給強(qiáng)化學(xué)習(xí)找一個(gè)應(yīng)用場(chǎng)景?？紤]到現(xiàn)實(shí)條件，我沒(méi)有辦法在香港繼續(xù)做核聚變研究，所以就把研究轉(zhuǎn)向了人形機(jī)器人，或者說(shuō)具身智能上面的應(yīng)用。

總體來(lái)講，我的思路就是：從一個(gè)比較具象的技術(shù)出發(fā)——自動(dòng)駕駛，慢慢找到自己對(duì)決策算法的興趣——強(qiáng)化學(xué)習(xí)。到后期為了讓研究興趣真正有 impact，我開(kāi)始想它具體的應(yīng)用，最終錨定了具身智能。

做具身智能一段時(shí)間之后，我發(fā)現(xiàn)它實(shí)際上是一個(gè)非常綜合的領(lǐng)域。你想把具身智能做好，基本上就要解決 AI 領(lǐng)域所有的大問(wèn)題：你要讓感知做得好，就得做計(jì)算機(jī)視覺(jué)；你想讓它既能聽(tīng)懂語(yǔ)言，又能看懂圖片，還能感受到力，這就涉及多模態(tài)融合；你想讓機(jī)器人比較通用，就得喂給它很多數(shù)據(jù)并用大模型，這涉及大模型的問(wèn)題；你想讓機(jī)器人很敏捷，又涉及機(jī)械工程的問(wèn)題。所以具身智能這個(gè)領(lǐng)域包含了人工智能基本上所有大的挑戰(zhàn)，我就越來(lái)越覺(jué)得它有意思，也想把它做一個(gè)長(zhǎng)期攻堅(jiān)的方向。

最后一點(diǎn)，它不僅是多項(xiàng)技術(shù)的集合，更代表著一個(gè)未來(lái)——給人工智能裝一個(gè)身體。它不僅在思維上更像人，在行為上也更像人。以具身智能為載體，你會(huì)研究很多與類人智能相關(guān)的問(wèn)題。從長(zhǎng)遠(yuǎn)來(lái)看，這是一個(gè)非常有前景的方向。

陳佳玉：對(duì)。

Jane：你大概是16年入學(xué)，那一年AlphaGo基本上點(diǎn)燃了整個(gè)第一波中國(guó)自動(dòng)駕駛公司和地平線等公司，就是那個(gè)時(shí)候誕生的。你經(jīng)歷了整個(gè)強(qiáng)化學(xué)習(xí)不斷融入先自動(dòng)駕駛、后來(lái)又融入機(jī)器人的過(guò)程。你覺(jué)得強(qiáng)化學(xué)習(xí)這么多年，過(guò)程中那些關(guān)鍵的問(wèn)題，所謂的"真問(wèn)題"，究竟在發(fā)生什么變化？

陳佳玉：這是一個(gè)好問(wèn)題。我這么來(lái)回答吧——強(qiáng)化學(xué)習(xí)的研究大概分為幾派。

第一派是理論派。大家研究你需要多少采樣才能學(xué)到最終的 policy，在數(shù)學(xué)上進(jìn)行推演。其實(shí)相關(guān)的研究在上個(gè)世紀(jì)就開(kāi)始了，只不過(guò)那時(shí)大家依賴比較強(qiáng)的假設(shè)以及不太切實(shí)際的 policy，研究的更多是有限的狀態(tài)和動(dòng)作空間。這一波理論研究的話，大家就越來(lái)越把它推向無(wú)限的狀態(tài)動(dòng)作空間下采樣效率的問(wèn)題。但整體上會(huì)發(fā)現(xiàn)，數(shù)學(xué)結(jié)果越漂亮的那些算法，離實(shí)際就越遠(yuǎn)。

第二派是以DeepMind為代表的算力派。他們?cè)谕扑懔?duì)強(qiáng)化學(xué)習(xí)算法的影響，代表成果就是 AlphaGo、AlphaZero——把強(qiáng)化學(xué)習(xí)里的值學(xué)習(xí)和蒙特卡洛樹(shù)搜索（MCTS）結(jié)合在一起，用來(lái)解決非常復(fù)雜的決策問(wèn)題，用算力來(lái)堆。這肯定是非常有用的，他們已經(jīng)造出了那種超越人類智能的系統(tǒng)——AlphaGo、AlphaFold、AlphaChip 等等，用算力結(jié)合強(qiáng)化學(xué)習(xí)堆出了很多實(shí)際上很有用的東西。但問(wèn)題是他們的研究不太適合學(xué)術(shù)界，因?yàn)閷W(xué)術(shù)界沒(méi)那么多算力。

第三派是以學(xué)術(shù)界和伯克利為代表的深度強(qiáng)化學(xué)習(xí)派。沒(méi)那么理論，對(duì)算力要求也沒(méi)那么大，但做出了很多有代表性的深度強(qiáng)化學(xué)習(xí)算法。比如 Soft Actor-Critic（SAC），這是在線強(qiáng)化學(xué)習(xí)的代表性算法。然后慢慢做到了離線強(qiáng)化學(xué)習(xí)（Offline RL），代表算法有 CQL，也是他們這些組做出來(lái)的。再后來(lái)，大家又開(kāi)始基于生成模型來(lái)做強(qiáng)化學(xué)習(xí)算法，代表性工作就是 Decision Transformer 和 Diffusion Policy?？偟膩?lái)說(shuō)，這一派沒(méi)那么理論，也不像 DeepMind 那樣依賴強(qiáng)算力，但誕生了一系列非常有代表性的深度強(qiáng)化學(xué)習(xí)算法。

大概在2022到2023年這個(gè)區(qū)間，大家就發(fā)現(xiàn)你再做更多的純強(qiáng)化學(xué)習(xí)算法，也比不了 PPO 有用，所以單純的強(qiáng)化學(xué)習(xí)算法研究遇到了瓶頸。大家逐漸轉(zhuǎn)向了強(qiáng)化學(xué)習(xí)的應(yīng)用。這時(shí)候特別是強(qiáng)化學(xué)習(xí)在大模型的后訓(xùn)練上有了非常好的效果，也就是我們說(shuō)的RLHF。第四波就起來(lái)了，以大模型公司為代表，做 RLHF 取得了很好的進(jìn)展。又過(guò)了一兩年，幾乎是同時(shí)，大家發(fā)現(xiàn)強(qiáng)化學(xué)習(xí)算法，特別是 PPO，在人形機(jī)器人的控制上有非常好的效果，具體案例就像宇樹(shù)科技的那些跳舞或打太極的展示，大部分都是基于 RL 做出來(lái)的。所以我認(rèn)為現(xiàn)在更像是一個(gè)強(qiáng)化學(xué)習(xí)的應(yīng)用時(shí)代。

如果再展望一下，之后強(qiáng)化學(xué)習(xí)會(huì)怎么樣？我認(rèn)為有一個(gè)特別關(guān)鍵的點(diǎn)——持續(xù)性的強(qiáng)化學(xué)習(xí)。就是你如何在學(xué)習(xí)新任務(wù)的時(shí)候不忘掉舊的任務(wù)，在學(xué)習(xí)新任務(wù)時(shí)能基于舊任務(wù)中學(xué)到的知識(shí)快速學(xué)習(xí)。這實(shí)際上很重要。另一個(gè)點(diǎn)是，你在進(jìn)行強(qiáng)化學(xué)習(xí)的時(shí)候如何利用 Foundation Model 已有的知識(shí)進(jìn)行高效的強(qiáng)化學(xué)習(xí)。強(qiáng)化學(xué)習(xí)是一個(gè)很本質(zhì)的技術(shù)——你給它一個(gè)獎(jiǎng)勵(lì)信號(hào)，然后期待它把完成那個(gè)獎(jiǎng)勵(lì)信號(hào)的最好策略學(xué)出來(lái)。它的缺陷在于太本質(zhì)了、太像人了，以至于我們想真正發(fā)揮出它的威力，就得做出那種類人智能來(lái)，才能很好地應(yīng)用強(qiáng)化學(xué)習(xí)。這需要我們?cè)谒惴ㄔO(shè)計(jì)上有新的突破。

Jane：你剛說(shuō)了強(qiáng)化學(xué)習(xí)接下來(lái)值得繼續(xù)研究的問(wèn)題，一個(gè)是持續(xù)性的學(xué)習(xí)，一個(gè)是把知識(shí)利用做得更有效率，這有點(diǎn)像大語(yǔ)言模型的記憶問(wèn)題，殊途同歸。

陳佳玉：對(duì)。人也是基于獎(jiǎng)勵(lì)信號(hào)在學(xué)習(xí)我們的策略——比如你的獎(jiǎng)勵(lì)信號(hào)是考上一個(gè)大學(xué)，然后我們每天調(diào)整自己的行為。強(qiáng)化學(xué)習(xí)大致也是這樣，你給它一個(gè)目標(biāo)，比如走出迷宮，然后它不斷探索，直到學(xué)到那個(gè)行為。

但人和 Agent 的不同點(diǎn)在于，我們?nèi)耸且粋€(gè)持續(xù)學(xué)習(xí)的過(guò)程。完成上大學(xué)的目標(biāo)之后，還有讀研究生、讀博士或找好工作這一系列的目標(biāo)。而且我們?cè)趯W(xué)新任務(wù)的時(shí)候，實(shí)際上是依賴過(guò)去知識(shí)的，我們?cè)谔剿鞯臅r(shí)候也不是無(wú)目的的探索，是有先驗(yàn)知識(shí)來(lái)指導(dǎo)的。但這些先驗(yàn)知識(shí)和持續(xù)學(xué)習(xí)的過(guò)程，在當(dāng)今主流的 RL 算法中都還沒(méi)有做到。這是之后需要攻克的點(diǎn)。

Jane：回到你個(gè)人研究的話，我看你發(fā)的論文涉及逆強(qiáng)化學(xué)習(xí)、Offline RL等等，都屬于深度強(qiáng)化學(xué)習(xí)里的一些分支，是不是？

陳佳玉：是的，深度強(qiáng)化學(xué)習(xí)。我也做一些強(qiáng)化學(xué)習(xí)理論相關(guān)的東西，也做過(guò)強(qiáng)化學(xué)習(xí)在大語(yǔ)言模型中的應(yīng)用，還做過(guò)強(qiáng)化學(xué)習(xí)在人形機(jī)器人上的應(yīng)用。整體思路就是隨著強(qiáng)化學(xué)習(xí)社區(qū)的遷移，從理論到算法，再?gòu)乃惴ǖ綉?yīng)用。

Jane：你剛說(shuō)到你從理論最后還是想做具體的應(yīng)用，你還記得是哪一刻覺(jué)得不想停留在理論階段了，想把它真正放到機(jī)器人身上或一些具體的事情來(lái)看到效果？

陳佳玉：要說(shuō)具體哪一刻，應(yīng)該很難講。我做過(guò)一些理論工作，每次做理論工作的時(shí)候，不僅要推數(shù)學(xué)，還要把算法寫成代碼，然后在實(shí)驗(yàn)上去跑。就發(fā)現(xiàn)你推出來(lái)數(shù)學(xué)結(jié)構(gòu)好的，寫成代碼運(yùn)行起來(lái)效果不一定好；反而是一些理論直覺(jué)上更差的東西，實(shí)際表現(xiàn)反而更好。這是一個(gè)點(diǎn)。

另一個(gè)點(diǎn)是，在做理論的過(guò)程中，你為了得到結(jié)果要引入一些假設(shè)，但那些假設(shè)隱隱約約會(huì)感覺(jué)到與實(shí)際非常不相符。所以你可能花了很大精力做數(shù)學(xué)推導(dǎo)，得到的結(jié)果可能沒(méi)太大實(shí)際意義。我覺(jué)得這是最大的一個(gè) pain point。

而且還有一個(gè) pain point——PPO 是2017年做出來(lái)的，現(xiàn)在大家用得最多的算法，無(wú)論在大語(yǔ)言模型還是機(jī)器人本體上，還是 PPO。所以我們應(yīng)該比較清晰地意識(shí)到這個(gè)問(wèn)題：你再做出新的算法來(lái)，可能也不太會(huì)有人用。

Jane：你其實(shí)是想看到更多真正落到實(shí)際上有意義和有價(jià)值的東西，這在你做的事情上是非常重要的一個(gè)衡量維度。

陳佳玉：對(duì)，因?yàn)槟慊ê芏鄷r(shí)間在做研究，總希望自己的研究能真的用在社會(huì)中的某一個(gè)角落里。把技術(shù)應(yīng)用到一個(gè)具體的領(lǐng)域里邊，這是非常重要的。我覺(jué)得對(duì)于做科研、做技術(shù)來(lái)講，這是非常重要的一個(gè)成就。

Jane：然后講一下你在CMU機(jī)器人研究所的經(jīng)歷吧，它其實(shí)就是完全跟機(jī)器人相關(guān)的？

陳佳玉：是跟控制相關(guān)的。具體來(lái)說(shuō)，我們跟美國(guó)的通用原子公司進(jìn)行合作，他們有核聚變?cè)O(shè)施。核聚變是要在一個(gè)裝置里，以水為燃料，產(chǎn)生一個(gè)比太陽(yáng)里還要熱、壓強(qiáng)還要高的運(yùn)行環(huán)境。在那個(gè)環(huán)境里，會(huì)有一團(tuán)溫度和壓強(qiáng)都極高的等離子體。你要控制那個(gè)等離子體，不讓它接觸裝置壁，因?yàn)橐坏┙佑|到壁，就相當(dāng)于失敗了。所以這是一個(gè)難度非常大的控制問(wèn)題。

由于它是非常極端的條件——高溫高壓——物理過(guò)程不完全清楚。一方面物理過(guò)程不清楚，另一方面控制問(wèn)題又很難。所以我們的解決方法就是用他們提供的大量數(shù)據(jù)，去學(xué)一個(gè)控制策略出來(lái)。

主要的技術(shù)棧就是強(qiáng)化學(xué)習(xí)。這也是強(qiáng)化學(xué)習(xí)吸引我的點(diǎn)——幾乎所有的決策問(wèn)題，不管是離散的還是連續(xù)的，不管是過(guò)程控制問(wèn)題還是機(jī)器人控制問(wèn)題，只要它能被建模成一個(gè)馬爾可夫過(guò)程，就可以用強(qiáng)化學(xué)習(xí)去求解一個(gè)好的策略。

Jane：我理解它是一個(gè)物理系統(tǒng)，強(qiáng)化學(xué)習(xí)是一套軟件系統(tǒng)，中間是通過(guò)軟件操控硬件，把這個(gè)用在上面。如果用通俗的方式來(lái)講，怎么能讓讀者更具象地感受到這件事？

陳佳玉：強(qiáng)化學(xué)習(xí)要學(xué)到的是一個(gè)策略，具體來(lái)講就是一個(gè)神經(jīng)網(wǎng)絡(luò)。這個(gè)神經(jīng)網(wǎng)絡(luò)的輸入是當(dāng)前的觀測(cè)，輸出是控制量。在核聚變裝置里，輸入是等離子體的速度、角度、壓強(qiáng)等，輸出是怎么用那些中子束去控制等離子體。如果放到人形機(jī)器人上面，仍然是一個(gè)神經(jīng)網(wǎng)絡(luò)，輸入可能是機(jī)器人看到的東西和接受的指令，輸出是機(jī)器人的關(guān)節(jié)角度。

也就是說(shuō)，強(qiáng)化學(xué)習(xí)學(xué)的就是一個(gè)神經(jīng)網(wǎng)絡(luò)，但這個(gè)神經(jīng)網(wǎng)絡(luò)根據(jù)應(yīng)用場(chǎng)景，可以改變它的輸入和輸出。

Jane：它其實(shí)是一個(gè)元技術(shù)。核聚變是一個(gè)具體范疇的東西，但不管什么領(lǐng)域，都可能涉及到?jīng)Q策。

陳佳玉：對(duì)，強(qiáng)化學(xué)習(xí)的應(yīng)用場(chǎng)景就是持續(xù)決策和控制。

Jane：具體到場(chǎng)景的話，自動(dòng)駕駛你早期研究過(guò)，還有機(jī)器人。這兩類系統(tǒng)在決策和控制方面，有哪些共性的難題，又有哪些不一樣的地方？

陳佳玉：共性難題是它們都是一個(gè) Sensory-Motor System。都有傳感器去獲取觀測(cè)——比如汽車有視覺(jué)攝像頭、RGB-D 攝像頭，有的還有激光雷達(dá)去感知周圍的公路、草叢、行人；輸出可能就是當(dāng)前的速度和轉(zhuǎn)向。機(jī)器人本質(zhì)上也是這樣，只不過(guò)需要控制的維度更多——不是簡(jiǎn)單控制速度和轉(zhuǎn)向，而是要控制每一個(gè)關(guān)節(jié)。

區(qū)別在于，我認(rèn)為可以把自動(dòng)駕駛當(dāng)成是機(jī)器人問(wèn)題中的一個(gè)子集。城市場(chǎng)景下的自動(dòng)駕駛是一個(gè)結(jié)構(gòu)化或半結(jié)構(gòu)化場(chǎng)景中的問(wèn)題——馬路的形狀是可以事先獲取的，交通規(guī)則是固定的，車道線也是固定的。但機(jī)器人的范圍很廣，比如家居場(chǎng)景的機(jī)器人要處理的是非結(jié)構(gòu)化的環(huán)境——每個(gè)人家都不一樣，沒(méi)有統(tǒng)一化的規(guī)則。所以我更傾向于把自動(dòng)駕駛看作是機(jī)器人問(wèn)題中的一個(gè)子問(wèn)題，相對(duì)于通用機(jī)器人來(lái)講，是一個(gè)稍微簡(jiǎn)單一些的問(wèn)題。

Jane：確實(shí)，從機(jī)器人場(chǎng)景適應(yīng)的復(fù)雜性上來(lái)說(shuō)，確實(shí)要比自動(dòng)駕駛完全不是一個(gè)量級(jí)。

陳佳玉：對(duì)，因?yàn)闄C(jī)器人范圍很廣。工廠里有機(jī)械臂，深海探測(cè)有深海探測(cè)機(jī)器人，靶向用藥有納米機(jī)器人。機(jī)器人范疇很廣，自動(dòng)駕駛可能就是機(jī)器人中的一個(gè)問(wèn)題，它們并不是并列關(guān)系。

Jane：現(xiàn)在你覺(jué)得在研究也好、產(chǎn)業(yè)也好，發(fā)展通用機(jī)器人的技術(shù)路徑上還有哪些非共識(shí)的地方？

陳佳玉：我認(rèn)為在發(fā)展通用機(jī)器人的路徑上，看似收斂，但方向?qū)Σ粚?duì)大家還不知道。

看似收斂是因?yàn)榇蠹液孟穸荚谟?VLA 在做。這可以理解，有兩個(gè)原因：第一，VLA 這個(gè)路徑本質(zhì)上是對(duì)大語(yǔ)言模型路徑的一個(gè)復(fù)制——用大數(shù)據(jù)、大算力、大模型得到一個(gè)通用的 Foundation Model。大家看到了大語(yǔ)言模型的成功，所以想走 VLA 這條路。第二，國(guó)外有一些領(lǐng)先的公司，比如 Physical Intelligence，確實(shí)做出了很好的 VLA 模型，導(dǎo)致特別是國(guó)內(nèi)公司基本上都在做 VLA，把精力放在采大量數(shù)據(jù)、堆算力、訓(xùn) VLA 模型、做 demo。

但實(shí)際上，正確的路是什么，大家現(xiàn)在還不知道。因?yàn)楝F(xiàn)在 VLA 還走不出 demo——任何一個(gè)公司發(fā)布了一個(gè) VLA 之后，如果讓大家隨便去試，很容易發(fā)現(xiàn)它泛化性的問(wèn)題。

VLA 成立的假設(shè)是你有無(wú)限多的數(shù)據(jù)，就能學(xué)到一個(gè)像大語(yǔ)言模型那樣無(wú)所不能的東西。但這不太成立，因?yàn)榇笳Z(yǔ)言模型之所以成功，是因?yàn)樗幚淼恼Z(yǔ)言是單一模態(tài)。而 VLA 是一個(gè)多模態(tài)的問(wèn)題，所需的數(shù)據(jù)要遠(yuǎn)遠(yuǎn)高于大語(yǔ)言模型，但我們擁有的視覺(jué)、觸覺(jué)數(shù)據(jù)以及包含 action 的數(shù)據(jù)非常少，采集成本非常高。也就是說(shuō)，VLA 相比大語(yǔ)言模型需要更多的數(shù)據(jù)，但采集成本更高。所以這個(gè)模式聽(tīng)起來(lái)不太 work——你照搬了大語(yǔ)言模型的路，但照搬得不太對(duì)。

那如果不走這條路，我們?cè)趺醋呦蛲ㄓ弥悄荏w？就像我剛才講的，它是一個(gè)非常復(fù)合的技術(shù)，大家對(duì)這方面的技術(shù)路線還沒(méi)有形成共識(shí)。從我自己來(lái)講，我認(rèn)為要真走到那一步，就得真的去做類人智能的研究——持續(xù)性的強(qiáng)化學(xué)習(xí)以及很好地融合先驗(yàn)知識(shí)的強(qiáng)化學(xué)習(xí)過(guò)程，是很必要的。

第二部分：職業(yè)選擇與產(chǎn)學(xué)研合作

Aaron：陳老師，我們現(xiàn)在聊一下職業(yè)選擇上的變化吧。你在港大之外，其實(shí)也加入了原力無(wú)限。我們比較好奇的是，從助理教授到正教授基本上已經(jīng)是大多數(shù)人覺(jué)得非常好的路徑了，特別是在港大這個(gè)平臺(tái)上。您為什么沒(méi)有走一條完全純學(xué)術(shù)的道路，而是選擇加入一家創(chuàng)業(yè)公司呢？

陳佳玉：因?yàn)槲覀円龅臇|西——通用的具身智能，實(shí)際上是一個(gè)需要很多很多資源的事情。比如你需要大量的研發(fā)資金來(lái)購(gòu)買機(jī)器人和招學(xué)生，同時(shí)也需要很多算力來(lái)訓(xùn)那些基礎(chǔ)模型。最重要的是你得有做實(shí)驗(yàn)的場(chǎng)地。但作為一個(gè) Junior Faculty 來(lái)講，在經(jīng)費(fèi)、算力和場(chǎng)地上都是非常窘迫的狀態(tài)。這是一個(gè)共有的問(wèn)題，特別是場(chǎng)地問(wèn)題——在港大，我們沒(méi)有實(shí)驗(yàn)的 space，基本上做不了任何真機(jī)的 Robot 實(shí)驗(yàn)，這是一個(gè)現(xiàn)實(shí)的困境。

其實(shí)在接觸到原力無(wú)限之前，我就已經(jīng)給香港政府寫了一個(gè) proposal 要做通用型家務(wù)機(jī)器人，但心里也有 concern，就是經(jīng)費(fèi)、算力和場(chǎng)地的問(wèn)題。和原力無(wú)限合作的話，他們可以提供算力、場(chǎng)地以及研究經(jīng)費(fèi)。相當(dāng)于雙方在資源稟賦與研究能力上形成了互補(bǔ)，這使很多原本難以推進(jìn)的真機(jī)研究得以加速展開(kāi)。我覺(jué)得更像是一種產(chǎn)學(xué)研結(jié)合，不是說(shuō)對(duì)港大這個(gè)平臺(tái)不滿意，而是我們確實(shí)需要更多資源來(lái)推進(jìn)我們想做的研究。

Aaron：明白。這種算力和資源的稀缺，應(yīng)該是現(xiàn)在學(xué)術(shù)界一個(gè)非常普遍的狀況。不管是大語(yǔ)言模型的研發(fā)還是具身智能的研發(fā)，其實(shí)是由產(chǎn)業(yè)界來(lái)主導(dǎo)的，因?yàn)樗麄兗扔兴懔σ灿绣X也有人。學(xué)術(shù)界可能反而稍微滯后了一些，所以就會(huì)采用這種產(chǎn)學(xué)合作的模式。

陳佳玉：對(duì)，是這樣。

陳佳玉：我覺(jué)得在于雙方合作中互相表現(xiàn)出的誠(chéng)意。我認(rèn)為最重要的一點(diǎn)是愿景一致——我在接觸他們之前就寫了做家務(wù)機(jī)器人、通用機(jī)器人的 proposal，而他們想做的正好是具身大腦，以及商業(yè)、制造、文旅、家庭等多場(chǎng)景落地，這與我長(zhǎng)期關(guān)注的通用機(jī)器人和家務(wù)場(chǎng)景研究方向能夠形成很好銜接。第二是他們的商業(yè)化做得很好，有充足的資金來(lái)支持研究，能給我們實(shí)驗(yàn)室提供比較穩(wěn)定的支持。第三是大家互相表現(xiàn)出誠(chéng)意——公司給了我很大的信任，讓我去主導(dǎo)一個(gè)聯(lián)合實(shí)驗(yàn)室，投入了很多資源，讓我去探索我想探索的方向。愿景一致，又給了很多的支持和信任，Why not？

Aaron：我比較好奇，從PhD階段在導(dǎo)師實(shí)驗(yàn)室里，到博后階段，到現(xiàn)在作為獨(dú)立faculty建立自己的實(shí)驗(yàn)室并主動(dòng)選擇和產(chǎn)業(yè)界合作，這里面最大的變化是什么？

陳佳玉：做 PhD 期間主要就是埋頭研究，鍛煉獨(dú)立研究的能力，這是最大的 focus。到博后階段，就多了一些寫 proposal 和指導(dǎo)學(xué)生的經(jīng)歷，在為做 faculty 做準(zhǔn)備。到真正開(kāi)始做獨(dú)立 faculty，我發(fā)現(xiàn)最重要的是能夠有自己的研究哲學(xué)——清楚自己可能很長(zhǎng)的一段研究生涯要解決一個(gè)什么大問(wèn)題。然后圍繞這些大問(wèn)題去搭建自己的團(tuán)隊(duì)：最根本的是拿到足夠的研究經(jīng)費(fèi)，基于經(jīng)費(fèi)去布置實(shí)驗(yàn)室的硬件，招相關(guān)方向的人。簡(jiǎn)單來(lái)講就是拿錢，還有構(gòu)建自己的實(shí)驗(yàn)室，和做 PhD 以及做 PostDoc 還是蠻不一樣的。

Aaron：您剛也提過(guò)有自己的研究哲學(xué)，跟原力無(wú)限之間有非常匹配的mission。能展開(kāi)講一下嗎？包括你提到要做家務(wù)場(chǎng)景機(jī)器人，這是你們未來(lái)發(fā)展的方向？

陳佳玉：對(duì)的。最大的 match 是，我們都希望去解決通用機(jī)器人的核心問(wèn)題。對(duì)公司而言，是圍繞具身大腦做多場(chǎng)景落地；對(duì)我個(gè)人而言，家庭/家務(wù)場(chǎng)景是其中一個(gè)最具挑戰(zhàn)也最有長(zhǎng)期價(jià)值的方向。技術(shù)路線上，他們給了我比較大的信任，支持我做我本來(lái)就想做的技術(shù)路線。具體來(lái)說(shuō)就是研究基于 VLA 的一個(gè)持續(xù)學(xué)習(xí)過(guò)程，以及融合世界模型、VLA 和一些多模態(tài)知識(shí)庫(kù)的類人智能。這是在探索一個(gè)和當(dāng)前大家做的都不太一樣的、但更接近類人智能的方向。我們想做的東西一致，研究方向上他們也給了很大的支持和信任。

Aaron：那陳老師，在你眼里，目前具身智能領(lǐng)域最被高估的一類問(wèn)題是什么？哪些問(wèn)題可能被誤以為是核心問(wèn)題，但實(shí)際上對(duì)行業(yè)本質(zhì)發(fā)展的貢獻(xiàn)是有限的？

陳佳玉：我認(rèn)為現(xiàn)在大家對(duì)具身智能最高估的一點(diǎn)，就是把Scaling Law從大語(yǔ)言模型搬到 VLA 上。因?yàn)?Scaling Law 在大語(yǔ)言模型上得到了驗(yàn)證——更多的數(shù)據(jù)、更大的模型、更多的 test-time computation，效果就更好?，F(xiàn)在大家想把那一套搬到 VLA 里，覺(jué)得采更多數(shù)據(jù)效果就會(huì)更好。

但我認(rèn)為這個(gè)東西非常貴——采數(shù)據(jù)貴，算力也貴，關(guān)鍵是它還沒(méi)那么 promising。你看現(xiàn)在 GPT-4o 和 GPT-5 的研發(fā)周期非常長(zhǎng)，但效果不明顯。這說(shuō)明即使在大語(yǔ)言模型這種有海量數(shù)據(jù)、單一模態(tài)的建模問(wèn)題上，Scaling 都不會(huì)是最終解決方案。應(yīng)用到 VLA 上大概率也不是，因?yàn)?VLA 是非常多模態(tài)的、數(shù)據(jù)非常稀少的、采集成本非常高的。

我認(rèn)為大家應(yīng)該想一想——人工智能怎么在數(shù)據(jù)有限的情況下進(jìn)行學(xué)習(xí)？這才是一個(gè)性價(jià)比更高的方向?，F(xiàn)在大家都做 Data-Driven Research，一個(gè)方向是拼命搞更多的數(shù)據(jù)，但大家普遍比較忽視的是怎么在數(shù)據(jù)有限的情況下更高效地學(xué)習(xí)，也就是在學(xué)習(xí)機(jī)制上的研究。我認(rèn)為這是一個(gè) misleading 的點(diǎn)。

陳佳玉：而且具身智能和大語(yǔ)言模型不一樣的另一個(gè)點(diǎn)是——大語(yǔ)言模型即便犯再離譜的錯(cuò)誤，它也只是生成文本，用不用還是由人來(lái)決定。而具身智能如果在部署過(guò)程中出現(xiàn)大的錯(cuò)誤，比如在工廠里或家里，實(shí)際上是很危險(xiǎn)的。也就是說(shuō)，它必須有可保證的泛化性、魯棒性和安全性。但目前這條路線要 copy 大語(yǔ)言模型，是沒(méi)辦法給出這種保證的。

Aaron：明白。那你覺(jué)得長(zhǎng)期被低估的硬核問(wèn)題又是哪些？

陳佳玉：我認(rèn)為被低估的問(wèn)題是——做更類人的智能。大家要去想人是怎么學(xué)習(xí)的，然后把它搬到機(jī)器上。這是一個(gè)非常被低估的方向，也是一個(gè)特有意思的方向。你去觀察那些嬰兒，他們接觸到很少很少的數(shù)據(jù)就能表現(xiàn)得非常 robust 和 general。人類比機(jī)器好的點(diǎn)就是——它的 robustness 和 generalization 都非常好，而且只依賴非常少的數(shù)據(jù)。

所以我認(rèn)為一個(gè)真正投入不足的點(diǎn)，就是怎么更類人地去學(xué)習(xí)。大家現(xiàn)在也在做類人——做人形機(jī)器人，但做的內(nèi)容是像人的形態(tài)一樣。大家沒(méi)有去考慮類人的學(xué)習(xí)機(jī)制。這是一個(gè)被低估的方向。類人不能只是形態(tài)上的類人，我們必須要有學(xué)習(xí)機(jī)制上的類人。

Aaron：你怎么理解現(xiàn)在具身智能的發(fā)展階段？如果用GPT來(lái)類比，現(xiàn)在算是GPT-3、GPT-4還是能到GPT-5這個(gè)階段了？

陳佳玉：我覺(jué)得還遠(yuǎn)遠(yuǎn)沒(méi)到 ChatGPT 那個(gè)程度，我覺(jué)得大概是 GPT-1、GPT-2 差不多。因?yàn)?ChatGPT 剛出來(lái)的時(shí)候就已經(jīng)比較 capable 了，我當(dāng)時(shí)還試了一下，讓它證明數(shù)學(xué)分析里的一些定理，它出來(lái)之后一度引起 OpenAI 服務(wù)器宕機(jī)——說(shuō)明它是真的有用了，而且能經(jīng)得住大家的測(cè)試。但現(xiàn)在的具身智能都走不出 demo，甚至 demo 都是精心剪輯才能做出來(lái)，更不要說(shuō)能經(jīng)得住大家的測(cè)試了。

Aaron：那你覺(jué)得具身智能的ChatGPT時(shí)刻還有多久？

陳佳玉：我不知道，但我之前看了楊立昆的一個(gè) talk，他的愿景就是更類人，和我很一致。他給主持人的答復(fù)是五到二十年。我認(rèn)為要想真正做出可以用的具身智能，在算法方面還需要另一層突破——得更類人，達(dá)到像人那樣的數(shù)據(jù)效率、泛化性和魯棒性。這需要算法上的突破，我不知道需要多少年，但楊立昆說(shuō)是五到二十年，所以 let's see。

Aaron：你剛也提到很多機(jī)器人走不出demo場(chǎng)景。很多機(jī)器人在視頻里可能看起來(lái)非?？苹茫B衣服或者跳舞，但真正在一個(gè)陌生場(chǎng)景里就基本不太能function了。你怎么理解這種巨大的落差？到底是算法的問(wèn)題，還是工程的問(wèn)題？

陳佳玉：是算法上的問(wèn)題。當(dāng)前算法依賴大量的數(shù)據(jù)，但跨場(chǎng)景的數(shù)據(jù)需求是指數(shù)級(jí)增長(zhǎng)的。當(dāng)前算法最大的弊病就是得有非常海量的數(shù)據(jù)才會(huì)有泛化性，數(shù)據(jù)不足就自然不會(huì)有泛化性。所以肯定是算法上的問(wèn)題。

Aaron：你想做的是家庭場(chǎng)景機(jī)器人，為什么選擇這個(gè)方向？你覺(jué)得現(xiàn)在很多機(jī)器人場(chǎng)景中，什么場(chǎng)景在短期內(nèi)比較promising？

陳佳玉：其實(shí)分三類場(chǎng)景——工業(yè)、商業(yè)和家庭。短期內(nèi)我認(rèn)為最好做的是商業(yè)場(chǎng)景。我們分析一下：工業(yè)場(chǎng)景要引入機(jī)器人，得有非常高的效率，有一個(gè)效率門檻；家庭場(chǎng)景有一個(gè) safety 的問(wèn)題——機(jī)器人不能出問(wèn)題，撞壞家具是小事，撞壞人就是大事了。商業(yè)場(chǎng)景反而是對(duì)效率要求不高、對(duì)安全性要求也不高的，所以實(shí)際上最有可能率先落地。

從公司實(shí)踐來(lái)看，原力無(wú)限已經(jīng)在商業(yè)、制造、文旅等場(chǎng)景形成多類機(jī)器人產(chǎn)品和解決方案落地，短期更容易跑通的是結(jié)構(gòu)更清晰、容錯(cuò)更高的商業(yè)化場(chǎng)景。

但我們之所以做家庭場(chǎng)景，是從長(zhǎng)期來(lái)看。我們?cè)谶x場(chǎng)景的時(shí)候得想，最希望機(jī)器人部署在哪？如果讓機(jī)器人部署在流水線上或工廠里替代藍(lán)領(lǐng)工作，實(shí)際上是一件非常殘酷的事情。我們更希望機(jī)器人出現(xiàn)在危險(xiǎn)的場(chǎng)景下，或者出現(xiàn)在家庭場(chǎng)景下——假如人們都不需要做家務(wù)了，那就是一個(gè)非常大的 relief。做家庭機(jī)器人是從我們自身的愿景出發(fā)，并不是單純認(rèn)為它短期內(nèi)好落地。

Aaron：所以工業(yè)場(chǎng)景在你的理解中，是處于商業(yè)場(chǎng)景和家庭場(chǎng)景中間？最難的是家庭場(chǎng)景，因?yàn)榘踩宰罡撸?/strong>

陳佳玉：也不能這么說(shuō)。工業(yè)場(chǎng)景對(duì)效率要求比較高，這是它的難點(diǎn)；家庭場(chǎng)景對(duì)安全性要求比較高，這是另一個(gè)難點(diǎn)。但它們?cè)趺幢?，不好比?/p>

第三部分：具身大腦、世界模型與產(chǎn)業(yè)格局

Aaron：在你看來(lái)，機(jī)器人要真正變得足夠能干，或者跟人一樣能干，最重要需要的能力項(xiàng)是什么？是需要更好的感知、更強(qiáng)的世界理解，還是真正的決策能力？

陳佳玉：我覺(jué)得它得更好地理解這個(gè)世界，理解這個(gè)世界的一些基礎(chǔ)因果?，F(xiàn)在的學(xué)習(xí)方法更像是——你給它一個(gè)視頻，你拿著杯子，突然撒手，杯子掉了。它很容易就學(xué)習(xí)到：你拿一個(gè)杯子，如果撒手就會(huì)掉。但如果它學(xué)到因果，它就會(huì)明白這個(gè)杯子掉是因?yàn)橛兄亓?，如果沒(méi)有一個(gè)向上的力，它就會(huì)掉。如果它學(xué)到因果，就可以很好地泛化——你把杯子換成一個(gè)壺，它也明白如果撒手也會(huì)掉。

也就是說(shuō)，機(jī)器人如果真的理解了這個(gè)世界，就往類人方向進(jìn)了一大步?；谶@個(gè)理解，再連接它的小腦部分——更敏捷、更精確的控制，這個(gè)實(shí)際上是相對(duì)好做的。我認(rèn)為比較難做的是大腦這部分，就是真的有那種類人的、對(duì)世界的理解。

Aaron：具有這種世界理解能力的世界模型，大概發(fā)展到什么階段了？

陳佳玉：世界模型比較特殊，它和 VLA 不一樣——世界模型的技術(shù)路線還沒(méi)有收斂。

比較有代表性的一派是**楊立昆（Yann LeCun）**之前在 Meta 做的JEPA（Joint Embedding Predictive Architecture），他認(rèn)為訓(xùn)練過(guò)程中不能有生成的部分——學(xué)術(shù)上講就是只能用 encoder，不能用 decoder。由于不能用 decoder，它就不能是一個(gè)監(jiān)督學(xué)習(xí)，而是一個(gè)自監(jiān)督學(xué)習(xí)。這是一派。

另一派像李飛飛做視覺(jué)這一派，或者 OpenAI 做的Sora那種視頻生成模型，他們是用海量的視頻數(shù)據(jù)進(jìn)行監(jiān)督學(xué)習(xí)來(lái)訓(xùn)世界模型。

兩派各自有自己的成果，但只能說(shuō)技術(shù)路線還沒(méi)有收斂。而且比較成功的世界模型 demo，基本上就是用世界模型去生成視頻，或者用世界模型生成一個(gè)模擬器。它的邏輯和大語(yǔ)言模型沒(méi)有什么區(qū)別——給它輸入、給它輸出，做監(jiān)督學(xué)習(xí)。監(jiān)督學(xué)習(xí)本質(zhì)上就是一個(gè) regression 問(wèn)題，那它仍然會(huì)和大語(yǔ)言模型面臨一樣的問(wèn)題：對(duì)數(shù)據(jù)依賴很強(qiáng)，方法沒(méi)有保證。

我認(rèn)為現(xiàn)在世界模型還得再問(wèn)深一點(diǎn)——有沒(méi)有一種學(xué)習(xí)機(jī)制，讓世界模型真的明白這個(gè)世界的一些物理定律或者因果？大家對(duì)這方面的研究還不深，我認(rèn)為這也是技術(shù)目前還沒(méi)有收斂的原因。

Aaron：所以世界模型現(xiàn)在也跟大語(yǔ)言模型一樣，還在大力出奇跡的階段，算法也沒(méi)有特別有效率的出現(xiàn)。

陳佳玉：對(duì)。我認(rèn)為具身智能的下一步，絕對(duì)需要不同于 VLA 或世界模型的技術(shù)出現(xiàn)。而且研究重點(diǎn)應(yīng)該在大腦這一塊。

Aaron：說(shuō)回到?jīng)Q策上面，現(xiàn)在很多多模態(tài)大模型已經(jīng)能看懂很多東西了，但你覺(jué)得"看懂"和"會(huì)決定"之間大概是什么樣的差距？

陳佳玉：看懂和會(huì)決定，實(shí)際上就差一個(gè)策略——你得依據(jù)你看懂的東西，得出當(dāng)前應(yīng)該執(zhí)行的一個(gè)動(dòng)作。這個(gè)策略可以通過(guò)模仿學(xué)習(xí)去學(xué)，也可以通過(guò)強(qiáng)化學(xué)習(xí)去學(xué)。問(wèn)題在于：如果用模仿學(xué)習(xí)，你就得提供專家示例，那就是一個(gè)數(shù)據(jù)驅(qū)動(dòng)的方法，依賴很多數(shù)據(jù)；如果用強(qiáng)化學(xué)習(xí)，就還是我剛才說(shuō)的問(wèn)題——當(dāng)前的強(qiáng)化學(xué)習(xí)算法每學(xué)一個(gè)新任務(wù)都要從頭學(xué)，不是一個(gè)持續(xù)學(xué)習(xí)的過(guò)程。它不能應(yīng)用以前學(xué)到的知識(shí)，什么都得從頭學(xué)，導(dǎo)致采樣效率非常低。

所以從能讀懂這個(gè)世界到能做出好的決策之間，我們其實(shí)還需要一個(gè)好的持續(xù)強(qiáng)化學(xué)習(xí)的算法。

Jane：現(xiàn)在機(jī)器學(xué)習(xí)的能力還是沒(méi)有辦法做到快速遷移、適應(yīng)不同環(huán)境，對(duì)吧？

陳佳玉：還不能。遷移就是泛化。泛化的話，大語(yǔ)言模型已經(jīng)做得很好了，因?yàn)樗鼣?shù)據(jù)量夠大，而且是單一模態(tài)的任務(wù)。但具身智能的泛化性還是很差，因?yàn)閳D片包含的信息比文字要多得多。這意味著你要實(shí)現(xiàn)很好的泛化性，就要提供比文本數(shù)據(jù)多得多的視頻數(shù)據(jù)。但視覺(jué)數(shù)據(jù)又恰恰比文本數(shù)據(jù)更難獲取。所以泛化很難，以現(xiàn)在的算法途徑來(lái)看，遷移或適應(yīng)也很難。

Jane：好，前面世界模型跟VLA是密不可分的，而且我覺(jué)得這兩個(gè)在定義層面都是極其非共識(shí)的地方。你怎么理解所謂的世界模型？有人甚至覺(jué)得它就是一個(gè)理論名詞。以及它和VLA之間的關(guān)系到底是什么？

陳佳玉：VLA 是依據(jù)當(dāng)前觀測(cè)得到當(dāng)前的動(dòng)作；世界模型是依據(jù)當(dāng)前的觀測(cè)和當(dāng)前的動(dòng)作，得到下一個(gè)時(shí)刻狀態(tài)的預(yù)測(cè)。

我這么解釋吧：你觀察到面前有一個(gè)杯子，然后你把它舉起來(lái)——這是一個(gè)從觀測(cè)到動(dòng)作的過(guò)程，可以用 VLA 來(lái)實(shí)現(xiàn)。然后你想知道，把杯子舉起來(lái)之后它會(huì)是什么狀態(tài)？得到這個(gè)預(yù)測(cè)是通過(guò)世界模型來(lái)實(shí)現(xiàn)的。

也就是說(shuō)，它們是兩個(gè)函數(shù)，功能不一樣。

Jane：現(xiàn)在各家公司都在做這塊，但背后各自的算法技術(shù)其實(shí)完全不一樣吧？

陳佳玉：我認(rèn)為恰恰相反。大家的算法其實(shí)是很相似的，不一樣的是數(shù)據(jù)和工程上的一些 tricks，但算法上相似度極高。

Jane：你之前提到你們做的類人智能研究，它是哪個(gè)part的事情？

陳佳玉：實(shí)際上就是怎么去訓(xùn) VLA。大家現(xiàn)在訓(xùn) VLA 就是給它輸入數(shù)據(jù)、輸出數(shù)據(jù)，做一個(gè)擬合——得到大量數(shù)據(jù)，像訓(xùn)練大語(yǔ)言模型一樣訓(xùn)練一個(gè) VLA。我們不一樣的點(diǎn)是，我們想用一種持續(xù)學(xué)習(xí)的機(jī)制來(lái)訓(xùn) VLA。他們用監(jiān)督學(xué)習(xí)方法來(lái)訓(xùn)，我們想用持續(xù)學(xué)習(xí)方法來(lái)訓(xùn)，這是區(qū)別點(diǎn)。

我們做的另一個(gè)不同點(diǎn)是，怎么去用世界模型。我們是把世界模型作為機(jī)器人知識(shí)庫(kù)的一部分，來(lái)輔助 VLA 的訓(xùn)練。

總結(jié)一下：第一，我們 VLA 的訓(xùn)練方式不一樣——大家普遍用監(jiān)督學(xué)習(xí)，我們?cè)谔剿饕环N持續(xù)學(xué)習(xí)的方式。第二，怎么用世界模型來(lái)訓(xùn) VLA，我們和大家做的也不太一樣?，F(xiàn)在大家用世界模型訓(xùn) VLA 基本上兩個(gè)路徑：一個(gè)是用世界模型去生成數(shù)據(jù)，然后用生成數(shù)據(jù)去訓(xùn) VLA；另一個(gè)是把世界模型當(dāng)做一個(gè)模擬器，在模擬器里訓(xùn) VLA。我們則是要建立一個(gè)知識(shí)庫(kù)，知識(shí)庫(kù)里包含實(shí)體之間的聯(lián)系以及層次抽象，我們把世界模型作為層次抽象的一部分，用來(lái)訓(xùn) VLA。

Jane：你自己的研究方向堅(jiān)定會(huì)認(rèn)為這條路是有效的？

陳佳玉：對(duì)，因?yàn)楦惾?。我們?nèi)瞬痪褪且粋€(gè)持續(xù)學(xué)習(xí)的過(guò)程嘛——你今天學(xué)數(shù)學(xué)物理，明天學(xué) Robotics，學(xué) Robotics 的時(shí)候就是在應(yīng)用你學(xué)的數(shù)學(xué)和物理。人就是一個(gè)持續(xù)學(xué)習(xí)的過(guò)程，那你想做出一個(gè)類人的機(jī)器人來(lái)，為什么不用一個(gè)持續(xù)學(xué)習(xí)的過(guò)程呢？

Jane：你們已經(jīng)在這條路上看到一些泛化能力的變化了嗎？

陳佳玉：對(duì)，我們?cè)谕瑫r(shí)進(jìn)行好幾項(xiàng)關(guān)于持續(xù)學(xué)習(xí)的研究，后面會(huì)陸陸續(xù)續(xù)出來(lái)。因?yàn)槲覀冞@個(gè)合作其實(shí)也剛剛開(kāi)始。

Jane：還有一個(gè)數(shù)據(jù)的問(wèn)題。大家堅(jiān)持不同的數(shù)據(jù)路線，可能導(dǎo)致規(guī)?；怀闪⒌狞c(diǎn)是什么？每條路線的問(wèn)題是什么？你們的選擇又是什么？

陳佳玉：數(shù)據(jù)方面，大家現(xiàn)在確實(shí)存在分歧。

以Physical Intelligence為代表的一派認(rèn)為真實(shí)數(shù)據(jù)為王——必須給模型足夠多的真實(shí)數(shù)據(jù)，才可能訓(xùn)出來(lái)比較好的 VLA。

以英偉達(dá)為代表的一派認(rèn)為仿真數(shù)據(jù)為王——因?yàn)椴杉鎸?shí)數(shù)據(jù)成本太高，得依賴高度可信的仿真來(lái)并行化、低成本地產(chǎn)生大量數(shù)據(jù)。

還有一類，像李飛飛為代表的，認(rèn)為數(shù)據(jù)應(yīng)該是世界模型生成的——生成的環(huán)境更可控，給一個(gè) text prompt 就能立刻生成一個(gè)環(huán)境，然后在里面生成數(shù)據(jù)。

大家這方面還沒(méi)有形成共識(shí)。目前來(lái)看最有效的是用真實(shí)數(shù)據(jù)，以及真實(shí)數(shù)據(jù)和仿真數(shù)據(jù)聯(lián)合訓(xùn)練。

我們目前不太做 data-centric research，我們會(huì)觀察哪種數(shù)據(jù)的成功率更好，follow 他們的研究用一樣的數(shù)據(jù)。因?yàn)槲覀兊难芯恐攸c(diǎn)不在于用什么數(shù)據(jù)，而是采用什么樣的學(xué)習(xí)機(jī)制，可以更有效地應(yīng)用這些數(shù)據(jù)。

Jane：關(guān)于真實(shí)數(shù)據(jù)，之前有人提出一個(gè)質(zhì)疑——如果真實(shí)數(shù)據(jù)是真機(jī)采集的，一旦機(jī)器迭代，那些數(shù)據(jù)可能就完全沒(méi)用了，數(shù)據(jù)規(guī)?；浅ｋy實(shí)現(xiàn)。

陳佳玉：對(duì)，所以你在采數(shù)據(jù)的時(shí)候，數(shù)據(jù)的形式要比較 general 一些，不能和采集設(shè)備綁得太死。比如你的輸入是圖片，輸出是歸一化之后的關(guān)節(jié)位置，這種通用格式的數(shù)據(jù)是可以遷移、甚至遷移到不同本體上的。

但我認(rèn)為大家還得想清楚一個(gè)問(wèn)題：能不能在采數(shù)據(jù)之前，對(duì)需要采集的數(shù)據(jù)量進(jìn)行一個(gè)估算？如果估算出來(lái)采多少數(shù)據(jù)都不會(huì)達(dá)到最終目的，那你還要不要采這個(gè)數(shù)據(jù)？這是一個(gè) question mark。

Jane：而且不同機(jī)型的數(shù)據(jù)采集出來(lái)，也不是行業(yè)可以共用的，因?yàn)楝F(xiàn)在機(jī)型差別太大——身高大小、有沒(méi)有臂、輪子還是腳。

陳佳玉：對(duì)，你可以做一些 retargeting——比如兩個(gè)人形機(jī)器人大小不一樣，但參數(shù)你都有，比如臂長(zhǎng)、身高，你可以用 retargeting 把小機(jī)器人的數(shù)據(jù) retarget 到大機(jī)器人身上，這是可以做到的。但如果跨得再厲害一些，比如人形機(jī)器人和機(jī)器狗之間，就不太好共用了。不過(guò)如果是同一類型的機(jī)器人只是大小不一樣，是可以做到一定程度的共用的。

Jane：目前你們最缺的是哪種類型的數(shù)據(jù)？

陳佳玉：最缺的是那些真的需要人去采集、不能通過(guò)仿真來(lái)生成的數(shù)據(jù)。比如疊衣服、系鞋帶、擰螺絲這種——必須得用人來(lái)采，很難通過(guò)仿真或者生成的方式獲得。

Jane：我突然意識(shí)到，遙操作作為一個(gè)商業(yè)模式產(chǎn)品，在這個(gè)時(shí)候其實(shí)非常成立。

陳佳玉：對(duì)，因?yàn)榫褪菫榱瞬蓴?shù)據(jù)。邏輯是這樣的：大語(yǔ)言模型驗(yàn)證了 Scaling Law 成立——從模型到 Scaling，從 Scaling 到數(shù)據(jù)，從數(shù)據(jù)再到遙操作，它這個(gè)需求鏈條就是這樣的。

Jane：然后原力無(wú)限是"一腦多身多場(chǎng)景"，為什么選擇這個(gè)范式？

陳佳玉：因?yàn)橐鐾ㄓ脵C(jī)器人，最難的部分就是做大腦——對(duì)世界的理解。如果你想做的是一個(gè)大腦，你就沒(méi)有必要限制它的應(yīng)用場(chǎng)景。只不過(guò)在具體的商業(yè)計(jì)劃中會(huì)一個(gè)一個(gè)場(chǎng)景地攻克——比如先做家居場(chǎng)景，再做商業(yè)場(chǎng)景，再做工業(yè)場(chǎng)景。但如果大腦做得很成熟了，就沒(méi)有必要限制應(yīng)用場(chǎng)景，它的應(yīng)用范圍會(huì)是非常廣的。這也是原力無(wú)限當(dāng)前‘聚焦具身大腦、賦能多形態(tài)本體、驅(qū)動(dòng)場(chǎng)景規(guī)?；暮诵倪壿嫛?/p>

Jane：現(xiàn)在大家錨定某個(gè)場(chǎng)景的核心原因，是因?yàn)榇_實(shí)大腦也只能用在那個(gè)場(chǎng)景中。

陳佳玉：是的。你做出來(lái)的模型只能用于一個(gè)場(chǎng)景，但你用來(lái)訓(xùn)那個(gè)模型的方法是可以跨場(chǎng)景應(yīng)用的。另外，如果你針對(duì)每一個(gè)場(chǎng)景都訓(xùn)練了模型，把它們分別部署到所屬的場(chǎng)景，它們就會(huì)日夜產(chǎn)生數(shù)據(jù)，你就擁有了大量跨場(chǎng)景的數(shù)據(jù)。那你能不能運(yùn)用這些跨場(chǎng)景的數(shù)據(jù)去得到一個(gè)跨場(chǎng)景的模型呢？這是第二階段的問(wèn)題了。

Jane：現(xiàn)在大家都還在第一階段。

陳佳玉：對(duì)，先做出單場(chǎng)景好用的模型，部署下去產(chǎn)生數(shù)據(jù)，然后再把一個(gè)多場(chǎng)景的模型做出來(lái)。這是第一階段和第二階段的關(guān)系。

Jane：這個(gè)底層變化會(huì)不會(huì)有一個(gè)類似Transformer級(jí)別的技術(shù)架構(gòu)，能突然讓這件事變成一個(gè)可以統(tǒng)一的事情？

陳佳玉：架構(gòu)和學(xué)習(xí)方法還是兩種東西。架構(gòu)的話，就是你用 Diffusion 還是 Transformer，這是架構(gòu)選擇上的問(wèn)題。我倒覺(jué)得這個(gè)不是那么本質(zhì)。本質(zhì)的還是說(shuō)，你怎么去學(xué)——你是用監(jiān)督學(xué)習(xí)、還是強(qiáng)化學(xué)習(xí)、還是一種持續(xù)性的學(xué)習(xí)？我認(rèn)為學(xué)習(xí)機(jī)制是一個(gè)比架構(gòu)更本質(zhì)的問(wèn)題。

Jane：那你覺(jué)得整個(gè)產(chǎn)業(yè)格局大概會(huì)走向什么樣的形態(tài)？

陳佳玉：我覺(jué)得最終可能會(huì)走向大公司做大腦，小公司做場(chǎng)景化的小腦。為什么？因?yàn)樽龃竽X需要大量的算力和數(shù)據(jù)投入，這不是小公司能承受的。小公司做什么呢？針對(duì)具體場(chǎng)景去落地——做場(chǎng)景化的小腦，用大公司的基礎(chǔ)大腦去適配特定場(chǎng)景。有點(diǎn)類似大語(yǔ)言模型的格局：OpenAI 做基礎(chǔ)模型，然后大量的應(yīng)用公司在上面做各種應(yīng)用。

Jane：所以你覺(jué)得具身智能最終也會(huì)形成這種分層的格局？

陳佳玉：我覺(jué)得是有可能的。但也有可能不一樣——因?yàn)榫呱碇悄苌婕暗接布幌翊笳Z(yǔ)言模型純粹是軟件。硬件上的差異化可能導(dǎo)致小公司也有機(jī)會(huì)，因?yàn)槟阍谔囟ǖ挠布倔w上積累了足夠多的數(shù)據(jù)和經(jīng)驗(yàn)，這本身就是壁壘。

Jane：好。然后聊一下海外，你了解到的海外一些做具身智能的同行，他們現(xiàn)在在做什么？

陳佳玉：海外比較有意思的公司，除了 Physical Intelligence 之外，還有一些比較小但很有追求的公司。比如有一些公司是從前 OpenAI 的人出來(lái)創(chuàng)立的，他們的追求不是做一個(gè)產(chǎn)品，而是追求算法上的突破——希望做出真正的類人智能。這種公司在海外還是有一些的。

Jane：比如？

陳佳玉：比如SSI（Safe Superintelligence Inc.），雖然他們主要是做大語(yǔ)言模型方向，但他們的追求就是純粹做算法突破。在具身智能領(lǐng)域也有一些類似的公司，雖然規(guī)模不大，但追求的是真正的算法創(chuàng)新而不是快速商業(yè)化。

Jane：你怎么看中美在具身智能方面的差異？

陳佳玉：中美差異還是比較明顯的。美國(guó)的優(yōu)勢(shì)在于算力和學(xué)術(shù)驅(qū)動(dòng)——他們有最強(qiáng)的算力資源，也有最好的高校和研究機(jī)構(gòu)在推動(dòng)基礎(chǔ)研究。中國(guó)的優(yōu)勢(shì)在于本體和數(shù)據(jù)成本——中國(guó)有非常好的機(jī)器人本體制造能力，比如宇樹(shù)科技在本體上做得非常好，硬件成本也比較低。另外，中國(guó)的數(shù)據(jù)采集成本也比較低，因?yàn)槿肆Τ杀鞠鄬?duì)較低。

所以如果你要做大腦這種需要大算力的研究，美國(guó)可能更有優(yōu)勢(shì)。但如果你要做硬件或者做場(chǎng)景化落地，中國(guó)的供應(yīng)鏈和成本優(yōu)勢(shì)是很明顯的。

Jane：波士頓動(dòng)力現(xiàn)在的定位你怎么看？

陳佳玉：波士頓動(dòng)力是一家非常有特點(diǎn)的公司。它的控制做得非常好，但在 AI 這一塊，至少?gòu)墓_(kāi)信息來(lái)看，還沒(méi)有特別多的成果。它更像是一家以機(jī)械控制見(jiàn)長(zhǎng)的公司，而不是以 AI 見(jiàn)長(zhǎng)的公司。

Jane：我們來(lái)聊一下人形機(jī)器人。你覺(jué)得人形是通用機(jī)器人的最佳載體嗎？

陳佳玉：人形這個(gè)事情有兩面。一面是它確實(shí)有一些獨(dú)特的優(yōu)勢(shì)——人類的生活環(huán)境都是為人體設(shè)計(jì)的，門的高度、椅子的高度、樓梯的尺寸，所以一個(gè)人形的機(jī)器人可以更自然地適應(yīng)人類的生活環(huán)境。這是一個(gè)很好的愿景。

但另一面是，現(xiàn)在的人形機(jī)器人和人的差距實(shí)在太大了。你看那些人形機(jī)器人，它的靈巧手跟人的差距非常大，它的運(yùn)動(dòng)能力跟人的差距也很大。所以通用本體是一個(gè)好愿景，但現(xiàn)在和人差太遠(yuǎn)。

我的看法是，你不一定非要用人形——取決于你的場(chǎng)景。如果你在家庭場(chǎng)景里，人形可能確實(shí)有優(yōu)勢(shì)。但如果在工廠里，一個(gè)機(jī)械臂可能比人形機(jī)器人效率高得多。所以本體的選擇應(yīng)該是跟場(chǎng)景匹配的，而不是一刀切地認(rèn)為人形就是最好的。

Jane：你之前有提到一個(gè)觀點(diǎn)——大家不應(yīng)該只在形態(tài)上追求類人，學(xué)習(xí)機(jī)制上的類人可能更重要。

陳佳玉：對(duì)，這是我一直強(qiáng)調(diào)的。你的外表像人不代表你的智能像人。真正要像人的地方，是你的學(xué)習(xí)過(guò)程——能持續(xù)學(xué)習(xí)、能遷移、能從很少的數(shù)據(jù)中學(xué)到東西。這才是類人智能的核心。形態(tài)上的類人當(dāng)然有它的價(jià)值，但如果你的學(xué)習(xí)機(jī)制不類人，那你就只是一個(gè)外觀像人的傳統(tǒng)機(jī)器人。

Aaron：最后一個(gè)比較大的問(wèn)題——你覺(jué)得未來(lái)人和機(jī)器人的關(guān)系會(huì)走向什么樣的狀態(tài)？

陳佳玉：我覺(jué)得未來(lái)機(jī)器人會(huì)更可見(jiàn)地融入我們的日常生活?，F(xiàn)在你在日常生活中很少能看到機(jī)器人——除了掃地機(jī)器人。但未來(lái)可能你去商場(chǎng)、去酒店、去停車場(chǎng)，都會(huì)看到各種各樣的機(jī)器人在工作。再遠(yuǎn)一點(diǎn)的話，家庭里可能也會(huì)有機(jī)器人。

我不覺(jué)得機(jī)器人會(huì)取代人，更像是人和機(jī)器人的一種共生。機(jī)器人做那些人不愿意做的、危險(xiǎn)的、重復(fù)性的工作，人做更有創(chuàng)造性的、需要情感和社交的工作。這是一個(gè)比較理想的狀態(tài)。

但這個(gè)過(guò)程是漸進(jìn)的。不會(huì)突然有一天你家里就出現(xiàn)一個(gè)人形機(jī)器人在做飯。它是一步一步來(lái)的——先是簡(jiǎn)單場(chǎng)景，再到復(fù)雜場(chǎng)景，先是輔助角色，再到更獨(dú)立的角色。

收尾：給年輕人的建議

Jane：最后我們來(lái)做一個(gè)收尾。如果現(xiàn)在有年輕人想進(jìn)入具身智能領(lǐng)域，不管是做學(xué)術(shù)研究還是做產(chǎn)業(yè)，你會(huì)給什么樣的建議？

陳佳玉：首先我覺(jué)得要聚焦真問(wèn)題。不要跟風(fēng)做別人做的東西，要去想什么是這個(gè)領(lǐng)域真正的瓶頸，然后聚焦在那個(gè)瓶頸上。比如現(xiàn)在大家都在做 VLA，你再去跟著做 VLA 可能已經(jīng)晚了，但如果你能看到 VLA 之后的問(wèn)題——比如怎么做持續(xù)學(xué)習(xí)、怎么做更好的泛化——這才是有價(jià)值的方向。

第二是要大膽探索。這個(gè)領(lǐng)域還非常早期，很多方向都還沒(méi)有被充分探索。不要被現(xiàn)有的框架限制住，要敢于去試不同的東西。

Jane：那你覺(jué)得具體哪些細(xì)分方向比較值得年輕研究者去投入？

陳佳玉：我推薦三個(gè)方向。第一個(gè)是Manipulation——靈巧操作，就是怎么讓機(jī)器人的手像人一樣靈活。這是一個(gè)非常難但也非常重要的問(wèn)題，現(xiàn)在做得好的人還不多。

第二個(gè)是多模態(tài)大模型——怎么把視覺(jué)、語(yǔ)言、觸覺(jué)等多種信息融合在一起，讓機(jī)器人有更全面的感知和理解。

第三個(gè)是我一直在說(shuō)的——Robo Brain，就是機(jī)器人的大腦。怎么做出一個(gè)真正理解世界的、能持續(xù)學(xué)習(xí)的大腦。這個(gè)方向可能需要更長(zhǎng)的時(shí)間才能看到成果，但它的價(jià)值也是最大的。

Aaron：非常感謝陳老師今天的分享，信息量非常大。

陳佳玉：謝謝，很開(kāi)心。

Jane：謝謝陳老師！

加入ZF討論群，請(qǐng)先添加小助手微信

我們相信認(rèn)知能夠跨越階層，

致力于為年輕人提供高質(zhì)量的科技和財(cái)經(jīng)內(nèi)容。

稿件經(jīng)采用可獲邀進(jìn)入Z Finance內(nèi)部社群，優(yōu)秀者將成為簽約作者，00后更有機(jī)會(huì)成為Z Finance的早期共創(chuàng)成員。

我們正在招募新一期的實(shí)習(xí)生

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/閱讀下一篇/

返回網(wǎng)易首頁(yè) 下載網(wǎng)易新聞客戶端

相關(guān)推薦

熱點(diǎn)推薦

周口一油菜花田打卡地被推土機(jī)鏟平，當(dāng)?shù)兀合挡疬w征收用地，居民不能私自種植

極目新聞 2026-03-27 14:54:50
19618 跟貼 19618

前方等位3000桌上海爆火飯館又出新規(guī)：就餐要看SIM卡

上觀新聞 2026-03-27 14:35:54
3090 跟貼 3090

第三輪第五批中央生態(tài)環(huán)保督察完成督察反饋

澎湃新聞 2026-03-27 22:09:14
263 跟貼 263

鄭州空房天價(jià)水費(fèi)追蹤丨水務(wù)公司：系馬桶漏水，水表計(jì)量有效

大象新聞 2026-03-27 15:17:10
7586 跟貼 7586

租客欠租留下滿屋垃圾，房東聯(lián)系反被要紅包吃飯：最后還是發(fā)了

星視頻 2026-03-27 18:42:58
99 跟貼 99

最新 | 天津供熱采暖收費(fèi)新政發(fā)布

天津廣播 2026-03-27 21:48:34
401 跟貼 401

現(xiàn)役軍官帶刀闖中使館日方僅表示"遺憾" 高市沒(méi)反應(yīng)

新民周刊 2026-03-28 09:08:46
1 跟貼 1

保定一小店售賣咸菜絲燒餅意外爆火，排隊(duì)人數(shù)太多店鋪宣布暫停營(yíng)業(yè)，店主：流量太大了，我們承接不住，也擔(dān)心影響燒餅品質(zhì)

極目新聞 2026-03-26 22:43:02
1939 跟貼 1939

狗狗幫主人整理大棚壓膜帶，來(lái)回往返，效率極高，網(wǎng)友：沒(méi)有一口狗糧是白吃的

BRTV新聞 2026-03-28 09:06:44
7 跟貼 7

三連勝終止！山東高速男籃客場(chǎng)94-100不敵山西男籃

閃電新聞 2026-03-27 22:01:42
143 跟貼 143

經(jīng)濟(jì)學(xué)家賈康：年輕人可以考慮購(gòu)買住房了

大象新聞 2026-03-27 14:45:03
208 跟貼 208

比亞迪年報(bào)：營(yíng)收8040億元居行業(yè)第一，研發(fā)投入再創(chuàng)新高

南方都市報(bào) 2026-03-28 10:03:48
5 跟貼 5

豐田在華發(fā)起14年來(lái)最大召回計(jì)劃，總計(jì)超56萬(wàn)輛

第一財(cái)經(jīng)資訊 2026-03-27 15:11:51
276 跟貼 276

在銅陵永泉小鎮(zhèn)，掙銅錢花銅錢，體驗(yàn)不一樣的樂(lè)趣。（記者檀美玲）

中安在線 2026-03-28 11:17:14
1 跟貼 1

教育部發(fā)布20條嚴(yán)禁清單，嚴(yán)禁以升學(xué)率對(duì)學(xué)校和教師排名

每日經(jīng)濟(jì)新聞 2026-03-28 08:47:40
6 跟貼 6

上班開(kāi)糞車下班開(kāi)奔馳的小伙今日大婚，當(dāng)事人：吸糞車婚車隊(duì)，全球第一個(gè)

極目新聞 2026-03-28 08:51:05
0 跟貼 0

楊瀚森18+7關(guān)鍵時(shí)刻建功撕裂之城混音險(xiǎn)勝奧斯汀馬刺

北青網(wǎng)-北京青年報(bào) 2026-03-28 11:37:02
0 跟貼 0

外賣大戰(zhàn)被叫停！明明百姓都能獲利，為啥要禁，3大危害關(guān)鍵

青梅侃史啊 2026-03-28 11:32:40
0 跟貼 0

重溫1999：西方媒體報(bào)道的炸館“另一面”，17名軍事顧問(wèn)遇難？
干史人
2026-02-27 11:00:05

2005年，韓國(guó)把“漢城”改為首爾，全世界為何只要求中國(guó)改稱呼？
咸説歷史
2026-03-19 07:06:34

英超要變天！穆里尼奧有望重返英倫，埃迪?豪帥位告急
瀾歸序
2026-03-28 04:28:30

李鑫養(yǎng)家豪宅亮相，三層別墅裝潢奢華，養(yǎng)家哥哥曬弟媳侄子正面照
花小貓的美食日常
2026-03-28 07:58:40

阿卡豪擲重金預(yù)訂豪華游艇，尺寸超越納達(dá)爾600萬(wàn)美元最貴座駕
網(wǎng)球之家
2026-03-27 22:29:00

張雪峰和爸媽合照流出：父親肺癌去世，母親暈厥，奶奶還蒙在鼓里
博士觀察
2026-03-27 22:16:10

普京要求俄羅斯寡頭自愿貢獻(xiàn)，有人當(dāng)場(chǎng)宣布捐出1000億
深析古今
2026-03-28 09:21:46

民眾黨明天上凱道力挺柯文哲，蔣萬(wàn)安：已有行程安排，無(wú)法出席
海峽導(dǎo)報(bào)社
2026-03-28 10:21:05

臺(tái)海局勢(shì)再次升級(jí)！武統(tǒng)、和統(tǒng)都沒(méi)希望，我國(guó)即將走上第3條路
深析古今
2026-03-23 16:29:45

驚天反轉(zhuǎn)！FBI局長(zhǎng)郵箱被攻破，私密信息全網(wǎng)曝光
老馬拉車莫少裝
2026-03-28 00:02:06

難以置信！一個(gè)身高一米八的山東大漢，竟會(huì)被妻子打得不敢回家？
川渝視覺(jué)
2026-03-27 16:26:59

娛樂(lè)領(lǐng)航家
2026-03-28 00:00:03

三部門提醒：“人民幣版”冥幣不可賣也不要用
澎湃新聞
2026-03-27 22:09:10

形勢(shì)有多嚴(yán)峻？35歲失業(yè)男與年輕女人事激烈碰撞，評(píng)論區(qū)炸鍋…
慧翔百科
2026-03-27 12:17:09

兩性關(guān)系：不用懷疑，女人最難忘的情人，是讓她生理性喜歡的男人
加油丁小文
2026-03-28 11:30:06

德國(guó)總理宣布:不再向?yàn)蹩颂m提供金牛座導(dǎo)彈！
達(dá)文西看世界
2026-03-27 09:58:23

鴻蒙智行電池技術(shù)負(fù)責(zé)人：為延長(zhǎng)電池壽命我們把華為化學(xué)家、數(shù)學(xué)家都投入了進(jìn)來(lái)
快科技
2026-03-27 15:22:06

中國(guó)腦梗人數(shù)全球第一：肉吃得越少，血管就越通，真的嗎？
蜉蝣說(shuō)
2026-03-24 10:00:57

知名樂(lè)評(píng)人批周杰倫新歌：嗓子粗糙、歌詞幼稚，還在那“我最強(qiáng)我最屌”
老吳教育課堂
2026-03-27 12:48:19

“老人味”的禍?zhǔn)妆痪境?！醫(yī)生提醒：55歲后要少碰，老了或也沒(méi)味
今日養(yǎng)生之道
2026-03-23 11:46:39

2026-03-28 11:59:01

ZFinance

Z世代的一站式AI、科技和財(cái)經(jīng)資訊

155文章數(shù) 13關(guān)注度

往期回顧全部

科技要聞

遭中國(guó)學(xué)界"拉黑"后，這家AI頂會(huì)低頭道歉

“龍蝦”出現(xiàn)后，大模型時(shí)代的共識(shí)被推翻了

Anthropic“神話”模型意外曝光

楊植麟張鵬夏立雪羅福莉，聊龍蝦、聊漲價(jià)

不用AI就滾蛋，扎克伯格的死命令把Meta打工人逼瘋了

頭條要聞

媒體:"霍爾木茲決戰(zhàn)"攤牌了美給伊朗開(kāi)出"投降"條件

牛彈琴:伊朗狠角色嘲諷美"連基地里的士兵都保護(hù)不了"

李昌鈺79歲喪偶后與揚(yáng)州女商人再婚晚年多次到訪中國(guó)

特朗普稱暫停打擊伊能源設(shè)施不到1天美以空襲伊核設(shè)施

美一新法案提出美議員急了：這不就成"中國(guó)優(yōu)先"了

頭條要聞

媒體:"霍爾木茲決戰(zhàn)"攤牌了美給伊朗開(kāi)出"投降"條件

牛彈琴:伊朗狠角色嘲諷美"連基地里的士兵都保護(hù)不了"

李昌鈺79歲喪偶后與揚(yáng)州女商人再婚晚年多次到訪中國(guó)

特朗普稱暫停打擊伊能源設(shè)施不到1天美以空襲伊核設(shè)施

美一新法案提出美議員急了：這不就成"中國(guó)優(yōu)先"了

體育要聞

“我是全家最差勁的運(yùn)動(dòng)員”

邵佳一執(zhí)教首秀國(guó)足2-0庫(kù)拉索韋世豪張玉寧建功

杰曼三分絕殺！北京20分大逆轉(zhuǎn)廣東趙睿23分

結(jié)束二連??！火箭6人上雙穩(wěn)更衣室氛圍？休媒仍不滿烏度卡用人

德國(guó)4-3逆轉(zhuǎn)瑞士，維爾茨兩射兩助，格納布里破門

娛樂(lè)要聞

王一博改名上熱搜！個(gè)人時(shí)代正式開(kāi)啟！

李昌鈺去世！“華人神探”破無(wú)數(shù)驚天大案

浪姐7情懷殺：安崎孔雪兒重聚，孫儷喊話陶昕然

陳思誠(chéng)野心真大，開(kāi)啟刑偵八虎篇章，張譯扛大旗

群魔亂舞的內(nèi)娛群像王，我要給到一個(gè)夯！

財(cái)經(jīng)要聞

我在小吃培訓(xùn)機(jī)構(gòu)學(xué)習(xí)“科技與狠活”

美國(guó)SEC相關(guān)監(jiān)管部門流失近四分之一人手

油氣價(jià)格飆升，歐盟考慮征收能源暴利稅

“龍蝦”出現(xiàn)后，大模型時(shí)代的共識(shí)被推翻了

朱炳仁應(yīng)邀與德國(guó)前總統(tǒng)文化交流，熔銅作品《情深和鳴》被收藏

汽車要聞

置換補(bǔ)貼價(jià)4.28萬(wàn)起第五代宏光MINIEV正式上市

吉利博越REV/博越L小藍(lán)燈版3月31日將上市

深藍(lán)汽車第一百萬(wàn)臺(tái)電驅(qū)下線新一代電驅(qū)效率94.13%

新復(fù)古造型/5門5座全新一代繽果Pro正式亮相

圖靈芯片上車新款小鵬MONA M03要繼續(xù)做年輕人第一車

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

手機(jī)

房產(chǎn)

時(shí)尚

數(shù)碼

軍事航空

手機(jī)要聞

小米18 Ultra要配LOFIC長(zhǎng)焦和三個(gè)2億像素鏡頭？

一加Nord CE6 Lite手機(jī)曝光：7000mAh電池、5000萬(wàn)主攝

蘋果iOS 27版Siri前瞻：重塑底層、升級(jí)聊天互動(dòng)、實(shí)現(xiàn)屏幕感知

全球首臺(tái)闊比例大折疊手機(jī)！華為Pura X2要改名

房產(chǎn)要聞

6.8萬(wàn)方！天河員村再征地，金融城西區(qū)開(kāi)發(fā)全面提速

剛剛，海南樓市，官方數(shù)據(jù)發(fā)布！

解鎖度假新體驗(yàn)｜正大·太陽(yáng)河咖啡小鎮(zhèn) 把日子過(guò)成咖啡與雨林的詩(shī)

勁銷64億后，海口這座改善標(biāo)桿盤，又要引爆樓市！

推廣中獎(jiǎng)名單-更新至2026年3月11日推廣

今日熱點(diǎn)：周杰倫新專輯編曲回應(yīng)差評(píng)；地壇公園回應(yīng)不能用明星姓名認(rèn)養(yǎng)樹(shù)……

女友BELLA+封面 | 張哲旭&弭金：尋找與契合

會(huì)打扮的女人衣服從來(lái)不多買，準(zhǔn)備好襯衫和裙子，舒適又簡(jiǎn)約

數(shù)碼要聞

華碩新款商務(wù)本ExpertBook B3 G1，配置超豐富！

距離鋼琴家指尖僅幾英寸！Vision Pro推出BBC音樂(lè)會(huì)沉浸式視頻

全球存儲(chǔ)芯片短缺，索尼宣布暫停CFexpress及SD卡訂單

長(zhǎng)城X系列電源上新！1000/1200W僅售699/799元

軍事要聞

伊朗：已組織超100萬(wàn)人為地面戰(zhàn)斗做準(zhǔn)備

伊朗或開(kāi)辟新戰(zhàn)線胡塞武裝：已為軍事行動(dòng)做好準(zhǔn)備

媒體：內(nèi)塔尼亞胡夫人為兩個(gè)兒子訴苦加沙兒童怎么看

CNN：特朗普必須作出一些讓步才能結(jié)束中東戰(zhàn)爭(zhēng)

手機(jī) / 數(shù)碼

房產(chǎn) / 家居

Z Waves｜對(duì)話陳佳玉：AtomVLA 刷爆基準(zhǔn)，真機(jī)完成高難度柔性物體操作，具身智能長(zhǎng)程任務(wù)進(jìn)入深水區(qū)

遭中國(guó)學(xué)界"拉黑"后，這家AI頂會(huì)低頭道歉

媒體:"霍爾木茲決戰(zhàn)"攤牌了 美給伊朗開(kāi)出"投降"條件

媒體:"霍爾木茲決戰(zhàn)"攤牌了 美給伊朗開(kāi)出"投降"條件

“我是全家最差勁的運(yùn)動(dòng)員”

王一博改名上熱搜！個(gè)人時(shí)代正式開(kāi)啟！

我在小吃培訓(xùn)機(jī)構(gòu)學(xué)習(xí)“科技與狠活”

置換補(bǔ)貼價(jià)4.28萬(wàn)起 第五代宏光MINIEV正式上市

態(tài)度原創(chuàng)

小米18 Ultra要配LOFIC長(zhǎng)焦和三個(gè)2億像素鏡頭？

6.8萬(wàn)方！天河員村再征地，金融城西區(qū)開(kāi)發(fā)全面提速

推廣中獎(jiǎng)名單-更新至2026年3月11日推廣

華碩新款商務(wù)本ExpertBook B3 G1，配置超豐富！

伊朗：已組織超100萬(wàn)人為地面戰(zhàn)斗做準(zhǔn)備

Z Waves｜對(duì)話陳佳玉：AtomVLA 刷爆基準(zhǔn)，真機(jī)完成高難度柔性物體操作，具身智能長(zhǎng)程任務(wù)進(jìn)入深水區(qū)

遭中國(guó)學(xué)界"拉黑"后，這家AI頂會(huì)低頭道歉

媒體:"霍爾木茲決戰(zhàn)"攤牌了美給伊朗開(kāi)出"投降"條件

媒體:"霍爾木茲決戰(zhàn)"攤牌了美給伊朗開(kāi)出"投降"條件

王一博改名上熱搜！個(gè)人時(shí)代正式開(kāi)啟！

置換補(bǔ)貼價(jià)4.28萬(wàn)起第五代宏光MINIEV正式上市

小米18 Ultra要配LOFIC長(zhǎng)焦和三個(gè)2億像素鏡頭？

6.8萬(wàn)方！天河員村再征地，金融城西區(qū)開(kāi)發(fā)全面提速

華碩新款商務(wù)本ExpertBook B3 G1，配置超豐富！