国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

北大ProAct:首個雙系統(tǒng)「主動社交」智能體,不做提線木偶

0
分享至


新智元報道

編輯:LRST

【新智元導(dǎo)讀】現(xiàn)有的具身智能大多是「你說我做」的被動響應(yīng)者。如何讓機器人像人類一樣擁有「主動性」?北京大學(xué)VCL實驗室針對當(dāng)前具身智能體「被動響應(yīng)」的局限,提出了一個基于「雙系統(tǒng)」架構(gòu)的主動社交智能體框架ProAct,模仿人類「快思考」與「慢思考」的認知機制,使機器人不僅能夠進行流暢自然的對話,還能基于情境理解主動發(fā)起互動,從而具備真正的「社交心智」。

在與機器人交互時,你是否常有這種感覺:如果你不說話,它就永遠沉默;如果你不發(fā)指令,它就「呆若木雞」。

這是因為目前的交互式系統(tǒng)絕大多數(shù)都是反應(yīng)式的,它們被困在一個短暫的時間窗口里,只能根據(jù)當(dāng)前的語音或視覺輸入做出反饋,這種機制使得智能體難以基于積累的長期語境來推斷意圖,更無法發(fā)起主動行為。

然而,生活中的人類社交本質(zhì)上是雙向且主動的。

在日?;又?,人們不僅是對他人的話語做出反應(yīng),更會運用意向性去預(yù)測需求、掌握主動權(quán)并在未被請求時采取行動。

例如,當(dāng)朋友顯得猶豫不決時給予鼓勵,或在看到空杯子時主動倒水。這種由內(nèi)部目標(biāo)驅(qū)動而非被動響應(yīng)外部刺激的「主動性」,是區(qū)分真正的伙伴與簡單問答機器人的關(guān)鍵。

想在具身智能體上實現(xiàn)這一點,還得解決一個核心矛盾:時間尺度。主動行為需要深思熟慮的推理和長程語境分析,也就是要「慢想」;而實時交互要求極低的延遲,必須「快回」。單一的端到端模型往往難以兼顧二者,因為深度推理會阻塞實時響應(yīng),而追求速度則會犧牲行為的合理性和準確性。

受認知科學(xué)中雙重加工理論的啟發(fā),北京大學(xué)研究團隊提出了一種雙系統(tǒng)架構(gòu)ProAct,核心思路在于快慢分離, 即將即時的反應(yīng)與慢速的推理分離,使得ProAct兼具響應(yīng)速度與主動的深度社交能力。


論文地址:https://arxiv.org/abs/2602.14048

項目主頁:https://proactrobot.github.io/

其中,行為系統(tǒng)(Behavioral System)作為「快系統(tǒng)」,負責(zé)維持高頻、低延遲的多模態(tài)交互流;認知系統(tǒng)(Cognitive System)作為「慢系統(tǒng)」,配備記憶與推理模塊,負責(zé)長程推理并生成高層主動意圖。


圖1. ProAct 雙系統(tǒng)框架概覽。(a) 系統(tǒng)架構(gòu)整合了快速的行為系統(tǒng)與慢速的認知系統(tǒng);(b) 實時交互中,智能體在用戶離開時主動發(fā)起挽留與提醒。

為了彌合兩者的時間差,ProAct進一步提出了一種基于流匹配(Flow Matching)的流式生成模型,支持通過 ControlNet 異步注入語義意圖,這樣一來,機器人在保持流暢交互的同時,也能無縫地從「被動反應(yīng)」切換到「主動出擊」。

文章的技術(shù)貢獻主要體現(xiàn)在以下三點:

  1. 提出了一種用于具身社交智能體的雙系統(tǒng)架構(gòu),成功將實時反應(yīng)與語境驅(qū)動的主動行為融為一體。

  2. 提出一種基于流匹配的流式生成模型,支持將高層語義意圖異步注入實時動作流,實現(xiàn)了反應(yīng)式與主動式行為的平滑切換。

  3. 將該系統(tǒng)部署于Unitree G1人形機器人,在真實世界中驗證了其主動交互的有效性。

下方的演示視頻可以直觀地感受ProAct如何讓機器人像人類一樣擁有「社交心智」:


視頻1. 在生活管家場景中,ProAct 發(fā)現(xiàn)用戶有急事后停止說話,并主動提醒用戶離開時忘記拿書包。


視頻2. 在情感支持場景中,ProAct 檢測到用戶劇烈的情緒波動,主動詢問緣由并安慰用戶。


視頻3. 在尋找物品場景中,ProAct在用戶尋找物品時,回憶起用戶之前放置藥品柜的經(jīng)過,主動提醒用戶藥瓶放在了哪里。

方法簡介

ProAct采用雙系統(tǒng)并行運行的機制:行為系統(tǒng)維持實時交互閉環(huán),認知系統(tǒng)在后臺進行周期性推理。

行為系統(tǒng):流式多模態(tài)交互

行為系統(tǒng)充當(dāng)著「快系統(tǒng)」的角色,負責(zé)處理用戶音頻與視覺流,生成低延遲的語音與動作反饋,由一個流式Omni-LLM和一個流式動作生成器級聯(lián)而成。

語音方面,系統(tǒng)利用GPT-4o Realtime模型處理用戶語音和第一視角圖像,實現(xiàn)了支持隨時打斷的實時對話。動作方面,為了維持具身的「存在感」,動作必須連續(xù)且流暢。

為此,ProAct提出了一種基于流匹配的生成模型,具備極高的實時性,首次響應(yīng)時間與真實社交場景中的人類相當(dāng)。通過「重疊-緩存」機制,ProAct保證每一幀動作的生成時間小于播放時間,并且能完美銜接上一幀的動作,滿足實時流式輸出的要求。

此外,模型還能同時接收雙方的語音流進行雙人交互建模,這讓機器人不僅在說話時有手勢,在傾聽時也能有自然的身體晃動等反饋。


圖2. 認知系統(tǒng)架構(gòu)。(a) 增量式多模態(tài)輸入;(b) 上下文編碼器與行為規(guī)劃器并行工作;(c) 通過不同通道注入行為計劃。

認知系統(tǒng):社會語境推理

認知系統(tǒng)作為「慢系統(tǒng)」,通過一個基于 LLM 的智能體框架在后臺運行,旨在解決「何時」以及「如何」發(fā)起主動行為的問題。如圖 2 所示,該系統(tǒng)包含兩個關(guān)鍵模塊。

首先是上下文編碼器 (Context Encoder)。為了防止隨著對話進行導(dǎo)致推理延遲增加,該模塊負責(zé)將累積的對話歷史、視覺幀與過往行為壓縮進一個「記憶庫」。記憶庫結(jié)構(gòu)化地存儲了用戶分析(如心智理論)、情境追蹤(如物體位置變化)以及機器人的歷史行為。

其次是行為規(guī)劃器 (Behavior Planner)。該模塊依據(jù)當(dāng)前的記憶與感知,進行動機評估。系統(tǒng)會從視覺場景變化、用戶意圖信號、對話狀態(tài)、社會規(guī)范要求、情感響應(yīng)需求這五個維度對當(dāng)前狀況進行打分。當(dāng)任一維度的動機分數(shù)超過設(shè)定閾值時,系統(tǒng)將觸發(fā)主動干預(yù)。

最終,認知系統(tǒng)的輸出將通過三個通道注入行為系統(tǒng):一是手勢意圖注入,通過 ControlNet 引導(dǎo)動作生成,例如「揮手打招呼」;二是對話干預(yù),向 Omni-LLM 注入指令以打斷對話或引導(dǎo)話題;三是移動控制,調(diào)整機器人的站位與朝向,例如「轉(zhuǎn)向用戶」。

實驗結(jié)果與部署

研究者們將ProAct全棧部署在Unitree G1人形機器人上,實驗設(shè)計了包括「海報講解」、「講故事」、「尋找物品」等多個交互場景。


圖3. 在海報講解場景中,ProAct 主動發(fā)現(xiàn)用戶并打招呼,隨后糾正用戶的誤解。


視頻4. 在海報講解場景中,ProAct 主動發(fā)現(xiàn)用戶并打招呼,隨后糾正用戶的誤解。


圖4. 在講故事場景中,ProAct 檢測到用戶玩手機分心,主動中斷故事并提醒用戶。


視頻5. 在講故事場景中,ProAct 檢測到用戶玩手機分心,主動中斷故事并提醒用戶。

如上述圖片所示,在海報講解任務(wù)中,ProAct 展現(xiàn)了超越簡單問答的能力:它能主動捕捉路過的用戶,建立眼神接觸,并在用戶表達錯誤觀點時主動打斷并糾正。在講故事場景中,當(dāng)檢測到用戶低頭玩手機時,機器人并未繼續(xù)自言自語,而是根據(jù)「社會規(guī)范」觸發(fā)器,生成了不滿的肢體語言(雙手叉腰)并口頭提醒用戶專心。通過視頻結(jié)果中的鏈接可以觀看完整的社交視頻。

視頻6. ProAct的完整demo視頻

結(jié)論

研究人員提出了一個用于主動具身社交智能體的雙系統(tǒng)框架ProAct。

ProAct首先構(gòu)建了一個支持語義意圖注入的流式動作生成模型;在此之上,設(shè)計了能夠解耦實時反應(yīng)與長程推理的雙系統(tǒng)架構(gòu)。

可視化結(jié)果與用戶研究表明,ProAct能夠生成語境恰當(dāng)?shù)闹鲃有袨?,顯著增強了人機交互的自然度與參與感 。

盡管該方法在提升主動性方面取得了顯著進展,仍存在一些局限性。首先,目前的觸發(fā)機制基于固定頻率與閾值,可能會錯過最合適的干預(yù)機會 ;其次,當(dāng)前系統(tǒng)主要依賴云端大模型,其網(wǎng)絡(luò)延遲(約1-2秒)在一定程度上限制了對極速突發(fā)事件的響應(yīng)能力 。未來研究者們將致力于端到端多模態(tài)模型的本地化部署與自適應(yīng)觸發(fā)策略的研究。

參考資料:

https://arxiv.org/abs/2602.14048

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
Coco說她很懷念在香港的日子,很懷念和謝賢在一起的12年

Coco說她很懷念在香港的日子,很懷念和謝賢在一起的12年

西樓知趣雜談
2026-02-19 21:09:49
大陸必須立刻斷供!

大陸必須立刻斷供!

安安說
2026-02-25 10:17:25
中俄東北虎數(shù)量差距斷崖:俄羅斯700只,中國的數(shù)量令人意外!

中俄東北虎數(shù)量差距斷崖:俄羅斯700只,中國的數(shù)量令人意外!

又是美好的日子
2026-02-21 04:01:54
WTT大滿貫!女單8強對陣出爐,蒯曼苦戰(zhàn)逆轉(zhuǎn),伊藤美誠強勢零封

WTT大滿貫!女單8強對陣出爐,蒯曼苦戰(zhàn)逆轉(zhuǎn),伊藤美誠強勢零封

漫川舟船
2026-02-26 11:21:25
相機為何突然漲到離譜,手機拍得更好卻沒人買,背后真相揭曉

相機為何突然漲到離譜,手機拍得更好卻沒人買,背后真相揭曉

石辰搞笑日常
2026-02-26 04:00:51
為什么所有行星,都在同一個平面上運行,太陽系是扁平的?

為什么所有行星,都在同一個平面上運行,太陽系是扁平的?

觀察宇宙
2026-02-26 16:42:07
15萬英鎊爭奪戰(zhàn):周躍龍攜手小司機追趕艾倫,趙心童成X因素!

15萬英鎊爭奪戰(zhàn):周躍龍攜手小司機追趕艾倫,趙心童成X因素!

夜深聊球
2026-02-26 22:42:40
張?zhí)m曝馬筱梅生子細節(jié),對準S家句句戳心,強調(diào)和大S子女是一家人

張?zhí)m曝馬筱梅生子細節(jié),對準S家句句戳心,強調(diào)和大S子女是一家人

胡一舸南游y
2026-02-25 20:02:05
出場時間刷新賽季新低,接下來火箭還會減少杜蘭特的出場時間嗎?

出場時間刷新賽季新低,接下來火箭還會減少杜蘭特的出場時間嗎?

稻谷與小麥
2026-02-26 23:07:20
小鼠研究表明,挖鼻孔與阿爾茨海默病之間存在令人驚訝的聯(lián)系

小鼠研究表明,挖鼻孔與阿爾茨海默病之間存在令人驚訝的聯(lián)系

心中的麥田
2026-01-21 20:18:15
段永平:炒股票的人會很危險,因為你炒不過梁文鋒了

段永平:炒股票的人會很危險,因為你炒不過梁文鋒了

風(fēng)風(fēng)順
2026-02-22 13:51:05
圍爐煮茶,為啥涼了?

圍爐煮茶,為啥涼了?

放牛娃的遐想
2026-02-25 08:14:29
廣西夜市偶遇韋雪,真人撞臉楊冪,吃東西張不開嘴,頂一張面具臉

廣西夜市偶遇韋雪,真人撞臉楊冪,吃東西張不開嘴,頂一張面具臉

離離言幾許
2026-02-25 13:49:18
國家力挺“一人公司”,單人AI創(chuàng)業(yè)時代到來,這5類人最先賺翻

國家力挺“一人公司”,單人AI創(chuàng)業(yè)時代到來,這5類人最先賺翻

商悟社
2026-02-25 21:56:07
春節(jié)后第一批受害者:超市老板哭訴禮盒滯銷,今年大家終于清醒了

春節(jié)后第一批受害者:超市老板哭訴禮盒滯銷,今年大家終于清醒了

王姐懶人家常菜
2026-02-25 15:07:32
中國男籃客場5打8逆轉(zhuǎn)日本!郭士強總結(jié)贏球原因,這一人最失意!

中國男籃客場5打8逆轉(zhuǎn)日本!郭士強總結(jié)贏球原因,這一人最失意!

詹妹侃體育
2026-02-26 23:32:15
世界首次五百強斷崖差:日本149家,美國151家,中國3家,現(xiàn)在呢

世界首次五百強斷崖差:日本149家,美國151家,中國3家,現(xiàn)在呢

王二哥老搞笑
2026-02-26 20:49:49
iPhone 18 Pro靈動島縮小35%,將首發(fā)搭載基于臺積電2nm工藝制造的A20 Pro芯片

iPhone 18 Pro靈動島縮小35%,將首發(fā)搭載基于臺積電2nm工藝制造的A20 Pro芯片

中國能源網(wǎng)
2026-02-24 12:01:06
女生失聯(lián)16天遺體被找到,其母否認懸賞加碼至100萬元

女生失聯(lián)16天遺體被找到,其母否認懸賞加碼至100萬元

大象新聞
2026-02-26 17:05:04
舒淇全家福曝光,姐弟顏值反差大,豪宅搶眼,馮德倫態(tài)度一目了然

舒淇全家福曝光,姐弟顏值反差大,豪宅搶眼,馮德倫態(tài)度一目了然

庭小娛
2026-02-25 15:01:06
2026-02-27 00:36:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
14596文章數(shù) 66644關(guān)注度
往期回顧 全部

科技要聞

單季營收681億凈利429億!英偉達再次炸裂

頭條要聞

男子因銀行系統(tǒng)錯誤"欠款1000萬億":工廠可能會被拍賣

頭條要聞

男子因銀行系統(tǒng)錯誤"欠款1000萬億":工廠可能會被拍賣

體育要聞

從排球少女到冰壺女神,她在米蘭冬奧練出6塊腹肌

娛樂要聞

向華強公開表態(tài) 財產(chǎn)留給兒媳婦郭碧婷

財經(jīng)要聞

中國AI調(diào)用量超美國 4款大模型霸榜前5

汽車要聞

40歲的吉利,不惑于內(nèi)外

態(tài)度原創(chuàng)

房產(chǎn)
健康
手機
教育
時尚

房產(chǎn)要聞

2.2萬/m2起!三亞主城性價比標(biāo)桿 海墾·桃花源實景現(xiàn)房春節(jié)被瘋搶

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

手機要聞

太好用!蘋果悄悄上線網(wǎng)絡(luò)測速工具,比第三方還準,你用上了嗎?

教育要聞

學(xué)習(xí)的真正對手,是精力分配失衡

今年春天最美搭配:西裝+半裙,怎么穿都好看!

無障礙瀏覽 進入關(guān)懷版