網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

把大模型推向億級DAU前臺，快手直播如何重構(gòu)匹配效率與交互體驗？

2026-04-23 20:36:56　來源: InfoQ

北京舉報

分享至

作者｜吳翔宇

策劃｜AICon 全球人工智能開發(fā)與應(yīng)用大會

審核 | Kimmy

在人工智能席卷全球的浪潮中，AI 往往被視為資本市場的“金鑰匙”，但在快手直播的實戰(zhàn)場景里，它更是一把深入業(yè)務(wù)肌理、腳踏實地服務(wù)用戶的“手術(shù)刀”。

本文基于快手算法專家吳翔宇在2025 AICon 全球人工智能開發(fā)與應(yīng)用大會·北京站的演講《快手直播的 AI 進化論：技術(shù)落地與用戶體驗升級》，回顧了直播行業(yè)從 1.0 的 PC 秀場到 2.0 的全民直播，再到3.0 “AI 共生”時代的蛻變歷程。他指出，直播的本質(zhì)始終是UA（User-Author）關(guān)系的深度綁定，而大模型的出現(xiàn)，正以前所未有的姿態(tài)重塑這一關(guān)系的建立邏輯。

通過自研 KVL 架構(gòu)的多模態(tài)理解、用戶觸點的全鏈路升級、以及互動智能體的規(guī)?；涞?/strong>，快手成功將大模型從幕后的算法推演推向了億級 DAU 場景的前臺交互。這不僅是一場生產(chǎn)力的革命，更是對直播生態(tài)大腦的一次徹底進化。

以下是演講實錄（經(jīng) InfoQ 進行不改變原意的編輯整理）

多模態(tài)大模型的出現(xiàn)，如同一場行業(yè)變革，徹底重塑了多模態(tài)內(nèi)容理解的框架與范式，推動該領(lǐng)域?qū)崿F(xiàn)跨越式發(fā)展。而在 AI 賦能交互領(lǐng)域，依托 GPT 類大模型卓越的生成能力，長期深耕系統(tǒng)后端的算法工程師，終于有機會在億級 DAU 的國民級應(yīng)用中，看到自身研發(fā)的模型直接與用戶實現(xiàn)溝通、交互與價值傳遞。

1 直播進化論：從 1.0 到 3.0，AI 如何重塑 UA 關(guān)系

過去二十年間，直播已從單一的娛樂工具演變?yōu)椴豢苫蛉钡纳鐣A(chǔ)設(shè)施。

在直播 1.0 時代，受限于 PC 硬件、寬帶及 Flash 技術(shù)，內(nèi)容多集中于顏值秀場、才藝展示及游戲直播。雖然這一階段確立了公會模式與打賞機制，使直播進入大眾視野，但其本質(zhì)仍屬于相對小眾的垂直娛樂領(lǐng)域。

隨著智能手機、5G 網(wǎng)絡(luò)及推薦算法的普及，直播邁入 2.0 時代。開播門檻的大幅降低，人人皆可主播。在快手等平臺上，直播已深入各行各業(yè)，催生了“直播 + 電商”、“直播 + 招聘”等多元形態(tài)。直播由此完成了從娛樂向生活方式的轉(zhuǎn)型，正式成為社會基礎(chǔ)設(shè)施。

如今，我們正步入以“AI 共生”為特征的 3.0 時代。大模型、AIGC 與數(shù)字人技術(shù)正深刻重構(gòu)直播的交互模式，推動其從單一的人際互動向智能交互跨越。例如數(shù)字人直播已能實現(xiàn) 24 小時不間斷帶貨，在提升用戶新鮮感的同時，挖掘出巨大的商業(yè)潛力。這一階段標志著生產(chǎn)力的革命，AI 不僅能輔助開播，更在內(nèi)容生產(chǎn)上實現(xiàn)了效率與智能化的飛躍。從 1.0 的“看熱鬧”到 2.0 的“辦實事”，再到 3.0 的“智能化”，直播正變得愈發(fā)聰明且無處不在。

快手認為，直播的本質(zhì)在于UA（User-Author，即用戶與主播）關(guān)系的建立。這種關(guān)系的形成并非隨機，而是如同漏斗模型所展示的，經(jīng)歷了匹配、觸達、認知與關(guān)系建立這四個環(huán)環(huán)相扣的演進階段。

建立 UA 關(guān)系的第一步是“找對人”，即通過深度分析用戶的內(nèi)容偏好、歷史互動及實時行為，實現(xiàn)主播與用戶的精準預(yù)匹配。然而，僅有匹配是不夠的，關(guān)鍵在于讓合適的主播在最佳時機出現(xiàn)在用戶面前。這需要結(jié)合直播間的實時內(nèi)容與用戶的實時狀態(tài)，尋找觸達用戶屏幕的最優(yōu)窗口。當用戶感知到直播間入口時，最初幾秒的視覺與內(nèi)容印象往往決定了其后續(xù)的留存意愿，因此，塑造第一印象至關(guān)重要。

為優(yōu)化這一環(huán)節(jié)，我們借助大模型對主播特色與風格進行深層理解，動態(tài)生成個性化的直播間外內(nèi)容展示。用戶在點擊進入前，便能與主播形成初步的認知共鳴。

用戶進入直播間，并不代表推薦環(huán)節(jié)的結(jié)束，反而恰恰是關(guān)系建立的開始。直播的核心價值，在于構(gòu)建長期的情感紐帶。通過個性化互動提醒、粉絲權(quán)益推送等方式，可持續(xù)強化觀眾的參與感、認同感與歸屬感，最終實現(xiàn) UA 關(guān)系的深度綁定。

既然直播的本質(zhì)在于 UA 關(guān)系的建立，那么在海量流量的背景下，如何實現(xiàn)高效且高質(zhì)量的連接便成為核心課題。在此過程中，大模型扮演著不可或缺的角色，快手 AI 從“匹配效率”與“服務(wù)質(zhì)量”兩個維度，全面重塑了秀場直播的生態(tài)循環(huán)。

在用戶側(cè)，AI 的核心任務(wù)是解決信息過載問題。面對數(shù)百萬量級的主播儲備，我們必須確保“對的主播”能在“對的時間”與用戶相遇。這不僅需要通過多維信號整合來深度刻畫主播特征與用戶畫像，更需要挖掘用戶行為背后的深層動因。我們不僅關(guān)注點擊偏好，更致力于理解用戶在特定直播間氛圍下的情感需求與打賞動機。此外，依托快手集短視頻、直播、搜索與電商于一體的多場景生態(tài)，我們通過“短直聯(lián)動”及多場景協(xié)同策略，確保了 AI 導(dǎo)向的精準性，從而最大化提升匹配效率。

在主播側(cè)，AI 則更多地扮演著“智能導(dǎo)師”與“超級助手”的角色。在內(nèi)容創(chuàng)作上，AI 能夠?qū)崟r生成話題并提示熱點，確保主播在互動中始終有?？山?、有話可聊。在經(jīng)營策略上，AI 依托大數(shù)據(jù)分析提供科學的開播建議，指導(dǎo)主播把握內(nèi)容趨勢以獲取更多關(guān)注。

這種匹配效率與服務(wù)質(zhì)量的雙重提升，最終構(gòu)建了一個理想的業(yè)務(wù)閉環(huán)：用戶因精準匹配而留存，主播因服務(wù)質(zhì)量優(yōu)化而增收。對平臺而言，AI 真正實現(xiàn)了效能與體驗的同步躍遷，并直接驅(qū)動了直播營收的穩(wěn)健增長。

2 深度理解：從 ID 匹配到語義認知的范式躍遷

傳統(tǒng)推薦算法多側(cè)重于 ID 特征的擬合與匹配，而在大模型快速發(fā)展的當下，我們正實現(xiàn)從單純 ID 關(guān)聯(lián)向深度語義理解的范式躍遷。接下來，我們將重點分享如何結(jié)合快手直播的場景特性，依托多模態(tài)大語言模型（MLLM）實現(xiàn)深度理解能力的突破，最終達成更優(yōu)質(zhì)的 UA 關(guān)系匹配。

首先在技術(shù)實現(xiàn)層面，支撐深度理解的關(guān)鍵在于我們構(gòu)建的多模態(tài)直播基座。早期我們曾借鑒 MiniCPM-V 等優(yōu)秀模型構(gòu)建了第一版基座，而目前則基于快手自研的 KVL 架構(gòu)，實現(xiàn)了從分散式模型向通用底層的范式轉(zhuǎn)移。

通過對比可以直觀地看到架構(gòu)演進帶來的巨大差異：早期我們的理解系統(tǒng)由數(shù)十個分散的模型堆砌而成，為了解析一段直播，需要建立多級類目、屬性標簽、人物環(huán)境、動作捕捉以及顏值、游戲 IP 等眾多專項模型。這種“打補丁”式的架構(gòu)不僅識別精度有限，且可擴展性差，維護數(shù)十個在線模型的成本也極高，各模型間的協(xié)同效率十分低下。

為了解決這些問題，我們基于自研的 KVL 架構(gòu)構(gòu)建了更懂直播的通用底層。在持續(xù)預(yù)訓(xùn)練階段，我們?nèi)谌肓舜罅靠焓种辈鼍暗膶贁?shù)據(jù)；在后訓(xùn)練階段，我們將直播類目標簽、主播描述等業(yè)務(wù)任務(wù)與視覺推理任務(wù)深度結(jié)合。這使得模型在保持強大通用能力的同時，實現(xiàn)了直播場景理解能力的顯著升級。

轉(zhuǎn)向這一新范式后，技術(shù)紅利十分明顯。首先，模型的泛化能力大幅提升，能夠理解各類從未見過的、新興的直播內(nèi)容，而不再受限于預(yù)設(shè)標簽；其次，多模態(tài)融合更加深入，模型能夠同時解析畫面、音頻、文本及用戶評論，實現(xiàn)真正的深度理解；此外，系統(tǒng)的可擴展性顯著增強，處理新業(yè)務(wù)邏輯時，不再需要頻繁上線新模型，而是通過策略定義即可快速補齊能力。

這種從分散走向融合的轉(zhuǎn)變，本質(zhì)上是直播生態(tài)“大腦”的進化，使模型能夠像人類一樣，在觀看直播后即可充分表達對主播風格、直播內(nèi)容及主題的多維度理解。

盡管多模態(tài)基座在領(lǐng)域訓(xùn)練中表現(xiàn)優(yōu)異，但在直播場景中，大模型對主播的認知與用戶的真實感知仍存在明顯差距。

未經(jīng)過對齊優(yōu)化的基座模型，通常只能生成機械、表層的描述，例如僅識別 “女性、室內(nèi)、唱歌” 這類基礎(chǔ)標簽，而用戶更習慣從 “治愈系、寵粉、正能量” 等情感維度認知主播。同時，受后訓(xùn)練階段對齊機制的限制，多模態(tài)模型易出現(xiàn)評價同質(zhì)化問題，對顏值等核心特質(zhì)無法做出具備區(qū)分度的深度判斷。

在此前提下，從用戶視角重新定義主播特質(zhì)成為這一階段的核心工作。我們通過兩條路徑引導(dǎo)大模型學習用戶真實反饋：一是深度挖掘用戶評論，借助 AI 聚類與語義標簽技術(shù)，從海量評論中提煉可精準反映主播顏值、互動風格的高價值信息；二是聯(lián)合產(chǎn)品端發(fā)放激勵問卷，收集用戶對主播的直觀反饋，經(jīng)低質(zhì)量內(nèi)容過濾與相關(guān)性校驗后，沉淀出具備代表性的核心反饋數(shù)據(jù)。

最后，我們將用戶側(cè)反饋作為強化學習的基準事實，推動模型在多模態(tài)信息融合中持續(xù)迭代。在用戶偏好的指引下，模型生成的標簽體系與用戶視角高度契合。經(jīng)過這一迭代過程，模型不僅能客觀解析主播內(nèi)容，更能從用戶視角感知與理解主播特質(zhì)。

便實現(xiàn)了對主播內(nèi)容的深度理解與用戶視角的對齊，在直播場景中依然存在一個核心挑戰(zhàn)：理解主播并不等同于理解 “用戶為何喜歡該主播”。過去的研究往往側(cè)重于單向的內(nèi)容評估，即判斷主播素質(zhì)優(yōu)劣，但優(yōu)質(zhì)內(nèi)容并不必然匹配所有用戶的口味。因此，我們必須從單邊理解邁向雙向匹配，構(gòu)建能夠推演用戶看播偏好、預(yù)測 UA 關(guān)系建立動因的深度能力。

在具體實現(xiàn)上，我們通過大模型對用戶的歷史行為序列（如打賞記錄）進行深度解析。我們將用戶過去互動過的主播視覺內(nèi)容、口播文本及評論信息作為輸入，并采用 “候選主播選擇題” 的形式對模型進行訓(xùn)練。為了得出正確答案，模型必須對用戶偏好序列與候選主播特質(zhì)進行同步的邏輯推理。在此過程中，我們引入了類似 GRPO 系列的強化學習算法，結(jié)合特定的任務(wù)規(guī)則與獎勵機制，對模型進行針對性優(yōu)化。

這種優(yōu)化帶來了雙重增益：一方面，系統(tǒng)能夠生成極其精細的用戶偏好畫像，例如精準識別出用戶對 “帶有強互動元素的歌唱類直播” 的細分偏好；另一方面，模型能夠輸出明確的推薦理由，使推薦過程具備了透明度與可解釋性。通過這種深層的心理與行為對齊，AI 實際上復(fù)盤了用戶與主播產(chǎn)生情感連接的全過程，從而將內(nèi)容理解對 UA 關(guān)系的預(yù)測精度提升到了前所未有的精度。

那么這種針對用戶關(guān)系深度理解的高投入模型是否已經(jīng)在快手落地？

直播場景恰恰提供了一個極為理想的實踐溫床。與短視頻或電商擁有數(shù)億級泛眾 DAU 的情況不同，直播中具有高頻打賞行為的高價值用戶群體規(guī)模相對精準且集中，這使得我們能夠投入更高精度的模型資源，為這部分核心用戶提供極致精準的主播匹配。

在過去的幾個月中，我們已將這種“會思考”的生成式推薦方案正式應(yīng)用于直播業(yè)務(wù)鏈路。具體流程如示例所示：系統(tǒng)首先獲取用戶的歷史打賞序列，通過大模型的歸納與推演，剖析其個性化偏好。這種分析生成的標簽并非死板的預(yù)設(shè)分類，而是動態(tài)產(chǎn)出的描述，例如“雙人互動 PK”、“青春女神”、“明亮室內(nèi)環(huán)境”以及“交友向情感互動”等。

基于這些動態(tài)生成的深度畫像，我們能夠在千萬級的主播資源庫中，精準發(fā)掘出用戶可能感興趣、但在傳統(tǒng)推薦邏輯中尚未觸達的“潛在匹配”。這種方式極大地拓寬了興趣預(yù)測的“解空間”，使我們能夠在海量候選結(jié)果中，實現(xiàn)比以往任何內(nèi)容理解方式都更加精準的匹配效果。

3 觸點升級：AI 驅(qū)動的第一印象與認知路徑重構(gòu)

如果說前面的討論聚焦于如何構(gòu)建更聰明、更懂人心的“直播大腦”，那么接下來的核心議題便是如何利用大模型能力為這個系統(tǒng)賦予“五官與嘴巴”，讓它看得懂、會表達。第三章關(guān)于“用戶觸點升級”的目標，是希望用戶與主播的首次相遇，能從隨機的驚鴻一瞥轉(zhuǎn)化為一種精準契合的必然。

要實現(xiàn)這一目標，意味著在用戶滑動切換直播間的毫秒之間，系統(tǒng)展示的信息必須精準擊中其潛在需求。為了探究用戶在短短幾秒內(nèi)做出留存決策的底層邏輯，我們進行了深度用戶調(diào)研。結(jié)果顯示，用戶對主播的篩選主要集中在主播特點、直播信息和直播效果三個維度。

在主播特點方面，超過 55.3% 的用戶最看重主播的性格，這標志著直播行業(yè)已從早期的“顏值經(jīng)濟”跨越到了“性格經(jīng)濟”時代，用戶更傾向于尋找能產(chǎn)生情緒共鳴的有趣靈魂。

其次，直播間的封面與標題是用戶獲取信息的關(guān)鍵觸點。調(diào)研數(shù)據(jù)指出，有 40.7% 的用戶會根據(jù)直播間傳遞的核心信息（如具體的業(yè)務(wù)品類或內(nèi)容主題）來決定是否留存。

同樣重要的是直播的實時效果，其中才藝內(nèi)容與互動氛圍是決定留存的核心。一個氛圍冷清的直播間，即便主播顏值再高，也難以產(chǎn)生持久的吸引力。

由此可見，盡管用戶興趣多元，但高效、多維度地獲取主播信息，仍是他們最核心且明確的共性訴求。面對瞬息萬變的直播內(nèi)容，用戶注意力已成為極度稀缺的資源。若信息觸點匱乏，高昂的選擇成本將直接導(dǎo)致用戶流失。

因此，我們的核心目標是通過強化直播間內(nèi)外的雙重觸點，縮短用戶對主播的認知路徑。

直播間外是塑造第一印象的主戰(zhàn)場，但主播難以時刻處于完美表演狀態(tài)。此時，AI 的輔助作用便不可或缺：它能精準提取并濃縮主播的核心亮點，生成個性化的直播間外文案或動態(tài)展示，從而激發(fā)用戶的點擊意愿。

而當用戶進入直播間后，常因信息斷層（如錯過精彩的 PK 或懲罰環(huán)節(jié)）而產(chǎn)生疏離感。為此，我們實時滾動播放精華摘要與直播預(yù)告，幫助用戶快速補全背景信息，確保其能迅速融入當前的直播節(jié)奏。這種“直播間外抓眼球、直播間內(nèi)留人心”的聯(lián)動機制，本質(zhì)上是利用 AI 自動生成的描述降低發(fā)現(xiàn)成本，再通過實時內(nèi)容摘要降低理解成本。

屏幕左側(cè)展示的正是我們“AI 主播簡介”功能的落地效果。通過這一功能，我們成功在用戶滑到直播間的第一秒，便能將其核心特點精準呈現(xiàn)。

首先，我們構(gòu)建了多元數(shù)據(jù)智能分析系統(tǒng)，不僅實時解析當前的直播畫面，還深度整合了主播的歷史內(nèi)容、直播行為、個人簡介及預(yù)約信息等全棧數(shù)據(jù)，為每位主播建立起深厚的基礎(chǔ)信息底座。

在此基礎(chǔ)上，依托 KVL 模型的深度提煉能力，系統(tǒng)會自動生成一段兼具準確性與吸引力的解讀文案。這段文案旨在突出主播的差異化核心賣點，從而徹底告別千篇一律的內(nèi)容展現(xiàn)。

“AI 主播簡介”的上線直接解決了兩大核心痛點。

一方面，它實現(xiàn)了觸點前置，用戶無需進入直播間觀察數(shù)分鐘，在 Feed 流中即可快速建立認知，極大縮短了用戶認知路徑。

另一方面，它通過緩解信息不對稱帶來的認知缺失，顯著提升了直播間的點擊效率與停留時長。例如，針對演唱經(jīng)典老歌的主播，AI 會提煉出“經(jīng)典老歌唱得透”等具有故事感的標簽，迅速將其從同質(zhì)化的內(nèi)容中脫穎而出；對于身著復(fù)古服裝的互動直播，AI 則能解釋其背后的整活邏輯，避免用戶產(chǎn)生誤解；而對于“秦腔非遺傳承”與“助農(nóng)”等關(guān)鍵詞的提取，則能迅速建立用戶的心理認同。

這一功能是將大模型的理解能力轉(zhuǎn)化為實際產(chǎn)品生產(chǎn)力的典型案例。它讓我們這些算法工程師從后臺走向前端，通過 AI 技術(shù)為主播遞上一張極具辨識度的“數(shù)字名片”。

如果說 “AI 主播簡介” 是為主播遞出的名片，那么 “AI 小快播報” 則更像是直播間內(nèi)全天候在線的智能觀察者。針對新進用戶常因 “跟不上進度” 而產(chǎn)生困惑、最終流失的長期痛點，AI 小快播報通過扮演實時記錄者的角色，根據(jù)直播間的不同形態(tài)，靈活切換兩種工作模式來提升用戶體驗。

在 “內(nèi)容梗概型” 模式下，AI 能夠像撰寫新聞簡報一樣，實時還原直播的內(nèi)容主線與核心節(jié)點。例如，對于剛進入直播間的用戶，系統(tǒng)會提示 “開播 20 分鐘、PK 戰(zhàn)況、受罰后的反擊” 等關(guān)鍵信息，幫助用戶迅速補全錯過的情節(jié)，消除信息斷層。而在 “氛圍鼓動型” 模式中，AI 則側(cè)重于情緒價值的引導(dǎo)，通過感性的話術(shù)激發(fā)用戶的共鳴與參與感。

這種實時的智能化輔助，不僅顯著延長了用戶的觀看時長，還通過消除信息壁壘降低了用戶的心理疲勞感。同時，氛圍的有效調(diào)動直接提升了評論與點贊的互動頻率，并驅(qū)動用戶在直播生態(tài)中進行更深度的瀏覽。

4 智能體落地：從輔助工具到數(shù)字分身的價值延伸

接下來將深入討論“AI 互動智能體”的落地實踐。這一技術(shù)真正為直播間注入了“數(shù)字生命”，不僅簡化了開播流程、讓交互更自然，更實現(xiàn)了從提供情緒價值到驅(qū)動直播打賞的高效轉(zhuǎn)化。

目前的單人秀場模式正面臨人力驅(qū)動的天然瓶頸。傳統(tǒng)的直播高度依賴主播個人，要求其在持續(xù)輸出高質(zhì)量內(nèi)容的同時，還需兼顧高頻的實時互動。這種“雙線作戰(zhàn)”的強度極易導(dǎo)致主播疲勞，進而影響直播表現(xiàn)的穩(wěn)定性；此外，人力精力的有限性也制約了單人模式的營收上限，導(dǎo)致業(yè)務(wù)規(guī)模難以在保證質(zhì)量的前提下持續(xù)擴張。

針對不同發(fā)展階段的主播，其核心痛點也存在明顯不同。中小主播往往尚未形成鮮明的個人特色，且難以承接好每一位觀眾，急需 AI 補齊基礎(chǔ)互動能力，以平穩(wěn)度過冷啟動期。

而對于頭部主播而言，雖然具備優(yōu)質(zhì)的內(nèi)容產(chǎn)出能力，但在面對海量粉絲時卻分身乏術(shù)。此時，AI 的核心價值在于拓寬其服務(wù)半徑，確保每位粉絲都能獲得被重視的個性化體驗?；谶@些現(xiàn)實挑戰(zhàn)，構(gòu)建 AI 互動智能體，已成為一個邏輯嚴密且具有實戰(zhàn)價值的方案。

如上圖所示，AI 助手在播前、播中、播后三個階段實現(xiàn)深度滲透。我們可以借此觀察，它如何補齊并強化直播間的服務(wù)能力，挖掘每個環(huán)節(jié)中的商業(yè)與情感價值。

直播前的準備階段，核心目標是實現(xiàn)“精準入場”。AI 助手會在開播前提前開展工作。它會搭建話題模板庫，自動準備個性化的歡迎語與感謝話術(shù)。同時，利用大模型優(yōu)化直播間標題，精準植入核心關(guān)鍵詞，提升搜索權(quán)重。此外，系統(tǒng)還會智能識別高價值粉絲，定向發(fā)送專屬邀請或紀念日提醒，保障用戶粘性。

進入直播中輔助階段，AI 助手會成為實時的“智能互動導(dǎo)師”。它能實時解析彈幕和用戶進場信號，輔助主播顧及到每一位觀眾。針對新老用戶的不同身份，AI 會生成差異化的歡迎語。結(jié)合觀眾的地域、興趣點，還能實時打造專屬話題。通過調(diào)取用戶的歷史互動記錄，AI 還能輔助主播進行動態(tài)關(guān)懷，構(gòu)建主播與用戶之間的專屬記憶。

直播后的維護環(huán)節(jié)，重點轉(zhuǎn)向深度關(guān)系維護與潛力用戶挖掘。直播結(jié)束后，AI 會自動承接繁瑣工作，把即時流量轉(zhuǎn)化為長期存量。它可以自動答謝榜單貢獻突出的用戶，建立長期情感鏈接。也能在海量新觀眾里，精準挖掘潛力用戶并進行針對性培養(yǎng)。通過深度分析本場直播數(shù)據(jù)，AI 還能為下一場直播給出科學的策略建議。

經(jīng)過全流程的滲透，AI 互動助手不再只是輔助工具。它更像是能幫助主播運營私域資產(chǎn)的智能合伙人。AI 讓主播從瑣碎事務(wù)中抽身，專注于核心的內(nèi)容創(chuàng)作。這從本質(zhì)上提升了直播間的運營效率。

關(guān)于 AI 互動助手在直播場景中的實際表現(xiàn)，我們可以通過兩個典型案例直觀感受。

首先是 “智能破冰與引導(dǎo)” 功能。當老客戶進入直播間時，系統(tǒng)會立即識別其身份。同時，精準建議主播基于用戶的歷史偏好進行互動。比如，用戶此前若表達過聽歌訴求，助手會提示主播主動詢問其想聽的曲目。這種具備 “記憶力” 的交互，極大增強了用戶的歸屬感。

其次是 “即時打賞反饋” 功能。當用戶贈送燈牌或禮物時，助手會迅速提醒主播。并且匹配高質(zhì)量的感謝話術(shù)，通過即時且溫情的反饋，促成用戶持續(xù)打賞。這種細致的 AI 輔助，已讓它成為快手直播今年的明星項目，為大盤帶來了 4.1% 的營收增長。

在賦能新主播方面，AI 助手的表現(xiàn)尤為突出。中小主播在冷啟動階段，普遍存在 “不知如何留客” 的痛點。AI 補齊了他們基礎(chǔ)服務(wù)能力的短板，讓新主播群體的營收增長接近 6%。此外，付費率、互動率及長播率等核心指標，均呈現(xiàn)出明顯的正向增長趨勢。

AI 互動助手不僅能為頭部主播錦上添花，更能為廣大中小主播雪中送炭。它通過技術(shù)手段，補齊主播服務(wù)能力的短板。讓每一個直播間，都能具備專業(yè)級的運營水平。

如果說此前介紹的 AI 互動助手是主播的輔助工具，那么 AI 分身則實現(xiàn)了主播能力的規(guī)?；瘡?fù)制。它核心解決的，是主播精力有限與用戶需求無限之間的矛盾，保證在各類高并發(fā)場景下，互動體驗都能保持實時、不間斷。

與側(cè)重第三方視角播報的 “AI 小快播報” 不同，AI 分身通過深度學習主播的語言風格，可完全切換至主播視角，完成自主交互。

要實現(xiàn)這種 “神形兼?zhèn)洹?的替代服務(wù)，首先需要完成主播風格的深度復(fù)刻。通過對主播獨有的互動話術(shù)、語音節(jié)奏進行精準建模，數(shù)字分身在回復(fù)用戶時，能保持高度的風格一致性。即便主播本人分身乏術(shù)，用戶依然能感受到被關(guān)注的親近感。

其次，分身具備深度內(nèi)容承接能力。它能針對用戶評論主動延伸話題，通過邏輯連貫的互動，維持直播間的活躍度。此外，數(shù)字分身還承擔著推動商業(yè)轉(zhuǎn)化的職責。它可實時監(jiān)測關(guān)注、打賞等核心行為，代替主播完成個性化答謝，確保轉(zhuǎn)化鏈路中的每個節(jié)點都能得到高效響應(yīng)。

要讓 AI 分身無破綻地替代主播提供服務(wù)，我們需要攻克三項核心挑戰(zhàn)。

第一，在語料復(fù)雜、特征稀疏的場景下，如何為主播構(gòu)建更精準的數(shù)字畫像；第二，垂類數(shù)據(jù)普遍稀疏，通用模型在此類場景下表現(xiàn)往往不佳，如何通過技術(shù)手段優(yōu)化模型輸出效果；第三，高并發(fā)場景對 Badcase 率要求極高，如何將其降至極低水平，確保 AI 每一次代班都穩(wěn)定可靠。

這一系列問題的核心解決方案，是我們搭建的多智能體（Multi-agent）協(xié)作機制。該機制包含多個關(guān)鍵環(huán)節(jié)：對 ASR 數(shù)據(jù)進行精細化清洗，對主播歷史互動語料做規(guī)范化處理，結(jié)合模型定向微調(diào)，并接入外部知識庫。最終通過多智能體協(xié)同配合，完成整體任務(wù)。

如屏幕左側(cè)的實際應(yīng)用場景所示，AI 分身不僅能深度理解用戶需求，更能以主播特有的口吻給出有溫度的反饋。例如，針對基層才藝主播，系統(tǒng)能自動生成極具親和力的引導(dǎo)話術(shù)；而針對音樂類主播，則能以貼合其形象的語氣邀約用戶點歌。

在引入 AI 分身的回復(fù)與引導(dǎo)后，直播間營收提升了 1.27%，付費 UV 與評論 UV 等也得到了顯著增強。數(shù)據(jù)證明，AI 分身有效填補了主播在精力受限時的服務(wù)空白，鎖定了原本可能流失的互動機會，顯著增強了用戶對主播的身份認同感和歸屬感。

AI 分身已不再是冰冷的數(shù)字人，而是主播服務(wù)能力的數(shù)智化延伸，確保每位進入直播間的用戶都能獲得即時回應(yīng)。這種沉浸式的交互體驗，正是我們邁向“直播 3.0：AI 共生時代”的核心標志。

5 未來展望

從 PC 秀場 1.0 時代，演進至 AI 共生的 3.0 時代，直播形態(tài)雖不斷更迭，但鏈接主播與用戶的本質(zhì)始終未變。借助大模型技術(shù)，我們在三個維度實現(xiàn)了核心能力的躍遷：通過深度理解增強認知能力，通過觸點升級提升產(chǎn)品力，借助互動智能體解放主播生產(chǎn)力。

如果說過去十年的關(guān)鍵詞是“鏈接”，那么下一階段的核心，便是 AI 與直播場景的“深度共生”我們正處在從工具輔助，向全面數(shù)智化運營跨越的關(guān)鍵節(jié)點。

順應(yīng)這一趨勢，快手在 2026 年上半年的工作重點，將聚焦于“交互式主播助手”的研發(fā)。與當前單向輸出信息的助手不同，交互式助手將支持主播通過對話，進行深度咨詢與答疑，助力主播呈現(xiàn)更高質(zhì)量的直播內(nèi)容。該助手不僅能提供直播表現(xiàn)回顧，涵蓋關(guān)鍵指標分析與亮點復(fù)盤；還能針對腳本創(chuàng)意、實時話題，提供個性化建議。更重要的是，它實現(xiàn)了從單向提示到雙向互動的范式轉(zhuǎn)變。當主播對直播現(xiàn)狀產(chǎn)生困惑，比如針對場觀數(shù)據(jù)、內(nèi)容瓶頸提出疑問時，助手能實時給出專業(yè)解答與指導(dǎo)。

如果說交互式主播助手賦能于生產(chǎn)端，那么“直播伴侶”則專注于革新看播體驗。它著力打破推薦系統(tǒng)的“黑盒”現(xiàn)狀，賦予系統(tǒng)與用戶直接對話的能力，標志著看播體驗從單純的算法推演，進化為雙向的意圖對齊。直播伴侶的核心價值，在于實時捕捉并響應(yīng)用戶需求。當用戶意圖較為模糊時，系統(tǒng)會基于多樣化的興趣建模，提供探索性內(nèi)容推薦，創(chuàng)造“意外驚喜”；當用戶指令明確時，比如提出“尋找同類型主播”的訴求，系統(tǒng)會通過關(guān)鍵詞匹配與個性化過濾，精準鎖定目標。

這種交互模式，與傳統(tǒng)搜索有本質(zhì)區(qū)別：搜索通常始于明確的初始意圖，而直播伴侶則扎根于看播過程中的即興狀態(tài)。例如，用戶在觀看某類直播時，產(chǎn)生“換個口味”的念頭，這種上下文相關(guān)的訴求，恰恰需要通過交互式助手來深度滿足。為進一步增強用戶對系統(tǒng)的信任，我們將持續(xù)強化推薦算法的可解釋性。

嘉賓介紹

吳翔宇，快手算法專家，先后負責過快手的標簽體系建設(shè)，內(nèi)容與行為聯(lián)合建模等工作，目前負責大模型在快手直播和商業(yè)化場景的應(yīng)用。對大模型有深入的實踐，尤其對大模型在社區(qū)場景的落地有濃厚的興趣與豐富的經(jīng)驗，推動了大模型在快手的內(nèi)容理解、智能交互、體驗優(yōu)化上等維度上的全面升級。

會議推薦

世界模型的下一個突破在哪？Agent 從 Demo 到工程化還差什么？安全與可信這道坎怎么過？研發(fā)體系不重構(gòu)，還能撐多久？

AICon 上海站 2026，4 大核心專題等你來：世界模型與多模態(tài)智能突破、Agent 架構(gòu)與工程化實踐、Agent 安全與可信治理、企業(yè)級研發(fā)體系重構(gòu)。14 個專題全面開放征稿。

誠摯邀請你登臺分享實戰(zhàn)經(jīng)驗。AICon 2026，期待與你同行。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/閱讀下一篇/

返回網(wǎng)易首頁下載網(wǎng)易新聞客戶端

相關(guān)推薦

熱點推薦

一大批高校，將搬遷！

吉刻新聞 2026-04-27 16:08:43
291 跟貼 291

小男孩翻出陽臺玩耍，媽媽耐心引導(dǎo)其回室內(nèi)，抓住瞬間憤怒值拉滿

星視頻 2026-04-27 07:54:01
138 跟貼 138

上海迪士尼回應(yīng)游客勸阻吸煙被打：園區(qū)沒有禁煙；被打男子發(fā)聲：對方已賠錢和解

中國新聞周刊 2026-04-27 14:25:00
10633 跟貼 10633

一醫(yī)院原院長：我就像一個吸血鬼

南方都市報 2026-04-26 23:49:54
153 跟貼 153

事關(guān)中小學春秋假！河北最新發(fā)布

魯中晨報 2026-04-27 21:56:12
19 跟貼 19

美海軍考慮從外國購買軍艦和零部件：日韓成潛在選擇

澎湃新聞 2026-04-27 14:28:09
45 跟貼 45

華山南峰論劍石被拆，官方回應(yīng)：北峰以外所有“華山論劍”石都會被拆

現(xiàn)代快報 2026-04-26 14:00:13
265 跟貼 265

烏克蘭民眾戰(zhàn)爭倦怠情緒日益加深

參考消息 2026-04-27 10:09:05
703 跟貼 703

被指"混不下去回國" 廣東專家顏寧回懟：崇洋媚外

南方都市報 2026-04-27 11:12:26
236 跟貼 236

江蘇一70多歲老人想打工，辦假證把年齡改小8歲，還特意染了黑發(fā)，民警：他老伴離世，自己一個人想找個工作充實自己

大象新聞 2026-04-27 11:17:05
758 跟貼 758

文旅部集中整治景區(qū)擺渡車，點名龍虎山、長白山、稻城亞丁等

南方都市報 2026-04-27 16:21:12
1104 跟貼 1104

湖州南潯古鎮(zhèn)有艘“核動力觀光船”？景區(qū)回應(yīng)：售票牌翻譯錯誤，會進行整改

上游新聞 2026-04-27 13:01:24
130 跟貼 130

美國已打空半數(shù)導(dǎo)彈儲備？研究稱重建庫存或需長達四年

財聯(lián)社 2026-04-27 15:22:17
72 跟貼 72

美國方面稱26日僅有2艘船只通過霍爾木茲海峽

界面新聞 2026-04-27 08:14:11
2533 跟貼 2533

趙心童曬童年及世錦賽比賽合影致敬丁俊暉：一起加油

現(xiàn)代快報 2026-04-27 09:47:33
185 跟貼 185

2500元包郵“中華老字號”？別讓金字招牌淪為造假生意

北青網(wǎng)-北京青年報 2026-04-28 00:53:18
14 跟貼 14

DNA比對成功！他在上海失蹤33年后，找到了！與親人相隔僅30公里

南宗歷史 2026-04-28 04:15:00
0 跟貼 0

廬山西海景區(qū)發(fā)布情況通報

澎湃新聞 2026-04-27 08:55:19
194 跟貼 194

泡泡瑪特推出Labubu冰箱，售價5999元，上千人預(yù)約

大象新聞 2026-04-26 13:01:02
0 跟貼 0

俄方宣布擴大禁止入境俄羅斯的歐方人員名單

新華社 2026-04-27 20:52:40
117 跟貼 117

大姨們組團去旅行，整齊搭肩扭著步伐前進瀟灑愜意

南陽日報 2026-04-27 19:30:20
81 跟貼 81

前3月全國規(guī)模以上工業(yè)企業(yè)利潤總額同比增15.5%

國家統(tǒng)計局 2026-04-27 09:32:00
2 跟貼 2

偶遇春日里的“樹堅強”：不完整也是一種美

北青網(wǎng)-北京青年報 2026-04-28 02:35:35
8 跟貼 8

生態(tài)園變豪華墓地無人動，百姓土葬強硬挖:如此“雙標”真諷刺

胡言炫語 2026-04-28 04:00:57
0 跟貼 0

廣告使用“清朝長辮”被指辱華，法國品牌Lemaire致歉
南方都市報
2026-04-26 20:40:18

男子一身名牌坐地鐵，被指像成功人士，網(wǎng)友：再有錢也怕堵車
丫頭舫
2026-04-27 17:39:57

38歲王思聰近照認不出！滿頭白發(fā)穿睡衣度假，駝背顯老像 50 歲
橙星文娛
2026-04-27 14:17:09

2-3！3-3！瘋狂一夜，亞特蘭大爆大冷，拉齊奧補時絕平，曼聯(lián)險勝
足球狗說
2026-04-28 05:07:09

“酩酊大醉”不讀míng dīng dà zuì了，正確讀音是什么？
未央看點
2026-04-27 22:13:40

從排隊入籍到集體觀望？美國入籍申請驟降，綠卡人群態(tài)度變了？
紐約時間
2026-04-28 02:29:16

看完女排最新集訓(xùn)，心里五味雜陳！別說里約，連倫敦周期都比不上
金毛愛女排
2026-04-28 00:00:04

Deepseek，光通信之后的下一個主升浪
靜姐的財富第六感
2026-04-26 22:31:06

淚目趙心童曬兒時與丁俊暉合照：偶像暉哥讓我加油你也要加油啊
風過鄉(xiāng)
2026-04-27 06:15:09

有的人為了當官，把老婆送給領(lǐng)導(dǎo)睡
斜杠人生
2026-04-28 00:00:04

金價：大家不用等候了！不出意外，金價可能將歷史重演！
殘夢重生來
2026-04-28 04:40:09

不到72小時，俞敏洪再迎兩大壞消息，主播集體辭職只是“開胃菜”
阿廢冷眼觀察所
2026-04-28 00:24:36

皮蛋再次成為關(guān)注對象！研究發(fā)現(xiàn)：高血脂吃皮蛋，身體或有6改善
健康科普365
2026-04-25 09:27:08

七萬匹東洋大馬的覆滅：國民黨三年敗光日本四十五年心血
小莜讀史
2026-04-26 22:44:33

特朗普轉(zhuǎn)發(fā)“中印是人間地獄”，印度痛批低俗，中方態(tài)度耐人尋味
線裝史冊
2026-04-28 02:38:29

東南亞隱藏的“電詐大佬”，一個個正在浮出水面
現(xiàn)實的聲音
2026-04-27 20:36:14

麥子情感故事
2026-04-27 21:34:15

沒人再提激光雷達數(shù)量？直擊北京車展：今年智能駕駛“卷”什么
時代周報
2026-04-26 18:14:26

涉黃被傳喚，馬斯克出事了
營銷頭版
2026-04-27 14:42:14

中國排協(xié)官宣！16點30分，女排訓(xùn)練將直播，第二批球員恐揭曉
跑者排球視角
2026-04-27 23:48:17

2026-04-28 05:28:49

InfoQ

有內(nèi)容的技術(shù)社區(qū)媒體

12309文章數(shù) 51863關(guān)注度

往期回顧全部

科技要聞

DeepSeek V4上線三天，第一批實測出來了

發(fā)改委：依法依規(guī)禁止外資收購Manus項目

GPT image-2爆火后，設(shè)計師的天塌了嗎？

漲價浪潮下，DeepSeek推動AI“價格戰(zhàn)”

北京車展外國人眾生相：抄作業(yè)，遞名片，等雷軍

頭條要聞

坐在特朗普身邊親歷槍擊案的女記者身份非常不一般

槍響時若特朗普、萬斯等"團滅" 第三順位繼承人已92歲

東方甄選多位主播離職羅永浩連發(fā)6個問句怒懟網(wǎng)友

受賄數(shù)額特別巨大、搞權(quán)色交易副部級王中和被判17年

媒體:關(guān)于美伊?；饏f(xié)議特朗普這次臨陣退縮的很徹底

頭條要聞

坐在特朗普身邊親歷槍擊案的女記者身份非常不一般

槍響時若特朗普、萬斯等"團滅" 第三順位繼承人已92歲

東方甄選多位主播離職羅永浩連發(fā)6個問句怒懟網(wǎng)友

受賄數(shù)額特別巨大、搞權(quán)色交易副部級王中和被判17年

媒體:關(guān)于美伊?；饏f(xié)議特朗普這次臨陣退縮的很徹底

體育要聞

人類馬拉松"破二"新紀元，一場跑鞋軍備競賽

斯諾克世錦賽：吳宜澤13-11塞爾比晉級8強，等待特魯姆普和瓦菲的勝者

大逆轉(zhuǎn)！希金斯4-9翻盤，13-12勝奧沙利文，晉級世錦賽8強

中國男籃19人短訓(xùn)營名單：廖三寧龐崢麟領(lǐng)銜王俊杰趙維倫回歸

中國男籃官宣4場熱身賽：6月初兩戰(zhàn)俱樂部下旬連戰(zhàn)澳大利亞荷蘭

娛樂要聞

黃楊鈿甜為“耳環(huán)風波”出鏡道歉：謠言已澄清

楊子新女友已產(chǎn)子！與黃圣依婚姻存續(xù)期疑云重重

刑偵劇又出一部黑馬，潘粵明演技驚艷四座！

白鹿《奔跑吧》發(fā)言遭審判！節(jié)目收視率創(chuàng)新低

陳妍希告陳曉大粉，詆毀網(wǎng)暴7年，男方坐視不管

財經(jīng)要聞

Meta 140億收購Manus遭中國發(fā)改委否決

二代侯亞孟掌舵后，珀萊雅為何突然下墜？

快手的房間，誰在退場？丨正經(jīng)深度

北方華創(chuàng)，巨額商譽壓力突然高懸？

中國太平從資管到總部，罰單“傳染”

汽車要聞

不那么小眾也可以 smart的路會越走越寬

蔚來全新ES8玄金特別版上市蔚來ES9亮相北京車展

卷王小車上攻下守 2026款MG4都有哪些改變

從AI上車到AI原生:榮威用了20年參透了新智能

在不確定中尋找確定性：大眾汽車的中國解法

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

數(shù)碼

房產(chǎn)

公開課

軍事航空

家居要聞

江景風格流動的秩序

自然肌理溫潤美學

浪漫協(xié)奏法式風格

極簡繪夢克制和諧

數(shù)碼要聞

6K/3K雙模切換！三星這款顯示器什么水平？

安克“AI錄音豆”智能錄音硬件新增64GB存儲空間版本，999元

LABUBU冰箱還未正式發(fā)售就已溢價3000元

30.72TB固態(tài)硬盤來了！

房產(chǎn)要聞

信號！海南商業(yè)版圖，迎來大變局！

新一輪教育大爆發(fā)來了！?？?，開始瘋狂建學校！

重磅新政！海口限價商品房：滿5年可上市繳15%土地溢價！

三亞安居房，突然官宣！

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻

為什么人類有不同的膚色？

七個無法存下錢的壞習慣

李彥宏：百度離破產(chǎn)30天

軍事要聞

伊朗外長折返伊斯蘭堡內(nèi)情披露

伊朗外長抵俄談美伊局勢將提交結(jié)束戰(zhàn)爭談判報告

伊朗：發(fā)現(xiàn)15枚美軍未爆重型導(dǎo)彈逆向研發(fā)仿制

兩萬名海員因美以伊戰(zhàn)事被困波斯灣物資已經(jīng)瀕臨耗盡

手機 / 數(shù)碼

房產(chǎn) / 家居

把大模型推向億級DAU前臺，快手直播如何重構(gòu)匹配效率與交互體驗？

DeepSeek V4上線三天，第一批實測出來了

坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

人類馬拉松"破二"新紀元，一場跑鞋軍備競賽

黃楊鈿甜為“耳環(huán)風波”出鏡道歉：謠言已澄清

Meta 140億收購Manus遭中國發(fā)改委否決

不那么小眾也可以 smart的路會越走越寬

態(tài)度原創(chuàng)

江景風格 流動的秩序

6K/3K雙模切換！三星這款顯示器什么水平？

信號！海南商業(yè)版圖，迎來大變局！

伊朗外長折返伊斯蘭堡內(nèi)情披露

把大模型推向億級DAU前臺，快手直播如何重構(gòu)匹配效率與交互體驗？

坐在特朗普身邊親歷槍擊案的女記者身份非常不一般

坐在特朗普身邊親歷槍擊案的女記者身份非常不一般

人類馬拉松"破二"新紀元，一場跑鞋軍備競賽

江景風格流動的秩序

6K/3K雙模切換！三星這款顯示器什么水平？

信號！海南商業(yè)版圖，迎來大變局！