国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

把大模型推向億級DAU前臺,快手直播如何重構(gòu)匹配效率與交互體驗?

0
分享至


作者| 吳翔宇

策劃|AICon 全球人工智能開發(fā)與應(yīng)用大會

審核 | Kimmy

在人工智能席卷全球的浪潮中,AI 往往被視為資本市場的“金鑰匙”,但在快手直播的實戰(zhàn)場景里,它更是一把深入業(yè)務(wù)肌理、腳踏實地服務(wù)用戶的“手術(shù)刀”。

本文基于快手算法專家吳翔宇2025 AICon 全球人工智能開發(fā)與應(yīng)用大會·北京站的演講《快手直播的 AI 進化論:技術(shù)落地與用戶體驗升級》,回顧了直播行業(yè)從 1.0 的 PC 秀場到 2.0 的全民直播,再到3.0 “AI 共生”時代的蛻變歷程。他指出,直播的本質(zhì)始終是UA(User-Author)關(guān)系的深度綁定,而大模型的出現(xiàn),正以前所未有的姿態(tài)重塑這一關(guān)系的建立邏輯。

通過自研 KVL 架構(gòu)的多模態(tài)理解、用戶觸點的全鏈路升級、以及互動智能體的規(guī)?;涞?/strong>,快手成功將大模型從幕后的算法推演推向了億級 DAU 場景的前臺交互。這不僅是一場生產(chǎn)力的革命,更是對直播生態(tài)大腦的一次徹底進化。

以下是演講實錄(經(jīng) InfoQ 進行不改變原意的編輯整理)

多模態(tài)大模型的出現(xiàn),如同一場行業(yè)變革,徹底重塑了多模態(tài)內(nèi)容理解的框架與范式,推動該領(lǐng)域?qū)崿F(xiàn)跨越式發(fā)展。而在 AI 賦能交互領(lǐng)域,依托 GPT 類大模型卓越的生成能力,長期深耕系統(tǒng)后端的算法工程師,終于有機會在億級 DAU 的國民級應(yīng)用中,看到自身研發(fā)的模型直接與用戶實現(xiàn)溝通、交互與價值傳遞。

1 直播進化論:從 1.0 到 3.0,AI 如何重塑 UA 關(guān)系


過去二十年間,直播已從單一的娛樂工具演變?yōu)椴豢苫蛉钡纳鐣A(chǔ)設(shè)施。

在直播 1.0 時代,受限于 PC 硬件、寬帶及 Flash 技術(shù),內(nèi)容多集中于顏值秀場、才藝展示及游戲直播。雖然這一階段確立了公會模式與打賞機制,使直播進入大眾視野,但其本質(zhì)仍屬于相對小眾的垂直娛樂領(lǐng)域。

隨著智能手機、5G 網(wǎng)絡(luò)及推薦算法的普及,直播邁入 2.0 時代。開播門檻的大幅降低,人人皆可主播。在快手等平臺上,直播已深入各行各業(yè),催生了“直播 + 電商”、“直播 + 招聘”等多元形態(tài)。直播由此完成了從娛樂向生活方式的轉(zhuǎn)型,正式成為社會基礎(chǔ)設(shè)施。

如今,我們正步入以“AI 共生”為特征的 3.0 時代。大模型、AIGC 與數(shù)字人技術(shù)正深刻重構(gòu)直播的交互模式,推動其從單一的人際互動向智能交互跨越。例如數(shù)字人直播已能實現(xiàn) 24 小時不間斷帶貨,在提升用戶新鮮感的同時,挖掘出巨大的商業(yè)潛力。這一階段標志著生產(chǎn)力的革命,AI 不僅能輔助開播,更在內(nèi)容生產(chǎn)上實現(xiàn)了效率與智能化的飛躍。從 1.0 的“看熱鬧”到 2.0 的“辦實事”,再到 3.0 的“智能化”,直播正變得愈發(fā)聰明且無處不在。


快手認為,直播的本質(zhì)在于UA(User-Author,即用戶與主播)關(guān)系的建立。這種關(guān)系的形成并非隨機,而是如同漏斗模型所展示的,經(jīng)歷了匹配、觸達、認知關(guān)系建立這四個環(huán)環(huán)相扣的演進階段。

建立 UA 關(guān)系的第一步是“找對人”,即通過深度分析用戶的內(nèi)容偏好、歷史互動及實時行為,實現(xiàn)主播與用戶的精準預(yù)匹配。然而,僅有匹配是不夠的,關(guān)鍵在于讓合適的主播在最佳時機出現(xiàn)在用戶面前。這需要結(jié)合直播間的實時內(nèi)容與用戶的實時狀態(tài),尋找觸達用戶屏幕的最優(yōu)窗口。當用戶感知到直播間入口時,最初幾秒的視覺與內(nèi)容印象往往決定了其后續(xù)的留存意愿,因此,塑造第一印象至關(guān)重要。

為優(yōu)化這一環(huán)節(jié),我們借助大模型對主播特色與風格進行深層理解,動態(tài)生成個性化的直播間外內(nèi)容展示。用戶在點擊進入前,便能與主播形成初步的認知共鳴。

用戶進入直播間,并不代表推薦環(huán)節(jié)的結(jié)束,反而恰恰是關(guān)系建立的開始。直播的核心價值,在于構(gòu)建長期的情感紐帶。通過個性化互動提醒、粉絲權(quán)益推送等方式,可持續(xù)強化觀眾的參與感、認同感與歸屬感,最終實現(xiàn) UA 關(guān)系的深度綁定。


既然直播的本質(zhì)在于 UA 關(guān)系的建立,那么在海量流量的背景下,如何實現(xiàn)高效且高質(zhì)量的連接便成為核心課題。在此過程中,大模型扮演著不可或缺的角色,快手 AI 從“匹配效率”與“服務(wù)質(zhì)量”兩個維度,全面重塑了秀場直播的生態(tài)循環(huán)。

在用戶側(cè),AI 的核心任務(wù)是解決信息過載問題。面對數(shù)百萬量級的主播儲備,我們必須確保“對的主播”能在“對的時間”與用戶相遇。這不僅需要通過多維信號整合來深度刻畫主播特征與用戶畫像,更需要挖掘用戶行為背后的深層動因。我們不僅關(guān)注點擊偏好,更致力于理解用戶在特定直播間氛圍下的情感需求與打賞動機。此外,依托快手集短視頻、直播、搜索與電商于一體的多場景生態(tài),我們通過“短直聯(lián)動”及多場景協(xié)同策略,確保了 AI 導(dǎo)向的精準性,從而最大化提升匹配效率。

在主播側(cè),AI 則更多地扮演著“智能導(dǎo)師”與“超級助手”的角色。在內(nèi)容創(chuàng)作上,AI 能夠?qū)崟r生成話題并提示熱點,確保主播在互動中始終有??山?、有話可聊。在經(jīng)營策略上,AI 依托大數(shù)據(jù)分析提供科學的開播建議,指導(dǎo)主播把握內(nèi)容趨勢以獲取更多關(guān)注。

這種匹配效率與服務(wù)質(zhì)量的雙重提升,最終構(gòu)建了一個理想的業(yè)務(wù)閉環(huán):用戶因精準匹配而留存,主播因服務(wù)質(zhì)量優(yōu)化而增收。對平臺而言,AI 真正實現(xiàn)了效能與體驗的同步躍遷,并直接驅(qū)動了直播營收的穩(wěn)健增長。

2 深度理解:從 ID 匹配到語義認知的范式躍遷

傳統(tǒng)推薦算法多側(cè)重于 ID 特征的擬合與匹配,而在大模型快速發(fā)展的當下,我們正實現(xiàn)從單純 ID 關(guān)聯(lián)向深度語義理解的范式躍遷。接下來,我們將重點分享如何結(jié)合快手直播的場景特性,依托多模態(tài)大語言模型(MLLM)實現(xiàn)深度理解能力的突破,最終達成更優(yōu)質(zhì)的 UA 關(guān)系匹配。


首先在技術(shù)實現(xiàn)層面,支撐深度理解的關(guān)鍵在于我們構(gòu)建的多模態(tài)直播基座。早期我們曾借鑒 MiniCPM-V 等優(yōu)秀模型構(gòu)建了第一版基座,而目前則基于快手自研的 KVL 架構(gòu),實現(xiàn)了從分散式模型向通用底層的范式轉(zhuǎn)移。

通過對比可以直觀地看到架構(gòu)演進帶來的巨大差異:早期我們的理解系統(tǒng)由數(shù)十個分散的模型堆砌而成,為了解析一段直播,需要建立多級類目、屬性標簽、人物環(huán)境、動作捕捉以及顏值、游戲 IP 等眾多專項模型。這種“打補丁”式的架構(gòu)不僅識別精度有限,且可擴展性差,維護數(shù)十個在線模型的成本也極高,各模型間的協(xié)同效率十分低下。

為了解決這些問題,我們基于自研的 KVL 架構(gòu)構(gòu)建了更懂直播的通用底層。在持續(xù)預(yù)訓(xùn)練階段,我們?nèi)谌肓舜罅靠焓种辈鼍暗膶贁?shù)據(jù);在后訓(xùn)練階段,我們將直播類目標簽、主播描述等業(yè)務(wù)任務(wù)與視覺推理任務(wù)深度結(jié)合。這使得模型在保持強大通用能力的同時,實現(xiàn)了直播場景理解能力的顯著升級。

轉(zhuǎn)向這一新范式后,技術(shù)紅利十分明顯。首先,模型的泛化能力大幅提升,能夠理解各類從未見過的、新興的直播內(nèi)容,而不再受限于預(yù)設(shè)標簽;其次,多模態(tài)融合更加深入,模型能夠同時解析畫面、音頻、文本及用戶評論,實現(xiàn)真正的深度理解;此外,系統(tǒng)的可擴展性顯著增強,處理新業(yè)務(wù)邏輯時,不再需要頻繁上線新模型,而是通過策略定義即可快速補齊能力。

這種從分散走向融合的轉(zhuǎn)變,本質(zhì)上是直播生態(tài)“大腦”的進化,使模型能夠像人類一樣,在觀看直播后即可充分表達對主播風格、直播內(nèi)容及主題的多維度理解。


盡管多模態(tài)基座在領(lǐng)域訓(xùn)練中表現(xiàn)優(yōu)異,但在直播場景中,大模型對主播的認知與用戶的真實感知仍存在明顯差距。

未經(jīng)過對齊優(yōu)化的基座模型,通常只能生成機械、表層的描述,例如僅識別 “女性、室內(nèi)、唱歌” 這類基礎(chǔ)標簽,而用戶更習慣從 “治愈系、寵粉、正能量” 等情感維度認知主播。同時,受后訓(xùn)練階段對齊機制的限制,多模態(tài)模型易出現(xiàn)評價同質(zhì)化問題,對顏值等核心特質(zhì)無法做出具備區(qū)分度的深度判斷。

在此前提下,從用戶視角重新定義主播特質(zhì)成為這一階段的核心工作。我們通過兩條路徑引導(dǎo)大模型學習用戶真實反饋:一是深度挖掘用戶評論,借助 AI 聚類與語義標簽技術(shù),從海量評論中提煉可精準反映主播顏值、互動風格的高價值信息;二是聯(lián)合產(chǎn)品端發(fā)放激勵問卷,收集用戶對主播的直觀反饋,經(jīng)低質(zhì)量內(nèi)容過濾與相關(guān)性校驗后,沉淀出具備代表性的核心反饋數(shù)據(jù)。

最后,我們將用戶側(cè)反饋作為強化學習的基準事實,推動模型在多模態(tài)信息融合中持續(xù)迭代。在用戶偏好的指引下,模型生成的標簽體系與用戶視角高度契合。經(jīng)過這一迭代過程,模型不僅能客觀解析主播內(nèi)容,更能從用戶視角感知與理解主播特質(zhì)。


便實現(xiàn)了對主播內(nèi)容的深度理解與用戶視角的對齊,在直播場景中依然存在一個核心挑戰(zhàn):理解主播并不等同于理解 “用戶為何喜歡該主播”。過去的研究往往側(cè)重于單向的內(nèi)容評估,即判斷主播素質(zhì)優(yōu)劣,但優(yōu)質(zhì)內(nèi)容并不必然匹配所有用戶的口味。因此,我們必須從單邊理解邁向雙向匹配,構(gòu)建能夠推演用戶看播偏好、預(yù)測 UA 關(guān)系建立動因的深度能力。

在具體實現(xiàn)上,我們通過大模型對用戶的歷史行為序列(如打賞記錄)進行深度解析。我們將用戶過去互動過的主播視覺內(nèi)容、口播文本及評論信息作為輸入,并采用 “候選主播選擇題” 的形式對模型進行訓(xùn)練。為了得出正確答案,模型必須對用戶偏好序列與候選主播特質(zhì)進行同步的邏輯推理。在此過程中,我們引入了類似 GRPO 系列的強化學習算法,結(jié)合特定的任務(wù)規(guī)則與獎勵機制,對模型進行針對性優(yōu)化。

這種優(yōu)化帶來了雙重增益:一方面,系統(tǒng)能夠生成極其精細的用戶偏好畫像,例如精準識別出用戶對 “帶有強互動元素的歌唱類直播” 的細分偏好;另一方面,模型能夠輸出明確的推薦理由,使推薦過程具備了透明度與可解釋性。通過這種深層的心理與行為對齊,AI 實際上復(fù)盤了用戶與主播產(chǎn)生情感連接的全過程,從而將內(nèi)容理解對 UA 關(guān)系的預(yù)測精度提升到了前所未有的精度。


那么這種針對用戶關(guān)系深度理解的高投入模型是否已經(jīng)在快手落地?

直播場景恰恰提供了一個極為理想的實踐溫床。與短視頻或電商擁有數(shù)億級泛眾 DAU 的情況不同,直播中具有高頻打賞行為的高價值用戶群體規(guī)模相對精準且集中,這使得我們能夠投入更高精度的模型資源,為這部分核心用戶提供極致精準的主播匹配。

在過去的幾個月中,我們已將這種“會思考”的生成式推薦方案正式應(yīng)用于直播業(yè)務(wù)鏈路。具體流程如示例所示:系統(tǒng)首先獲取用戶的歷史打賞序列,通過大模型的歸納與推演, 剖析其個性化偏好。這種分析生成的標簽并非死板的預(yù)設(shè)分類,而是動態(tài)產(chǎn)出的描述,例如“雙人互動 PK”、“青春女神”、“明亮室內(nèi)環(huán)境”以及“交友向情感互動”等。

基于這些動態(tài)生成的深度畫像,我們能夠在千萬級的主播資源庫中,精準發(fā)掘出用戶可能感興趣、但在傳統(tǒng)推薦邏輯中尚未觸達的“潛在匹配”。這種方式極大地拓寬了興趣預(yù)測的“解空間”,使我們能夠在海量候選結(jié)果中,實現(xiàn)比以往任何內(nèi)容理解方式都更加精準的匹配效果。

3 觸點升級:AI 驅(qū)動的第一印象與認知路徑重構(gòu)


如果說前面的討論聚焦于如何構(gòu)建更聰明、更懂人心的“直播大腦”,那么接下來的核心議題便是如何利用大模型能力為這個系統(tǒng)賦予“五官與嘴巴”,讓它看得懂、會表達。第三章關(guān)于“用戶觸點升級”的目標,是希望用戶與主播的首次相遇,能從隨機的驚鴻一瞥轉(zhuǎn)化為一種精準契合的必然。

要實現(xiàn)這一目標,意味著在用戶滑動切換直播間的毫秒之間,系統(tǒng)展示的信息必須精準擊中其潛在需求。為了探究用戶在短短幾秒內(nèi)做出留存決策的底層邏輯,我們進行了深度用戶調(diào)研。結(jié)果顯示,用戶對主播的篩選主要集中在主播特點、直播信息和直播效果三個維度。

在主播特點方面,超過 55.3% 的用戶最看重主播的性格,這標志著直播行業(yè)已從早期的“顏值經(jīng)濟”跨越到了“性格經(jīng)濟”時代,用戶更傾向于尋找能產(chǎn)生情緒共鳴的有趣靈魂。

其次,直播間的封面與標題是用戶獲取信息的關(guān)鍵觸點。調(diào)研數(shù)據(jù)指出,有 40.7% 的用戶會根據(jù)直播間傳遞的核心信息(如具體的業(yè)務(wù)品類或內(nèi)容主題)來決定是否留存。

同樣重要的是直播的實時效果,其中才藝內(nèi)容與互動氛圍是決定留存的核心。一個氛圍冷清的直播間,即便主播顏值再高,也難以產(chǎn)生持久的吸引力。

由此可見,盡管用戶興趣多元,但高效、多維度地獲取主播信息,仍是他們最核心且明確的共性訴求。面對瞬息萬變的直播內(nèi)容,用戶注意力已成為極度稀缺的資源。若信息觸點匱乏,高昂的選擇成本將直接導(dǎo)致用戶流失。

因此,我們的核心目標是通過強化直播間內(nèi)外的雙重觸點,縮短用戶對主播的認知路徑。

直播間外是塑造第一印象的主戰(zhàn)場,但主播難以時刻處于完美表演狀態(tài)。此時,AI 的輔助作用便不可或缺:它能精準提取并濃縮主播的核心亮點,生成個性化的直播間外文案或動態(tài)展示,從而激發(fā)用戶的點擊意愿。

而當用戶進入直播間后,常因信息斷層(如錯過精彩的 PK 或懲罰環(huán)節(jié))而產(chǎn)生疏離感。為此,我們實時滾動播放精華摘要與直播預(yù)告,幫助用戶快速補全背景信息,確保其能迅速融入當前的直播節(jié)奏。這種“直播間外抓眼球、直播間內(nèi)留人心”的聯(lián)動機制,本質(zhì)上是利用 AI 自動生成的描述降低發(fā)現(xiàn)成本,再通過實時內(nèi)容摘要降低理解成本。


屏幕左側(cè)展示的正是我們“AI 主播簡介”功能的落地效果。通過這一功能,我們成功在用戶滑到直播間的第一秒,便能將其核心特點精準呈現(xiàn)。

首先,我們構(gòu)建了多元數(shù)據(jù)智能分析系統(tǒng),不僅實時解析當前的直播畫面,還深度整合了主播的歷史內(nèi)容、直播行為、個人簡介及預(yù)約信息等全棧數(shù)據(jù),為每位主播建立起深厚的基礎(chǔ)信息底座。

在此基礎(chǔ)上,依托 KVL 模型的深度提煉能力,系統(tǒng)會自動生成一段兼具準確性與吸引力的解讀文案。這段文案旨在突出主播的差異化核心賣點,從而徹底告別千篇一律的內(nèi)容展現(xiàn)。

“AI 主播簡介”的上線直接解決了兩大核心痛點。

一方面,它實現(xiàn)了觸點前置,用戶無需進入直播間觀察數(shù)分鐘,在 Feed 流中即可快速建立認知,極大縮短了用戶認知路徑。

另一方面,它通過緩解信息不對稱帶來的認知缺失,顯著提升了直播間的點擊效率與停留時長。例如,針對演唱經(jīng)典老歌的主播,AI 會提煉出“經(jīng)典老歌唱得透”等具有故事感的標簽,迅速將其從同質(zhì)化的內(nèi)容中脫穎而出;對于身著復(fù)古服裝的互動直播,AI 則能解釋其背后的整活邏輯,避免用戶產(chǎn)生誤解;而對于“秦腔非遺傳承”與“助農(nóng)”等關(guān)鍵詞的提取,則能迅速建立用戶的心理認同。

這一功能是將大模型的理解能力轉(zhuǎn)化為實際產(chǎn)品生產(chǎn)力的典型案例。它讓我們這些算法工程師從后臺走向前端,通過 AI 技術(shù)為主播遞上一張極具辨識度的“數(shù)字名片”。


如果說 “AI 主播簡介” 是為主播遞出的名片,那么 “AI 小快播報” 則更像是直播間內(nèi)全天候在線的智能觀察者。針對新進用戶常因 “跟不上進度” 而產(chǎn)生困惑、最終流失的長期痛點,AI 小快播報通過扮演實時記錄者的角色,根據(jù)直播間的不同形態(tài),靈活切換兩種工作模式來提升用戶體驗。

在 “內(nèi)容梗概型” 模式下,AI 能夠像撰寫新聞簡報一樣,實時還原直播的內(nèi)容主線與核心節(jié)點。例如,對于剛進入直播間的用戶,系統(tǒng)會提示 “開播 20 分鐘、PK 戰(zhàn)況、受罰后的反擊” 等關(guān)鍵信息,幫助用戶迅速補全錯過的情節(jié),消除信息斷層。而在 “氛圍鼓動型” 模式中,AI 則側(cè)重于情緒價值的引導(dǎo),通過感性的話術(shù)激發(fā)用戶的共鳴與參與感。

這種實時的智能化輔助,不僅顯著延長了用戶的觀看時長,還通過消除信息壁壘降低了用戶的心理疲勞感。同時,氛圍的有效調(diào)動直接提升了評論與點贊的互動頻率,并驅(qū)動用戶在直播生態(tài)中進行更深度的瀏覽。

4 智能體落地:從輔助工具到數(shù)字分身的價值延伸


接下來將深入討論“AI 互動智能體”的落地實踐。這一技術(shù)真正為直播間注入了“數(shù)字生命”,不僅簡化了開播流程、讓交互更自然,更實現(xiàn)了從提供情緒價值到驅(qū)動直播打賞的高效轉(zhuǎn)化。

目前的單人秀場模式正面臨人力驅(qū)動的天然瓶頸。傳統(tǒng)的直播高度依賴主播個人,要求其在持續(xù)輸出高質(zhì)量內(nèi)容的同時,還需兼顧高頻的實時互動。這種“雙線作戰(zhàn)”的強度極易導(dǎo)致主播疲勞,進而影響直播表現(xiàn)的穩(wěn)定性;此外,人力精力的有限性也制約了單人模式的營收上限,導(dǎo)致業(yè)務(wù)規(guī)模難以在保證質(zhì)量的前提下持續(xù)擴張。

針對不同發(fā)展階段的主播,其核心痛點也存在明顯不同。中小主播往往尚未形成鮮明的個人特色,且難以承接好每一位觀眾,急需 AI 補齊基礎(chǔ)互動能力,以平穩(wěn)度過冷啟動期。

而對于頭部主播而言,雖然具備優(yōu)質(zhì)的內(nèi)容產(chǎn)出能力,但在面對海量粉絲時卻分身乏術(shù)。此時,AI 的核心價值在于拓寬其服務(wù)半徑,確保每位粉絲都能獲得被重視的個性化體驗?;谶@些現(xiàn)實挑戰(zhàn),構(gòu)建 AI 互動智能體,已成為一個邏輯嚴密且具有實戰(zhàn)價值的方案。


如上圖所示,AI 助手在播前、播中、播后三個階段實現(xiàn)深度滲透。我們可以借此觀察,它如何補齊并強化直播間的服務(wù)能力,挖掘每個環(huán)節(jié)中的商業(yè)與情感價值。

直播前的準備階段,核心目標是實現(xiàn)“精準入場”。AI 助手會在開播前提前開展工作。它會搭建話題模板庫,自動準備個性化的歡迎語與感謝話術(shù)。同時,利用大模型優(yōu)化直播間標題,精準植入核心關(guān)鍵詞,提升搜索權(quán)重。此外,系統(tǒng)還會智能識別高價值粉絲,定向發(fā)送專屬邀請或紀念日提醒,保障用戶粘性。

進入直播中輔助階段,AI 助手會成為實時的“智能互動導(dǎo)師”。它能實時解析彈幕和用戶進場信號,輔助主播顧及到每一位觀眾。針對新老用戶的不同身份,AI 會生成差異化的歡迎語。結(jié)合觀眾的地域、興趣點,還能實時打造專屬話題。通過調(diào)取用戶的歷史互動記錄,AI 還能輔助主播進行動態(tài)關(guān)懷,構(gòu)建主播與用戶之間的專屬記憶。

直播后的維護環(huán)節(jié),重點轉(zhuǎn)向深度關(guān)系維護與潛力用戶挖掘。直播結(jié)束后,AI 會自動承接繁瑣工作,把即時流量轉(zhuǎn)化為長期存量。它可以自動答謝榜單貢獻突出的用戶,建立長期情感鏈接。也能在海量新觀眾里,精準挖掘潛力用戶并進行針對性培養(yǎng)。通過深度分析本場直播數(shù)據(jù),AI 還能為下一場直播給出科學的策略建議。

經(jīng)過全流程的滲透,AI 互動助手不再只是輔助工具。它更像是能幫助主播運營私域資產(chǎn)的智能合伙人。AI 讓主播從瑣碎事務(wù)中抽身,專注于核心的內(nèi)容創(chuàng)作。這從本質(zhì)上提升了直播間的運營效率。


關(guān)于 AI 互動助手在直播場景中的實際表現(xiàn),我們可以通過兩個典型案例直觀感受。

首先是 “智能破冰與引導(dǎo)” 功能。當老客戶進入直播間時,系統(tǒng)會立即識別其身份。同時,精準建議主播基于用戶的歷史偏好進行互動。比如,用戶此前若表達過聽歌訴求,助手會提示主播主動詢問其想聽的曲目。這種具備 “記憶力” 的交互,極大增強了用戶的歸屬感。

其次是 “即時打賞反饋” 功能。當用戶贈送燈牌或禮物時,助手會迅速提醒主播。并且匹配高質(zhì)量的感謝話術(shù),通過即時且溫情的反饋,促成用戶持續(xù)打賞。這種細致的 AI 輔助,已讓它成為快手直播今年的明星項目,為大盤帶來了 4.1% 的營收增長。

在賦能新主播方面,AI 助手的表現(xiàn)尤為突出。中小主播在冷啟動階段,普遍存在 “不知如何留客” 的痛點。AI 補齊了他們基礎(chǔ)服務(wù)能力的短板,讓新主播群體的營收增長接近 6%。此外,付費率、互動率及長播率等核心指標,均呈現(xiàn)出明顯的正向增長趨勢。

AI 互動助手不僅能為頭部主播錦上添花,更能為廣大中小主播雪中送炭。它通過技術(shù)手段,補齊主播服務(wù)能力的短板。讓每一個直播間,都能具備專業(yè)級的運營水平。


如果說此前介紹的 AI 互動助手是主播的輔助工具,那么 AI 分身則實現(xiàn)了主播能力的規(guī)?;瘡?fù)制。它核心解決的,是主播精力有限與用戶需求無限之間的矛盾,保證在各類高并發(fā)場景下,互動體驗都能保持實時、不間斷。

與側(cè)重第三方視角播報的 “AI 小快播報” 不同,AI 分身通過深度學習主播的語言風格,可完全切換至主播視角,完成自主交互。

要實現(xiàn)這種 “神形兼?zhèn)洹?的替代服務(wù),首先需要完成主播風格的深度復(fù)刻。通過對主播獨有的互動話術(shù)、語音節(jié)奏進行精準建模,數(shù)字分身在回復(fù)用戶時,能保持高度的風格一致性。即便主播本人分身乏術(shù),用戶依然能感受到被關(guān)注的親近感。

其次,分身具備深度內(nèi)容承接能力。它能針對用戶評論主動延伸話題,通過邏輯連貫的互動,維持直播間的活躍度。此外,數(shù)字分身還承擔著推動商業(yè)轉(zhuǎn)化的職責。它可實時監(jiān)測關(guān)注、打賞等核心行為,代替主播完成個性化答謝,確保轉(zhuǎn)化鏈路中的每個節(jié)點都能得到高效響應(yīng)。

要讓 AI 分身無破綻地替代主播提供服務(wù),我們需要攻克三項核心挑戰(zhàn)。

第一,在語料復(fù)雜、特征稀疏的場景下,如何為主播構(gòu)建更精準的數(shù)字畫像;第二,垂類數(shù)據(jù)普遍稀疏,通用模型在此類場景下表現(xiàn)往往不佳,如何通過技術(shù)手段優(yōu)化模型輸出效果;第三,高并發(fā)場景對 Badcase 率要求極高,如何將其降至極低水平,確保 AI 每一次代班都穩(wěn)定可靠。

這一系列問題的核心解決方案,是我們搭建的多智能體(Multi-agent)協(xié)作機制。該機制包含多個關(guān)鍵環(huán)節(jié):對 ASR 數(shù)據(jù)進行精細化清洗,對主播歷史互動語料做規(guī)范化處理,結(jié)合模型定向微調(diào),并接入外部知識庫。最終通過多智能體協(xié)同配合,完成整體任務(wù)。


如屏幕左側(cè)的實際應(yīng)用場景所示,AI 分身不僅能深度理解用戶需求,更能以主播特有的口吻給出有溫度的反饋。例如,針對基層才藝主播,系統(tǒng)能自動生成極具親和力的引導(dǎo)話術(shù);而針對音樂類主播,則能以貼合其形象的語氣邀約用戶點歌。

在引入 AI 分身的回復(fù)與引導(dǎo)后,直播間營收提升了 1.27%,付費 UV 與評論 UV 等也得到了顯著增強。數(shù)據(jù)證明,AI 分身有效填補了主播在精力受限時的服務(wù)空白,鎖定了原本可能流失的互動機會,顯著增強了用戶對主播的身份認同感和歸屬感。

AI 分身已不再是冰冷的數(shù)字人,而是主播服務(wù)能力的數(shù)智化延伸,確保每位進入直播間的用戶都能獲得即時回應(yīng)。這種沉浸式的交互體驗,正是我們邁向“直播 3.0:AI 共生時代”的核心標志。

5 未來展望

從 PC 秀場 1.0 時代,演進至 AI 共生的 3.0 時代,直播形態(tài)雖不斷更迭,但鏈接主播與用戶的本質(zhì)始終未變。借助大模型技術(shù),我們在三個維度實現(xiàn)了核心能力的躍遷:通過深度理解增強認知能力,通過觸點升級提升產(chǎn)品力,借助互動智能體解放主播生產(chǎn)力。

如果說過去十年的關(guān)鍵詞是“鏈接”,那么下一階段的核心,便是 AI 與直播場景的“深度共生”我們正處在從工具輔助,向全面數(shù)智化運營跨越的關(guān)鍵節(jié)點。

順應(yīng)這一趨勢,快手在 2026 年上半年的工作重點,將聚焦于“交互式主播助手”的研發(fā)。與當前單向輸出信息的助手不同,交互式助手將支持主播通過對話,進行深度咨詢與答疑,助力主播呈現(xiàn)更高質(zhì)量的直播內(nèi)容。該助手不僅能提供直播表現(xiàn)回顧,涵蓋關(guān)鍵指標分析與亮點復(fù)盤;還能針對腳本創(chuàng)意、實時話題,提供個性化建議。更重要的是,它實現(xiàn)了從單向提示到雙向互動的范式轉(zhuǎn)變。當主播對直播現(xiàn)狀產(chǎn)生困惑,比如針對場觀數(shù)據(jù)、內(nèi)容瓶頸提出疑問時,助手能實時給出專業(yè)解答與指導(dǎo)。

如果說交互式主播助手賦能于生產(chǎn)端,那么“直播伴侶”則專注于革新看播體驗。它著力打破推薦系統(tǒng)的“黑盒”現(xiàn)狀,賦予系統(tǒng)與用戶直接對話的能力,標志著看播體驗從單純的算法推演,進化為雙向的意圖對齊。直播伴侶的核心價值,在于實時捕捉并響應(yīng)用戶需求。當用戶意圖較為模糊時,系統(tǒng)會基于多樣化的興趣建模,提供探索性內(nèi)容推薦,創(chuàng)造“意外驚喜”;當用戶指令明確時,比如提出“尋找同類型主播”的訴求,系統(tǒng)會通過關(guān)鍵詞匹配與個性化過濾,精準鎖定目標。

這種交互模式,與傳統(tǒng)搜索有本質(zhì)區(qū)別:搜索通常始于明確的初始意圖,而直播伴侶則扎根于看播過程中的即興狀態(tài)。例如,用戶在觀看某類直播時,產(chǎn)生“換個口味”的念頭,這種上下文相關(guān)的訴求,恰恰需要通過交互式助手來深度滿足。為進一步增強用戶對系統(tǒng)的信任,我們將持續(xù)強化推薦算法的可解釋性。

嘉賓介紹

吳翔宇,快手算法專家,先后負責過快手的標簽體系建設(shè),內(nèi)容與行為聯(lián)合建模等工作,目前負責大模型在快手直播和商業(yè)化場景的應(yīng)用。對大模型有深入的實踐,尤其對大模型在社區(qū)場景的落地有濃厚的興趣與豐富的經(jīng)驗,推動了大模型在快手的內(nèi)容理解、智能交互、體驗優(yōu)化上等維度上的全面升級。

會議推薦

世界模型的下一個突破在哪?Agent 從 Demo 到工程化還差什么?安全與可信這道坎怎么過?研發(fā)體系不重構(gòu),還能撐多久?

AICon 上海站 2026,4 大核心專題等你來:世界模型與多模態(tài)智能突破、Agent 架構(gòu)與工程化實踐、Agent 安全與可信治理、企業(yè)級研發(fā)體系重構(gòu)。14 個專題全面開放征稿。

誠摯邀請你登臺分享實戰(zhàn)經(jīng)驗。AICon 2026,期待與你同行。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
廣告使用“清朝長辮”被指辱華,法國品牌Lemaire致歉

廣告使用“清朝長辮”被指辱華,法國品牌Lemaire致歉

南方都市報
2026-04-26 20:40:18
男子一身名牌坐地鐵,被指像成功人士,網(wǎng)友:再有錢也怕堵車

男子一身名牌坐地鐵,被指像成功人士,網(wǎng)友:再有錢也怕堵車

丫頭舫
2026-04-27 17:39:57
38歲王思聰近照認不出!滿頭白發(fā)穿睡衣度假,駝背顯老像 50 歲

38歲王思聰近照認不出!滿頭白發(fā)穿睡衣度假,駝背顯老像 50 歲

橙星文娛
2026-04-27 14:17:09
2-3!3-3!瘋狂一夜,亞特蘭大爆大冷,拉齊奧補時絕平,曼聯(lián)險勝

2-3!3-3!瘋狂一夜,亞特蘭大爆大冷,拉齊奧補時絕平,曼聯(lián)險勝

足球狗說
2026-04-28 05:07:09
“酩酊大醉”不讀míng dīng dà zuì了,正確讀音是什么?

“酩酊大醉”不讀míng dīng dà zuì了,正確讀音是什么?

未央看點
2026-04-27 22:13:40
從排隊入籍到集體觀望?美國入籍申請驟降,綠卡人群態(tài)度變了?

從排隊入籍到集體觀望?美國入籍申請驟降,綠卡人群態(tài)度變了?

紐約時間
2026-04-28 02:29:16
看完女排最新集訓(xùn),心里五味雜陳!別說里約,連倫敦周期都比不上

看完女排最新集訓(xùn),心里五味雜陳!別說里約,連倫敦周期都比不上

金毛愛女排
2026-04-28 00:00:04
Deepseek,光通信之后的下一個主升浪

Deepseek,光通信之后的下一個主升浪

靜姐的財富第六感
2026-04-26 22:31:06
淚目 趙心童曬兒時與丁俊暉合照:偶像暉哥讓我加油 你也要加油啊

淚目 趙心童曬兒時與丁俊暉合照:偶像暉哥讓我加油 你也要加油啊

風過鄉(xiāng)
2026-04-27 06:15:09
有的人為了當官,把老婆送給領(lǐng)導(dǎo)睡

有的人為了當官,把老婆送給領(lǐng)導(dǎo)睡

斜杠人生
2026-04-28 00:00:04
金價:大家不用等候了!不出意外,金價可能將歷史重演!

金價:大家不用等候了!不出意外,金價可能將歷史重演!

殘夢重生來
2026-04-28 04:40:09
不到72小時,俞敏洪再迎兩大壞消息,主播集體辭職只是“開胃菜”

不到72小時,俞敏洪再迎兩大壞消息,主播集體辭職只是“開胃菜”

阿廢冷眼觀察所
2026-04-28 00:24:36
皮蛋再次成為關(guān)注對象!研究發(fā)現(xiàn):高血脂吃皮蛋,身體或有6改善

皮蛋再次成為關(guān)注對象!研究發(fā)現(xiàn):高血脂吃皮蛋,身體或有6改善

健康科普365
2026-04-25 09:27:08
七萬匹東洋大馬的覆滅:國民黨三年敗光日本四十五年心血

七萬匹東洋大馬的覆滅:國民黨三年敗光日本四十五年心血

小莜讀史
2026-04-26 22:44:33
特朗普轉(zhuǎn)發(fā)“中印是人間地獄”,印度痛批低俗,中方態(tài)度耐人尋味

特朗普轉(zhuǎn)發(fā)“中印是人間地獄”,印度痛批低俗,中方態(tài)度耐人尋味

線裝史冊
2026-04-28 02:38:29
東南亞隱藏的“電詐大佬”,一個個正在浮出水面

東南亞隱藏的“電詐大佬”,一個個正在浮出水面

現(xiàn)實的聲音
2026-04-27 20:36:14
大姑子一家9口住進來,老公說他5200養(yǎng)活全家足夠,我?guī)夯啬锛?>
    </a>
        <h3>
      <a href=麥子情感故事
2026-04-27 21:34:15
沒人再提激光雷達數(shù)量?直擊北京車展:今年智能駕駛“卷”什么

沒人再提激光雷達數(shù)量?直擊北京車展:今年智能駕駛“卷”什么

時代周報
2026-04-26 18:14:26
涉黃被傳喚,馬斯克出事了

涉黃被傳喚,馬斯克出事了

營銷頭版
2026-04-27 14:42:14
中國排協(xié)官宣!16點30分,女排訓(xùn)練將直播,第二批球員恐揭曉

中國排協(xié)官宣!16點30分,女排訓(xùn)練將直播,第二批球員恐揭曉

跑者排球視角
2026-04-27 23:48:17
2026-04-28 05:28:49
InfoQ incentive-icons
InfoQ
有內(nèi)容的技術(shù)社區(qū)媒體
12309文章數(shù) 51863關(guān)注度
往期回顧 全部

科技要聞

DeepSeek V4上線三天,第一批實測出來了

頭條要聞

坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

頭條要聞

坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

體育要聞

人類馬拉松"破二"新紀元,一場跑鞋軍備競賽

娛樂要聞

黃楊鈿甜為“耳環(huán)風波”出鏡道歉:謠言已澄清

財經(jīng)要聞

Meta 140億收購Manus遭中國發(fā)改委否決

汽車要聞

不那么小眾也可以 smart的路會越走越寬

態(tài)度原創(chuàng)

家居
數(shù)碼
房產(chǎn)
公開課
軍事航空

家居要聞

江景風格 流動的秩序

數(shù)碼要聞

6K/3K雙模切換!三星這款顯示器什么水平?

房產(chǎn)要聞

信號!海南商業(yè)版圖,迎來大變局!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗外長折返伊斯蘭堡內(nèi)情披露

無障礙瀏覽 進入關(guān)懷版