国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

【精選】基于AIGC的輕量化廣電數(shù)字人的生成及應用

0
分享至

本文精選自《廣播與電視技術(shù)》2025第11期,閱讀原文請訪問“廣電獵酷”小程序“”。


近年來,人工智能生成內(nèi)容(AIGC)技術(shù)的迅猛發(fā)展,為數(shù)字人制作提供了新路徑。針對廣電行業(yè)對高頻次、低成本數(shù)字人內(nèi)容的迫切需求,本研究提出了一條基于AIGC的輕量化廣電數(shù)字人生成路徑。該路徑通過充分運用各類AIGC技術(shù),摒棄了依賴專業(yè)硬件與復雜工藝的“重”制作模式,轉(zhuǎn)向以智能化、自動化為核心的“輕”生成范式,通過流程整合與資源協(xié)同,實現(xiàn)生成效率與內(nèi)容質(zhì)量的最優(yōu)平衡。

本文作者:

呂晨,任海全 北京廣播電視臺

第一作者簡介:

呂晨(1989—),女,北京廣播電視臺高級工程師,碩士。主要從事廣播播出系統(tǒng)的研究、AIGC及其在廣播電視行業(yè)的應用研究。

NO.1

輕量化廣電數(shù)字人生成路徑的整體設(shè)計

1.1設(shè)計目標與核心原則

本路徑的設(shè)計整合多種 AIGC 技術(shù),確立了明確的輕量化目標:實現(xiàn)高頻生產(chǎn),支持日更級內(nèi)容輸出;確保成本可控,顯著降低專業(yè)設(shè)備與人員依賴 ;保障質(zhì)量達標,滿足廣電播出基本要求。

為實現(xiàn)這些目標,路徑構(gòu)建了三大核心原則 :并行發(fā)起,在流程設(shè)計上實現(xiàn)視覺與語音支路的同步啟動;串行依賴,在各支路內(nèi)部基于 AIGC 技術(shù)特性建立穩(wěn)定處理序列 ;審核閉環(huán),在 AIGC 生成關(guān)鍵節(jié)點嵌入人工審核,確保內(nèi)容安全與質(zhì)量。

1.2生成路徑的流程剖析

基于 AIGC 技術(shù)構(gòu)建的輕量化廣電數(shù)字人生成路徑,包含了視覺與語音兩條并行生成支路及最終合成環(huán)節(jié)(如圖1所示),各環(huán)節(jié)通過 AIGC 技術(shù)的輸入輸出關(guān)系緊密銜接,并在關(guān)鍵節(jié)點設(shè)有審核機制以確保內(nèi)容質(zhì)量。


圖1 輕量化數(shù)字人生成路徑示意圖

該路徑具體流程充分體現(xiàn)了多種 AIGC 技術(shù)的協(xié)同應用:視覺支路通過 AIGC 文生圖 / 圖生圖模型將文本或圖像輸入轉(zhuǎn)化為數(shù)字人靜態(tài)形象 ;語音支路借助 AIGC 大語言模型生成播報文案,再通過 AIGC 語音合成技術(shù)轉(zhuǎn)化為語音音頻。在合成環(huán)節(jié),基于 AIGC 音頻驅(qū)動技術(shù)將靜態(tài)形象與語音音頻融合,生成口型精準匹配的廣電數(shù)字人播報視頻。最終輸出前需經(jīng)過成品質(zhì)量審核,確保內(nèi)容符合播出標準。

整個流程通過合理的并行設(shè)計提升效率,基于 AIGC 技術(shù)邏輯的串行執(zhí)行保證可靠性,并結(jié)合多重審核機制確保內(nèi)容質(zhì)量與安全。

1.3“輕量化”在路徑中的體現(xiàn)

本路徑的“輕量化”特質(zhì)源于 AIGC技術(shù)的全方位賦能,具體體現(xiàn)在三個層面:

1.流程輕便:通過科學的流程設(shè)計實現(xiàn)多支路并行執(zhí)行,充分發(fā)揮不同 AIGC技術(shù)的獨立處理能力,大幅壓縮生產(chǎn)周期。

2.資產(chǎn)輕盈:通過 AIGC 生成技術(shù)直接輸出標準化視頻文件,摒棄了龐大的三維模型數(shù)據(jù),極大降低了存儲與傳輸需求。

3.操作輕捷:依托 AIGC 技術(shù)的友好交互特性,內(nèi)容創(chuàng)作者無需專業(yè)三維軟件技能,即可實現(xiàn)高效的數(shù)字人內(nèi)容創(chuàng)作。

該路徑通過多種 AIGC 技術(shù)在流程中的有機組合,構(gòu)建了真正意義上的輕量化廣電數(shù)字人生產(chǎn)解決方案,為行業(yè)規(guī)?;瘧锰峁┝丝煽柯窂?。

NO.2

關(guān)鍵技術(shù)與實現(xiàn)

本章將系統(tǒng)闡述輕量化廣電數(shù)字人生成路徑中各環(huán)節(jié)所依托的核心 AIGC 技術(shù)。這些技術(shù)共同構(gòu)成了從文本描述到最終視頻內(nèi)容的自動化生成基礎(chǔ),是實現(xiàn)輕量化生產(chǎn)目標的技術(shù)保障。

2.1視覺資產(chǎn)生成環(huán)節(jié)的關(guān)鍵技術(shù)

視覺資產(chǎn)生成環(huán)節(jié)主要依托 AIGC 領(lǐng)域的圖像生成技術(shù),具體包括文生圖與圖生圖兩類生成方式。通過 AIGC 模型對輸入信息的深度語義理解與視覺重構(gòu),能夠高效生成符合要求的廣電數(shù)字人靜態(tài)形象。

國內(nèi)主流平臺如文心一言、通義萬相和即夢 AI 等在中文語境理解和文化特征表現(xiàn)方面具有顯著優(yōu)勢,能夠準確解析包含特定文化元素的描述詞,更好地適配廣電行業(yè)需求。提示詞工程對生成質(zhì)量至關(guān)重要,采用涵蓋主體、細節(jié)、環(huán)境與風格的結(jié)構(gòu)化提示策略可有效改善輸出效果。技術(shù)選型應兼顧生成質(zhì)量、計算效率與文化適配性,上述國產(chǎn) AIGC 模型在這些方面的綜合優(yōu)勢明顯,更適合廣電行業(yè)的輕量化應用場景。

2.2語音資產(chǎn)生成環(huán)節(jié)的關(guān)鍵技術(shù)

語音資產(chǎn)生成環(huán)節(jié)充分利用 AIGC 技術(shù)在自然語言處理與語音合成方面的能力。在文案生成方面,DeepSeek、通義千問、文心一言等國產(chǎn)大語言模型能夠依據(jù)主題快速生成結(jié)構(gòu)嚴謹、表達準確且符合中文語境和文化習慣的播報文案。

語音合成環(huán)節(jié)優(yōu)先選用國內(nèi)技術(shù)方案,MiniMax Speech-02 等商用 AIGC 語音合成方案可以提供高質(zhì)量的云端 API 服務,支持高質(zhì)量聲音復刻與多情感語音合成,適合廣電行業(yè)快速集成與應用。另一方面,IndexTTS2、VibeVoice 等開源AIGC 語音合成技術(shù)支持本地化部署,雖需自行配置推理環(huán)境,但具備更高的數(shù)據(jù)安全性和定制靈活性。

實際系統(tǒng)構(gòu)建中,可通過靈活調(diào)用云端 API 或部署本地TTS 引擎,將大語言模型與語音合成服務高效集成,形成端到端的自動化語音生產(chǎn)流程,為廣電行業(yè)提供高質(zhì)量、高效率的語音生成解決方案。

2.3音頻驅(qū)動與視頻輸出環(huán)節(jié)的關(guān)鍵技術(shù)

音頻驅(qū)動與視頻輸出環(huán)節(jié)是廣電數(shù)字人生產(chǎn)流程中的核心技術(shù)階段,承擔著通過輸入音頻驅(qū)動靜態(tài)數(shù)字人圖像生成最終播出視頻的關(guān)鍵任務,其性能直接決定數(shù)字人內(nèi)容的音畫同步質(zhì)量與視覺表現(xiàn)力。

目前,已有多種成熟可靠的 AIGC 技術(shù)能夠為這一環(huán)節(jié)的實現(xiàn)提供有力支持。Wan2.2-S2V 基于擴散模型實現(xiàn)高精度口型同步與電影級視頻生成,在單人播報場景中表現(xiàn)優(yōu)異。MultiTalk 通過創(chuàng)新的標簽旋轉(zhuǎn)位置嵌入技術(shù),有效解決多角色對話場景中的音畫綁定難題,適用于訪談、節(jié)目等多人群場景。InfiniteTalk 采用稀疏幀視頻配音和流式生成架構(gòu),在確??谛屯骄鹊耐瑫r實現(xiàn)長視頻生成與全身動作的連貫性。

上述 AIGC 技術(shù)均以開源形式提供,支持本地化部署,便于依據(jù)廣播電視業(yè)務的具體需求進行靈活選擇與適配,為廣電數(shù)字人技術(shù)的大規(guī)模應用提供可靠的技術(shù)支持。

2.4技術(shù)集成與實現(xiàn)考量

在輕量化廣電數(shù)字人生成路徑的整體實現(xiàn)中,需要基于AIGC 技術(shù)特點統(tǒng)籌以下關(guān)鍵要素 :

1. 效果與效率的協(xié)同 :平衡 AIGC 生成質(zhì)量與推理速度,優(yōu)先采用高效且支持分布式部署的模型,在滿足口型同步度、畫面真實感等基本播出要求的同時保障時效性。

2. 資源優(yōu)化與成本控制 :通過模型量化、顯存優(yōu)化與多任務調(diào)度降低 AIGC 模型資源開銷,積極利用國產(chǎn)化推理框架與硬件適配控制成本,支撐大規(guī)模應用。

3. 可擴展性與質(zhì)量保障 :保持技術(shù)架構(gòu)的模塊化和開放性,為后續(xù) AIGC 算法迭代和多風格擴展預留能力。建立全流程質(zhì)量校驗機制,對生成結(jié)果的音畫同步、語義一致性等關(guān)鍵指標進行監(jiān)測與篩選。

通過以上維度的統(tǒng)籌設(shè)計,能夠構(gòu)建既滿足輕量化要求,又兼顧業(yè)務適應性的廣電數(shù)字人生成路徑,為 AIGC 技術(shù)在廣電行業(yè)的深度應用提供實踐基礎(chǔ)。

NO.3

實踐成果與流程驗證

為驗證技術(shù)路徑的可行性,前述基于 AIGC 的輕量化廣電數(shù)字人生成路徑在典型廣電場景中完成了全流程驗證,積累了實踐經(jīng)驗并取得了階段性成果。

3.1典型場景的流程驗證與初步成果

該技術(shù)路徑已在以下三類典型場景中完成應用驗證 :

1.應急預警播報場景:通過大雨紅色預警播報的實踐(如圖 2 所示),驗證了基于 AIGC 的輕量化廣電數(shù)字人在緊急信息發(fā)布方面的快速響應能力。


圖2 廣電數(shù)字人在應急預警播報場景中的應用

2.重大活動播報場景:圍繞 2025 年北京文化論壇、服貿(mào)會等重大活動,開展了即時新聞播報驗證(如圖 3 所示)。


圖3 廣電數(shù)字人在重大活動播報場景中的應用

3.生活服務類播報場景:以二十四節(jié)氣介紹為代表,驗證了廣電數(shù)字人在生活資訊領(lǐng)域的適用性。通過 AIGC 技術(shù)將傳統(tǒng)文化知識轉(zhuǎn)化為親切易懂的短視頻,單期制作時間約 5 小時,展現(xiàn)了輕量化廣電數(shù)字人在日常節(jié)目制作中的便捷性與親和力,為生活服務類內(nèi)容創(chuàng)新提供了新的技術(shù)路徑。

3.2當前應用效能的階段性評估

通過多場景實踐驗證,基于 AIGC 的輕量化廣電數(shù)字人生成路徑在應用效能上展現(xiàn)出三方面優(yōu)勢 :制作效率顯著提升,時政類內(nèi)容生產(chǎn)周期從數(shù)天縮短至小時級;成本控制效果明顯,減少了對專業(yè)攝像、后期人員的依賴 ;內(nèi)容質(zhì)量基本達標,口型同步與畫面質(zhì)量滿足新媒體端播出要求。特別是在政務與應急場景中,技術(shù)路徑展現(xiàn)出快速響應、靈活生產(chǎn)的特點,為構(gòu)建現(xiàn)代化公共服務體系提供了技術(shù)支撐。

3.3實踐過程中暴露的局限性

在取得初步成果的同時,實踐過程中也發(fā)現(xiàn)當前技術(shù)路徑在廣電高標準場景下存在的局限性 :數(shù)字人表現(xiàn)力仍顯不足,面部表情單一,缺乏細膩情感變化,影響內(nèi)容感染力;動作自然度有待提升,除口型同步外,頭部與身體的自然微動作缺失,觀感略顯生硬 ;系統(tǒng)集成度較低,各技術(shù)環(huán)節(jié)仍為獨立工具,未與制播系統(tǒng)深度打通,文件傳遞依賴人工操作,影響工作效率。

NO.4

應用展望與后續(xù)工作設(shè)想

基于實踐驗證中發(fā)現(xiàn)的技術(shù)局限,后續(xù)工作將重點圍繞技術(shù)深化與流程優(yōu)化兩個維度展開,進一步提升輕量化廣電數(shù)字人的實用性與易用性。

4.1 技術(shù)深化

在數(shù)字人表現(xiàn)力方面,通過引入更先進的 AIGC 情感化語音合成模型,提升語音播報的情感豐富度 ;同時優(yōu)化 AIGC 提示詞工程,增強面部微表情與肢體動作的自然度,著力提升廣電數(shù)字人的視覺表現(xiàn)力與內(nèi)容感染力。

在流程集成方面,致力于構(gòu)建一體化的輕量化廣電數(shù)字人生產(chǎn)工作流。通過開發(fā)統(tǒng)一的 AIGC 技術(shù)調(diào)度平臺,打通從文案生成到視頻輸出的各個環(huán)節(jié),減少人工干預 ;同時推動與現(xiàn)有制播系統(tǒng)的 API 對接,實現(xiàn)廣電數(shù)字人內(nèi)容的自動化歸檔與發(fā)布,全面提升生產(chǎn)效率。

4.2 應用優(yōu)化

針對已驗證的典型場景,將進一步固化生產(chǎn)流程,開發(fā)適用于不同場景的專用模板。通過優(yōu)化提示詞工程與參數(shù)配置,提升內(nèi)容生成的質(zhì)量穩(wěn)定性。同時,建立常態(tài)化的質(zhì)量監(jiān)測機制,對生成內(nèi)容的音畫同步、語義一致性等關(guān)鍵指標進行持續(xù)優(yōu)化,確保播出質(zhì)量。

通過以上技術(shù)路徑的持續(xù)完善,基于 AIGC 的輕量化廣電數(shù)字人將在廣電行業(yè)的數(shù)字化轉(zhuǎn)型中發(fā)揮更重要的作用,為高頻次、高質(zhì)量的內(nèi)容生產(chǎn)提供可靠的技術(shù)支撐。

NO.5

結(jié)束語

本研究成功構(gòu)建并實踐驗證了一套基于 AIGC 的輕量化廣電數(shù)字人生成路徑。該路徑通過創(chuàng)新的流程設(shè)計與技術(shù)整合,在應急預警、重大活動報道等典型場景中展現(xiàn)出顯著的應用價值,有力推動了數(shù)字人技術(shù)在廣電領(lǐng)域的規(guī)模化落地。當前技術(shù)雖然在效率與成本方面取得突破,但在廣電數(shù)字人情感自然度、動作表現(xiàn)力與系統(tǒng)集成度方面仍存在提升空間。未來研究將聚焦于多模態(tài) AIGC 技術(shù)的深度融合,重點突破自然動作生成等關(guān)鍵技術(shù)瓶頸,進一步提升廣電數(shù)字人的智能水平與藝術(shù)表現(xiàn)力,拓展其在智慧廣電生態(tài)中的創(chuàng)新應用,為媒體深度融合發(fā)展提供持續(xù)技術(shù)支撐。

end

參考文獻

[1] 謝婧, 寧金輝, 孫琳, 于明. 虛擬數(shù)字資產(chǎn)在視聽行業(yè)的生產(chǎn)與應用研究[J]. 北京: 影視制作, 2024, 30(7): 41-45.

[2] 孫德萊. 城市臺虛擬數(shù)字人的研究與實踐[J]. 北京: 廣播與電視技術(shù), 2024, 51(10): 15-19.

[3] 郝洺, 張翀, 馮海亮, 施玉海. 基于語音驅(qū)動的風格化數(shù)字人關(guān)鍵技術(shù)研究與應用示范[J]. 北京: 廣播與電視技術(shù), 2024, 51(10): 20-23.

《廣播與電視技術(shù)》、“廣電獵酷”廣告經(jīng)營與商務合作代理:

北京中廣信通文化傳媒有限公司

聯(lián)系人:李聰

聯(lián)系電話:18518221868

好文共賞請轉(zhuǎn)發(fā) 有話要說請留言

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
抗美援朝中,5位高級軍事干部被撤職,他們分別是誰?因為何事?

抗美援朝中,5位高級軍事干部被撤職,他們分別是誰?因為何事?

墨說古今
2025-12-23 23:49:00
比亞迪突然官宣:188萬元,新車正式上市

比亞迪突然官宣:188萬元,新車正式上市

高科技愛好者
2025-12-24 23:01:12
強勢帝王在位54年,43年統(tǒng)兵作戰(zhàn),一生奉行誰不服就打誰的準則

強勢帝王在位54年,43年統(tǒng)兵作戰(zhàn),一生奉行誰不服就打誰的準則

磊子講史
2025-12-23 11:14:11
特朗普硬扛47周后發(fā)表逃跑宣言,美政府稱中國強大

特朗普硬扛47周后發(fā)表逃跑宣言,美政府稱中國強大

絕世的畫a
2025-12-24 22:05:06
藤浦惠——極品身材,業(yè)界的鄰家輕熟美女

藤浦惠——極品身材,業(yè)界的鄰家輕熟美女

素然追光
2025-12-11 00:24:21
樊振東不回國,波爾說可憐的小伙子平時孤零零的,將邀請他過圣誕

樊振東不回國,波爾說可憐的小伙子平時孤零零的,將邀請他過圣誕

李橑在北漂
2025-12-24 13:51:45
飛機偶遇徐志勝!手不離書,脫口秀演員的內(nèi)核果然靠知識撐著

飛機偶遇徐志勝!手不離書,脫口秀演員的內(nèi)核果然靠知識撐著

石場阿鑫
2025-12-24 12:24:17
地主傻兒子往井里扔金條,土匪洗劫一空,他指著井底:這是后路

地主傻兒子往井里扔金條,土匪洗劫一空,他指著井底:這是后路

牛魔王與芭蕉扇
2025-12-22 16:51:33
俄烏迎來劇終,戰(zhàn)后留80萬士兵,最大保證國出現(xiàn),歐盟賠了個精光

俄烏迎來劇終,戰(zhàn)后留80萬士兵,最大保證國出現(xiàn),歐盟賠了個精光

梁訊
2025-12-23 19:49:05
特朗普提高攻擊調(diào)門,安理會舉行緊急會議,馬杜羅公開信反擊美國施壓

特朗普提高攻擊調(diào)門,安理會舉行緊急會議,馬杜羅公開信反擊美國施壓

環(huán)球網(wǎng)資訊
2025-12-24 06:59:26
中國發(fā)現(xiàn)“無價之寶”,每噸估價46億,日本破防:怎么又是中國的

中國發(fā)現(xiàn)“無價之寶”,每噸估價46億,日本破防:怎么又是中國的

烈史
2025-12-23 17:44:35
上海多區(qū)發(fā)布寒潮藍色預警!48小時內(nèi)降溫8-10℃!網(wǎng)友:入冬在明年?

上海多區(qū)發(fā)布寒潮藍色預警!48小時內(nèi)降溫8-10℃!網(wǎng)友:入冬在明年?

上觀新聞
2025-12-24 14:52:08
故事:山東一男子救下5只黃鼠狼后,身上頻發(fā)怪事,至今都難以解釋

故事:山東一男子救下5只黃鼠狼后,身上頻發(fā)怪事,至今都難以解釋

清茶淺談
2024-12-04 14:29:09
南博事件升級!參與定"偽"的專家徐沄秋被扒,果然有情況

南博事件升級!參與定"偽"的專家徐沄秋被扒,果然有情況

鋭娛之樂
2025-12-21 08:30:41
26歲天才股神坦言:但凡第二日漲停的股票,都會提前釋放2個信號

26歲天才股神坦言:但凡第二日漲停的股票,都會提前釋放2個信號

股經(jīng)縱橫談
2025-12-24 17:12:44
蔣介石遺體早已腐爛不堪?守靈三年的貼身侍衛(wèi)說出慈湖的秘密

蔣介石遺體早已腐爛不堪?守靈三年的貼身侍衛(wèi)說出慈湖的秘密

阿光的技巧課堂
2025-11-14 18:55:48
新來的縣委書記是我大學時的男友,會議結(jié)束,他把我叫到了辦公室

新來的縣委書記是我大學時的男友,會議結(jié)束,他把我叫到了辦公室

五元講堂
2025-12-14 08:50:03
按薄一波的資歷,假如參加55年授銜,能不能被授予“開國大將”?

按薄一波的資歷,假如參加55年授銜,能不能被授予“開國大將”?

鶴羽說個事
2025-12-20 11:25:04
不到24小時美國扣押第三艘油輪,遭遇強硬對手引發(fā)海上追逐戰(zhàn)

不到24小時美國扣押第三艘油輪,遭遇強硬對手引發(fā)海上追逐戰(zhàn)

優(yōu)趣紀史記
2025-12-23 16:23:38
美少婦晚上睡覺不關(guān)門,陌生小伙偷偷遛進,女子:隱約感到太小!

美少婦晚上睡覺不關(guān)門,陌生小伙偷偷遛進,女子:隱約感到太??!

趣味萌寵的日常
2025-10-22 10:16:29
2025-12-25 00:59:00
廣電獵酷 incentive-icons
廣電獵酷
致力于廣電科技的第一訂閱號
10893文章數(shù) 2628關(guān)注度
往期回顧 全部

科技要聞

智譜和MiniMax拿出了“血淋淋”的賬本

頭條要聞

15歲女孩遭同班14歲男生殺害:對方曾拍攝其胸部等照片

頭條要聞

15歲女孩遭同班14歲男生殺害:對方曾拍攝其胸部等照片

體育要聞

26歲廣西球王,在質(zhì)疑聲中成為本土得分王

娛樂要聞

懷孕增重30斤!闞清子驚傳誕一女夭折?

財經(jīng)要聞

北京進一步放松限購 滬深是否會跟進?

汽車要聞

“運動版庫里南”一月份亮相???或命名極氪9S

態(tài)度原創(chuàng)

藝術(shù)
手機
房產(chǎn)
公開課
軍事航空

藝術(shù)要聞

有一種冬天,叫呼倫貝爾!你絕對不能錯過!

手機要聞

榮耀Magic8 Ultra:雙3D生物識別+LOFIC主攝,還有24GB大內(nèi)存!

房產(chǎn)要聞

硬核!央企??谝痪€江景頂流紅盤,上演超預期交付!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

軍事專家:"特朗普級"戰(zhàn)艦設(shè)計疑大量借鑒中國055大驅(qū)

無障礙瀏覽 進入關(guān)懷版