国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

亞馬遜把視頻分析成本砍了47%,卻沒人發(fā)現(xiàn)這個隱藏開關(guān)

0
分享至


全球每天產(chǎn)生的視頻數(shù)據(jù)超過5億小時,但能被真正"看懂"的不到3%。這不是存儲問題,是理解能力的瓶頸——傳統(tǒng)方案要么雇人逐幀看,要么用預(yù)設(shè)規(guī)則硬套,漏掉的關(guān)鍵信息比抓到的還多。

亞馬遜云科技(AWS)最近開源了一套基于Amazon Bedrock多模態(tài)模型的視頻理解方案,用三種架構(gòu)路徑把規(guī)模化視頻分析的成本和延遲重新做了分配。這套方案已經(jīng)放在GitHub上,但有意思的是,文檔里藏著一個讓處理成本直降47%的幀去重機制,多數(shù)人第一次看都會滑過去。

為什么傳統(tǒng)視頻分析總在"猜謎"

現(xiàn)有的視頻分析大致分兩派:人工審核派和計算機視覺派。前者準(zhǔn)但慢,后者快但笨——只能識別預(yù)定義的標(biāo)簽,比如"人臉""車牌",遇到需要理解語境的場景就抓瞎。

舉個例子:一段監(jiān)控畫面里,一個人站在ATM機前。傳統(tǒng)CV能告訴你"檢測到人臉",但判斷這是正常取款還是可疑逗留,需要理解時間序列、肢體語言和周邊環(huán)境的關(guān)系。這種"語義級"理解恰恰是規(guī)則系統(tǒng)的死角。

多模態(tài)基礎(chǔ)模型(Multimodal Foundation Models)的介入改變了游戲規(guī)則。這類模型能同時處理視覺和文本信息,生成自然語言描述、回答關(guān)于視頻內(nèi)容的問題、檢測那些"難以編程定義"的細(xì)微事件。Bedrock上的Nova系列模型就是沖著這個場景來的。

三種架構(gòu),三種"解題思路"

AWS這次開源的方案沒有搞"一刀切",而是針對不同的成本-精度-延遲權(quán)衡,提供了三條技術(shù)路徑。

路徑一:幀采樣+語義去重


這是最經(jīng)濟的方案。系統(tǒng)以固定間隔抽取視頻幀,用Nova多模態(tài)嵌入模型(MME)生成256維向量表示,通過余弦距離計算幀間相似度。距離低于0.2閾值的幀被判定為冗余,直接丟棄。

這個去重機制的設(shè)計很微妙:它不是簡單的像素比對,而是捕捉高層視覺概念。光線微調(diào)、鏡頭輕微抖動不會觸發(fā)誤判,但場景切換能精準(zhǔn)識別。測試數(shù)據(jù)顯示,對于監(jiān)控類固定機位視頻,去重率能達(dá)到60%以上,意味著API調(diào)用成本同比例下降。

音頻部分走獨立管道,用Amazon Transcribe轉(zhuǎn)寫。視覺和文本最終合并輸入多模態(tài)模型做聯(lián)合推理。

路徑二:關(guān)鍵幀+事件驅(qū)動

適合需要精確時間戳的場景,比如廣告插播檢測、體育賽事精彩瞬間抓取。系統(tǒng)先用輕量級模型做初篩,只在檢測到預(yù)定義事件觸發(fā)時才調(diào)用大模型深度分析。

這種"分層過濾"的思路,本質(zhì)上是用小模型的確定性換大模型的不確定性。延遲比純幀采樣高,但精度更可控,適合對誤報容忍度低的商業(yè)場景。

路徑三:原生視頻理解

最高配選項,直接把原始視頻流喂給支持時序建模的多模態(tài)模型。不需要抽幀、不需要對齊音畫,模型自己學(xué)習(xí)時空關(guān)聯(lián)。代價是計算成本指數(shù)級上升,目前只適用于高價值內(nèi)容的深度分析,比如影視版權(quán)合規(guī)審查、法醫(yī)級監(jiān)控溯源。

那個被多數(shù)人忽略的"成本開關(guān)"


回到幀采樣方案里的去重機制。文檔里提到兩種相似度計算方法,但Nova MME的方案明顯更受推薦——不是因為技術(shù)更先進(jìn),而是成本結(jié)構(gòu)更友好。

嵌入模型的調(diào)用費用遠(yuǎn)低于完整的多模態(tài)推理。用 embedding 做預(yù)篩選,相當(dāng)于在"看懂畫面"之前先問一句"這張和上一張像不像",把大量重復(fù)勞動擋在門外。AWS內(nèi)部測試的監(jiān)控場景里,這個預(yù)處理步驟讓總成本從每千分鐘視頻$47降到$25,降幅47%。

但這里有個隱藏前提:視頻內(nèi)容的冗余度。對于電影、Vlog這類剪輯密集的內(nèi)容,去重效果有限;監(jiān)控、直播、會議錄像才是甜點場景。選型之前得先問自己:我的視頻"有多無聊"?

另一個細(xì)節(jié)是閾值調(diào)參。默認(rèn)0.2的余弦距離是個保守值,追求更高壓縮率可以上調(diào)到0.3,但可能漏掉細(xì)微變化——比如監(jiān)控畫面里一個人從站立改為蹲下,向量距離可能剛好卡在0.25附近。這個 trade-off 沒有標(biāo)準(zhǔn)答案,得用實際數(shù)據(jù)回測。

開源代碼里的"產(chǎn)品經(jīng)理思維"

整套方案的編排用的是AWS Step Functions,狀態(tài)機設(shè)計暴露了明顯的"防坑"意圖。每個處理階段都有明確的錯誤捕獲和重試邏輯,甚至預(yù)留了人工審核的回調(diào)接口。

這種設(shè)計哲學(xué)很AWS:工具鏈給你搭好,但關(guān)鍵決策點留給你自己填。比如去重后的幀序列如何與音頻時間戳對齊,文檔里給了兩種策略——嚴(yán)格同步(犧牲部分幀)和寬松對齊(容忍輕微漂移)——但沒有替你做選擇。

GitHub倉庫的示例代碼里還埋了一個彩蛋:針對Nova Pro和Nova Lite兩套模型,分別預(yù)設(shè)了不同的幀采樣率和去重閾值。Pro版追求精度,采樣更密、閾值更嚴(yán);Lite版走量,10fps抽幀、0.3閾值,成本再砍一半。這種"預(yù)設(shè)配置"的顆粒度,明顯是踩過足夠多的坑才總結(jié)出來的。

目前這套方案已經(jīng)被用在三個公開場景:媒體公司的廣告合規(guī)審查(路徑二)、物流倉庫的安全監(jiān)控(路徑一)、以及一個未透露名稱的流媒體平臺的內(nèi)容審核(路徑三)。最后一個案例的延遲要求最苛刻,端到端處理需要在內(nèi)容上傳后15秒內(nèi)完成初審——他們最終選了路徑一,但把Nova MME換成了更輕量的自定義嵌入模型,代價是犧牲部分語義理解能力。

如果你的業(yè)務(wù)每天需要處理超過1000小時的視頻,現(xiàn)在值得去GitHub拉一遍代碼。但有個問題想先問你:你現(xiàn)在的視頻分析 pipeline 里,有多少計算量花在了"看重復(fù)畫面"上?這個數(shù)字可能比你想的高得多。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
泰國總理換新車支持國產(chǎn)!從勞斯萊斯到比亞迪,還向民眾極力推薦

泰國總理換新車支持國產(chǎn)!從勞斯萊斯到比亞迪,還向民眾極力推薦

削桐作琴
2026-03-26 18:14:58
網(wǎng)傳蘇州女司機撞到老人后被家屬打死?記者核實:女司機耳部縫針治療后已出院,后續(xù)仍需觀察

網(wǎng)傳蘇州女司機撞到老人后被家屬打死?記者核實:女司機耳部縫針治療后已出院,后續(xù)仍需觀察

揚子晚報
2026-03-25 20:25:53
76人最多領(lǐng)先47分大勝公牛 恩比德復(fù)出35+6+7喬治解禁28分

76人最多領(lǐng)先47分大勝公牛 恩比德復(fù)出35+6+7喬治解禁28分

醉臥浮生
2026-03-26 09:25:57
旅游+演藝,激活消費新空間(大數(shù)據(jù)觀察)

旅游+演藝,激活消費新空間(大數(shù)據(jù)觀察)

人民網(wǎng)
2026-03-26 06:17:20
心梗去世的人越來越多?醫(yī)生再次強調(diào):寧可打打牌,也別做這6事

心梗去世的人越來越多?醫(yī)生再次強調(diào):寧可打打牌,也別做這6事

健康之光
2026-03-26 16:00:06
伊朗切斷自己的退路,停戰(zhàn)三條件震動全球,47年恩怨要做了斷

伊朗切斷自己的退路,停戰(zhàn)三條件震動全球,47年恩怨要做了斷

近史談
2026-03-26 06:17:39
最自私的人是什么樣的?網(wǎng)友:我爸58歲得癌,拆遷180萬全部花光

最自私的人是什么樣的?網(wǎng)友:我爸58歲得癌,拆遷180萬全部花光

火山詩話
2026-03-24 17:32:57
特朗普幫了中國大忙,中國首次成為全球第一,日本完全被踩在腳下

特朗普幫了中國大忙,中國首次成為全球第一,日本完全被踩在腳下

時尚的弄潮
2026-03-26 14:02:47
國安部緊急提醒:手機這3類功能絕不常開!現(xiàn)在改還來得及

國安部緊急提醒:手機這3類功能絕不常開!現(xiàn)在改還來得及

西莫的藝術(shù)宮殿
2026-03-26 15:20:40
廣東一體長超2米、重達(dá)40多斤大蟒蛇河邊曬太陽被抓捕,將擇機放生;街坊稱年前也曾抓走一條類似大小的蟒蛇,猜測是一公一母在此藏身安家

廣東一體長超2米、重達(dá)40多斤大蟒蛇河邊曬太陽被抓捕,將擇機放生;街坊稱年前也曾抓走一條類似大小的蟒蛇,猜測是一公一母在此藏身安家

瀟湘晨報
2026-03-26 11:59:13
中央定調(diào),養(yǎng)老金調(diào)整方向明確,2026年若上漲,企退能多漲3%嗎?

中央定調(diào),養(yǎng)老金調(diào)整方向明確,2026年若上漲,企退能多漲3%嗎?

有范又有料
2026-03-26 14:35:52
伊朗警告地面戰(zhàn)“更加危險且代價更大”

伊朗警告地面戰(zhàn)“更加危險且代價更大”

界面新聞
2026-03-26 18:27:25
加沙的沉默:當(dāng)“抵抗之弧”烽火連天,哈馬斯為何失聲

加沙的沉默:當(dāng)“抵抗之弧”烽火連天,哈馬斯為何失聲

民間鐵血柔情
2026-03-09 06:03:33
50℃高溫鎖住國運!電不夠水沒有,印度的未來,徹底沒希望了?

50℃高溫鎖住國運!電不夠水沒有,印度的未來,徹底沒希望了?

Hi科普啦
2026-03-25 14:57:31
近期,一名中國男子去泰國玩,花6000泰銖找21歲女孩,悲劇發(fā)生了

近期,一名中國男子去泰國玩,花6000泰銖找21歲女孩,悲劇發(fā)生了

鯨探所長
2026-03-01 14:38:25
罕見一幕,中俄戰(zhàn)機升空后,特朗普急喊話,就怕再晚一步就鎮(zhèn)不住

罕見一幕,中俄戰(zhàn)機升空后,特朗普急喊話,就怕再晚一步就鎮(zhèn)不住

夏目歷史君
2026-03-26 17:23:42
近90%都是“小藍(lán)燈”!高架和高速越來越多了!網(wǎng)友:你不要過來??!

錢塘地產(chǎn)
2026-03-26 11:27:56

殲-16D攜載LD-8A,開啟反輻射作戰(zhàn)新篇!

殲-16D攜載LD-8A,開啟反輻射作戰(zhàn)新篇!

楊風(fēng)
2026-03-25 20:50:09
穆雷轟53+6+4無緣今日最佳!對不起,東契奇暴走創(chuàng)神級紀(jì)錄

穆雷轟53+6+4無緣今日最佳!對不起,東契奇暴走創(chuàng)神級紀(jì)錄

世界體育圈
2026-03-26 13:01:23
800架戰(zhàn)機掩護 3000輛坦克突擊 40萬大軍兩個月就位 這仗非打不可

800架戰(zhàn)機掩護 3000輛坦克突擊 40萬大軍兩個月就位 這仗非打不可

聚峰軍評
2026-03-24 15:08:30
2026-03-26 18:51:00
爬蟲飼養(yǎng)員
爬蟲飼養(yǎng)員
業(yè)余養(yǎng)了只叫“龍蝦”的AI爬蟲,主業(yè)是給互聯(lián)網(wǎng)打工。
114文章數(shù) 1關(guān)注度
往期回顧 全部

科技要聞

Meta高管狂分百億期權(quán),700名員工卻下崗

頭條要聞

原正部級劉慧被開除黨籍:結(jié)交政治騙子 匿名誣告他人

頭條要聞

原正部級劉慧被開除黨籍:結(jié)交政治騙子 匿名誣告他人

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

張雪峰家人首發(fā)聲 不設(shè)追思會喪事從簡

財經(jīng)要聞

油價"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

教育
健康
時尚
數(shù)碼
本地

教育要聞

2026高考撿漏指南:西安藏著4所“就業(yè)王炸”院校,考生閉眼沖

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

皮衣+裙,高級到炸

數(shù)碼要聞

蘋果MacBook Neo將重塑整個筆電行業(yè)!分析師紛紛強調(diào):打不過

本地新聞

救命,這只醬板鴨已經(jīng)在我手機復(fù)仇了一萬遍

無障礙瀏覽 進(jìn)入關(guān)懷版