国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Yelp 發(fā)布大規(guī)模管理 S3 服務(wù)器訪(fǎng)問(wèn)日志的方案

0
分享至


作者 | Craig Risi

譯者 | 馬可薇

在這篇 工程實(shí)踐文章 中,Yelp 詳細(xì)介紹了他們?nèi)绾螛?gòu)建一套可擴(kuò)展且具備成本效率的日志處理流水線(xiàn),用于在全公司范圍內(nèi)處理 Amazon S3 的服務(wù)器訪(fǎng)問(wèn)日志(SAL),并成功突破了原始日志在高規(guī)模場(chǎng)景下面臨的存儲(chǔ)成本高、查詢(xún)效率低等傳統(tǒng)瓶頸。文章系統(tǒng)性地梳理了 Yelp 在日志體量、存儲(chǔ)開(kāi)銷(xiāo)以及查詢(xún)性能方面遇到的挑戰(zhàn),以及他們?nèi)绾瓮ㄟ^(guò)工程手段讓對(duì)象級(jí)日志在大規(guī)模場(chǎng)景下變得可行。

目前,Yelp 每天都會(huì)產(chǎn)生 TB 級(jí)別的訪(fǎng)問(wèn)日志。這些日志雖然最初以純文本形式寫(xiě)入,但隨后會(huì)被轉(zhuǎn)換為緊湊的 Parquet 格式歸檔文件,從而可以被 Amazon Athena 等查詢(xún)工具高效分析。通過(guò)定期執(zhí)行的“壓縮”流程,原本分散的大量純文本日志對(duì)象會(huì)被合并為數(shù)量更少、體積更大的 Parquet 文件,這一過(guò)程將整體存儲(chǔ)空間減少了約 85%,同時(shí)將對(duì)象數(shù)量削減了 99.99% 以上。在顯著降低存儲(chǔ)成本的同時(shí),也讓權(quán)限排查、成本歸因、事故調(diào)查以及數(shù)據(jù)保留分析等查詢(xún)場(chǎng)景變得快速而經(jīng)濟(jì)。

在底層架構(gòu)上,這套系統(tǒng)使用 AWS Glue Data Catalog 來(lái)統(tǒng)一管理跨多個(gè) AWS 賬號(hào)的日志 schema,并結(jié)合定時(shí)批處理作業(yè)、Lambda 函數(shù)以及基于分區(qū)投影的表設(shè)計(jì),實(shí)現(xiàn)穩(wěn)定且高度自動(dòng)化的日志攝取流程??紤]到 SAL 本身允許延遲或重復(fù)投遞日志,系統(tǒng)在寫(xiě)入時(shí)采用冪等設(shè)計(jì),從而避免數(shù)據(jù)重復(fù)。同時(shí),一旦日志內(nèi)容被安全歸檔,原始對(duì)象就會(huì)被打上生命周期管理標(biāo)簽,按策略自動(dòng)過(guò)期清理。

這套訪(fǎng)問(wèn)日志系統(tǒng)也支撐了多種關(guān)鍵的運(yùn)維和治理場(chǎng)景。工程師可以查詢(xún)某個(gè)具體對(duì)象在特定時(shí)間點(diǎn)是否被訪(fǎng)問(wèn)或被拒絕,用于權(quán)限和安全排查;也可以按 IAM 角色聚合 API 調(diào)用情況,從而分析不同服務(wù)或團(tuán)隊(duì)的訪(fǎng)問(wèn)成本;在數(shù)據(jù)治理層面,通過(guò)將訪(fǎng)問(wèn)日志與 S3 inventory 結(jié)合,團(tuán)隊(duì)能夠識(shí)別長(zhǎng)期未被訪(fǎng)問(wèn)的對(duì)象,并在確保安全的前提下進(jìn)行清理。

Yelp 的這項(xiàng)工作具有雙重意義。一方面,它證明了長(zhǎng)期以來(lái)被認(rèn)為“過(guò)于昂貴或難以運(yùn)維”的 S3 對(duì)象級(jí)訪(fǎng)問(wèn)日志,在合理的架構(gòu)設(shè)計(jì)下完全可以實(shí)現(xiàn)規(guī)?;涞兀涣硪环矫?,它為希望提升云存儲(chǔ)環(huán)境中可觀測(cè)性、合規(guī)能力和審計(jì)能力的組織,提供了一套可參考的工程范式。隨著企業(yè)對(duì)數(shù)據(jù)治理、審計(jì)以及成本可視化需求的持續(xù)增強(qiáng),Yelp 的實(shí)踐展示了一種在不顯著推高存儲(chǔ)成本的前提下,仍能保持良好查詢(xún)能力的現(xiàn)實(shí)路徑。

與 Yelp 的實(shí)踐相呼應(yīng),業(yè)界也存在多種采用這種被 Yelp 稱(chēng)作是“大規(guī)模 S3 服務(wù)器訪(fǎng)問(wèn)日志”的類(lèi)似設(shè)計(jì)模式方案。

例如,Upsolver 作為一款數(shù)據(jù)湖與 ETL 平臺(tái),內(nèi)置了對(duì) S3 訪(fǎng)問(wèn)日志的攝取支持,可將日志轉(zhuǎn)換為面向分析的格式并針對(duì)查詢(xún)引擎進(jìn)行優(yōu)化,其 S3 訪(fǎng)問(wèn)日志的處理流程與 Yelp 的方案高度相似,均圍繞日志攝取、格式轉(zhuǎn)換以及通過(guò) Amazon Athena 等 SQL 引擎進(jìn)行查詢(xún)展開(kāi)。這種方案讓團(tuán)隊(duì)能跳過(guò)手搓自定義日志訪(fǎng)問(wèn)流水線(xiàn)的同時(shí),仍能獲得規(guī)?;罩痉治龅暮锰?。

AWS 官方同樣 發(fā)布 過(guò)一套基于 Glue 作業(yè)處理 S3 服務(wù)器訪(fǎng)問(wèn)日志的參考架構(gòu),尤其在與 Ray 結(jié)合用于可擴(kuò)展的 Python 處理場(chǎng)景中具有參考價(jià)值。該方案通過(guò)對(duì)日志進(jìn)行分區(qū)、轉(zhuǎn)換為 Parquet 格式并注冊(cè)到數(shù)據(jù)目錄中,再使用 Athena 或可視化處理工具 Amazon QuickSight 進(jìn)行分析,本質(zhì)上復(fù)現(xiàn)了 Yelp 所采用的“壓縮 + 表結(jié)構(gòu) + 數(shù)據(jù)目錄 + 查詢(xún)”的整體模式,只不過(guò)是以 AWS 托管方案的形式提供。

此外,在更通用的日志和事件型數(shù)據(jù)湖場(chǎng)景中,諸如 Apache Druid,以及 Presto/Trino 等系統(tǒng),常被用作包括 S3 對(duì)象存儲(chǔ)的底層查詢(xún)引擎。當(dāng)日志被轉(zhuǎn)換為列式存儲(chǔ)格式(如 Parquet、ORC,或通過(guò) Apache Iceberg 等湖表格式進(jìn)行管理)后,這些引擎可以作為可擴(kuò)展、低延遲的查詢(xún)層,為訪(fǎng)問(wèn)日志、審計(jì)日志或事件日志提供支撐。

對(duì)于需要近實(shí)時(shí)搜索與告警能力的場(chǎng)景(例如安全分析或異常檢測(cè)),AWS 的博文 中還提到了將 S3 訪(fǎng)問(wèn)日志通過(guò) Lambda 和攝取管道導(dǎo)入 OpenSearch,并使用 Kibana 進(jìn)行可視化分析的方案。雖然這種方式在長(zhǎng)期存儲(chǔ)效率上不如 Parquet + Athena 的組合,但在安全、合規(guī)或運(yùn)維監(jiān)控等場(chǎng)景中,可以提供更即時(shí)的調(diào)查與響應(yīng)能力。

https://www.infoq.com/news/2025/12/yelp-s3-server-access-logs/

聲明:本文為 InfoQ 翻譯,未經(jīng)許可禁止轉(zhuǎn)載。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
為什么全國(guó)人民都在拒接電話(huà)?連10086打來(lái)也是瞄一眼就掛掉了!

為什么全國(guó)人民都在拒接電話(huà)?連10086打來(lái)也是瞄一眼就掛掉了!

今朝牛馬
2026-01-08 16:05:10
老婆敗光20億真相大白10個(gè)月,張學(xué)友近況引人擔(dān)憂(yōu),王晶真沒(méi)說(shuō)錯(cuò)

老婆敗光20億真相大白10個(gè)月,張學(xué)友近況引人擔(dān)憂(yōu),王晶真沒(méi)說(shuō)錯(cuò)

攬星河的筆記
2025-12-29 17:05:48
領(lǐng)導(dǎo)30萬(wàn)員工1萬(wàn),申萬(wàn)期貨員工質(zhì)疑年終獎(jiǎng)分配遭停職,和總經(jīng)理起沖突,雙方已報(bào)警

領(lǐng)導(dǎo)30萬(wàn)員工1萬(wàn),申萬(wàn)期貨員工質(zhì)疑年終獎(jiǎng)分配遭停職,和總經(jīng)理起沖突,雙方已報(bào)警

紅星新聞
2026-01-09 19:12:18
揚(yáng)言不上春晚一周后,央媒“點(diǎn)名”岳云鵬,郭德綱的話(huà)有人信了

揚(yáng)言不上春晚一周后,央媒“點(diǎn)名”岳云鵬,郭德綱的話(huà)有人信了

銀河史記
2026-01-09 19:24:55
有點(diǎn)失控了!

有點(diǎn)失控了!

子木聊房
2026-01-09 11:52:39
45歲男星曬上海新家!4萬(wàn)電視柜,15萬(wàn)沙發(fā),沒(méi)戲拍日子照樣舒坦

45歲男星曬上海新家!4萬(wàn)電視柜,15萬(wàn)沙發(fā),沒(méi)戲拍日子照樣舒坦

瓜汁橘長(zhǎng)Dr
2026-01-09 17:44:33
吳士存:若世界滑向“叢林法則”,中國(guó)更須穩(wěn)定南海、維護(hù)國(guó)際秩序

吳士存:若世界滑向“叢林法則”,中國(guó)更須穩(wěn)定南海、維護(hù)國(guó)際秩序

澎湃新聞
2026-01-09 07:24:33
天道:低級(jí)人活在情緒里,中級(jí)人活在價(jià)值里,高級(jí)人活在覺(jué)醒里

天道:低級(jí)人活在情緒里,中級(jí)人活在價(jià)值里,高級(jí)人活在覺(jué)醒里

洞見(jiàn)
2026-01-09 21:19:55
剛剛,谷歌反超蘋(píng)果成全球第二大市值公司!而救它的,竟然是一個(gè)連名字都沒(méi)有的產(chǎn)品

剛剛,谷歌反超蘋(píng)果成全球第二大市值公司!而救它的,竟然是一個(gè)連名字都沒(méi)有的產(chǎn)品

AI范兒
2026-01-09 09:44:00
調(diào)查:30歲健美冠軍之死

調(diào)查:30歲健美冠軍之死

新民周刊
2026-01-09 21:18:09
不要聽(tīng)他們說(shuō)什么,要看他們?cè)趺醋觯?>
    </a>
        <h3>
      <a href=胖胖說(shuō)他不胖
2026-01-09 11:00:09
特朗普:美扣押一艘離開(kāi)委內(nèi)瑞拉油輪,石油將出售

特朗普:美扣押一艘離開(kāi)委內(nèi)瑞拉油輪,石油將出售

界面新聞
2026-01-10 07:16:10
萬(wàn)科創(chuàng)始人王石妻子疑似評(píng)論郁亮“抓”

萬(wàn)科創(chuàng)始人王石妻子疑似評(píng)論郁亮“抓”

地產(chǎn)微資訊
2026-01-09 18:00:51
網(wǎng)傳某國(guó)產(chǎn)操作系統(tǒng)大廠(chǎng)老董開(kāi)除核心工程師,理由竟是 “沒(méi)穿西裝”

網(wǎng)傳某國(guó)產(chǎn)操作系統(tǒng)大廠(chǎng)老董開(kāi)除核心工程師,理由竟是 “沒(méi)穿西裝”

可達(dá)鴨面面觀
2026-01-08 19:48:13
73歲影帝欠租6萬(wàn)面臨驅(qū)逐,昔日硬漢如今禿頭領(lǐng)外賣(mài)太糟心

73歲影帝欠租6萬(wàn)面臨驅(qū)逐,昔日硬漢如今禿頭領(lǐng)外賣(mài)太糟心

蜉蝣說(shuō)
2026-01-09 14:51:15
閆學(xué)晶慌了?圈內(nèi)大佬不再沉默下場(chǎng)表態(tài),馮鞏態(tài)度屬實(shí)令人意外

閆學(xué)晶慌了?圈內(nèi)大佬不再沉默下場(chǎng)表態(tài),馮鞏態(tài)度屬實(shí)令人意外

削桐作琴
2026-01-09 17:30:49
中國(guó)通告全球?qū)θ障陆睿毡就{反擊,高市早苗手上僅剩一張牌

中國(guó)通告全球?qū)θ障陆睿毡就{反擊,高市早苗手上僅剩一張牌

博覽歷史
2026-01-09 18:05:34
網(wǎng)友建議地鐵增設(shè)月票,深圳市發(fā)改委回應(yīng)

網(wǎng)友建議地鐵增設(shè)月票,深圳市發(fā)改委回應(yīng)

澎湃新聞
2026-01-10 07:44:28
伊朗革命衛(wèi)隊(duì):將徹底挫敗 敵人陰謀 保障民眾安全

伊朗革命衛(wèi)隊(duì):將徹底挫敗 敵人陰謀 保障民眾安全

每日經(jīng)濟(jì)新聞
2026-01-10 00:04:36
中國(guó)最狠禁令砸向日本!這次結(jié)局,一定比廣場(chǎng)協(xié)議還慘

中國(guó)最狠禁令砸向日本!這次結(jié)局,一定比廣場(chǎng)協(xié)議還慘

一個(gè)壞土豆
2026-01-08 20:50:28
2026-01-10 08:32:49
InfoQ incentive-icons
InfoQ
有內(nèi)容的技術(shù)社區(qū)媒體
11920文章數(shù) 51690關(guān)注度
往期回顧 全部

科技要聞

市場(chǎng)偏愛(ài)MiniMax:開(kāi)盤(pán)漲42%,市值超700億

頭條要聞

媒體:日本吃下中方反制重拳后怕了 欲拉G7給自己壯膽

頭條要聞

媒體:日本吃下中方反制重拳后怕了 欲拉G7給自己壯膽

體育要聞

金元時(shí)代最后的外援,來(lái)中國(guó)8年了

娛樂(lè)要聞

關(guān)曉彤鹿晗風(fēng)波后露面 不受影響狀態(tài)佳

財(cái)經(jīng)要聞

投資必看!瑞銀李萌給出3大核心配置建議

汽車(chē)要聞

助跑三年的奇瑞 接下來(lái)是加速還是起跳?

態(tài)度原創(chuàng)

手機(jī)
時(shí)尚
旅游
本地
藝術(shù)

手機(jī)要聞

網(wǎng)易數(shù)碼2025年度好物揭曉:30款精選產(chǎn)品上榜,你用過(guò)哪些?

推廣中獎(jiǎng)名單-更新至2025年12月19日推廣

旅游要聞

一部電影帶火一座城 盤(pán)點(diǎn)2025被電影帶火的文旅地標(biāo)

本地新聞

云游內(nèi)蒙|“包”你再來(lái)?一座在硬核里釀出詩(shī)意的城

藝術(shù)要聞

15位著名畫(huà)家的女性之美:哪一張觸動(dòng)了你的心?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版