国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Uber 和 OpenAI 重組了限流系統(tǒng)

0
分享至


作者 | Patrick Farry

譯者 | 劉雅夢

在最近的博客文章中,優(yōu)步(Uber 的限流系統(tǒng))和 OpenAI(超越限流:擴(kuò)展對 Codex 和 Sora 的訪問)都討論了他們對限流方法的轉(zhuǎn)變:從基于計(jì)數(shù)器的、每個(gè)服務(wù)的限流轉(zhuǎn)向適應(yīng)性、基于策略的系統(tǒng)。兩家公司都開發(fā)了專有的限流平臺,并在基礎(chǔ)設(shè)施層實(shí)施。這些系統(tǒng)具有軟控制功能,通過向客戶端施加壓力而不是使用硬停止來管理流量——無論是通過概率性丟棄還是基于信用的瀑布流——確保系統(tǒng)彈性而不犧牲用戶動力。

以前,優(yōu)步工程師為每個(gè)服務(wù)實(shí)施限流,通常使用由 Redis 支持的 令牌桶。這導(dǎo)致了操作效率低下,例如額外的延遲,以及部署時(shí)需要調(diào)整閾值。不一致的配置增加了維護(hù)風(fēng)險(xiǎn),并導(dǎo)致保護(hù)不均衡,一些較小的服務(wù)沒有任何限制。此外,可觀測性是分散的,使得很難準(zhǔn)確指出由限流引起的問題。

優(yōu)步用新的全球限流器(GRL)替換了這些遺留限流器。GRL 架構(gòu)由一個(gè)三層反饋循環(huán)組成:優(yōu)步服務(wù)網(wǎng)格數(shù)據(jù)平面中的限流客戶端在本地執(zhí)行決策,區(qū)域聚合器收集指標(biāo),區(qū)域控制器計(jì)算全局限制并將其推送回客戶端。

GRL 還用一個(gè)降低可配置流量百分比(例如 10%)的系統(tǒng)取代了硬停止桶。這個(gè)策略作為一個(gè)軟限制,對調(diào)用者服務(wù)施加壓力,允許它們繼續(xù)運(yùn)行,而不會因配額耗盡而關(guān)閉。

OpenAI 以類似的架構(gòu)實(shí)施了其新的限流器;然而,主要驅(qū)動力是 Codex 和 Sora 應(yīng)用程序的用戶體驗(yàn),而不是運(yùn)維彈性。隨著越來越多的采用,OpenAI 看到了一個(gè)一致的模式:用戶發(fā)現(xiàn)這些工具具有很大的價(jià)值,但被限流中斷。雖然這些界限確保了公平的訪問和系統(tǒng)的穩(wěn)定性,但它們經(jīng)常讓參與的用戶感到沮喪。OpenAI 尋求一種方法,通過即時(shí)基于使用量的計(jì)費(fèi),在不阻礙探索的情況下保持動力。

工程團(tuán)隊(duì)設(shè)計(jì)了一種綜合方法,允許用戶在一定限額內(nèi)訪問系統(tǒng),超過限額后系統(tǒng)將從信用余額中扣除。團(tuán)隊(duì)將這個(gè)決策過程描述為“瀑布式”:

這個(gè)模型反映了用戶對產(chǎn)品的實(shí)際體驗(yàn)。限流、免費(fèi)層、信用、促銷和企業(yè)權(quán)益都只是同一個(gè)決策堆棧中的層。從用戶的角度來看,他們不會“切換系統(tǒng)”——他們只是繼續(xù)使用 Codex 和 Sora。這就是為什么信用感覺不可見:它們只是瀑布中的另一個(gè)元素。

為確保這種過渡是無縫的,OpenAI 構(gòu)建了一個(gè)專用的實(shí)時(shí)訪問引擎,將使用跟蹤、限流窗口和信用余額整合到單一評估路徑中。與傳統(tǒng)的異步計(jì)費(fèi)系統(tǒng)不同,這些系統(tǒng)因延遲而受到影響,這個(gè)引擎同步地做出可證明正確的決策:每個(gè)請求在立即檢查信用余額之前,都會識別出限流層的可用容量。

為保持低延遲,系統(tǒng)通過一個(gè)流處理器異步結(jié)算信用借記,使用穩(wěn)定的 冪等鍵 防止雙重收費(fèi)。這種架構(gòu)依賴于三個(gè)緊密耦合的數(shù)據(jù)流——產(chǎn)品使用事件、貨幣化事件和余額更新——確保每筆交易都是可審計(jì)和可對賬的,而不會中斷用戶的創(chuàng)作流程。

優(yōu)步和 OpenAI 都報(bào)告說,這些架構(gòu)轉(zhuǎn)變成功地實(shí)現(xiàn)了他們各自的操作和產(chǎn)品目標(biāo)。在優(yōu)步,全球限流器的實(shí)施已經(jīng)擴(kuò)展到每秒處理超過 8000 萬個(gè)請求,覆蓋 1100 個(gè)服務(wù),顯著降低了尾部延遲,消除了外部 Redis 依賴。該系統(tǒng)在生產(chǎn)中證明了其有效性,吸收了 15 倍的流量激增而沒有退化,并在 DDoS 攻擊到達(dá)內(nèi)部系統(tǒng)之前減輕了它們。

同樣,OpenAI 已經(jīng)將信用系統(tǒng)集成到 Codex 和 Sora 的訪問路徑中,用連續(xù)的瀑布模型替換了硬停止。平臺提供實(shí)時(shí)、準(zhǔn)確的計(jì)費(fèi),同時(shí)保持交互式 AI 應(yīng)用程序所需的低延遲性能。對于這兩家公司來說,轉(zhuǎn)向內(nèi)部、基礎(chǔ)設(shè)施級別的平臺已經(jīng)用自動化、適應(yīng)性控制取代了手動配置,允許他們各自的集群在最小的人為干預(yù)下處理大規(guī)模問題。

https://www.infoq.com/news/2026/02/uber-openai-rate-limiting/

聲明:本文為 InfoQ 翻譯,未經(jīng)許可禁止轉(zhuǎn)載。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
國會以55-42票通過限制總統(tǒng)開戰(zhàn)權(quán),特朗普或面臨彈劾

國會以55-42票通過限制總統(tǒng)開戰(zhàn)權(quán),特朗普或面臨彈劾

原來仙女不講理
2026-03-03 11:48:30
父親浦東最大地主,母親是影后,上海有133套房21歲就已身家百億

父親浦東最大地主,母親是影后,上海有133套房21歲就已身家百億

沒有偏旁的常慶
2026-03-03 06:45:03
冒死反擊!伊朗,徹底殺瘋了!

冒死反擊!伊朗,徹底殺瘋了!

大嘴說天下
2026-03-01 22:02:26
特朗普:對斯塔默感到“非常失望”;斯塔默:我們都記得伊拉克戰(zhàn)爭所犯的錯(cuò)誤

特朗普:對斯塔默感到“非常失望”;斯塔默:我們都記得伊拉克戰(zhàn)爭所犯的錯(cuò)誤

揚(yáng)子晚報(bào)
2026-03-03 15:03:31
多家交易所,緊急提示風(fēng)險(xiǎn)!

多家交易所,緊急提示風(fēng)險(xiǎn)!

環(huán)球網(wǎng)資訊
2026-03-03 07:59:09
歷史上首次,中國石油出現(xiàn)連續(xù)漲停走勢,并創(chuàng)18年以來新高!

歷史上首次,中國石油出現(xiàn)連續(xù)漲停走勢,并創(chuàng)18年以來新高!

有范又有料
2026-03-03 12:05:49
美特使披露對伊動武前談判破裂細(xì)節(jié):伊方拒絕“十年零濃縮鈾”方案

美特使披露對伊動武前談判破裂細(xì)節(jié):伊方拒絕“十年零濃縮鈾”方案

財(cái)聯(lián)社
2026-03-03 12:28:08
馬刺整活整出歷史級浪漫!1-2-3-4-5 號球衣首發(fā)陣,太炸了!

馬刺整活整出歷史級浪漫!1-2-3-4-5 號球衣首發(fā)陣,太炸了!

林子說事
2026-03-03 07:48:19
伊朗最高國家安全委員會發(fā)布第1號公告

伊朗最高國家安全委員會發(fā)布第1號公告

界面新聞
2026-02-28 18:24:27
藏匿9年的本·拉登:5米高墻鐵絲網(wǎng)防護(hù),致命破綻是院中晾衣繩

藏匿9年的本·拉登:5米高墻鐵絲網(wǎng)防護(hù),致命破綻是院中晾衣繩

通鑒史智
2026-01-23 14:52:23
迪拜人設(shè)崩了

迪拜人設(shè)崩了

睡前馬戲團(tuán)
2026-03-02 16:21:05
再見,崔龍海!

再見,崔龍海!

IN朝鮮
2026-03-02 15:47:57
突發(fā)!上海重啟五年限售!

突發(fā)!上海重啟五年限售!

巢客HOME
2026-03-03 07:00:05
阿韋洛亞:裁判縱容了這樣一場比賽,赫塔費(fèi)做了裁判允許的事

阿韋洛亞:裁判縱容了這樣一場比賽,赫塔費(fèi)做了裁判允許的事

懂球帝
2026-03-03 08:39:44
周杰倫和田馥甄戀情,突沖熱搜第一!

周杰倫和田馥甄戀情,突沖熱搜第一!

人間頌
2026-03-01 12:25:17
《最強(qiáng)大腦》徹底被打臉

《最強(qiáng)大腦》徹底被打臉

鋒哥與八卦哥
2026-01-18 15:11:06
外媒:一艘懸掛美國國旗油輪遭兩枚炮彈擊中

外媒:一艘懸掛美國國旗油輪遭兩枚炮彈擊中

參考消息
2026-03-02 20:53:04
日媒看明白了,伊朗不是委內(nèi)瑞拉,特朗普慫恿庫爾德只因判斷失敗

日媒看明白了,伊朗不是委內(nèi)瑞拉,特朗普慫恿庫爾德只因判斷失敗

淡然小司
2026-03-03 14:34:00
英媒:歐美要死死守住這5項(xiàng)技術(shù),一旦被中國突破那將勢不可擋

英媒:歐美要死死守住這5項(xiàng)技術(shù),一旦被中國突破那將勢不可擋

林子說事
2026-03-03 01:07:19
最初發(fā)現(xiàn)時(shí)僅1株!專家繁殖20年沒成功,湖北農(nóng)民只用6年種出27棵

最初發(fā)現(xiàn)時(shí)僅1株!專家繁殖20年沒成功,湖北農(nóng)民只用6年種出27棵

墨蘭史書
2026-02-23 22:10:47
2026-03-03 15:35:00
InfoQ incentive-icons
InfoQ
有內(nèi)容的技術(shù)社區(qū)媒體
12101文章數(shù) 51783關(guān)注度
往期回顧 全部

科技要聞

手機(jī)AI在MWC上卷出了新高度

頭條要聞

特朗普:不擔(dān)心美領(lǐng)土遭受襲擊威脅 這是戰(zhàn)爭的一部分

頭條要聞

特朗普:不擔(dān)心美領(lǐng)土遭受襲擊威脅 這是戰(zhàn)爭的一部分

體育要聞

35輪后積分-7,他們遭遇史上最早的降級

娛樂要聞

謝娜霸氣護(hù)夫:喊話薛之謙給張杰道歉

財(cái)經(jīng)要聞

借殼上市納斯達(dá)克?小楊哥海外"洗白"之路

汽車要聞

長安汽車2月銷量151922輛 環(huán)比逆勢增長12.8%

態(tài)度原創(chuàng)

親子
手機(jī)
教育
時(shí)尚
藝術(shù)

親子要聞

本來只準(zhǔn)備留一條,收到手后決定都留下來,畢竟兩條也不到80塊錢 楊雪呀

手機(jī)要聞

OPPO Find N6官宣本月登場,無折痕內(nèi)屏驚艷外媒

教育要聞

在學(xué)校吃午餐VS回家吃?半年后差距這么大!第3點(diǎn)很多家長沒想到

普通人穿衣真的很簡單!單品選對、搭配合理,大方舒適又得體

藝術(shù)要聞

Nihad Aghazada:當(dāng)代阿塞拜疆畫家

無障礙瀏覽 進(jìn)入關(guān)懷版