Skip to content

超越限流:扩展 Codex 与 Sora 的访问机制

  • 原文标题:Beyond rate limits: scaling access to Codex and Sora
  • 原文链接:https://openai.com/index/beyond-rate-limits/
  • 发布时间:2026-02-13
  • 来源:OpenAI Engineering
  • 主题:限流、用量计量、credits、访问控制

本文是中文精读笔记,不是原文全文翻译。

这篇文章解决什么问题

传统 rate limit 只关心单位时间请求数,但 Codex 和 Sora 这类产品的资源消耗更复杂:一次任务可能持续很久、占用不同资源、产生异步结果。文章讨论访问控制如何从简单限流演进为更细粒度的实时用量系统。

核心内容

  • Codex 和 Sora 的请求成本不容易用固定 QPS 表达。
  • credits、实时用量和额度系统可以比硬性 rate limit 更贴近资源真实消耗。
  • 访问系统要兼顾公平性、计费正确性、滥用防护和用户体验。
  • 规模化产品需要在资源紧张时提供可解释的限制,而不是让用户遇到不可理解的失败。

工程启发

  • Agent 产品的成本单位可能是任务、工具调用、执行时长、模型 token 和外部资源的组合。
  • 限流系统必须和计量、计费、队列、降级策略联动。
  • 用户可见的限制应当清楚说明原因和恢复方式。

和本站章节的关系

面试追问

  • 为什么 QPS 限流不适合所有 AI 产品?
  • 如何给长时间运行的 Agent 设计用量计量?
  • credits 系统和 rate limit 分别解决什么问题?

基于 MIT 协议开源