一线工程分享
OpenAI 和 Anthropic 的工程博客,是观察 Agent 产品如何真实落地的高信噪比窗口。本栏目把两家的公开工程分享整理成站内中文精读页,保留原文标题、发布时间、来源链接和主题脉络,重点提炼工程问题、架构取舍、上线经验和面试可追问点。
说明:这里是中文学习笔记,不是逐字全文转载。完整正文、图片和代码请回到原文阅读。
OpenAI Engineering
- 用 Codex 构建可自我改进的税务 Agent
- 为 Windows 版 Codex 构建安全有效的沙箱
- 加速大规模 AI 训练的超算网络
- OpenAI 如何大规模交付低延迟语音 AI
- Codex 编排开源规范:Symphony
- 使用 Responses API 的 WebSocket 加速 Agent 工作流
- 从模型到 Agent:为 Responses API 配备计算机环境
- 超越限流:扩展 Codex 与 Sora 的访问机制
- Harness 工程:在 Agent-first 世界使用 Codex
- 解锁 Codex Harness:App Server 架构
Anthropic Engineering
- Claude 跨产品隔离与约束
- Claude Code 质量报告更新
- 扩展托管 Agent:把“大脑”和“手”解耦
- Claude Code auto mode:更安全地减少权限确认
- 长周期应用开发的 Harness 设计
- Claude Opus 4.6 BrowseComp 表现中的评测感知
- 量化 Agent 编程评测中的基础设施噪声
- 用一组并行 Claude 构建 C 编译器
- 设计抗 AI 的技术评测
- 揭开 AI Agent 评测的面纱
- 长周期 Agent 的有效 Harness
- Claude Developer Platform 的高级工具使用
- 用 MCP 执行代码:构建更高效的 Agent
- 通过沙箱让 Claude Code 更安全更自主
- 用 Agent Skills 装备真实世界 Agent
- AI Agent 的有效上下文工程
- 三个近期问题复盘
- 用 Agent 编写有效的 Agent 工具
- Claude Desktop Extensions:一键安装 MCP Server
- Anthropic 如何构建多 Agent 研究系统
- Claude Code:Agent 编程最佳实践
- “think” 工具:让 Claude 在复杂工具使用中停下来思考
- 用 Claude 3.5 Sonnet 提升 SWE-bench Verified 表现
- 构建高效 Agent
- Contextual Retrieval
和本站章节的关系
- Agent 工程化 讲评估、观测、成本、安全这些通用工程问题。
- Agent 源码解析 讲 Claude Code、Codex CLI、Cline、OpenHands 等系统的实现思路。
- 上下文工程 和 工具调用 是理解这些文章的底层知识。