Harness 工程：在 Agent-first 世界使用 Codex

原文标题：Harness engineering: leveraging Codex in an agent-first world
原文链接：https://openai.com/index/harness-engineering/
发布时间：2026-02-11
来源：OpenAI Engineering
主题：Codex、Harness、Agent-first 工程、反馈循环

本文是中文精读笔记，不是原文全文翻译。

这篇文章解决什么问题

文章复盘一个极端实验：团队约束自己不手写产品代码，而是让 Codex 完成应用逻辑、测试、CI、文档和工具。真正的问题不是“AI 能不能写代码”，而是工程团队如何设计环境，让 Agent 能稳定地产出可验证的软件。

核心内容

Agent-first 工程里，人类从“直接写代码”转向“设计环境、表达意图、构建反馈循环”。
可靠输出依赖 repo 结构、测试、文档、CI、任务描述和错误反馈。
Harness 是 Codex 工作的外骨骼：它让模型知道如何观察、修改和验证系统。
越大的代码生成比例，越需要更强的验证和回滚机制。

工程启发

想提高 Coding Agent 成功率，先优化仓库可读性、测试速度和任务规格。
Agent-friendly repo 应该有清晰边界、可运行测试、稳定脚本和明确贡献约定。
工程师不会消失，但工作重心会转向系统设计、评审和反馈工程。

和本站章节的关系

面试追问

什么是 harness？它和 prompt 的区别是什么？
为什么测试质量决定 Coding Agent 的上限？
Agent-first 团队里工程师最重要的产出是什么？