Skip to content

Harness 工程:在 Agent-first 世界使用 Codex

  • 原文标题:Harness engineering: leveraging Codex in an agent-first world
  • 原文链接:https://openai.com/index/harness-engineering/
  • 发布时间:2026-02-11
  • 来源:OpenAI Engineering
  • 主题:Codex、Harness、Agent-first 工程、反馈循环

本文是中文精读笔记,不是原文全文翻译。

这篇文章解决什么问题

文章复盘一个极端实验:团队约束自己不手写产品代码,而是让 Codex 完成应用逻辑、测试、CI、文档和工具。真正的问题不是“AI 能不能写代码”,而是工程团队如何设计环境,让 Agent 能稳定地产出可验证的软件。

核心内容

  • Agent-first 工程里,人类从“直接写代码”转向“设计环境、表达意图、构建反馈循环”。
  • 可靠输出依赖 repo 结构、测试、文档、CI、任务描述和错误反馈。
  • Harness 是 Codex 工作的外骨骼:它让模型知道如何观察、修改和验证系统。
  • 越大的代码生成比例,越需要更强的验证和回滚机制。

工程启发

  • 想提高 Coding Agent 成功率,先优化仓库可读性、测试速度和任务规格。
  • Agent-friendly repo 应该有清晰边界、可运行测试、稳定脚本和明确贡献约定。
  • 工程师不会消失,但工作重心会转向系统设计、评审和反馈工程。

和本站章节的关系

面试追问

  • 什么是 harness?它和 prompt 的区别是什么?
  • 为什么测试质量决定 Coding Agent 的上限?
  • Agent-first 团队里工程师最重要的产出是什么?

基于 MIT 协议开源