Skip to content
Built 26/04/17 09:39commit 8de3d61

OpenAI:Agent 优先世界中的 Harness Engineering

中文 | English

摘要

这份来源认为,一旦 agent 写出几乎全部代码,工程瓶颈就会从手工实现转移到 harness 设计、仓库可读性,以及能让 agent 以极少人工关注持续可靠运行的反馈回路上。

来源

主要观点

  • 把软件工程重新描述为环境设计:人类负责引导、表达意图和编码反馈回路,agent 负责执行。
  • 认为仓库内文档和计划应是 system of record,并把 AGENTS.md 定位为地图,而不是百科全书。
  • 强调对 agent 的可读性应覆盖 UI 行为、日志、指标、trace、架构边界和 review 流程。
  • 论证架构约束和自定义 lint 之所以是乘数,是因为它们把人类品味和系统不变量变成可机械执行的指导。
  • 把高 agent 吞吐与一种不同的合并哲学联系起来:廉价修正回路、短生命周期 PR,以及更多 agent 对 agent 的 review。

核心观点

  • 如果仓库本身不能提供足够的结构、工具和文档让 agent 仅凭本地上下文推理,那么一个完全由 agent 生成代码的代码库就无法长期保持高效。
  • 人类投入最能复利的地方,不是直接写代码,而是投资在脚手架和控制系统上。
  • 单体指令文件不可扩展;短地图加索引化深层文档的渐进式披露方式更可持续。
  • agent 自主性会引入熵,因此必须有循环性的 cleanup 和可执行的黄金原则,才能阻止 slop 不断累积。

对本库整理的启发

  • AGENTS.md 应保持足够短,只负责给模型定向,并把领域细节下沉到 canonical 页面。
  • 主题页和 source page 应被视为面向 agent 的基础设施,而不只是给人看的笔记。
  • 应优先依赖仓库内的耐久产物,而不是聊天记录或外部文档。
  • lint 和 ingest 需要持续判断:哪些结构性指导应该被沉淀到 canonical 页面,而不是只停留在临时对话里。

相关页面