Codexのハーネスエンジニアリング読解

要点

OpenAIの記事でいうハーネスエンジニアリングは、「モデルにうまく頼む技術」ではなく、エージェントが迷わず作業できる環境を設計する仕事として読むのがよい。

具体的には、リポジトリ内の知識、AGENTS.md、実行可能な検証、観測ログ、レビュー手順、アーキテクチャ制約を、エージェントが使える形で置くこと。大きな自動化基盤より、短く正確な作業入口と検証手順のほうが先に効く。

単発の依頼をよくする。

何度でも作業できる環境を整える。

Codex公式manualでは、AGENTS.mdはリポジトリ構造、重要ディレクトリ、ビルド・テスト・lintコマンド、慣習、制約、完了条件を置く場所とされている。長い運用文書ではなく、正確な入口として保つ。

エージェントは、口頭の暗黙知や古いチャット履歴より、現在のファイル、コマンド、テスト、ログに強く依存する。設計判断、禁止事項、検証方法、既知の罠は作業対象リポジトリに寄せる。

「ちゃんと確認して」と書くだけでは弱い。テスト、lint、型チェック、挙動確認、diff reviewを完了条件に入れ、script、CI、fixture、sample artifactで実行しやすくする。

Codexのskillは、手順、参照資料、任意のscriptをパッケージ化する仕組み。調査メモをHTML化する、PRコメントを処理する、特定形式のログを読む、といった狭い作業が向く。

このvaultでは、すでに research-note、file-to-html、research-publish のように、captureから調査、HTML出力、commitまでを分けている。これはハーネスエンジニアリングの小さな実例として扱える。

この記事は、Codexを「コード生成器」として使う話ではなく、エージェントが働くための作業場をどう設計するかの話として読むと使いやすい。

Source	Use
OpenAI: ハーネスエンジニアリング	元記事と見出し構成の確認。
Codex Best practices	AGENTS.md、検証、skill、automationの公式推奨。
Codex manual	AGENTS.mdとskillsの仕様確認。