CODEX
Codexのハーネスエンジニアリング読解
OpenAIの記事を、AGENTS.md、検証、skill、リポジトリ知識設計に落として読む。焦点はプロンプトではなく、エージェントが迷わず動ける作業環境にある。
Takeaway
Codexを実務で使うなら、まず短いAGENTS.md、実行可能な検証、反復作業のskill化から始める。
要点
OpenAIの記事でいうハーネスエンジニアリングは、「モデルにうまく頼む技術」ではなく、エージェントが迷わず作業できる環境を設計する仕事として読むのがよい。
具体的には、リポジトリ内の知識、AGENTS.md、実行可能な検証、観測ログ、レビュー手順、アーキテクチャ制約を、エージェントが使える形で置くこと。大きな自動化基盤より、短く正確な作業入口と検証手順のほうが先に効く。
Prompt
単発の依頼をよくする。
Harness
何度でも作業できる環境を整える。
実務ポイント
AGENTS.mdは短い目次にする
Codex公式manualでは、AGENTS.mdはリポジトリ構造、重要ディレクトリ、ビルド・テスト・lintコマンド、慣習、制約、完了条件を置く場所とされている。長い運用文書ではなく、正確な入口として保つ。
知識はリポジトリを正にする
エージェントは、口頭の暗黙知や古いチャット履歴より、現在のファイル、コマンド、テスト、ログに強く依存する。設計判断、禁止事項、検証方法、既知の罠は作業対象リポジトリに寄せる。
検証を仕組みにする
「ちゃんと確認して」と書くだけでは弱い。テスト、lint、型チェック、挙動確認、diff reviewを完了条件に入れ、script、CI、fixture、sample artifactで実行しやすくする。
スキル化は反復作業から始める
Codexのskillは、手順、参照資料、任意のscriptをパッケージ化する仕組み。調査メモをHTML化する、PRコメントを処理する、特定形式のログを読む、といった狭い作業が向く。
vaultへの持ち帰り
このvaultでは、すでに research-note、file-to-html、research-publish のように、captureから調査、HTML出力、commitまでを分けている。これはハーネスエンジニアリングの小さな実例として扱える。
- AGENTS.mdはvault構造と編集時の注意に絞る。
- 調査やHTML化の細則はskillへ置く。
- .html-output はscriptでindex再生成し、手編集を避ける。
- 自動実行は「open itemがなければ何もしない」を明示する。
- 同じ失敗が2回出たら、memoryではなくskillかscriptへ反映する。
この記事は、Codexを「コード生成器」として使う話ではなく、エージェントが働くための作業場をどう設計するかの話として読むと使いやすい。
Sources
| Source | Use |
|---|---|
| OpenAI: ハーネスエンジニアリング | 元記事と見出し構成の確認。 |
| Codex Best practices | AGENTS.md、検証、skill、automationの公式推奨。 |
| Codex manual | AGENTS.mdとskillsの仕様確認。 |