AGENT LOOP
Loop Engineeringは「自動実行」より先に「止め方」を設計する
Google Driveで共有されていたPDFを起点に、agentを毎回手で促すのではなく、発見、実行、検証、記録、再実行までを設計する考え方を整理する。
Takeaway
loopを作るなら、最初に増やすべきなのは実行回数ではなく、検証、状態管理、停止条件、人間が入る場所である。
これはAnthropic公式白書ではなく、実務フレームの再構成である
Google Drive の PDF は Loop Engineering: The Anthropic Playbook for Designing Systems That Prompt Your Agents という 2026-06-24 作成の 11 ページ資料だった。
題名に Anthropic とあるが、資料末尾では HuaShu の Orange Book guide をもとにした独立した conference-style synthesis と説明されている。したがって、Anthropic 公式資料そのものではなく、Addy Osmani の Loop Engineering、Claude Code、Anthropic engineering blog の文脈をまとめ直した資料として読むのがよい。
中心にあるのは「良いプロンプトを書く」話ではない。人間が毎回 agent に仕事を渡す位置から離れ、agent を起動し、結果を疑い、状態を残し、次回に接続する仕組みを設計する話である。
Loopの1ターンは5つの動きに分けられる
資料は、loop の 1 ターンを discovery、handoff、verification、persistence、scheduling に分けている。この分解は、そのまま automation のレビュー観点になる。
| 動き | 実務で見るポイント |
|---|---|
| Discovery | 今回やるべき仕事を、CI、issue、commit、inbox、タグなどから見つける。 |
| Handoff | 仕事を小さく切り、必要なら worktree などで agent ごとの作業場を分ける。 |
| Verification | テスト、別 agent、人間の review で、結果に「no」と言える場所を作る。 |
| Persistence | 会話外の markdown、issue、PR、state file に結果と未完了事項を残す。 |
| Scheduling | 次回の実行に接続する。ここがなければ単発 run であり、loop ではない。 |
どれかを欠くと失敗モードが変わる。検証がなければ agent が自分にうなずくだけになり、永続化がなければ毎回忘れ、schedule がなければ単発実行に戻る。
核心は、作るagentと疑うagentを分けること
資料が最も強く押しているのは、generator と evaluator の分離である。実装や文章を作る agent に、そのまま「自分で確認して」と頼むだけでは弱い。作った本人は、自分の出力を甘く見やすい。
機械的なgate
test、lint、static validation、schema check、HTTP check のように、結果を機械的に落とせる条件を用意する。
別視点のreview
別 agent や人間が、仕様、差分、失敗時の影響を確認する。重要なのは「止める権限」を持たせること。
loop が危ないのは、失敗が 1 回で止まらず、state や次回の入力に混ざって積み上がる点にある。だから「何ができるか」より先に「どこで止まるか」を設計する必要がある。
このvaultのresearch-publishも小さなloopとして見られる
この automation は、巨大な自律開発 pipeline ではない。しかし loop engineering の観点では、かなり健全な小さい loop になっている。
- Discovery:
#Research/openを finder で探す - Handoff: 1 件だけ research note にする
- Verification: source verification、HTML static validation、可能なら browser check
- Persistence:
20_Working/、.html-output/、source note の#Research/closed - Scheduling: automation と memory
良い点は、1 回に処理する件数を 1 件に絞っていること、source note に trace を残すこと、commit scope を限定していることだ。一方で、browser validation が環境都合で飛ぶことがあるため、そこは validation gap として記録し続ける必要がある。
新しいautomationを作る前のチェックリスト
最初に作る loop は、大きくしない。毎朝 1 件だけ調べる、1 つだけ候補を出す、1 つだけ差分を作る、という粒度から始める。
- 何を読んで仕事を見つけるのか。
- 1 回に最大何件まで処理するのか。
- 結果と状態をどこに残すのか。
- どの検証が失敗したら止まるのか。
- 人間が見る場所はどこか。
- token、時間、retry の上限はどこか。
- commit、push、delete、send など不可逆操作の前に gate があるか。
この 7 点に答えられない automation は、まだ loop ではなく、繰り返し実行される長い prompt と見たほうがよい。
Sources
| Source | Use |
|---|---|
| Captured Google Drive PDF | 対象資料の本文、章立て、作成日、独立再構成である caveat の確認。 |
| Addy Osmani: Loop Engineering | loop engineering の定義、5 つの構成要素、maker と checker の分離。 |
| Anthropic: Harness design for long-running application development | 長時間 agent 作業における harness と検証設計の文脈。 |
| Anthropic: Effective harnesses for long-running agents | long-running agents の実務上の failure mode と運用設計。 |
| Claude Code Docs: hooks | agent lifecycle に hook を置く公式 docs の確認。 |
| Claude Code Docs: skills | project knowledge を reusable skill として持つ公式 docs の確認。 |