Loop Engineeringは「自動実行」より先に「止め方」を設計する

これはAnthropic公式白書ではなく、実務フレームの再構成である

Google Drive の PDF は Loop Engineering: The Anthropic Playbook for Designing Systems That Prompt Your Agents という 2026-06-24 作成の 11 ページ資料だった。

題名に Anthropic とあるが、資料末尾では HuaShu の Orange Book guide をもとにした独立した conference-style synthesis と説明されている。したがって、Anthropic 公式資料そのものではなく、Addy Osmani の Loop Engineering、Claude Code、Anthropic engineering blog の文脈をまとめ直した資料として読むのがよい。

中心にあるのは「良いプロンプトを書く」話ではない。人間が毎回 agent に仕事を渡す位置から離れ、agent を起動し、結果を疑い、状態を残し、次回に接続する仕組みを設計する話である。

Loopの1ターンは5つの動きに分けられる

資料は、loop の 1 ターンを discovery、handoff、verification、persistence、scheduling に分けている。この分解は、そのまま automation のレビュー観点になる。

動き	実務で見るポイント
Discovery	今回やるべき仕事を、CI、issue、commit、inbox、タグなどから見つける。
Handoff	仕事を小さく切り、必要なら worktree などで agent ごとの作業場を分ける。
Verification	テスト、別 agent、人間の review で、結果に「no」と言える場所を作る。
Persistence	会話外の markdown、issue、PR、state file に結果と未完了事項を残す。
Scheduling	次回の実行に接続する。ここがなければ単発 run であり、loop ではない。

どれかを欠くと失敗モードが変わる。検証がなければ agent が自分にうなずくだけになり、永続化がなければ毎回忘れ、schedule がなければ単発実行に戻る。

核心は、作るagentと疑うagentを分けること

資料が最も強く押しているのは、generator と evaluator の分離である。実装や文章を作る agent に、そのまま「自分で確認して」と頼むだけでは弱い。作った本人は、自分の出力を甘く見やすい。

機械的なgate

test、lint、static validation、schema check、HTTP check のように、結果を機械的に落とせる条件を用意する。

別視点のreview

別 agent や人間が、仕様、差分、失敗時の影響を確認する。重要なのは「止める権限」を持たせること。

loop が危ないのは、失敗が 1 回で止まらず、state や次回の入力に混ざって積み上がる点にある。だから「何ができるか」より先に「どこで止まるか」を設計する必要がある。

このvaultのresearch-publishも小さなloopとして見られる

この automation は、巨大な自律開発 pipeline ではない。しかし loop engineering の観点では、かなり健全な小さい loop になっている。

Discovery: #Research/open を finder で探す
Handoff: 1 件だけ research note にする
Verification: source verification、HTML static validation、可能なら browser check
Persistence: 20_Working/、.html-output/、source note の #Research/closed
Scheduling: automation と memory

良い点は、1 回に処理する件数を 1 件に絞っていること、source note に trace を残すこと、commit scope を限定していることだ。一方で、browser validation が環境都合で飛ぶことがあるため、そこは validation gap として記録し続ける必要がある。

新しいautomationを作る前のチェックリスト

最初に作る loop は、大きくしない。毎朝 1 件だけ調べる、1 つだけ候補を出す、1 つだけ差分を作る、という粒度から始める。

何を読んで仕事を見つけるのか。
1 回に最大何件まで処理するのか。
結果と状態をどこに残すのか。
どの検証が失敗したら止まるのか。
人間が見る場所はどこか。
token、時間、retry の上限はどこか。
commit、push、delete、send など不可逆操作の前に gate があるか。

この 7 点に答えられない automation は、まだ loop ではなく、繰り返し実行される長い prompt と見たほうがよい。

Sources

Source	Use
Captured Google Drive PDF	対象資料の本文、章立て、作成日、独立再構成である caveat の確認。
Addy Osmani: Loop Engineering	loop engineering の定義、5 つの構成要素、maker と checker の分離。
Anthropic: Harness design for long-running application development	長時間 agent 作業における harness と検証設計の文脈。
Anthropic: Effective harnesses for long-running agents	long-running agents の実務上の failure mode と運用設計。
Claude Code Docs: hooks	agent lifecycle に hook を置く公式 docs の確認。
Claude Code Docs: skills	project knowledge を reusable skill として持つ公式 docs の確認。