Claude Managed Agents 初心者向け徹底ガイド|ハーネス・セッション・サンドボックスを図解で理解

AI

2026年4月8日、AnthropicはClaude Managed Agents(パブリックベータ)を正式リリースしました。「AIエージェント」という言葉は日常的に聞くようになりましたが、実際の仕組みや用語をきちんと理解している人はまだ少数です。

この記事ではAIエージェントの基礎用語から全体アーキテクチャまで、初心者が疑問に思うポイントをすべて図解つきで解説します。AIエージェント初級者を対象に、ハーネス・セッション・サンドボックスの正体と、従来との違いおよび企業が得られる価値を整理します。


AIエージェントとは何か?チャットとの違い

まず「AIエージェント」と「普通のAIチャット(Claude.aiなど)」の違いを整理しましょう。ここを押さえておくと、Managed Agentsの価値がより明確になります。

比較項目普通のAIチャット
(Claude.aiなど)
AIエージェント
動作スタイル1問1答で完結目標達成まで自律的に動き続ける
ツール使用基本なし検索・コード実行・外部API操作など
実行時間数秒数分〜数時間の長期タスクも可
人間の介入毎回必要最初の指示だけで自動進行
状態管理なし(毎回リセット)セッションで進捗を保持

例え話:AIチャットは「質問に何でも答えてくれる優秀なアシスタント」。AIエージェントは「段取りから実行まで自分でこなすプロジェクトマネージャー」です。前者は答えを出して終わり、後者は目標が達成されるまで動き続けます。


Claude Managed Agentsとは?

一言でいうと、「AIエージェントのインフラ面を全部Anthropicが管理してくれるクラウドサービス」です。従来、本番環境でAIエージェントを動かすには次のような作業が必要でした。

従来の開発コスト:Dockerコンテナの設定・サーバーの構築・スケーリング(負荷増減への対応)・監視システムの整備・障害時の復旧設計…これらを全部やると数ヶ月規模の開発工数がかかります。

Managed Agentsはこれらを全部代行します。開発者はエージェントの「何をするか」だけに集中でき、プロトタイプから本番リリースまでを数日〜数週間に短縮できます。

初期採用企業:Notion・楽天・Asana・Vibecode・Sentryなどがパブリックベータに参加し、コード自動化・生産性向上・HRや財務ワークフローなどに活用しています。


基礎用語12項目を完全解説

Managed Agentsを理解するうえで必要な用語をまとめて解説します。それぞれ「一言の定義」と「具体的な例え」をセットで覚えましょう。

① 構築(Build)・デプロイ(Deploy)

構築はエージェントを「作ること」。タスク・ツール・制約を設定ファイルで定義します。デプロイは作ったエージェントを「実際に動くサーバーへ配置すること」。研修を終えた社員を現場に配属するイメージです。

② インフラ / コンテナ(Docker)

AIエージェントはDockerのようなコンテナ(隔離された実行環境)上で動作します。インフラとはそのコンテナを動かすサーバー・スケーリング・監視の総称です。Managed Agentsはこれらをすべて代行します。

③ ハーネス(Harness)

馬具の「ハーネス(手綱・鞍・あぶみのセット)」が語源で、Claudeを繰り返し呼び出す制御ループ全体のことです。「Claudeを呼ぶ → ツール結果を受け取る → 次の行動を決める → 繰り返す」というサイクルを動かす司令塔プログラムです。ルールの設定(=ガードレール)とは別物です。

④ メタハーネス(Meta-Harness)

特定のハーネス実装に依存しない上位レイヤーです。OSが「プロセス」「ファイル」という抽象概念でハードウェアを包んだのと同じ発想で、Claude Code・カスタムハーネスなどあらゆるハーネスを内包できる基盤です。Managed Agentsがこれに該当します。

⑤ セッション(Session)

エージェントが「何をしたか全部記録し続ける追記専用の日誌」です。ハーネスの外側に独立して保存されるため、ハーネスが落ちても消えません。emitEvent()で書き込み、getEvents()で読み出し、wake(sessionId)で再開します。

⑥ サンドボックス(Sandbox)コード実行

「外の世界に影響を与えない隔離された実行箱」です。エージェントが生成したコードをここで動かすことで、本番のサーバーやDBを誤って壊すリスクをなくします。砂場の中だけで遊ぶという比喩が語源です。

⑦ 認証(Authentication)

「誰がこのエージェントを動かしているか」を確認する仕組みです。GitHubやSlackなど外部サービスへのアクセストークンはサンドボックスの外の安全な保管庫(Vault)に置かれ、エージェント本体が直接触れることはありません。

⑧ チェックポイント(Checkpoint)

ゲームの「セーブ機能」と同じ概念です。長時間動作するエージェントが障害に遭っても直前の状態から再開できます。セッションログがこのセーブデータの役割を担います。

⑨ スコープ付きパーミッション(Scoped Permission)

エージェントに与える権限を最小限に絞る仕組みです。「メール送信のみOK・削除はNG」「このフォルダのみ読み込み可」のように権限の範囲(スコープ)を細かく設定し、セキュリティリスクを下げます。

⑩ 永続的な長時間セッション

通常のAPI呼び出しは1回ずつ切断されますが、エージェントが数時間・数日かけて仕事をするには接続状態の継続が必要です。セッションログを外部に保持することで、接続が切れても再開できます。

⑪ タスク・ツール・ガードレール

  • タスク:エージェントへの「お題」(例:毎朝9時に競合ブログを要約してSlackに投稿)
  • ツール:エージェントが使える道具箱(Web検索・コード実行・外部API等)
  • ガードレール:「やってはいけないこと」の安全制約(例:個人情報を含むファイルの外部送信禁止)

⑫ マルチエージェント連携

複雑なタスクで1体のエージェントが別のエージェントを召喚して並行作業させる仕組みです(現在リサーチプレビュー)。「リサーチエージェントが情報収集 → ライティングエージェントが文章化」のような役割分担が可能になります。


全体アーキテクチャを図解

Managed Agentsはセッション・ハーネス・サンドボックスの3層が独立した設計になっています。「脳(ブレイン)」と「手(ハンズ)」を分けることが最大の設計思想です。

なぜ3層に分けるのか?

旧来はこれらを1つのコンテナに詰め込んでいました。その問題点は「コンテナが落ちるとセッション(進捗ログ)も消えてしまう」こと、いわゆる「ペット問題」です。さらに認証情報とコード実行環境が同居しているため、悪意ある指示が注入された場合に認証情報が漏洩するリスクもありました。

3層分離により、どれか1つが落ちても他は生き続けます。ハーネスが落ちてもwake(sessionId)で日誌を拾って再開できます。


ハーネスの位置づけを深掘り

「ハーネス = ルール設定」と誤解されがちですが、正確には「Claudeを動かす制御ループ全体」です。ユーザーとClaudeの間に入る仲介役です。

ハーネスガードレール
何かClaudeを呼び出す制御プログラムやってはいけないことの安全制約
役割エージェントを「動かす骨格」エージェントを「安全に保つ柵」
呼び出しループ・ツール振り分け個人情報の外部送信禁止

ハーネスが動く流れを具体的に示すと次のとおりです。

① ユーザー   →  「競合記事を調査してSlackに投稿して」
② ハーネス  →  Claudeを呼び出す
③ Claude   →  「Web検索ツールを使いたい」と返答
④ ハーネス  →  Web検索を実行して結果をClaudeに渡す
⑤ Claude   →  「Slackに投稿したい」と返答
⑥ ハーネス  →  ガードレール確認 → OK → Slack APIを呼ぶ
⑦ Claude   →  「完了」と返答
⑧ ハーネス  →  タスク完了と判断・終了

馬と手綱の比喩:Claude(馬)はハーネス(手綱・鞍・あぶみ)なしには制御された動きができません。Claude Code もハーネスの一例で、Managed Agentsはそれを内包できる「メタハーネス」です。全体アーキテクチャ図で見ると、ハーネスは中央層全体であり、Claude(LLM)はその中の一部品に過ぎません。


セッションの仕組みを深掘り

セッションは「エージェントが何をしたか全部記録し続ける、追記専用の日誌」です。最大の特徴はハーネスの外側に独立して保存される点です。

3つのAPIでできること

API操作説明
emitEvent(id, event)書き込み出来事をログに書き足す。ハーネスがループの各ステップで呼び出す。
getEvents()読み出しログを読み返す。どの時点から読むか範囲指定が可能。
wake(sessionId)再開セッションを再開する。ハーネスが落ちても別のハーネスが引き継げる。

セッションがないと何が起きるか

❌ セッションなし(旧来の設計)
ユーザー「5時間かけてデータを分析して」
→ 3時間後にサーバー障害
→ 進捗がすべて消える
→ 最初からやり直し

✅ セッションあり(Managed Agents)
→ emitEvent() で3時間分のログが保存済み
→ wake(sessionId) で再開
→ 「あ、ステップ7まで終わってた」と把握
→ ステップ8から続き

セッション ≠ コンテキストウィンドウ:Claudeのコンテキストウィンドウ(一度に読める情報量)には上限があります。セッションはコンテキストウィンドウの外側に永続的に保存されるため、長時間タスクでも過去の全履歴を参照できます。getEvents()で必要な部分だけスライスして読み込む設計です。


料金体系

課金項目料金
モデル使用量(トークン)通常API料金と同じ
エージェントのアクティブ実行時間$0.08 / セッション時間(時)
Web検索$10 / 1,000回
アイドル時間(ツール待ち・次の入力待ち)課金なし

エージェントが「実際に働いている時間」だけ課金されます。次の指示を待っている間や、ツールの結果を待っている間はカウントされません。


活用シーン

部署・業種活用例
開発チームコードレビュー自動化・テスト生成・技術文書作成
カスタマーサポート問い合わせ対応・FAQ自動更新・エスカレーション判定
マーケティング競合リサーチ・記事要約・SNS投稿案の生成
バックオフィス経費処理補助・HR書類作成・スケジュール調整
データ分析レポート自動生成・ダッシュボードへのデータ投入


まとめ

  • AIエージェントは「自律的に長時間タスクを実行するAI」。普通のチャットとは根本的に異なる。
  • Managed Agentsはインフラ(コンテナ・スケーリング・監視)をすべて代行するクラウドサービス。
  • ハーネスはユーザーとClaudeの間に存在する「制御ループ全体」。ルール設定(ガードレール)とは別物。
  • セッションはハーネスの外側に保存される「追記専用の日誌」。障害後も再開できる。
  • サンドボックスはコードを安全に実行する隔離環境。認証情報はVaultに別保管。
  • 3層分離(セッション・ハーネス・サンドボックス)により障害に強く安全性も高い設計。
  • 料金はアクティブ時間のみ課金($0.08/時 + トークン料金)。アイドル時間は無料。
  • Notion・楽天・Asanaなどが初期採用。現在パブリックベータで提供中。

インフラエンジニアがいなくても、エージェントを本番環境で動かせる時代が本格的に始まっています。まずは公式ドキュメントを読んで、自社のどの業務を自動化できるか探ってみましょう。


参考リソース

  • Anthropic Engineering Blog: Scaling Managed Agents ― 3層分離アーキテクチャの設計思想を詳細に解説した公式エンジニアリングブログ(英語)
  • Claude Platform Docs: Managed Agents Overview ― APIの使い方・設定方法など実装向け公式ドキュメント(英語)
  • The New Stack: With Claude Managed Agents, Anthropic Wants to Run Your AI Agents for You ― 機能・料金・初期ユーザーをまとめた解説記事(英語)
  • SiliconAngle: Anthropic launches Claude Managed Agents ― 発表当日のニュース記事。状態管理・ツールオーケストレーションの機能詳細(英語)

コメント

タイトルとURLをコピーしました