本記事は、Claude Codeの開発に携わるAnthropicのThariq Shihipar(@trq212)氏がXに投稿した内容をもとに作成しています。原文はこちらをご参照ください → https://x.com/trq212
Claude Codeが「Claude Code SDK」から「Claude Agent SDK」になった理由
もともとClaude Codeを動かすエンジン部分は「Claude Code SDK」という名前で公開されていました。
ところが使っていくうちに、このエンジンがコーディング以外にも使えることが分かってきました。Anthropicの社内では今、Claude Codeをディープリサーチ、動画制作、ノート作成、そしてほぼすべての主要な業務自動化に使っているそうです。
そこでより広いビジョンを示すため、名前を「Claude Agent SDK」に変えました。
そもそも「SDK」って何?
SDKとは「Software Development Kit(ソフトウェア開発キット)」の略で、ソフトウェアを作るための道具一式のことです。
Claude Agent SDKは「Claude Codeを動かすエンジンを使って、自分だけのAIエージェントを作れる道具セット」と思ってください。Claude Codeというアプリを使うのではなく、同じ仕組みで動く独自のエージェントを構築できます。
Claude Agent SDKの基本思想:「AIにコンピュータを渡す」
Claude Codeが強力な理由のひとつは、AIが実際のコンピュータを使えることです。
プログラマーがコードを書くとき何をするか考えると分かりやすいです。ファイルを探して開く、コードを書いて保存する、実行して結果を確認する、エラーがあれば直す——この繰り返しです。
Claude Codeはそのまま同じことができます。ファイルを読み書きし、コマンドを実行し、結果を確認して修正する。
「AIにコンピュータを渡す」 という設計思想が、Claude Agent SDKのすべての機能に通底しています。
こんなエージェントが作れる
財務エージェント
投資ポートフォリオの状況を把握して、外部APIで市場データを取得し、コードを実行して計算・分析し、投資の判断材料を提供します。
パーソナルアシスタントエージェント
出張手配・カレンダー管理・資料作成などを、社内のデータソースに接続しながら進めます。複数のアプリをまたいでコンテキストを引き継げます。
カスタマーサポートエージェント
「返品したい」のような曖昧なリクエストを理解して、ユーザーデータを確認し、外部APIで処理を進め、必要に応じて人間にエスカレーション(引き継ぎ)します。
ディープリサーチエージェント
大量のドキュメントを横断して調査し、ファイルシステムを使って情報を整理・分析し、複数ソースのデータを照合して詳細なレポートを生成します。
エージェントの基本ループ:3ステップの繰り返し
優れたエージェントはすべて、次の3ステップを繰り返して動きます。
[コンテキストを集める] → [行動する] → [作業を確認する] → (繰り返し)
このループを念頭に置きながら、メールエージェントを例に説明します。
ステップ1:コンテキストを集める
エージェントはプロンプトを受け取るだけでなく、自分でコンテキスト(作業に必要な情報)を取得・更新できます。
ファイルシステムで探す
大きなファイル(ログ、メール、ドキュメントなど)に対してAIはgrep(テキスト検索)やtail(ファイルの末尾を読む)などのコマンドを使って必要な部分だけ読み込みます。フォルダとファイルの構造が「コンテキストの設計図」になります。
メールエージェントなら:過去の会話をConversationsフォルダに保存しておき、質問に応じてそこを検索する。
サブエージェントで並行調査
Claude Agent SDKはサブエージェント(分担して動く複数のAI)をデフォルトでサポートしています。
メールエージェントなら:複数の検索サブエージェントを同時に起動し、それぞれ異なるキーワードで検索させる。全文ではなく関連部分だけをオーケストレーター(まとめ役)に返させる。
コンテキスト圧縮(Compaction)
長時間動かすエージェントでは、やり取りが増えてコンテキストウィンドウの上限に達します。Claude Agent SDKの圧縮機能は、過去のやり取りを自動的に要約してエージェントが継続できるようにします。
ステップ2:行動する
ツール
ツールはエージェントの主な行動手段です。AIのコンテキストウィンドウの中で目立つ存在なので、「主要な行動」に絞って設計します。
メールエージェントの例:fetchInbox(受信箱を取得)、searchEmails(メールを検索)など。
Bash・スクリプト
汎用的な処理に使います。
メールエージェントの例:添付PDFをダウンロード→テキストに変換→必要な情報を抽出——この一連の処理をBashスクリプトで自動化。
コード生成
Claude Agent SDKはコード生成が特に得意です。コードは「精度が高く、再利用できる」という点で、エージェントの出力として優れています。
実際の活用例:Claude.ai(チャットサービス)のファイル生成機能では、ClaudeがPythonスクリプトを書いてExcel・PowerPoint・Wordファイルを生成しています。コードで作ることで、複雑なフォーマットと機能を確実に実現できます。
MCP(外部サービスとの接続)
MCP(Model Context Protocol)は、外部サービスと接続するための標準規格です。Slack・GitHub・Google Drive・Asanaなどと、認証処理などを自前で書かずに繋げられます。
メールエージェントなら:Slackでチームの会話を確認したり、Asanaで担当者がいるか確認したりできます。
ステップ3:作業を確認する
エージェントが自分の出力を確認・修正できる仕組みを作ることで、信頼性が大幅に上がります。
ルールベースの確認
具体的なルールを定義してチェックします。
- メールアドレスが有効か(無効ならエラー)
- 過去にやり取りがある相手か(初めての場合は確認)
- コードのlint(構文チェック)でエラーがないか
TypeScriptで書いたコードのlintは、JavaScriptより多くのフィードバックが得られるため品質が上がりやすい、という実例もあります。
視覚的フィードバック
HTMLメールやUIを生成した場合は、スクリーンショットを使って確認できます。PlaywrightというMCPサーバーを使えば、スクリーンショット撮影・操作テスト・レスポンシブ確認(さまざまな画面サイズでの表示確認)を自動化できます。
LLMによる判定
別のAIモデルに出力を評価させる方法です。「このメールのトーンは適切か?」のような、ルールで表現しにくい判断に使います。ただし処理時間が増えるため、本当に必要な場面に絞って使います。
エージェントを改善するための問いかけ
作ったエージェントがうまく動かないとき、Thariq氏はこんな問いを投げかけます。
- タスクを誤解する → 情報が足りていないのでは? 検索APIの構造を改善できるか?
- 同じ失敗を繰り返す → ルールを追加できないか? ツールに明示的な制約を入れる
- エラーから回復できない → 別のアプローチを取れるツールを与えられないか?
- 機能追加で品質がバラつく → テストセット(evalセット)を作って定量評価する
まとめ
| 従来のAI活用 | Claude Agent SDKを使った場合 |
|---|---|
| 一問一答で終わる | 複数ステップを自律的に実行する |
| テキスト生成のみ | ファイル操作・コマンド実行・外部サービス連携 |
| コーディング専用 | 業務自動化全般に応用できる |
| 1回のリクエストで完結 | 「集める→行動する→確認する」を繰り返す |
Claude Agent SDKは今日から試し始めることができます。「コンテキストを集める→行動する→確認する」という3ステップのループを設計の基本に置けば、信頼性が高く改善しやすいエージェントが作れます。
コメント