Claude Codeはコーディングツールを卒業した——汎用AIエージェントを作るAgent SDKとは

2026.03.30

本記事は、Claude Codeの開発に携わるAnthropicのThariq Shihipar（@trq212）氏がXに投稿した内容をもとに作成しています。原文はこちらをご参照ください → https://x.com/trq212

Claude Codeが「Claude Code SDK」から「Claude Agent SDK」になった理由
そもそも「SDK」って何？
Claude Agent SDKの基本思想：「AIにコンピュータを渡す」
こんなエージェントが作れる
エージェントの基本ループ：3ステップの繰り返し
ステップ1：コンテキストを集める
ステップ2：行動する
ステップ3：作業を確認する
エージェントを改善するための問いかけ
まとめ

Claude Codeが「Claude Code SDK」から「Claude Agent SDK」になった理由

もともとClaude Codeを動かすエンジン部分は「Claude Code SDK」という名前で公開されていました。

ところが使っていくうちに、このエンジンがコーディング以外にも使えることが分かってきました。Anthropicの社内では今、Claude Codeをディープリサーチ、動画制作、ノート作成、そしてほぼすべての主要な業務自動化に使っているそうです。

そこでより広いビジョンを示すため、名前を「Claude Agent SDK」に変えました。

そもそも「SDK」って何？

SDKとは「Software Development Kit（ソフトウェア開発キット）」の略で、ソフトウェアを作るための道具一式のことです。

Claude Agent SDKは「Claude Codeを動かすエンジンを使って、自分だけのAIエージェントを作れる道具セット」と思ってください。Claude Codeというアプリを使うのではなく、同じ仕組みで動く独自のエージェントを構築できます。

Claude Agent SDKの基本思想：「AIにコンピュータを渡す」

Claude Codeが強力な理由のひとつは、AIが実際のコンピュータを使えることです。

プログラマーがコードを書くとき何をするか考えると分かりやすいです。ファイルを探して開く、コードを書いて保存する、実行して結果を確認する、エラーがあれば直す——この繰り返しです。

Claude Codeはそのまま同じことができます。ファイルを読み書きし、コマンドを実行し、結果を確認して修正する。

「AIにコンピュータを渡す」 という設計思想が、Claude Agent SDKのすべての機能に通底しています。

こんなエージェントが作れる

財務エージェント

投資ポートフォリオの状況を把握して、外部APIで市場データを取得し、コードを実行して計算・分析し、投資の判断材料を提供します。

パーソナルアシスタントエージェント

出張手配・カレンダー管理・資料作成などを、社内のデータソースに接続しながら進めます。複数のアプリをまたいでコンテキストを引き継げます。

カスタマーサポートエージェント

「返品したい」のような曖昧なリクエストを理解して、ユーザーデータを確認し、外部APIで処理を進め、必要に応じて人間にエスカレーション（引き継ぎ）します。

ディープリサーチエージェント

大量のドキュメントを横断して調査し、ファイルシステムを使って情報を整理・分析し、複数ソースのデータを照合して詳細なレポートを生成します。

エージェントの基本ループ：3ステップの繰り返し

優れたエージェントはすべて、次の3ステップを繰り返して動きます。

[コンテキストを集める] → [行動する] → [作業を確認する] → (繰り返し)

このループを念頭に置きながら、メールエージェントを例に説明します。

ステップ1：コンテキストを集める

エージェントはプロンプトを受け取るだけでなく、自分でコンテキスト（作業に必要な情報）を取得・更新できます。

ファイルシステムで探す

大きなファイル（ログ、メール、ドキュメントなど）に対してAIはgrep（テキスト検索）やtail（ファイルの末尾を読む）などのコマンドを使って必要な部分だけ読み込みます。フォルダとファイルの構造が「コンテキストの設計図」になります。

メールエージェントなら：過去の会話をConversationsフォルダに保存しておき、質問に応じてそこを検索する。

サブエージェントで並行調査

Claude Agent SDKはサブエージェント（分担して動く複数のAI）をデフォルトでサポートしています。

メールエージェントなら：複数の検索サブエージェントを同時に起動し、それぞれ異なるキーワードで検索させる。全文ではなく関連部分だけをオーケストレーター（まとめ役）に返させる。

コンテキスト圧縮（Compaction）

長時間動かすエージェントでは、やり取りが増えてコンテキストウィンドウの上限に達します。Claude Agent SDKの圧縮機能は、過去のやり取りを自動的に要約してエージェントが継続できるようにします。

ステップ2：行動する

ツール

ツールはエージェントの主な行動手段です。AIのコンテキストウィンドウの中で目立つ存在なので、「主要な行動」に絞って設計します。

メールエージェントの例：fetchInbox（受信箱を取得）、searchEmails（メールを検索）など。

Bash・スクリプト

汎用的な処理に使います。

メールエージェントの例：添付PDFをダウンロード→テキストに変換→必要な情報を抽出——この一連の処理をBashスクリプトで自動化。

コード生成

Claude Agent SDKはコード生成が特に得意です。コードは「精度が高く、再利用できる」という点で、エージェントの出力として優れています。

実際の活用例：Claude.ai（チャットサービス）のファイル生成機能では、ClaudeがPythonスクリプトを書いてExcel・PowerPoint・Wordファイルを生成しています。コードで作ることで、複雑なフォーマットと機能を確実に実現できます。

MCP（外部サービスとの接続）

MCP（Model Context Protocol）は、外部サービスと接続するための標準規格です。Slack・GitHub・Google Drive・Asanaなどと、認証処理などを自前で書かずに繋げられます。

メールエージェントなら：Slackでチームの会話を確認したり、Asanaで担当者がいるか確認したりできます。

ステップ3：作業を確認する

エージェントが自分の出力を確認・修正できる仕組みを作ることで、信頼性が大幅に上がります。

ルールベースの確認

具体的なルールを定義してチェックします。

メールアドレスが有効か（無効ならエラー）
過去にやり取りがある相手か（初めての場合は確認）
コードのlint（構文チェック）でエラーがないか

TypeScriptで書いたコードのlintは、JavaScriptより多くのフィードバックが得られるため品質が上がりやすい、という実例もあります。

視覚的フィードバック

HTMLメールやUIを生成した場合は、スクリーンショットを使って確認できます。PlaywrightというMCPサーバーを使えば、スクリーンショット撮影・操作テスト・レスポンシブ確認（さまざまな画面サイズでの表示確認）を自動化できます。

LLMによる判定

別のAIモデルに出力を評価させる方法です。「このメールのトーンは適切か？」のような、ルールで表現しにくい判断に使います。ただし処理時間が増えるため、本当に必要な場面に絞って使います。

エージェントを改善するための問いかけ

作ったエージェントがうまく動かないとき、Thariq氏はこんな問いを投げかけます。

タスクを誤解する → 情報が足りていないのでは？ 検索APIの構造を改善できるか？
同じ失敗を繰り返す → ルールを追加できないか？ ツールに明示的な制約を入れる
エラーから回復できない → 別のアプローチを取れるツールを与えられないか？
機能追加で品質がバラつく → テストセット（evalセット）を作って定量評価する

まとめ

従来のAI活用	Claude Agent SDKを使った場合
一問一答で終わる	複数ステップを自律的に実行する
テキスト生成のみ	ファイル操作・コマンド実行・外部サービス連携
コーディング専用	業務自動化全般に応用できる
1回のリクエストで完結	「集める→行動する→確認する」を繰り返す

Claude Agent SDKは今日から試し始めることができます。「コンテキストを集める→行動する→確認する」という3ステップのループを設計の基本に置けば、信頼性が高く改善しやすいエージェントが作れます。

Claude Codeを使う時、コーディングしなくてもBashツールが必要な理由——非エンジニアこそ知っておきたい活用法