AIエージェントを、あなたの会社に。

Claude Codeはコーディングツールを卒業した——汎用AIエージェントを作るAgent SDKとは

本記事は、Claude Codeの開発に携わるAnthropicのThariq Shihipar(@trq212)氏がXに投稿した内容をもとに作成しています。原文はこちらをご参照ください → https://x.com/trq212


Claude Codeが「Claude Code SDK」から「Claude Agent SDK」になった理由

もともとClaude Codeを動かすエンジン部分は「Claude Code SDK」という名前で公開されていました。

ところが使っていくうちに、このエンジンがコーディング以外にも使えることが分かってきました。Anthropicの社内では今、Claude Codeをディープリサーチ、動画制作、ノート作成、そしてほぼすべての主要な業務自動化に使っているそうです。

そこでより広いビジョンを示すため、名前を「Claude Agent SDK」に変えました。


そもそも「SDK」って何?

SDKとは「Software Development Kit(ソフトウェア開発キット)」の略で、ソフトウェアを作るための道具一式のことです。

Claude Agent SDKは「Claude Codeを動かすエンジンを使って、自分だけのAIエージェントを作れる道具セット」と思ってください。Claude Codeというアプリを使うのではなく、同じ仕組みで動く独自のエージェントを構築できます。


Claude Agent SDKの基本思想:「AIにコンピュータを渡す」

Claude Codeが強力な理由のひとつは、AIが実際のコンピュータを使えることです。

プログラマーがコードを書くとき何をするか考えると分かりやすいです。ファイルを探して開く、コードを書いて保存する、実行して結果を確認する、エラーがあれば直す——この繰り返しです。

Claude Codeはそのまま同じことができます。ファイルを読み書きし、コマンドを実行し、結果を確認して修正する。

「AIにコンピュータを渡す」 という設計思想が、Claude Agent SDKのすべての機能に通底しています。


こんなエージェントが作れる

財務エージェント

投資ポートフォリオの状況を把握して、外部APIで市場データを取得し、コードを実行して計算・分析し、投資の判断材料を提供します。

パーソナルアシスタントエージェント

出張手配・カレンダー管理・資料作成などを、社内のデータソースに接続しながら進めます。複数のアプリをまたいでコンテキストを引き継げます。

カスタマーサポートエージェント

「返品したい」のような曖昧なリクエストを理解して、ユーザーデータを確認し、外部APIで処理を進め、必要に応じて人間にエスカレーション(引き継ぎ)します。

ディープリサーチエージェント

大量のドキュメントを横断して調査し、ファイルシステムを使って情報を整理・分析し、複数ソースのデータを照合して詳細なレポートを生成します。


エージェントの基本ループ:3ステップの繰り返し

優れたエージェントはすべて、次の3ステップを繰り返して動きます。

[コンテキストを集める] → [行動する] → [作業を確認する] → (繰り返し)

このループを念頭に置きながら、メールエージェントを例に説明します。


ステップ1:コンテキストを集める

エージェントはプロンプトを受け取るだけでなく、自分でコンテキスト(作業に必要な情報)を取得・更新できます。

ファイルシステムで探す

大きなファイル(ログ、メール、ドキュメントなど)に対してAIはgrep(テキスト検索)やtail(ファイルの末尾を読む)などのコマンドを使って必要な部分だけ読み込みます。フォルダとファイルの構造が「コンテキストの設計図」になります。

メールエージェントなら:過去の会話をConversationsフォルダに保存しておき、質問に応じてそこを検索する。

サブエージェントで並行調査

Claude Agent SDKはサブエージェント(分担して動く複数のAI)をデフォルトでサポートしています。

メールエージェントなら:複数の検索サブエージェントを同時に起動し、それぞれ異なるキーワードで検索させる。全文ではなく関連部分だけをオーケストレーター(まとめ役)に返させる。

コンテキスト圧縮(Compaction)

長時間動かすエージェントでは、やり取りが増えてコンテキストウィンドウの上限に達します。Claude Agent SDKの圧縮機能は、過去のやり取りを自動的に要約してエージェントが継続できるようにします。


ステップ2:行動する

ツール

ツールはエージェントの主な行動手段です。AIのコンテキストウィンドウの中で目立つ存在なので、「主要な行動」に絞って設計します。

メールエージェントの例:fetchInbox(受信箱を取得)、searchEmails(メールを検索)など。

Bash・スクリプト

汎用的な処理に使います。

メールエージェントの例:添付PDFをダウンロード→テキストに変換→必要な情報を抽出——この一連の処理をBashスクリプトで自動化。

コード生成

Claude Agent SDKはコード生成が特に得意です。コードは「精度が高く、再利用できる」という点で、エージェントの出力として優れています。

実際の活用例:Claude.ai(チャットサービス)のファイル生成機能では、ClaudeがPythonスクリプトを書いてExcel・PowerPoint・Wordファイルを生成しています。コードで作ることで、複雑なフォーマットと機能を確実に実現できます。

MCP(外部サービスとの接続)

MCP(Model Context Protocol)は、外部サービスと接続するための標準規格です。Slack・GitHub・Google Drive・Asanaなどと、認証処理などを自前で書かずに繋げられます。

メールエージェントなら:Slackでチームの会話を確認したり、Asanaで担当者がいるか確認したりできます。


ステップ3:作業を確認する

エージェントが自分の出力を確認・修正できる仕組みを作ることで、信頼性が大幅に上がります。

ルールベースの確認

具体的なルールを定義してチェックします。

  • メールアドレスが有効か(無効ならエラー)
  • 過去にやり取りがある相手か(初めての場合は確認)
  • コードのlint(構文チェック)でエラーがないか

TypeScriptで書いたコードのlintは、JavaScriptより多くのフィードバックが得られるため品質が上がりやすい、という実例もあります。

視覚的フィードバック

HTMLメールやUIを生成した場合は、スクリーンショットを使って確認できます。PlaywrightというMCPサーバーを使えば、スクリーンショット撮影・操作テスト・レスポンシブ確認(さまざまな画面サイズでの表示確認)を自動化できます。

LLMによる判定

別のAIモデルに出力を評価させる方法です。「このメールのトーンは適切か?」のような、ルールで表現しにくい判断に使います。ただし処理時間が増えるため、本当に必要な場面に絞って使います。


エージェントを改善するための問いかけ

作ったエージェントがうまく動かないとき、Thariq氏はこんな問いを投げかけます。

  • タスクを誤解する → 情報が足りていないのでは? 検索APIの構造を改善できるか?
  • 同じ失敗を繰り返す → ルールを追加できないか? ツールに明示的な制約を入れる
  • エラーから回復できない → 別のアプローチを取れるツールを与えられないか?
  • 機能追加で品質がバラつく → テストセット(evalセット)を作って定量評価する

まとめ

従来のAI活用Claude Agent SDKを使った場合
一問一答で終わる複数ステップを自律的に実行する
テキスト生成のみファイル操作・コマンド実行・外部サービス連携
コーディング専用業務自動化全般に応用できる
1回のリクエストで完結「集める→行動する→確認する」を繰り返す

Claude Agent SDKは今日から試し始めることができます。「コンテキストを集める→行動する→確認する」という3ステップのループを設計の基本に置けば、信頼性が高く改善しやすいエージェントが作れます。

コメント

この記事へのトラックバックはありません。

関連記事

【Windows版】Claude Code導入〜VSCode連携まで完全ガイド(非エンジニア/初心者向け)2026

Claude Codeのツール設計は「芸術」だ——AIエージェントに何を渡すかで、できることが変わる

Claude Codeを使う時、コーディングしなくてもBashツールが必要な理由——非エンジニアこそ知っておきたい活用法

PAGE TOP