Vertex AI Agent Builderとは？仕組みと使いどころをわかりやすく解説

解決する課題

基盤モデルだけでは社内ドキュメントや最新情報を知らず、自社データに基づいた回答を返せない
RAG（検索拡張生成）の仕組みを、検索基盤・埋め込み・取り込みパイプラインまでゼロから自作するのは負担が大きい
公開サイトや社内ナレッジに、Google 品質の高精度なエンタープライズ検索を組み込みたい
問い合わせや業務手続きを、ツール呼び出しや外部 API 連携を伴うAI エージェントに任せたい
生成 AI の回答に出典（引用）や根拠付けを付けて、利用者が検証できる形で提供したい

主要概念と用語

Vertex AI Agent Builder: 検索・推薦・会話エージェントなど、自社データに根拠付けした生成 AI アプリをコード中心でもノーコードでも構築できるプラットフォーム
データストア（Data Store）: ウェブサイト・非構造化ドキュメント・構造化データなどを取り込む受け皿。検索やエージェントの根拠（グラウンディング）元になる
アプリ / エンジン（App / Engine）: データストアを束ねて公開する単位。検索アプリ・チャットアプリ・推薦アプリなど用途別に作る
グラウンディング（Grounding）: 生成結果をデータストアや Google 検索に根拠付けし、出典を添えてハルシネーションを抑える仕組み
エージェント（Agent）: ユーザーの指示を理解し、ツールや外部 API、データストアを使って多段の処理を実行する自律的な仕組み
ツール（Tool）: エージェントが呼び出せる機能。データストア検索、外部 API（OpenAPI 定義）、関数などを登録して使わせる
コネクタ（Connector）: サードパーティのデータソースから定期的にデータを同期して取り込む仕組み
RAG（検索拡張生成）: 質問に関連する文書を検索し、その内容を文脈として与えて回答を生成する手法。Agent Builder の核となる考え方

仕様・制限・クォータ

データソースはウェブサイト・非構造化ドキュメント・構造化データなど複数種類を扱える。取り込み後はインデックス化され、検索やエージェントから参照できる
取り込み対象のファイル形式・サイズ・ドキュメント件数には上限があり、形式により扱いが異なる。具体的な数値は変動するため公式ドキュメントで都度確認する
検索・エージェントのリクエストには、プロジェクト単位のクエリ毎秒（QPS）などのレート制限がある。これらは定性的に「上限がある」と捉え、コンソールのクォータ画面で確認する
生成 AI による要約・回答には、基盤モデル側の入力・出力トークン上限が影響する
リージョン単位の設定があり、**データの所在地（マルチリージョンの選択）**を取り込み前に決める必要がある
利用できる機能・モデルは更新が頻繁なため、対応形式や上限値は断定せず公式情報で確認する

データ所在地は取り込み前に決める

データストアの保存ロケーション（リージョン/マルチリージョン）は作成時に決まり、後から変更しにくい構成になりがちです。コンプライアンス上のデータ所在地要件と、利用したいモデルの提供地域を、取り込みを始める前に突き合わせてください。

内部の仕組み

Agent Builder の基本は RAG（検索拡張生成） です。まず**取り込み（インジェスト）**フェーズで、ウェブやドキュメントの内容を解析し、チャンク（断片）に分割して埋め込みベクトルを生成し、検索インデックスを構築します。これがデータストアの実体です。

問い合わせ時には、ユーザーの質問から関連する文書を検索（リトリーバル）で取り出し、その内容を文脈として基盤モデルに渡して回答を生成します。生成結果には参照した文書への**出典（引用）**が添えられ、根拠を辿れます。検索には Google のエンタープライズ検索技術が使われ、キーワードと意味（セマンティック）の双方を考慮します。

エージェントでは、ここにツール呼び出しの制御が加わります。モデルがユーザーの意図を解釈し、必要に応じてデータストア検索や外部 API（ツール）を選んで呼び出し、結果を踏まえて次の行動を決める、という多段の推論ループを回します。

Amazon Q / Bedrock との立ち位置

AWS では、自社データに根拠付けした生成 AI アシスタントを Amazon Q、エージェントとナレッジベースを Bedrock Agents / Knowledge Bases が担います。Agent Builder は「データストア取り込み＋検索＋根拠付き生成＋ツール実行」という構図がこれらに近く、RAG 基盤を自作せずマネージドに使える点が共通します。

設計パターン / ベストプラクティス

検索かエージェントかを切り分ける: ナレッジ検索や FAQ 回答なら検索アプリ、多段の手続きや外部 API 連携が要るならエージェントを選ぶ
根拠付けを前提にする: 業務利用では必ずデータストアにグラウンディングし、出典を表示して回答を検証可能にする
取り込み品質を整える: 重複・古い文書を除き、構造の整ったドキュメントを取り込むほど検索精度が上がる。コネクタで定期同期し鮮度を保つ
ツールは最小限かつ明確に: エージェントに渡すツールは説明を具体的に書き、用途を絞ると誤った呼び出しが減る
回答の評価を回す: 想定質問のテストセットで回答品質と出典の妥当性を継続評価し、取り込みやプロンプトを改善する
フォールバックを用意する: 根拠が見つからない質問には推測で答えさせず、「該当情報なし」と返す設計にする

グラウンディングなしの生成は避ける

データストアに根拠付けせず基盤モデルだけで回答させると、もっともらしい誤答（ハルシネーション）が混ざりやすくなります。業務向けでは根拠付けを必須とし、出典のない回答はユーザーに提示しないか注意を促す設計にしてください。

運用・監視

Cloud Logging / Cloud Monitoring で検索・エージェントのリクエスト数・レイテンシ・エラー率を監視し、健全性を把握する
取り込みジョブ（インジェスト）の成功・失敗とドキュメント件数を確認し、同期エラーや取りこぼしを早期に検知する
実際のクエリログを分析し、ヒットしない質問やフォールバック多発の傾向から取り込み内容やプロンプトを改善する
データソースを更新したら**再取り込み（再インデックス）**のタイミングを管理し、回答の鮮度を保つ
生成 AI ではトークン消費量とレート制限の到達状況を監視し、必要に応じてクォータ増枠やリトライ設計を行う

コスト

項目	課金の考え方	コストを抑える勘所
検索クエリ	処理した検索リクエスト量に応じて課金	不要な再検索を避けキャッシュを活用
データ取り込み・保存	インデックス化したデータ量や保存量	古い・重複文書を整理して肥大を防ぐ
生成 AI 要約	入力・出力のトークン量（モデルにより単価が異なる）	プロンプト短縮と適切なモデル選択
エージェント実行	ツール呼び出しや推論ステップに応じた利用量	ツール数と多段推論を必要最小限にする

取り込みデータの肥大に注意

データストアは取り込んだデータ量に応じて保存・インデックスのコストが膨らみます。検証で大量に取り込んだまま放置せず、不要なデータソースは削除し、重複や古い文書を整理してから取り込むと無駄が減ります。

セキュリティ

IAM でアプリ・データストア・エージェントへのアクセスを最小権限に分離する（編集者と利用者のロールを分ける）
取り込むデータには機微情報が含まれやすいため、**アクセス制御（ドキュメント単位の権限）**を設計し、見せてよい範囲だけを検索対象にする
保存データは既定で暗号化され、要件に応じて CMEK（顧客管理鍵、Cloud KMS） を適用できる
機微なデータ境界が必要なら VPC Service Controls で外部への持ち出し経路を制限する
エージェントに外部 API ツールを与える場合は、呼び出し先の認証と入力検証を行い、プロンプトインジェクションによる意図しないツール実行に備える

アンチパターン

全社員に見せてはいけない機微文書を、アクセス制御をかけずデータストアに取り込むのは危険です。検索やエージェント経由で権限のない利用者に内容が露出します。取り込み前にドキュメント単位のアクセス制御を設計し、ツールの呼び出し先も認証必須にしてください。

観点	GCP（Agent Builder）	AWS（相当サービス）
分類	検索・エージェント構築プラットフォーム	Amazon Q / Bedrock Agents
根拠データ	データストア（ウェブ/文書/構造化）	Knowledge Bases
検索方式	エンタープライズ検索＋セマンティック	ベクトル検索ベースの RAG
根拠付き生成	グラウンディングと出典表示	Knowledge Bases による根拠付け
エージェント	ツール/外部 API を呼ぶエージェント	Bedrock Agents
課金	検索量・取り込み量・生成量の従量	リクエスト/トークン量の従量

ハンズオン / CLI例

# 1) Discovery Engine API を有効化（Agent Builder の基盤 API）
gcloud services enable discoveryengine.googleapis.com \
  --project=MY_PROJECT

# 2) ウェブサイトを取り込むデータストアを作成
gcloud alpha discovery-engine data-stores create my-data-store \
  --project=MY_PROJECT \
  --location=global \
  --display-name="docs-store" \
  --industry-vertical=GENERIC \
  --content-config=PUBLIC_WEBSITE \
  --solution-types=SOLUTION_TYPE_SEARCH

# 3) 作成したデータストア一覧を確認
gcloud alpha discovery-engine data-stores list \
  --project=MY_PROJECT \
  --location=global

# 4) 検索エンジン（アプリ）を作成し、データストアを紐づける
gcloud alpha discovery-engine engines create my-search-engine \
  --project=MY_PROJECT \
  --location=global \
  --display-name="docs-search" \
  --data-store-ids=my-data-store \
  --solution-type=SOLUTION_TYPE_SEARCH

Vertex AI Agent Builder

解決する課題

主要概念と用語

仕様・制限・クォータ

内部の仕組み

設計パターン / ベストプラクティス

運用・監視

コスト

セキュリティ

関連サービス・比較

ハンズオン / CLI例

Vertex AI Agent Builderを実務で読む

解決すること

比較で見る軸

導入後に効く点

先に潰すリスク

判断チェックリスト

次に確認する観点