TL

Cloud Service

Vertex AI Agent Builder

コードを書かずに AI エージェントや検索を素早く構築。自社データに根拠付けした生成 AI アプリを作る Google Cloud のプラットフォーム。AWS の Amazon Q / Bedrock Agents に近い位置づけ。

中級運用上の優秀性セキュリティ
最終更新: 2026-06-28公式ドキュメント ↗
TL;DR要点だけ先に
  • 1.自社データに根拠付けした検索・チャット・エージェントを素早く構築できるプラットフォーム。
  • 2.データストアへの取り込みで RAG 的な根拠付き回答を実現し、ハルシネーションを抑える。
  • 3.AWS では Amazon Q や Bedrock Agents/Knowledge Bases に相当する役割を担う。

解決する課題

  • 基盤モデルだけでは社内ドキュメントや最新情報を知らず、自社データに基づいた回答を返せない
  • RAG(検索拡張生成)の仕組みを、検索基盤・埋め込み・取り込みパイプラインまでゼロから自作するのは負担が大きい
  • 公開サイトや社内ナレッジに、Google 品質の高精度なエンタープライズ検索を組み込みたい
  • 問い合わせや業務手続きを、ツール呼び出しや外部 API 連携を伴うAI エージェントに任せたい
  • 生成 AI の回答に出典(引用)や根拠付けを付けて、利用者が検証できる形で提供したい

主要概念と用語

  • Vertex AI Agent Builder: 検索・推薦・会話エージェントなど、自社データに根拠付けした生成 AI アプリをコード中心でもノーコードでも構築できるプラットフォーム
  • データストア(Data Store): ウェブサイト・非構造化ドキュメント・構造化データなどを取り込む受け皿。検索やエージェントの根拠(グラウンディング)元になる
  • アプリ / エンジン(App / Engine): データストアを束ねて公開する単位。検索アプリ・チャットアプリ・推薦アプリなど用途別に作る
  • グラウンディング(Grounding): 生成結果をデータストアや Google 検索に根拠付けし、出典を添えてハルシネーションを抑える仕組み
  • エージェント(Agent): ユーザーの指示を理解し、ツールや外部 API、データストアを使って多段の処理を実行する自律的な仕組み
  • ツール(Tool): エージェントが呼び出せる機能。データストア検索、外部 API(OpenAPI 定義)、関数などを登録して使わせる
  • コネクタ(Connector): サードパーティのデータソースから定期的にデータを同期して取り込む仕組み
  • RAG(検索拡張生成): 質問に関連する文書を検索し、その内容を文脈として与えて回答を生成する手法。Agent Builder の核となる考え方

仕様・制限・クォータ

  • データソースはウェブサイト・非構造化ドキュメント・構造化データなど複数種類を扱える。取り込み後はインデックス化され、検索やエージェントから参照できる
  • 取り込み対象のファイル形式・サイズ・ドキュメント件数には上限があり、形式により扱いが異なる。具体的な数値は変動するため公式ドキュメントで都度確認する
  • 検索・エージェントのリクエストには、プロジェクト単位のクエリ毎秒(QPS)などのレート制限がある。これらは定性的に「上限がある」と捉え、コンソールのクォータ画面で確認する
  • 生成 AI による要約・回答には、基盤モデル側の入力・出力トークン上限が影響する
  • リージョン単位の設定があり、**データの所在地(マルチリージョンの選択)**を取り込み前に決める必要がある
  • 利用できる機能・モデルは更新が頻繁なため、対応形式や上限値は断定せず公式情報で確認する
データ所在地は取り込み前に決める

データストアの保存ロケーション(リージョン/マルチリージョン)は作成時に決まり、後から変更しにくい構成になりがちです。コンプライアンス上のデータ所在地要件と、利用したいモデルの提供地域を、取り込みを始める前に突き合わせてください。

内部の仕組み

Agent Builder の基本は RAG(検索拡張生成) です。まず**取り込み(インジェスト)**フェーズで、ウェブやドキュメントの内容を解析し、チャンク(断片)に分割して埋め込みベクトルを生成し、検索インデックスを構築します。これがデータストアの実体です。

問い合わせ時には、ユーザーの質問から関連する文書を検索(リトリーバル)で取り出し、その内容を文脈として基盤モデルに渡して回答を生成します。生成結果には参照した文書への**出典(引用)**が添えられ、根拠を辿れます。検索には Google のエンタープライズ検索技術が使われ、キーワードと意味(セマンティック)の双方を考慮します。

エージェントでは、ここにツール呼び出しの制御が加わります。モデルがユーザーの意図を解釈し、必要に応じてデータストア検索や外部 API(ツール)を選んで呼び出し、結果を踏まえて次の行動を決める、という多段の推論ループを回します。

Amazon Q / Bedrock との立ち位置

AWS では、自社データに根拠付けした生成 AI アシスタントを Amazon Q、エージェントとナレッジベースを Bedrock Agents / Knowledge Bases が担います。Agent Builder は「データストア取り込み+検索+根拠付き生成+ツール実行」という構図がこれらに近く、RAG 基盤を自作せずマネージドに使える点が共通します。

設計パターン / ベストプラクティス

  • 検索かエージェントかを切り分ける: ナレッジ検索や FAQ 回答なら検索アプリ、多段の手続きや外部 API 連携が要るならエージェントを選ぶ
  • 根拠付けを前提にする: 業務利用では必ずデータストアにグラウンディングし、出典を表示して回答を検証可能にする
  • 取り込み品質を整える: 重複・古い文書を除き、構造の整ったドキュメントを取り込むほど検索精度が上がる。コネクタで定期同期し鮮度を保つ
  • ツールは最小限かつ明確に: エージェントに渡すツールは説明を具体的に書き、用途を絞ると誤った呼び出しが減る
  • 回答の評価を回す: 想定質問のテストセットで回答品質と出典の妥当性を継続評価し、取り込みやプロンプトを改善する
  • フォールバックを用意する: 根拠が見つからない質問には推測で答えさせず、「該当情報なし」と返す設計にする
グラウンディングなしの生成は避ける

データストアに根拠付けせず基盤モデルだけで回答させると、もっともらしい誤答(ハルシネーション)が混ざりやすくなります。業務向けでは根拠付けを必須とし、出典のない回答はユーザーに提示しないか注意を促す設計にしてください。

運用・監視

  • Cloud Logging / Cloud Monitoring で検索・エージェントのリクエスト数・レイテンシ・エラー率を監視し、健全性を把握する
  • 取り込みジョブ(インジェスト)の成功・失敗とドキュメント件数を確認し、同期エラーや取りこぼしを早期に検知する
  • 実際のクエリログを分析し、ヒットしない質問やフォールバック多発の傾向から取り込み内容やプロンプトを改善する
  • データソースを更新したら**再取り込み(再インデックス)**のタイミングを管理し、回答の鮮度を保つ
  • 生成 AI ではトークン消費量とレート制限の到達状況を監視し、必要に応じてクォータ増枠やリトライ設計を行う

コスト

項目課金の考え方コストを抑える勘所
検索クエリ処理した検索リクエスト量に応じて課金不要な再検索を避けキャッシュを活用
データ取り込み・保存インデックス化したデータ量や保存量古い・重複文書を整理して肥大を防ぐ
生成 AI 要約入力・出力のトークン量(モデルにより単価が異なる)プロンプト短縮と適切なモデル選択
エージェント実行ツール呼び出しや推論ステップに応じた利用量ツール数と多段推論を必要最小限にする
取り込みデータの肥大に注意

データストアは取り込んだデータ量に応じて保存・インデックスのコストが膨らみます。検証で大量に取り込んだまま放置せず、不要なデータソースは削除し、重複や古い文書を整理してから取り込むと無駄が減ります。

セキュリティ

  • IAM でアプリ・データストア・エージェントへのアクセスを最小権限に分離する(編集者と利用者のロールを分ける)
  • 取り込むデータには機微情報が含まれやすいため、**アクセス制御(ドキュメント単位の権限)**を設計し、見せてよい範囲だけを検索対象にする
  • 保存データは既定で暗号化され、要件に応じて CMEK(顧客管理鍵、Cloud KMS) を適用できる
  • 機微なデータ境界が必要なら VPC Service Controls で外部への持ち出し経路を制限する
  • エージェントに外部 API ツールを与える場合は、呼び出し先の認証と入力検証を行い、プロンプトインジェクションによる意図しないツール実行に備える
アンチパターン

全社員に見せてはいけない機微文書を、アクセス制御をかけずデータストアに取り込むのは危険です。検索やエージェント経由で権限のない利用者に内容が露出します。取り込み前にドキュメント単位のアクセス制御を設計し、ツールの呼び出し先も認証必須にしてください。

関連サービス・比較

ナレッジ根拠の会話ボットを作る用途では Dialogflow CX(Conversational Agents)と機能が重なります。会話フローの細かな状態遷移設計が中心なら Dialogflow、自社データへの根拠付き検索・回答が中心なら Agent Builder が向きます。

観点GCP(Agent Builder)AWS(相当サービス)
分類検索・エージェント構築プラットフォームAmazon Q / Bedrock Agents
根拠データデータストア(ウェブ/文書/構造化)Knowledge Bases
検索方式エンタープライズ検索+セマンティックベクトル検索ベースの RAG
根拠付き生成グラウンディングと出典表示Knowledge Bases による根拠付け
エージェントツール/外部 API を呼ぶエージェントBedrock Agents
課金検索量・取り込み量・生成量の従量リクエスト/トークン量の従量

ハンズオン / CLI例

# 1) Discovery Engine API を有効化(Agent Builder の基盤 API)
gcloud services enable discoveryengine.googleapis.com \
  --project=MY_PROJECT

# 2) ウェブサイトを取り込むデータストアを作成
gcloud alpha discovery-engine data-stores create my-data-store \
  --project=MY_PROJECT \
  --location=global \
  --display-name="docs-store" \
  --industry-vertical=GENERIC \
  --content-config=PUBLIC_WEBSITE \
  --solution-types=SOLUTION_TYPE_SEARCH

# 3) 作成したデータストア一覧を確認
gcloud alpha discovery-engine data-stores list \
  --project=MY_PROJECT \
  --location=global

# 4) 検索エンジン(アプリ)を作成し、データストアを紐づける
gcloud alpha discovery-engine engines create my-search-engine \
  --project=MY_PROJECT \
  --location=global \
  --display-name="docs-search" \
  --data-store-ids=my-data-store \
  --solution-type=SOLUTION_TYPE_SEARCH

Google Cloud Service

Vertex AI Agent Builderを実務で読む

TL;DRは入口です。実際に選ぶ・使う段階では、何を解決するか、何と比較するか、導入後にどこで詰まるかまで見る必要があります。

解決すること

AI / 機械学習

比較で見る軸

クラウド: Google Cloud / カテゴリ: AI / 機械学習 / 難易度: intermediate

導入後に効く点

データストアへの取り込みで RAG 的な根拠付き回答を実現し、ハルシネーションを抑える。

先に潰すリスク

サービス単体ではなく、権限、ネットワーク、監視、課金、バックアップを含めて設計する必要がある。

数字・仕様の読み方
クラウド
Google Cloud
カテゴリ
AI / 機械学習
難易度
intermediate
関連資格
設計柱
operational / security

判断チェックリスト

  • 自社の用途が「AI / 機械学習 / operational」に近いか確認する。
  • 強みである「自社データに根拠付けした検索・チャット・エージェントを素早く構築できるプラットフォーム。」が本当に評価軸になるか確認する。
  • 注意点の「サービス単体ではなく、権限、ネットワーク、監視、課金、バックアップを含めて設計する必要がある。」を運用で吸収できるか確認する。
  • 公開値や仕様値は、対象プラン・対象機種・対象リージョンまで確認する。
  • 既存システム、ID、ネットワーク、監視、バックアップとの接続方法を先に洗い出す。
  • 小さく試してから、本番移行、権限設計、障害時手順、コスト監視を決める。

次に確認する観点

AI / 機械学習operationalsecurity