Cloud Service
Vertex AI Agent Builder
コードを書かずに AI エージェントや検索を素早く構築。自社データに根拠付けした生成 AI アプリを作る Google Cloud のプラットフォーム。AWS の Amazon Q / Bedrock Agents に近い位置づけ。
- 1.自社データに根拠付けした検索・チャット・エージェントを素早く構築できるプラットフォーム。
- 2.データストアへの取り込みで RAG 的な根拠付き回答を実現し、ハルシネーションを抑える。
- 3.AWS では Amazon Q や Bedrock Agents/Knowledge Bases に相当する役割を担う。
解決する課題
- 基盤モデルだけでは社内ドキュメントや最新情報を知らず、自社データに基づいた回答を返せない
- RAG(検索拡張生成)の仕組みを、検索基盤・埋め込み・取り込みパイプラインまでゼロから自作するのは負担が大きい
- 公開サイトや社内ナレッジに、Google 品質の高精度なエンタープライズ検索を組み込みたい
- 問い合わせや業務手続きを、ツール呼び出しや外部 API 連携を伴うAI エージェントに任せたい
- 生成 AI の回答に出典(引用)や根拠付けを付けて、利用者が検証できる形で提供したい
主要概念と用語
- Vertex AI Agent Builder: 検索・推薦・会話エージェントなど、自社データに根拠付けした生成 AI アプリをコード中心でもノーコードでも構築できるプラットフォーム
- データストア(Data Store): ウェブサイト・非構造化ドキュメント・構造化データなどを取り込む受け皿。検索やエージェントの根拠(グラウンディング)元になる
- アプリ / エンジン(App / Engine): データストアを束ねて公開する単位。検索アプリ・チャットアプリ・推薦アプリなど用途別に作る
- グラウンディング(Grounding): 生成結果をデータストアや Google 検索に根拠付けし、出典を添えてハルシネーションを抑える仕組み
- エージェント(Agent): ユーザーの指示を理解し、ツールや外部 API、データストアを使って多段の処理を実行する自律的な仕組み
- ツール(Tool): エージェントが呼び出せる機能。データストア検索、外部 API(OpenAPI 定義)、関数などを登録して使わせる
- コネクタ(Connector): サードパーティのデータソースから定期的にデータを同期して取り込む仕組み
- RAG(検索拡張生成): 質問に関連する文書を検索し、その内容を文脈として与えて回答を生成する手法。Agent Builder の核となる考え方
仕様・制限・クォータ
- データソースはウェブサイト・非構造化ドキュメント・構造化データなど複数種類を扱える。取り込み後はインデックス化され、検索やエージェントから参照できる
- 取り込み対象のファイル形式・サイズ・ドキュメント件数には上限があり、形式により扱いが異なる。具体的な数値は変動するため公式ドキュメントで都度確認する
- 検索・エージェントのリクエストには、プロジェクト単位のクエリ毎秒(QPS)などのレート制限がある。これらは定性的に「上限がある」と捉え、コンソールのクォータ画面で確認する
- 生成 AI による要約・回答には、基盤モデル側の入力・出力トークン上限が影響する
- リージョン単位の設定があり、**データの所在地(マルチリージョンの選択)**を取り込み前に決める必要がある
- 利用できる機能・モデルは更新が頻繁なため、対応形式や上限値は断定せず公式情報で確認する
データストアの保存ロケーション(リージョン/マルチリージョン)は作成時に決まり、後から変更しにくい構成になりがちです。コンプライアンス上のデータ所在地要件と、利用したいモデルの提供地域を、取り込みを始める前に突き合わせてください。
内部の仕組み
Agent Builder の基本は RAG(検索拡張生成) です。まず**取り込み(インジェスト)**フェーズで、ウェブやドキュメントの内容を解析し、チャンク(断片)に分割して埋め込みベクトルを生成し、検索インデックスを構築します。これがデータストアの実体です。
問い合わせ時には、ユーザーの質問から関連する文書を検索(リトリーバル)で取り出し、その内容を文脈として基盤モデルに渡して回答を生成します。生成結果には参照した文書への**出典(引用)**が添えられ、根拠を辿れます。検索には Google のエンタープライズ検索技術が使われ、キーワードと意味(セマンティック)の双方を考慮します。
エージェントでは、ここにツール呼び出しの制御が加わります。モデルがユーザーの意図を解釈し、必要に応じてデータストア検索や外部 API(ツール)を選んで呼び出し、結果を踏まえて次の行動を決める、という多段の推論ループを回します。
AWS では、自社データに根拠付けした生成 AI アシスタントを Amazon Q、エージェントとナレッジベースを Bedrock Agents / Knowledge Bases が担います。Agent Builder は「データストア取り込み+検索+根拠付き生成+ツール実行」という構図がこれらに近く、RAG 基盤を自作せずマネージドに使える点が共通します。
設計パターン / ベストプラクティス
- 検索かエージェントかを切り分ける: ナレッジ検索や FAQ 回答なら検索アプリ、多段の手続きや外部 API 連携が要るならエージェントを選ぶ
- 根拠付けを前提にする: 業務利用では必ずデータストアにグラウンディングし、出典を表示して回答を検証可能にする
- 取り込み品質を整える: 重複・古い文書を除き、構造の整ったドキュメントを取り込むほど検索精度が上がる。コネクタで定期同期し鮮度を保つ
- ツールは最小限かつ明確に: エージェントに渡すツールは説明を具体的に書き、用途を絞ると誤った呼び出しが減る
- 回答の評価を回す: 想定質問のテストセットで回答品質と出典の妥当性を継続評価し、取り込みやプロンプトを改善する
- フォールバックを用意する: 根拠が見つからない質問には推測で答えさせず、「該当情報なし」と返す設計にする
データストアに根拠付けせず基盤モデルだけで回答させると、もっともらしい誤答(ハルシネーション)が混ざりやすくなります。業務向けでは根拠付けを必須とし、出典のない回答はユーザーに提示しないか注意を促す設計にしてください。
運用・監視
- Cloud Logging / Cloud Monitoring で検索・エージェントのリクエスト数・レイテンシ・エラー率を監視し、健全性を把握する
- 取り込みジョブ(インジェスト)の成功・失敗とドキュメント件数を確認し、同期エラーや取りこぼしを早期に検知する
- 実際のクエリログを分析し、ヒットしない質問やフォールバック多発の傾向から取り込み内容やプロンプトを改善する
- データソースを更新したら**再取り込み(再インデックス)**のタイミングを管理し、回答の鮮度を保つ
- 生成 AI ではトークン消費量とレート制限の到達状況を監視し、必要に応じてクォータ増枠やリトライ設計を行う
コスト
| 項目 | 課金の考え方 | コストを抑える勘所 |
|---|---|---|
| 検索クエリ | 処理した検索リクエスト量に応じて課金 | 不要な再検索を避けキャッシュを活用 |
| データ取り込み・保存 | インデックス化したデータ量や保存量 | 古い・重複文書を整理して肥大を防ぐ |
| 生成 AI 要約 | 入力・出力のトークン量(モデルにより単価が異なる) | プロンプト短縮と適切なモデル選択 |
| エージェント実行 | ツール呼び出しや推論ステップに応じた利用量 | ツール数と多段推論を必要最小限にする |
データストアは取り込んだデータ量に応じて保存・インデックスのコストが膨らみます。検証で大量に取り込んだまま放置せず、不要なデータソースは削除し、重複や古い文書を整理してから取り込むと無駄が減ります。
セキュリティ
- IAM でアプリ・データストア・エージェントへのアクセスを最小権限に分離する(編集者と利用者のロールを分ける)
- 取り込むデータには機微情報が含まれやすいため、**アクセス制御(ドキュメント単位の権限)**を設計し、見せてよい範囲だけを検索対象にする
- 保存データは既定で暗号化され、要件に応じて CMEK(顧客管理鍵、Cloud KMS) を適用できる
- 機微なデータ境界が必要なら VPC Service Controls で外部への持ち出し経路を制限する
- エージェントに外部 API ツールを与える場合は、呼び出し先の認証と入力検証を行い、プロンプトインジェクションによる意図しないツール実行に備える
全社員に見せてはいけない機微文書を、アクセス制御をかけずデータストアに取り込むのは危険です。検索やエージェント経由で権限のない利用者に内容が露出します。取り込み前にドキュメント単位のアクセス制御を設計し、ツールの呼び出し先も認証必須にしてください。
関連サービス・比較
ナレッジ根拠の会話ボットを作る用途では Dialogflow CX(Conversational Agents)と機能が重なります。会話フローの細かな状態遷移設計が中心なら Dialogflow、自社データへの根拠付き検索・回答が中心なら Agent Builder が向きます。
| 観点 | GCP(Agent Builder) | AWS(相当サービス) |
|---|---|---|
| 分類 | 検索・エージェント構築プラットフォーム | Amazon Q / Bedrock Agents |
| 根拠データ | データストア(ウェブ/文書/構造化) | Knowledge Bases |
| 検索方式 | エンタープライズ検索+セマンティック | ベクトル検索ベースの RAG |
| 根拠付き生成 | グラウンディングと出典表示 | Knowledge Bases による根拠付け |
| エージェント | ツール/外部 API を呼ぶエージェント | Bedrock Agents |
| 課金 | 検索量・取り込み量・生成量の従量 | リクエスト/トークン量の従量 |
ハンズオン / CLI例
# 1) Discovery Engine API を有効化(Agent Builder の基盤 API)
gcloud services enable discoveryengine.googleapis.com \
--project=MY_PROJECT
# 2) ウェブサイトを取り込むデータストアを作成
gcloud alpha discovery-engine data-stores create my-data-store \
--project=MY_PROJECT \
--location=global \
--display-name="docs-store" \
--industry-vertical=GENERIC \
--content-config=PUBLIC_WEBSITE \
--solution-types=SOLUTION_TYPE_SEARCH
# 3) 作成したデータストア一覧を確認
gcloud alpha discovery-engine data-stores list \
--project=MY_PROJECT \
--location=global
# 4) 検索エンジン(アプリ)を作成し、データストアを紐づける
gcloud alpha discovery-engine engines create my-search-engine \
--project=MY_PROJECT \
--location=global \
--display-name="docs-search" \
--data-store-ids=my-data-store \
--solution-type=SOLUTION_TYPE_SEARCH
Google Cloud Service
Vertex AI Agent Builderを実務で読む
TL;DRは入口です。実際に選ぶ・使う段階では、何を解決するか、何と比較するか、導入後にどこで詰まるかまで見る必要があります。
解決すること
AI / 機械学習
比較で見る軸
クラウド: Google Cloud / カテゴリ: AI / 機械学習 / 難易度: intermediate
導入後に効く点
データストアへの取り込みで RAG 的な根拠付き回答を実現し、ハルシネーションを抑える。
先に潰すリスク
サービス単体ではなく、権限、ネットワーク、監視、課金、バックアップを含めて設計する必要がある。
- クラウド
- Google Cloud
- カテゴリ
- AI / 機械学習
- 難易度
- intermediate
- 関連資格
- —
- 設計柱
- operational / security
判断チェックリスト
- 自社の用途が「AI / 機械学習 / operational」に近いか確認する。
- 強みである「自社データに根拠付けした検索・チャット・エージェントを素早く構築できるプラットフォーム。」が本当に評価軸になるか確認する。
- 注意点の「サービス単体ではなく、権限、ネットワーク、監視、課金、バックアップを含めて設計する必要がある。」を運用で吸収できるか確認する。
- 公開値や仕様値は、対象プラン・対象機種・対象リージョンまで確認する。
- 既存システム、ID、ネットワーク、監視、バックアップとの接続方法を先に洗い出す。
- 小さく試してから、本番移行、権限設計、障害時手順、コスト監視を決める。