Cloud Service
OCI Generative AI Agents
自社データに根拠を持つ RAG エージェントを運用なしで構築できる。ナレッジベース・SQL・関数呼び出しのツールを組み合わせ、出典付きで回答する OCI のマネージドエージェント基盤。AWS の Bedrock Agents/Knowledge Bases に相当。
- 1.自社データを取り込み、出典付きで回答する RAG エージェントをマネージドで構築する。
- 2.ナレッジベース(RAG)・SQL・関数呼び出しのツールをエージェントに組み合わせられる。
- 3.Amazon Bedrock のエージェント/ナレッジベースに相当する位置づけ。
解決する課題
大規模言語モデル(LLM)は汎用知識は豊富でも、自社固有のドキュメントや業務データを知りません。そのまま使うと、根拠のない回答(ハルシネーション)や、社内ナレッジに基づかない一般論に陥りがちです。OCI Generative AI Agents は、自社データを取り込み、検索結果を根拠にして出典付きで回答するエージェントを、検索基盤や LLM の運用なしに構築できるようにします。
- LLM に自社ドキュメントの内容を踏まえて回答させたいが、RAG(検索拡張生成)の基盤を自前で組みたくない
- 回答の根拠(出典)を提示し、ハルシネーションを抑えて信頼できる応答にしたい
- 自然言語の問い合わせからデータベースへの SQL を生成・実行して答えさせたい
- 在庫照会や予約のような**外部処理の呼び出し(関数呼び出し)**をエージェントに任せたい
- これらを OCI の IAM・ネットワーク・監査の枠組みの中で安全に運用したい
主要概念と用語
- エージェント(Agent): 1 つ以上のツールを束ね、ユーザーの問いに応じてツールを使い分けて回答する中核の構成単位
- ツール(Tool): エージェントが利用する能力。主に RAG ツール・SQL ツール・関数呼び出しツールがある
- RAG ツール: ナレッジベースを検索し、取得した文書を根拠に回答を生成する。検索拡張生成(Retrieval-Augmented Generation)を担う
- SQL ツール: 自然言語の質問からスキーマに基づいた SQL を生成し、データベースへ問い合わせて答える
- 関数呼び出しツール(Function Calling): 必要に応じて外部の関数・API を呼び出し、その結果を回答に組み込む
- ナレッジベース(Knowledge Base): RAG ツールが検索する知識の集合。データソースを取り込んでベクトル化し、検索可能にしたもの
- データソース(Data Source): ナレッジベースの元データ。Object Storage 上のファイルや、データベースのベクトル検索などを指定する
- 取り込み(Ingestion): データソースの文書を読み込み、チャンク化・埋め込み(ベクトル化)してナレッジベースに反映する処理
- エンドポイント(Endpoint): 作成したエージェントへチャットリクエストを送るためのアクセス先
- セッション(Session): 会話の文脈を保持する単位。複数ターンのやり取りで前後の文脈を踏まえる
- 出典(Citation): 回答の根拠となった文書箇所への参照。回答とともに返され、検証可能性を高める
- ガードレール / コンテンツモデレーション: 入出力の有害・不適切なコンテンツや、根拠外の生成を抑制する仕組み
- ADK(Agent Development Kit): エージェントをコードから構築・運用するための開発キット(Python / Java)
- コンパートメント: リソースを論理分離する OCI の枠組み(IAM の単位)
仕様・制限・クォータ
- エージェントはツールの組み合わせで構成され、RAG・SQL・関数呼び出しを単独または併用できる
- ナレッジベースの裏側には、サービス管理のベクトルストア(Object Storage 由来のデータを取り込む方式)のほか、OCI Search with OpenSearch や Oracle Database のベクトル検索などを選べる
- RAG の対象文書は対応するファイル形式・サイズに制約があり、超える場合は分割や前処理が必要
- 取り込み(ingestion)は非同期ジョブとして実行され、データソースを更新したら再取り込みが必要になる
- 利用できる基盤モデルやリージョンは提供状況に依存するため、対象リージョンで確認する
- エージェント数・ナレッジベース数・データソースのサイズなどに**サービス制限(クォータ)**があり、引き上げ申請が可能
- 具体的なファイルサイズ上限・件数・対応形式・モデルの提供範囲は変動し得るため、最新の公式ドキュメントで確認する
内部の仕組み
OCI Generative AI Agents は、LLM とツール群、検索基盤を Oracle がマネージドに束ねたサービスです。ユーザーの問い合わせはエージェントに渡り、エージェントは利用可能なツールの中から適切なものを選んで実行し、その結果を踏まえて回答を生成します。
- RAG ツールでは、まずデータソースを取り込み(ingestion)でチャンク化・ベクトル化してナレッジベースに格納する。問い合わせ時はクエリをベクトル化して類似文書を検索し、取得した文書をプロンプトに添えて LLM が出典付きの回答を生成する
- SQL ツールでは、対象データベースのスキーマ情報をもとに自然言語からクエリを生成し、実行結果を回答に反映する
- 関数呼び出しツールでは、エージェントがどの関数をどの引数で呼ぶべきかを判断し、呼び出し結果を会話に組み込む
- セッションが会話の文脈を保持し、複数ターンにわたって一貫した応答を可能にする
- 完成したエージェントはエンドポイントとして公開され、クライアント API やチャットからアクセスする
自社ドキュメントに基づく回答が目的なら、まず本サービスの RAG(取り込み+検索)を検討してください。文書の追加・更新は再取り込みで反映でき、出典も提示できます。口調や形式を恒常的に作り込みたい場合のみ、別途ファインチューニングを併用します。
設計パターン / ベストプラクティス
- 文書は意味の区切りでチャンク化し、見出しやメタデータを保持すると検索精度と出典の妥当性が上がる
- データソースを更新したら再取り込み(ingestion)を自動化し、ナレッジベースの鮮度を保つ
- 回答には出典(citation)を必ず提示させ、根拠を確認できる UI にしてハルシネーションを抑える
- RAG・SQL・関数呼び出しは役割を明確に分けてツールを設計し、エージェントが選択を誤らないよう指示を具体化する
- SQL ツールは読み取り専用の最小権限ユーザーで接続し、参照範囲を限定する
- 基盤モデルは設定値として切り替え可能にし、モデルの世代交代に追従できるようにする
- 入出力にガードレール / コンテンツモデレーションを組み込み、機微情報の漏えいや有害生成を抑える
運用・監視
- OCI Monitoring で問い合わせ数・レイテンシ・エラー率を監視し、取り込みジョブの成否を追跡する
- 取り込み(ingestion)やエージェント・ナレッジベースの作成削除は**非同期ジョブ(Work Request)**として進捗を確認できる
- エージェントやデータソースの操作は OCI Audit に記録され、誰がいつ何を変更したかを追跡できる
- データソース更新時の再取り込み漏れは古い回答の原因になるため、更新と取り込みを連動させる
- スロットリングが出たらバックオフ付きリトライを入れ、恒常的に超える場合はクォータ引き上げを検討する
- 回答品質は出典の妥当性や評価セットで定期的に確認し、チャンク戦略やプロンプトを改善する
コスト
課金は、エージェントの推論(LLM の利用)と、ナレッジベースの取り込み・検索基盤の利用が主な要素です。取り込み時のベクトル化や、検索を支える OpenSearch / データベースなどの基盤リソースにも費用が発生します。具体的な単価はモデル・リージョン・時期で変動するため、公式の価格表で確認してください。
| コスト要素 | 課金の考え方 | 最適化のポイント |
|---|---|---|
| エージェント推論 | 問い合わせごとの LLM 利用(トークン量など) | プロンプトと取得文書量を絞り出力上限を設定する |
| 取り込み(ingestion) | ベクトル化する文書量・更新頻度 | 差分のみ再取り込みし不要文書を除く |
| 検索基盤 | ベクトルストアや OpenSearch 等の基盤リソース | 適切なサイズで構成し不要リソースは削除する |
| 関連サービス | Object Storage やデータベースの利用料 | 保管データを整理しアクセスを限定する |
セキュリティ
- アクセス制御は OCI IAM ポリシーで行い、コンパートメント単位にエージェント・ナレッジベース・データソースの権限を最小化する
- アプリからの認証は、ハードコードした鍵ではなくインスタンスプリンシパル / リソースプリンシパルを使い、鍵の配布・ローテーションを不要にする
- RAG の元データを置く Object Storage は暗号化し、バケットとアクセスを限定する。SQL ツールのデータベース接続は読み取り専用の最小権限にする
- 通信は TLS で保護される。プライベート接続が必要な場合はサービスゲートウェイやプライベートエンドポイントで OCI バックボーン内から到達させる
- 入出力にガードレール / コンテンツモデレーションを適用し、機微情報の漏えいや有害生成を抑える。プロンプトに秘密情報を不用意に含めない
- 操作は OCI Audit に記録され、コンプライアンス上の追跡が可能
SQL ツールを強い権限のデータベースユーザーで接続するのは危険です。生成された SQL が想定外の更新や参照を行うリスクがあるため、必ず読み取り専用の最小権限ユーザーに限定してください。また、資格情報をアプリやインスタンスにハードコードせず、インスタンス/リソースプリンシパルを使ってください。
関連サービス・比較
OCI Generative AI Agents は、基盤モデル API を提供する OCI Generative AI の上に、ツールと検索基盤を束ねたエージェント層です。単にモデルを呼ぶだけなら Generative AI、自社データに根拠を持たせたエージェントが要るなら本サービス、という使い分けになります。AWS では Bedrock のエージェント/ナレッジベースに相当します。
| 観点 | OCI Generative AI Agents | Amazon Bedrock Agents/KB |
|---|---|---|
| 位置づけ | OCI のマネージド RAG エージェント基盤 | AWS のマネージド RAG エージェント基盤 |
| RAG | ナレッジベース(取り込み+検索) | Knowledge Bases for Bedrock |
| データソース | Object Storage / OpenSearch / DB ベクトル検索 | S3 等+ベクトルストア |
| ツール | RAG / SQL / 関数呼び出し | アクショングループ(関数)/ ナレッジベース |
| 出典 | 回答に出典を提示 | 回答に出典を提示 |
| 権限制御 | OCI IAM + インスタンス/リソースプリンシパル | IAM ロール/ポリシー |
| 監査 | OCI Audit | AWS CloudTrail |
ハンズオン / CLI例
# ナレッジベースを作成する(Object Storage 由来のデータソースを後で紐付ける想定)
# 詳細なデータソース構成は JSON で指定する。実値は環境に合わせて置き換える
oci generative-ai-agent knowledge-base create \
--compartment-id "$COMPARTMENT_OCID" \
--display-name "docs-kb" \
--wait-for-state ACTIVE
# エージェントを作成する(作成後にツールやエンドポイントを構成する)
oci generative-ai-agent agent create \
--compartment-id "$COMPARTMENT_OCID" \
--display-name "support-agent" \
--wait-for-state ACTIVE
# 作成済みのエージェント一覧を確認する
oci generative-ai-agent agent list \
--compartment-id "$COMPARTMENT_OCID"
OCI Service
OCI Generative AI Agentsを実務で読む
TL;DRは入口です。実際に選ぶ・使う段階では、何を解決するか、何と比較するか、導入後にどこで詰まるかまで見る必要があります。
解決すること
AI / 機械学習
比較で見る軸
クラウド: OCI / カテゴリ: AI / 機械学習 / 難易度: intermediate
導入後に効く点
ナレッジベース(RAG)・SQL・関数呼び出しのツールをエージェントに組み合わせられる。
先に潰すリスク
サービス単体ではなく、権限、ネットワーク、監視、課金、バックアップを含めて設計する必要がある。
- クラウド
- OCI
- カテゴリ
- AI / 機械学習
- 難易度
- intermediate
- 関連資格
- —
- 設計柱
- operational / security / reliability
判断チェックリスト
- 自社の用途が「AI / 機械学習 / operational」に近いか確認する。
- 強みである「自社データを取り込み、出典付きで回答する RAG エージェントをマネージドで構築する。」が本当に評価軸になるか確認する。
- 注意点の「サービス単体ではなく、権限、ネットワーク、監視、課金、バックアップを含めて設計する必要がある。」を運用で吸収できるか確認する。
- 公開値や仕様値は、対象プラン・対象機種・対象リージョンまで確認する。
- 既存システム、ID、ネットワーク、監視、バックアップとの接続方法を先に洗い出す。
- 小さく試してから、本番移行、権限設計、障害時手順、コスト監視を決める。