TL

Cloud Service

OCI Generative AI Agents

自社データに根拠を持つ RAG エージェントを運用なしで構築できる。ナレッジベース・SQL・関数呼び出しのツールを組み合わせ、出典付きで回答する OCI のマネージドエージェント基盤。AWS の Bedrock Agents/Knowledge Bases に相当。

中級運用上の優秀性セキュリティ信頼性
最終更新: 2026-06-28公式ドキュメント ↗
TL;DR要点だけ先に
  • 1.自社データを取り込み、出典付きで回答する RAG エージェントをマネージドで構築する。
  • 2.ナレッジベース(RAG)・SQL・関数呼び出しのツールをエージェントに組み合わせられる。
  • 3.Amazon Bedrock のエージェント/ナレッジベースに相当する位置づけ。

解決する課題

大規模言語モデル(LLM)は汎用知識は豊富でも、自社固有のドキュメントや業務データを知りません。そのまま使うと、根拠のない回答(ハルシネーション)や、社内ナレッジに基づかない一般論に陥りがちです。OCI Generative AI Agents は、自社データを取り込み、検索結果を根拠にして出典付きで回答するエージェントを、検索基盤や LLM の運用なしに構築できるようにします。

  • LLM に自社ドキュメントの内容を踏まえて回答させたいが、RAG(検索拡張生成)の基盤を自前で組みたくない
  • 回答の根拠(出典)を提示し、ハルシネーションを抑えて信頼できる応答にしたい
  • 自然言語の問い合わせからデータベースへの SQL を生成・実行して答えさせたい
  • 在庫照会や予約のような**外部処理の呼び出し(関数呼び出し)**をエージェントに任せたい
  • これらを OCI の IAM・ネットワーク・監査の枠組みの中で安全に運用したい

主要概念と用語

  • エージェント(Agent): 1 つ以上のツールを束ね、ユーザーの問いに応じてツールを使い分けて回答する中核の構成単位
  • ツール(Tool): エージェントが利用する能力。主に RAG ツール・SQL ツール・関数呼び出しツールがある
  • RAG ツール: ナレッジベースを検索し、取得した文書を根拠に回答を生成する。検索拡張生成(Retrieval-Augmented Generation)を担う
  • SQL ツール: 自然言語の質問からスキーマに基づいた SQL を生成し、データベースへ問い合わせて答える
  • 関数呼び出しツール(Function Calling): 必要に応じて外部の関数・API を呼び出し、その結果を回答に組み込む
  • ナレッジベース(Knowledge Base): RAG ツールが検索する知識の集合。データソースを取り込んでベクトル化し、検索可能にしたもの
  • データソース(Data Source): ナレッジベースの元データ。Object Storage 上のファイルや、データベースのベクトル検索などを指定する
  • 取り込み(Ingestion): データソースの文書を読み込み、チャンク化・埋め込み(ベクトル化)してナレッジベースに反映する処理
  • エンドポイント(Endpoint): 作成したエージェントへチャットリクエストを送るためのアクセス先
  • セッション(Session): 会話の文脈を保持する単位。複数ターンのやり取りで前後の文脈を踏まえる
  • 出典(Citation): 回答の根拠となった文書箇所への参照。回答とともに返され、検証可能性を高める
  • ガードレール / コンテンツモデレーション: 入出力の有害・不適切なコンテンツや、根拠外の生成を抑制する仕組み
  • ADK(Agent Development Kit): エージェントをコードから構築・運用するための開発キット(Python / Java)
  • コンパートメント: リソースを論理分離する OCI の枠組み(IAM の単位)

仕様・制限・クォータ

  • エージェントはツールの組み合わせで構成され、RAG・SQL・関数呼び出しを単独または併用できる
  • ナレッジベースの裏側には、サービス管理のベクトルストア(Object Storage 由来のデータを取り込む方式)のほか、OCI Search with OpenSearchOracle Database のベクトル検索などを選べる
  • RAG の対象文書は対応するファイル形式・サイズに制約があり、超える場合は分割や前処理が必要
  • 取り込み(ingestion)は非同期ジョブとして実行され、データソースを更新したら再取り込みが必要になる
  • 利用できる基盤モデルやリージョンは提供状況に依存するため、対象リージョンで確認する
  • エージェント数・ナレッジベース数・データソースのサイズなどに**サービス制限(クォータ)**があり、引き上げ申請が可能
  • 具体的なファイルサイズ上限・件数・対応形式・モデルの提供範囲は変動し得るため、最新の公式ドキュメントで確認する

内部の仕組み

OCI Generative AI Agents は、LLM とツール群、検索基盤を Oracle がマネージドに束ねたサービスです。ユーザーの問い合わせはエージェントに渡り、エージェントは利用可能なツールの中から適切なものを選んで実行し、その結果を踏まえて回答を生成します。

  • RAG ツールでは、まずデータソースを取り込み(ingestion)でチャンク化・ベクトル化してナレッジベースに格納する。問い合わせ時はクエリをベクトル化して類似文書を検索し、取得した文書をプロンプトに添えて LLM が出典付きの回答を生成する
  • SQL ツールでは、対象データベースのスキーマ情報をもとに自然言語からクエリを生成し、実行結果を回答に反映する
  • 関数呼び出しツールでは、エージェントがどの関数をどの引数で呼ぶべきかを判断し、呼び出し結果を会話に組み込む
  • セッションが会話の文脈を保持し、複数ターンにわたって一貫した応答を可能にする
  • 完成したエージェントはエンドポイントとして公開され、クライアント API やチャットからアクセスする
RAG とファインチューニングの違い

自社ドキュメントに基づく回答が目的なら、まず本サービスの RAG(取り込み+検索)を検討してください。文書の追加・更新は再取り込みで反映でき、出典も提示できます。口調や形式を恒常的に作り込みたい場合のみ、別途ファインチューニングを併用します。

設計パターン / ベストプラクティス

  • 文書は意味の区切りでチャンク化し、見出しやメタデータを保持すると検索精度と出典の妥当性が上がる
  • データソースを更新したら再取り込み(ingestion)を自動化し、ナレッジベースの鮮度を保つ
  • 回答には出典(citation)を必ず提示させ、根拠を確認できる UI にしてハルシネーションを抑える
  • RAG・SQL・関数呼び出しは役割を明確に分けてツールを設計し、エージェントが選択を誤らないよう指示を具体化する
  • SQL ツールは読み取り専用の最小権限ユーザーで接続し、参照範囲を限定する
  • 基盤モデルは設定値として切り替え可能にし、モデルの世代交代に追従できるようにする
  • 入出力にガードレール / コンテンツモデレーションを組み込み、機微情報の漏えいや有害生成を抑える

運用・監視

  • OCI Monitoring で問い合わせ数・レイテンシ・エラー率を監視し、取り込みジョブの成否を追跡する
  • 取り込み(ingestion)やエージェント・ナレッジベースの作成削除は**非同期ジョブ(Work Request)**として進捗を確認できる
  • エージェントやデータソースの操作は OCI Audit に記録され、誰がいつ何を変更したかを追跡できる
  • データソース更新時の再取り込み漏れは古い回答の原因になるため、更新と取り込みを連動させる
  • スロットリングが出たらバックオフ付きリトライを入れ、恒常的に超える場合はクォータ引き上げを検討する
  • 回答品質は出典の妥当性や評価セットで定期的に確認し、チャンク戦略やプロンプトを改善する

コスト

課金は、エージェントの推論(LLM の利用)と、ナレッジベースの取り込み・検索基盤の利用が主な要素です。取り込み時のベクトル化や、検索を支える OpenSearch / データベースなどの基盤リソースにも費用が発生します。具体的な単価はモデル・リージョン・時期で変動するため、公式の価格表で確認してください。

コスト要素課金の考え方最適化のポイント
エージェント推論問い合わせごとの LLM 利用(トークン量など)プロンプトと取得文書量を絞り出力上限を設定する
取り込み(ingestion)ベクトル化する文書量・更新頻度差分のみ再取り込みし不要文書を除く
検索基盤ベクトルストアや OpenSearch 等の基盤リソース適切なサイズで構成し不要リソースは削除する
関連サービスObject Storage やデータベースの利用料保管データを整理しアクセスを限定する

セキュリティ

  • アクセス制御は OCI IAM ポリシーで行い、コンパートメント単位にエージェント・ナレッジベース・データソースの権限を最小化する
  • アプリからの認証は、ハードコードした鍵ではなくインスタンスプリンシパル / リソースプリンシパルを使い、鍵の配布・ローテーションを不要にする
  • RAG の元データを置く Object Storage は暗号化し、バケットとアクセスを限定する。SQL ツールのデータベース接続は読み取り専用の最小権限にする
  • 通信は TLS で保護される。プライベート接続が必要な場合はサービスゲートウェイやプライベートエンドポイントで OCI バックボーン内から到達させる
  • 入出力にガードレール / コンテンツモデレーションを適用し、機微情報の漏えいや有害生成を抑える。プロンプトに秘密情報を不用意に含めない
  • 操作は OCI Audit に記録され、コンプライアンス上の追跡が可能
アンチパターン

SQL ツールを強い権限のデータベースユーザーで接続するのは危険です。生成された SQL が想定外の更新や参照を行うリスクがあるため、必ず読み取り専用の最小権限ユーザーに限定してください。また、資格情報をアプリやインスタンスにハードコードせず、インスタンス/リソースプリンシパルを使ってください。

関連サービス・比較

OCI Generative AI Agents は、基盤モデル API を提供する OCI Generative AI の上に、ツールと検索基盤を束ねたエージェント層です。単にモデルを呼ぶだけなら Generative AI、自社データに根拠を持たせたエージェントが要るなら本サービス、という使い分けになります。AWS では Bedrock のエージェント/ナレッジベースに相当します。

観点OCI Generative AI AgentsAmazon Bedrock Agents/KB
位置づけOCI のマネージド RAG エージェント基盤AWS のマネージド RAG エージェント基盤
RAGナレッジベース(取り込み+検索)Knowledge Bases for Bedrock
データソースObject Storage / OpenSearch / DB ベクトル検索S3 等+ベクトルストア
ツールRAG / SQL / 関数呼び出しアクショングループ(関数)/ ナレッジベース
出典回答に出典を提示回答に出典を提示
権限制御OCI IAM + インスタンス/リソースプリンシパルIAM ロール/ポリシー
監査OCI AuditAWS CloudTrail

ハンズオン / CLI例

# ナレッジベースを作成する(Object Storage 由来のデータソースを後で紐付ける想定)
# 詳細なデータソース構成は JSON で指定する。実値は環境に合わせて置き換える
oci generative-ai-agent knowledge-base create \
  --compartment-id "$COMPARTMENT_OCID" \
  --display-name "docs-kb" \
  --wait-for-state ACTIVE

# エージェントを作成する(作成後にツールやエンドポイントを構成する)
oci generative-ai-agent agent create \
  --compartment-id "$COMPARTMENT_OCID" \
  --display-name "support-agent" \
  --wait-for-state ACTIVE

# 作成済みのエージェント一覧を確認する
oci generative-ai-agent agent list \
  --compartment-id "$COMPARTMENT_OCID"

OCI Service

OCI Generative AI Agentsを実務で読む

TL;DRは入口です。実際に選ぶ・使う段階では、何を解決するか、何と比較するか、導入後にどこで詰まるかまで見る必要があります。

解決すること

AI / 機械学習

比較で見る軸

クラウド: OCI / カテゴリ: AI / 機械学習 / 難易度: intermediate

導入後に効く点

ナレッジベース(RAG)・SQL・関数呼び出しのツールをエージェントに組み合わせられる。

先に潰すリスク

サービス単体ではなく、権限、ネットワーク、監視、課金、バックアップを含めて設計する必要がある。

数字・仕様の読み方
クラウド
OCI
カテゴリ
AI / 機械学習
難易度
intermediate
関連資格
設計柱
operational / security / reliability

判断チェックリスト

  • 自社の用途が「AI / 機械学習 / operational」に近いか確認する。
  • 強みである「自社データを取り込み、出典付きで回答する RAG エージェントをマネージドで構築する。」が本当に評価軸になるか確認する。
  • 注意点の「サービス単体ではなく、権限、ネットワーク、監視、課金、バックアップを含めて設計する必要がある。」を運用で吸収できるか確認する。
  • 公開値や仕様値は、対象プラン・対象機種・対象リージョンまで確認する。
  • 既存システム、ID、ネットワーク、監視、バックアップとの接続方法を先に洗い出す。
  • 小さく試してから、本番移行、権限設計、障害時手順、コスト監視を決める。

次に確認する観点

AI / 機械学習operationalsecurityreliability