OCI Generative AI Agentsとは？仕組みと使いどころをわかりやすく解説

解決する課題

大規模言語モデル（LLM）は汎用知識は豊富でも、自社固有のドキュメントや業務データを知りません。そのまま使うと、根拠のない回答（ハルシネーション）や、社内ナレッジに基づかない一般論に陥りがちです。OCI Generative AI Agents は、自社データを取り込み、検索結果を根拠にして出典付きで回答するエージェントを、検索基盤や LLM の運用なしに構築できるようにします。

LLM に自社ドキュメントの内容を踏まえて回答させたいが、RAG（検索拡張生成）の基盤を自前で組みたくない
回答の根拠（出典）を提示し、ハルシネーションを抑えて信頼できる応答にしたい
自然言語の問い合わせからデータベースへの SQL を生成・実行して答えさせたい
在庫照会や予約のような**外部処理の呼び出し（関数呼び出し）**をエージェントに任せたい
これらを OCI の IAM・ネットワーク・監査の枠組みの中で安全に運用したい

主要概念と用語

エージェント（Agent）: 1 つ以上のツールを束ね、ユーザーの問いに応じてツールを使い分けて回答する中核の構成単位
ツール（Tool）: エージェントが利用する能力。主に RAG ツール・SQL ツール・関数呼び出しツールがある
RAG ツール: ナレッジベースを検索し、取得した文書を根拠に回答を生成する。検索拡張生成（Retrieval-Augmented Generation）を担う
SQL ツール: 自然言語の質問からスキーマに基づいた SQL を生成し、データベースへ問い合わせて答える
関数呼び出しツール（Function Calling）: 必要に応じて外部の関数・API を呼び出し、その結果を回答に組み込む
ナレッジベース（Knowledge Base）: RAG ツールが検索する知識の集合。データソースを取り込んでベクトル化し、検索可能にしたもの
データソース（Data Source）: ナレッジベースの元データ。Object Storage 上のファイルや、データベースのベクトル検索などを指定する
取り込み（Ingestion）: データソースの文書を読み込み、チャンク化・埋め込み（ベクトル化）してナレッジベースに反映する処理
エンドポイント（Endpoint）: 作成したエージェントへチャットリクエストを送るためのアクセス先
セッション（Session）: 会話の文脈を保持する単位。複数ターンのやり取りで前後の文脈を踏まえる
出典（Citation）: 回答の根拠となった文書箇所への参照。回答とともに返され、検証可能性を高める
ガードレール / コンテンツモデレーション: 入出力の有害・不適切なコンテンツや、根拠外の生成を抑制する仕組み
ADK（Agent Development Kit）: エージェントをコードから構築・運用するための開発キット（Python / Java）
コンパートメント: リソースを論理分離する OCI の枠組み（IAM の単位）

仕様・制限・クォータ

エージェントはツールの組み合わせで構成され、RAG・SQL・関数呼び出しを単独または併用できる
ナレッジベースの裏側には、サービス管理のベクトルストア（Object Storage 由来のデータを取り込む方式）のほか、OCI Search with OpenSearch や Oracle Database のベクトル検索などを選べる
RAG の対象文書は対応するファイル形式・サイズに制約があり、超える場合は分割や前処理が必要
取り込み（ingestion）は非同期ジョブとして実行され、データソースを更新したら再取り込みが必要になる
利用できる基盤モデルやリージョンは提供状況に依存するため、対象リージョンで確認する
エージェント数・ナレッジベース数・データソースのサイズなどに**サービス制限（クォータ）**があり、引き上げ申請が可能
具体的なファイルサイズ上限・件数・対応形式・モデルの提供範囲は変動し得るため、最新の公式ドキュメントで確認する

内部の仕組み

OCI Generative AI Agents は、LLM とツール群、検索基盤を Oracle がマネージドに束ねたサービスです。ユーザーの問い合わせはエージェントに渡り、エージェントは利用可能なツールの中から適切なものを選んで実行し、その結果を踏まえて回答を生成します。

RAG ツールでは、まずデータソースを取り込み（ingestion）でチャンク化・ベクトル化してナレッジベースに格納する。問い合わせ時はクエリをベクトル化して類似文書を検索し、取得した文書をプロンプトに添えて LLM が出典付きの回答を生成する
SQL ツールでは、対象データベースのスキーマ情報をもとに自然言語からクエリを生成し、実行結果を回答に反映する
関数呼び出しツールでは、エージェントがどの関数をどの引数で呼ぶべきかを判断し、呼び出し結果を会話に組み込む
セッションが会話の文脈を保持し、複数ターンにわたって一貫した応答を可能にする
完成したエージェントはエンドポイントとして公開され、クライアント API やチャットからアクセスする

RAG とファインチューニングの違い

自社ドキュメントに基づく回答が目的なら、まず本サービスの RAG（取り込み＋検索）を検討してください。文書の追加・更新は再取り込みで反映でき、出典も提示できます。口調や形式を恒常的に作り込みたい場合のみ、別途ファインチューニングを併用します。

設計パターン / ベストプラクティス

文書は意味の区切りでチャンク化し、見出しやメタデータを保持すると検索精度と出典の妥当性が上がる
データソースを更新したら再取り込み（ingestion）を自動化し、ナレッジベースの鮮度を保つ
回答には出典（citation）を必ず提示させ、根拠を確認できる UI にしてハルシネーションを抑える
RAG・SQL・関数呼び出しは役割を明確に分けてツールを設計し、エージェントが選択を誤らないよう指示を具体化する
SQL ツールは読み取り専用の最小権限ユーザーで接続し、参照範囲を限定する
基盤モデルは設定値として切り替え可能にし、モデルの世代交代に追従できるようにする
入出力にガードレール / コンテンツモデレーションを組み込み、機微情報の漏えいや有害生成を抑える

運用・監視

OCI Monitoring で問い合わせ数・レイテンシ・エラー率を監視し、取り込みジョブの成否を追跡する
取り込み（ingestion）やエージェント・ナレッジベースの作成削除は**非同期ジョブ（Work Request）**として進捗を確認できる
エージェントやデータソースの操作は OCI Audit に記録され、誰がいつ何を変更したかを追跡できる
データソース更新時の再取り込み漏れは古い回答の原因になるため、更新と取り込みを連動させる
スロットリングが出たらバックオフ付きリトライを入れ、恒常的に超える場合はクォータ引き上げを検討する
回答品質は出典の妥当性や評価セットで定期的に確認し、チャンク戦略やプロンプトを改善する

コスト

課金は、エージェントの推論（LLM の利用）と、ナレッジベースの取り込み・検索基盤の利用が主な要素です。取り込み時のベクトル化や、検索を支える OpenSearch / データベースなどの基盤リソースにも費用が発生します。具体的な単価はモデル・リージョン・時期で変動するため、公式の価格表で確認してください。

コスト要素	課金の考え方	最適化のポイント
エージェント推論	問い合わせごとの LLM 利用（トークン量など）	プロンプトと取得文書量を絞り出力上限を設定する
取り込み（ingestion）	ベクトル化する文書量・更新頻度	差分のみ再取り込みし不要文書を除く
検索基盤	ベクトルストアや OpenSearch 等の基盤リソース	適切なサイズで構成し不要リソースは削除する
関連サービス	Object Storage やデータベースの利用料	保管データを整理しアクセスを限定する

セキュリティ

アクセス制御は OCI IAM ポリシーで行い、コンパートメント単位にエージェント・ナレッジベース・データソースの権限を最小化する
アプリからの認証は、ハードコードした鍵ではなくインスタンスプリンシパル / リソースプリンシパルを使い、鍵の配布・ローテーションを不要にする
RAG の元データを置く Object Storage は暗号化し、バケットとアクセスを限定する。SQL ツールのデータベース接続は読み取り専用の最小権限にする
通信は TLS で保護される。プライベート接続が必要な場合はサービスゲートウェイやプライベートエンドポイントで OCI バックボーン内から到達させる
入出力にガードレール / コンテンツモデレーションを適用し、機微情報の漏えいや有害生成を抑える。プロンプトに秘密情報を不用意に含めない
操作は OCI Audit に記録され、コンプライアンス上の追跡が可能

アンチパターン

SQL ツールを強い権限のデータベースユーザーで接続するのは危険です。生成された SQL が想定外の更新や参照を行うリスクがあるため、必ず読み取り専用の最小権限ユーザーに限定してください。また、資格情報をアプリやインスタンスにハードコードせず、インスタンス/リソースプリンシパルを使ってください。

観点	OCI Generative AI Agents	Amazon Bedrock Agents/KB
位置づけ	OCI のマネージド RAG エージェント基盤	AWS のマネージド RAG エージェント基盤
RAG	ナレッジベース（取り込み＋検索）	Knowledge Bases for Bedrock
データソース	Object Storage / OpenSearch / DB ベクトル検索	S3 等＋ベクトルストア
ツール	RAG / SQL / 関数呼び出し	アクショングループ（関数）/ ナレッジベース
出典	回答に出典を提示	回答に出典を提示
権限制御	OCI IAM + インスタンス/リソースプリンシパル	IAM ロール/ポリシー
監査	OCI Audit	AWS CloudTrail

ハンズオン / CLI例

# ナレッジベースを作成する（Object Storage 由来のデータソースを後で紐付ける想定）
# 詳細なデータソース構成は JSON で指定する。実値は環境に合わせて置き換える
oci generative-ai-agent knowledge-base create \
  --compartment-id "$COMPARTMENT_OCID" \
  --display-name "docs-kb" \
  --wait-for-state ACTIVE

# エージェントを作成する（作成後にツールやエンドポイントを構成する）
oci generative-ai-agent agent create \
  --compartment-id "$COMPARTMENT_OCID" \
  --display-name "support-agent" \
  --wait-for-state ACTIVE

# 作成済みのエージェント一覧を確認する
oci generative-ai-agent agent list \
  --compartment-id "$COMPARTMENT_OCID"

OCI Generative AI Agents

解決する課題

主要概念と用語

仕様・制限・クォータ

内部の仕組み

設計パターン / ベストプラクティス

運用・監視

コスト

セキュリティ

関連サービス・比較

ハンズオン / CLI例

OCI Generative AI Agentsを実務で読む

解決すること

比較で見る軸

導入後に効く点

先に潰すリスク

判断チェックリスト

次に確認する観点