OCI Visionとは？仕組みを図解でわかりやすく解説

解決する課題

画像に何が写っているかを自前のモデル開発なしで判定したい
帳票や看板の文字を画像から抽出して後続処理に渡したい
検品・在庫・コンテンツ管理などで画像処理を自動化したい

主要概念と用語

画像分類（Image Classification）: 画像全体に何が写るかのラベルを付与する
物体検出（Object Detection）: 物体の位置を示す枠（バウンディングボックス）とラベルを返す
文字認識（OCR / ドキュメント解析）: 画像内のテキストや表・キーと値を抽出する
事前学習モデル（Pretrained）: 学習不要ですぐ呼べる汎用モデル
カスタムモデル: 自分の画像でラベル付けして学習させる専用モデル
同期 / 非同期: 単一画像は同期、大量・複数ページは非同期ジョブで処理する

仕様・制限・クォータ

入力は一般的な画像形式（JPEG、PNG など）に対応し、ドキュメント解析ではPDFも扱える
1リクエストあたりの画像サイズ・解像度・ページ数には上限がある（定性的に把握し、最新値は公式で確認）
非同期処理の結果はオブジェクトストレージに出力される
API呼び出し回数や同時実行数にはテナンシ単位のサービス制限がある

内部の仕組み

利用者は画像をAPIに渡すか、オブジェクトストレージ上の画像を指定します。事前学習モデルを使う場合はそのまま推論結果（ラベル、信頼度スコア、バウンディングボックス、抽出テキスト）が返ります。カスタムモデルでは、ラベル付き画像でモデルを学習させ、完成したモデルに対して同じAPI形式で推論します。単一画像は同期呼び出しで即座に応答し、大量画像や複数ページのドキュメントは非同期ジョブとして処理して結果をオブジェクトストレージへ書き出します。

まず事前学習で試す

汎用的な物体・文字なら事前学習モデルで十分なことが多いです。精度が足りない領域だけカスタムモデルを作ると、ラベリングと学習のコストを抑えられます。

横にスクロール

モデルの信頼度をそのまま正解扱いせず、誤検知と見逃しのコストから業務閾値を決める。

設計パターン / ベストプラクティス

イベント駆動: オブジェクトストレージへの画像アップロードをトリガーに関数で推論を起動する
大量処理は非同期: バッチや複数ページは非同期ジョブにまとめてスループットを稼ぐ
信頼度スコアでしきい値判定: 低スコアは人手レビューへ回す二段構えにする
前処理: 解像度・向き・トリミングを整えると検出・OCR精度が安定する

運用・監視

API呼び出しの成否・レイテンシ・スロットリングを監視サービスのメトリクスで追う
操作ログは監査サービスに記録され、誰がいつ推論したかを追跡できる
カスタムモデルは精度を定期的に評価し、データドリフトが見えたら再学習する

コスト

基本は推論した画像・ページ数に応じた従量課金で、機能（分類・検出・OCR）ごとに単価が異なる
カスタムモデルは学習と推論で費用が発生する
事前学習で済むものをカスタム化しない、低解像度で十分なら過剰な高解像度を避ける、といった選別がコストに効く

セキュリティ

アクセス制御はIAMのポリシーで、コンパートメント単位に最小権限で付与する
画像はオブジェクトストレージ側の暗号化・アクセス制御で保護する
個人情報を含む画像は保管・出力先の権限と保持期間を明確にする

Well-Architected の観点

運用上の優秀性: マネージドAPIで画像解析基盤の構築・運用負荷を下げ、イベント駆動で自動化する

試験で問われるポイント

頻出

画像の物体検出・分類・文字認識（OCR）をマネージドで提供＝OCI Vision
事前学習モデルは学習不要で即利用、独自精度が要ればカスタムモデル
大量・複数ページは非同期ジョブで結果をオブジェクトストレージへ出力
AWSでの相当はRekognition（画像・動画解析）

観点	OCI Vision	AWS Rekognition
提供元	Oracle Cloud	AWS
主な機能	物体検出・分類・文字認識	物体検出・分類・顔分析など
カスタムモデル	可能	可能（Custom Labels）
呼び出し	同期と非同期ジョブ	同期と非同期
結果出力	応答とオブジェクトストレージ	応答とS3

ハンズオン / CLI例

# オブジェクトストレージ上の画像に対し、物体検出を実行する例
oci ai-vision analyze-image-object-storage-image-details \
  --compartment-id "ocid1.compartment.oc1..xxxx" \
  --features '[{"featureType":"OBJECT_DETECTION"}]' \
  --image-namespace-name "mytenancy" \
  --image-bucket-name "images" \
  --image-object-name "sample.jpg"

OCI Vision

解決する課題

主要概念と用語

仕様・制限・クォータ

内部の仕組み

設計パターン / ベストプラクティス

運用・監視

コスト

セキュリティ

Well-Architected の観点

試験で問われるポイント

関連サービス・比較

ハンズオン / CLI例

OCI Visionを実務で読む

解決すること

比較で見る軸

導入後に効く点

先に潰すリスク

判断チェックリスト

次に確認する観点