TL

Cloud Service

OCI Vision

画像の物体検出・分類・文字認識をAPI一本で提供するマネージドな画像解析サービス。学習不要ですぐ使える。

基礎運用上の優秀性
最終更新: 2026-06-14公式ドキュメント ↗
TL;DR要点だけ先に
  • 1.画像から物体検出・分類・文字抽出(OCR)をAPIで取得できる。
  • 2.事前学習モデルは即利用、独自データでカスタムモデルも作れる。
  • 3.AWSのRekognitionに相当する位置づけのサービス。

解決する課題

  • 画像に何が写っているかを自前のモデル開発なしで判定したい
  • 帳票や看板の文字を画像から抽出して後続処理に渡したい
  • 検品・在庫・コンテンツ管理などで画像処理を自動化したい

主要概念と用語

  • 画像分類(Image Classification): 画像全体に何が写るかのラベルを付与する
  • 物体検出(Object Detection): 物体の位置を示す枠(バウンディングボックス)とラベルを返す
  • 文字認識(OCR / ドキュメント解析): 画像内のテキストや表・キーと値を抽出する
  • 事前学習モデル(Pretrained): 学習不要ですぐ呼べる汎用モデル
  • カスタムモデル: 自分の画像でラベル付けして学習させる専用モデル
  • 同期 / 非同期: 単一画像は同期、大量・複数ページは非同期ジョブで処理する

仕様・制限・クォータ

  • 入力は一般的な画像形式(JPEG、PNG など)に対応し、ドキュメント解析ではPDFも扱える
  • 1リクエストあたりの画像サイズ・解像度・ページ数には上限がある(定性的に把握し、最新値は公式で確認)
  • 非同期処理の結果はオブジェクトストレージに出力される
  • API呼び出し回数や同時実行数にはテナンシ単位のサービス制限がある

内部の仕組み

利用者は画像をAPIに渡すか、オブジェクトストレージ上の画像を指定します。事前学習モデルを使う場合はそのまま推論結果(ラベル、信頼度スコア、バウンディングボックス、抽出テキスト)が返ります。カスタムモデルでは、ラベル付き画像でモデルを学習させ、完成したモデルに対して同じAPI形式で推論します。単一画像は同期呼び出しで即座に応答し、大量画像や複数ページのドキュメントは非同期ジョブとして処理して結果をオブジェクトストレージへ書き出します。

まず事前学習で試す

汎用的な物体・文字なら事前学習モデルで十分なことが多いです。精度が足りない領域だけカスタムモデルを作ると、ラベリングと学習のコストを抑えられます。

設計パターン / ベストプラクティス

  • イベント駆動: オブジェクトストレージへの画像アップロードをトリガに関数で推論を起動する
  • 大量処理は非同期: バッチや複数ページは非同期ジョブにまとめてスループットを稼ぐ
  • 信頼度スコアでしきい値判定: 低スコアは人手レビューへ回す二段構えにする
  • 前処理: 解像度・向き・トリミングを整えると検出・OCR精度が安定する

運用・監視

  • API呼び出しの成否・レイテンシ・スロットリングを監視サービスのメトリクスで追う
  • 操作ログは監査サービスに記録され、誰がいつ推論したかを追跡できる
  • カスタムモデルは精度を定期的に評価し、データドリフトが見えたら再学習する

コスト

  • 基本は推論した画像・ページ数に応じた従量課金で、機能(分類・検出・OCR)ごとに単価が異なる
  • カスタムモデルは学習と推論で費用が発生する
  • 事前学習で済むものをカスタム化しない、低解像度で十分なら過剰な高解像度を避ける、といった選別がコストに効く

セキュリティ

  • アクセス制御はIAMのポリシーで、コンパートメント単位に最小権限で付与する
  • 画像はオブジェクトストレージ側の暗号化・アクセス制御で保護する
  • 個人情報を含む画像は保管・出力先の権限と保持期間を明確にする

Well-Architected の観点

  • 運用上の優秀性: マネージドAPIで画像解析基盤の構築・運用負荷を下げ、イベント駆動で自動化する

試験で問われるポイント

頻出
  • 画像の物体検出・分類・文字認識(OCR)をマネージドで提供=OCI Vision
  • 事前学習モデルは学習不要で即利用、独自精度が要ればカスタムモデル
  • 大量・複数ページは非同期ジョブで結果をオブジェクトストレージへ出力
  • AWSでの相当はRekognition(画像・動画解析)

関連サービス・比較

観点OCI VisionAWS Rekognition
提供元Oracle CloudAWS
主な機能物体検出・分類・文字認識物体検出・分類・顔分析など
カスタムモデル可能可能(Custom Labels)
呼び出し同期と非同期ジョブ同期と非同期
結果出力応答とオブジェクトストレージ応答とS3

ハンズオン / CLI例

# オブジェクトストレージ上の画像に対し、物体検出を実行する例
oci ai-vision detect-image-objects \
  --compartment-id "ocid1.compartment.oc1..xxxx" \
  --image '{"source":"OBJECT_STORAGE","namespaceName":"mytenancy","bucketName":"images","objectName":"sample.jpg"}'

OCI Service

OCI Visionを実務で読む

TL;DRは入口です。実際に選ぶ・使う段階では、何を解決するか、何と比較するか、導入後にどこで詰まるかまで見る必要があります。

解決すること

AI / 機械学習

比較で見る軸

クラウド: OCI / カテゴリ: AI / 機械学習 / 難易度: basic

導入後に効く点

事前学習モデルは即利用、独自データでカスタムモデルも作れる。

先に潰すリスク

サービス単体ではなく、権限、ネットワーク、監視、課金、バックアップを含めて設計する必要がある。

数字・仕様の読み方
クラウド
OCI
カテゴリ
AI / 機械学習
難易度
basic
関連資格
設計柱
operational

判断チェックリスト

  • 自社の用途が「AI / 機械学習 / operational」に近いか確認する。
  • 強みである「画像から物体検出・分類・文字抽出(OCR)をAPIで取得できる。」が本当に評価軸になるか確認する。
  • 注意点の「サービス単体ではなく、権限、ネットワーク、監視、課金、バックアップを含めて設計する必要がある。」を運用で吸収できるか確認する。
  • 公開値や仕様値は、対象プラン・対象機種・対象リージョンまで確認する。
  • 既存システム、ID、ネットワーク、監視、バックアップとの接続方法を先に洗い出す。
  • 小さく試してから、本番移行、権限設計、障害時手順、コスト監視を決める。

次に確認する観点

AI / 機械学習operational