OCI GPU Compute (Bare Metal/VM)とは？仕組みと使いどころをわかりやすく解説

解決する課題

大規模言語モデルの学習・ファインチューニングに必要な GPU を確保したい
推論・画像生成・**HPC（数値計算・シミュレーション）**を高速化したい
単一ノードに収まらないモデルを、複数 GPU ノードへ分散して学習したい
ノード間の通信がボトルネックにならない低遅延・高帯域ネットワークが欲しい

主要概念と用語

GPU シェイプ: GPU を搭載したシェイプ。BM.GPU 系（ベアメタル、複数 GPU 専有）と VM.GPU 系（VM、少数 GPU）があり、世代ごとに NVIDIA の GPU が載る
ベアメタル / VM: ベアメタルは仮想化レイヤーなしでホストを専有し全 GPU を使える。VM は GPU をより小さい単位で使える
クラスタネットワーク: 複数の GPU ノードを RDMA（RoCE） で接続し、低遅延・高帯域でノード間通信を行う専用ネットワーク
GPU メモリ（VRAM）: GPU 上のメモリ。モデルとバッチが収まるかを左右する最重要リソース
NVLink / NVSwitch: ノード内 GPU 同士を高速接続する NVIDIA の技術。ベアメタルの多 GPU シェイプで活きる
GPU ドライバ / CUDA: GPU を使うためのドライバとランタイム。GPU 対応イメージや Marketplace イメージに同梱される場合がある

仕様・制限・クォータ

GPU シェイプは世代・GPU 種別ごとに搭載数や GPU メモリが異なる。提供有無はリージョンと可用性ドメインに依存し、全リージョンにあるわけではない
GPU 容量は需要が高く、サービスリミット（クォータ）の引き上げ申請や容量予約が前提になることが多い
ベアメタル GPU は停止中もコンピューティング課金が続く点に注意（多くの GPU/ベアメタルは停止で課金が止まらない）。ブート/ブロックボリュームは別途課金
マルチノード学習にはクラスタネットワーク対応のシェイプが必要。RDMA を使うには対応シェイプ・イメージ・配置の条件を満たす
OCPU/メモリの考え方は通常の Compute と共通だが、GPU 数は固定の組み合わせで提供されることが多い

内部の仕組み

OCI の GPU はベアメタルでは仮想化レイヤーなしにホストの全 GPU を専有でき、NVLink/NVSwitch によってノード内 GPU 間を高速に接続します。複数ノードをまたぐ大規模学習では、クラスタネットワークが鍵になります。

クラスタネットワークは RDMA over Converged Ethernet（RoCE） を用い、CPU を介さずに GPU/メモリ間でデータを転送して低遅延・高帯域を実現する
ノードは近接配置され、集団通信（all-reduce など）の遅延を抑える
ローカル NVMe を持つシェイプはホスト直結で高速だが揮発性。永続化はブロックボリューム/Object Storage へ

単一ノードか、マルチノードか

モデルとバッチが 1 ノードの GPU メモリに収まるなら、まず単一ノードで始めるのが簡単です。収まらない、または学習を高速化したい場合に、クラスタネットワーク対応シェイプでマルチノードへ広げます。

設計パターン / ベストプラクティス

まず VM の小さい GPU で検証し、本番の大規模学習でベアメタル/クラスタネットワークへ拡張
分散学習はクラスタネットワーク対応シェイプを選び、近接配置で集団通信の遅延を抑える
データセットや成果物は Object Storage に置き、ノードはステートレスに保って再作成しやすくする
GPU ドライバ/CUDA の整合を取るため、GPU 対応イメージや Marketplace の HPC/ML イメージを起点にする
高価な GPU を遊ばせないよう、ジョブ単位で起動・終了し、利用状況を監視して稼働率を上げる

運用・監視

OCI Monitoring でインスタンスのメトリクス、Logging でログを収集
GPU 使用率・GPU メモリ・温度は nvidia-smi や NVIDIA のエクスポータで取得し、稼働率とボトルネックを把握
クラスタネットワーク利用時はノード間帯域・遅延と集団通信の効率を確認
起動トラブルはインスタンスコンソール接続 / シリアルコンソールで調査。GPU が見えない場合はドライバとイメージの整合を確認

コスト

GPU は単価が高いため、稼働率と中断許容性の設計がコストを大きく左右します。

購入オプション	特徴	向いている用途
従量（PAYG）	定価で即時利用	短期・検証・単発ジョブ
年間ユニバーサルクレジット	コミットで割引	定常的な学習・推論
容量予約	GPU 枠を事前確保	確実に確保したい大規模学習
プリエンプティブル	割安だが中断あり	チェックポイント前提のバッチ

停止しても課金が止まらないことがある

多くの GPU/ベアメタルシェイプは停止中もコンピューティング課金が続きます。使い終えたら停止ではなく終了（削除）するか、必要なときだけ起動する運用にしてコストを抑えます。

セキュリティ

インスタンスプリンシパルで資格情報のハードコードを回避し、Object Storage などへ安全にアクセス
プライベートサブネット + セキュリティリスト / NSG で公開範囲を最小化し、必要なら Bastion 経由で接続
ブート/ブロックボリュームは既定で暗号化、鍵は OCI Vault で管理
モデルや学習データは機微情報になり得るため、コンパートメントと IAM ポリシーで分離・最小権限を徹底

観点	OCI GPU Compute	OCI Compute（CPU）
主な用途	学習・推論・HPC	汎用 IaaS・Web・DB
アクセラレータ	NVIDIA GPU	なし（CPU のみ）
ノード間接続	RDMA クラスタネットワーク	通常の VCN
停止時課金	止まらないことが多い	標準 VM は停止で止まる
AWS 相当	P / G 系インスタンス	EC2 汎用インスタンス

ハンズオン / CLI例

# GPU 対応シェイプの一覧を確認（コンパートメント内で利用可能なシェイプ）
oci compute shape list \
  --compartment-id ocid1.compartment.oc1..aaaa \
  --query "data[?contains(shape, 'GPU')].{Shape:shape, GPUs:gpus, GPUMemGB:\"gpu-description\"}" \
  --output table

# VM の GPU シェイプでインスタンスを起動（要: 適切な GPU 対応イメージ OCID）
oci compute instance launch \
  --availability-domain "xxxx:AP-TOKYO-1-AD-1" \
  --compartment-id ocid1.compartment.oc1..aaaa \
  --shape "VM.GPU.A10.1" \
  --image-id ocid1.image.oc1..bbbb \
  --subnet-id ocid1.subnet.oc1..cccc \
  --display-name gpu-train

# 起動後、SSH 接続して GPU が見えているか確認
# nvidia-smi

OCI GPU Compute (Bare Metal/VM)

解決する課題

主要概念と用語

仕様・制限・クォータ

内部の仕組み

設計パターン / ベストプラクティス

運用・監視

コスト

セキュリティ

関連サービス・比較

ハンズオン / CLI例

OCI GPU Compute (Bare Metal/VM)を実務で読む

解決すること

比較で見る軸

導入後に効く点

先に潰すリスク

判断チェックリスト

次に確認する観点