Cloud Service
Azure Managed Lustre
HPC や AI 学習の大規模並列 I/O に応える。Azure Managed Lustre は Lustre 並列ファイルシステムをフルマネージドで提供し、Blob との連携で高スループットを実現。AWS の FSx for Lustre 相当。
- 1.Lustre 並列ファイルシステムをフルマネージドで提供する高スループットストレージ。
- 2.Blob Storage と連携し、データの取り込みと書き戻しを自動化できる。
- 3.AWS FSx for Lustre 相当。HPC や AI/ML 学習の大規模 I/O に最適。
解決する課題
数百〜数千の計算ノードから巨大データへ同時に読み書きする HPC や AI/ML 学習では、汎用の共有ファイルやオブジェクトストレージだけではスループットが足りません。Azure Managed Lustre は、HPC で広く使われる Lustre 並列ファイルシステムをマネージドで提供し、クラスタ構築・運用なしに高い集約スループットを得られるようにします。
- HPC シミュレーションや解析パイプラインで、多数のノードから単一の名前空間へ並列 I/O したい
- AI/ML の学習で、大量の学習データを高スループットでフィードし GPU を遊ばせたくない
- オンプレの Lustre クラスタをクラウドへ移行し、運用負荷を下げたい
- Blob Storage 上のデータセットを高速ファイルシステムとして展開し、ジョブ後に結果を書き戻したい
主要概念と用語
- Lustre: 多数のクライアントから単一の名前空間へ並列アクセスできるオープンソースの並列ファイルシステム。HPC で広く使われる
- 並列ファイルシステム: データを複数のサーバーへ分散配置し、クライアントが並列に I/O することで集約スループットを稼ぐ方式
- MDS / MDT(メタデータ): ファイル名やディレクトリ構造などのメタデータを扱うサーバーとそのターゲット
- OSS / OST(オブジェクトストレージ): 実データを格納するサーバーとそのターゲット。台数に応じてスループット上限が伸びる
- HSM 連携 / Blob 統合: Azure Blob Storage をアーカイブ層とみなし、ファイルシステムへの取り込み(ハイドレーション)と書き戻しを行う仕組み
- インポート / エクスポート: Blob のデータをファイルシステムへ取り込む処理と、ファイルシステムの変更を Blob へ書き戻す処理
- クライアント(lustre client): 計算ノード側に入れる Lustre クライアント。VNet 経由でファイルシステムをマウントする
仕様・制限・クォータ
- ファイルシステムは POSIX 互換で、Lustre クライアント経由で多数のノードからマウントする
- スループットは 容量とパフォーマンス階層に連動し、容量を増やすほど集約スループット上限が伸びる傾向にある
- ファイルシステムは VNet 内の専用サブネットに配置し、クライアントは同一 VNet からプライベートに接続する
- Azure Blob Storage との連携により、データの取り込み(インポート)と書き戻し(エクスポート)を自動化できる
- 提供されるパフォーマンス階層は要件に応じて選択し、容量あたりのスループット単価が階層で変わる
- 対応リージョン・容量の最小単位・上限値・クォータはサービス更新で変わるため、最新の公式ドキュメントで確認する
Lustre の集約スループットは OST(データサーバー)の台数や確保容量に応じて伸びます。容量に余裕があっても性能が頭打ちな場合、確保容量を増やすかパフォーマンス階層を上げる必要があります。性能要件から逆算して容量を見積もってください。
内部の仕組み
Azure Managed Lustre は、メタデータを扱う MDS / MDT と実データを扱う OSS / OST から成る Lustre のアーキテクチャを、マイクロソフトがマネージドで構築・運用します。利用者はサーバー個別を意識せず、容量とパフォーマンス階層を指定するだけでクラスタが用意されます。
- クライアント(計算ノード)は VNet 内の専用サブネット経由でファイルシステムをマウントし、単一の名前空間として読み書きする
- 実データは複数の OST に分散ストライプされ、多数のクライアントから並列に I/O することで集約スループットを稼ぐ
- メタデータ操作は MDT が処理し、データ I/O とは別経路で扱われる
- Blob Storage との連携では、ジョブ開始時に必要なデータをファイルシステムへ取り込み(ハイドレーション)、ジョブ完了後に結果を Blob へ書き戻すことで、長期保管は安価な Blob、計算時は高速 Lustre という役割分担ができる
データの長期保管は Blob、ジョブ実行時だけ Managed Lustre へ取り込むパターンが基本です。必要なときにファイルシステムを立て、終わったら結果を書き戻して破棄すれば、高速層を常時確保するコストを抑えられます。
設計パターン / ベストプラクティス
- HPC スクラッチ領域: シミュレーションの中間データや並列出力先として Lustre を使い、最終結果だけを Blob へエクスポートする
- AI/ML 学習のデータフィード: 学習データセットを Blob からインポートし、多数の GPU ノードへ高スループットで供給する
- ジョブ単位のライフサイクル: 必要なときだけファイルシステムを作成し、終了後に結果を書き戻して削除する使い捨て運用でコストを最適化する
- 容量を性能から逆算: スループット要件を満たす容量・パフォーマンス階層を先に見積もり、I/O ボトルネックを避ける
- ストライプ設計を意識: 大きなファイルは複数 OST にまたがるよう配置し、並列 I/O の効果を引き出す
- 専用サブネットを最初に確保: VNet 設計時に Managed Lustre 用のサブネットと IP レンジを確保しておく
運用・監視
- Azure Monitor のメトリクスで、スループット・IOPS・容量使用率などを監視し、性能上限への接近を検知する
- 性能が頭打ちなら、容量の増加やパフォーマンス階層の引き上げで対処する。容量と性能が連動する点に注意する
- 容量使用率にアラートを設定し、ファイルシステムの空き枯渇でジョブが失敗する事態を防ぐ
- Blob 連携では、インポート / エクスポートの進捗と整合性を確認し、書き戻し完了前の削除を避ける
- マウントできないときは、専用サブネットの設定・VNet 到達性・クライアントのバージョン・名前解決を順に切り分ける
コスト
課金は基本的に確保したファイルシステム容量とパフォーマンス階層に対して発生します。実使用量ではなく確保量が基準になるため、常時確保しっぱなしにすると割高になりやすいサービスです。
- パフォーマンス階層が高いほど、確保容量あたりの単価が上がる
- 長期保管は安価な Blob に寄せ、計算時だけ Managed Lustre を立てる使い捨て運用がコスト効率に直結する
- 使い終わったファイルシステムは、結果を Blob へ書き戻したうえで速やかに削除して確保コストを止める
- Blob とのデータ転送やエクスポートに伴うコストも、必要分だけに抑える
Managed Lustre は使用量ではなく確保した容量が課金の基準です。ジョブが終わったら結果を Blob へ書き戻し、ファイルシステムを削除して確保コストを止める「使い捨て」運用が、コスト最適化の要になります。
セキュリティ
- ファイルシステムは専用サブネット経由でプライベートにアクセスし、VNet 外へ公開エンドポイントを持たない
- 保存時暗号化が有効で、要件に応じてカスタマー管理キー(CMK)を利用できる構成がある
- 暗号鍵は Azure Key Vault で管理し、ローテーションを運用する
- ネットワークは VNet・サブネット・NSG・ルーティングで閉域化し、クライアントの到達範囲を限定する
- 連携先の Blob Storage 側のアクセス制御(RBAC・ネットワーク制限) も併せて設計し、データ経路全体を保護する
- 管理操作は Microsoft Entra ID + RBAC で最小権限に制御する
関連サービス・比較
同じ高性能ストレージでも、Managed Lustre は並列ファイルシステムによる大規模 I/O、Azure NetApp Files は低レイテンシのエンタープライズ NAS という位置づけです。AWS では FSx for Lustre が相当します。
| 観点 | Azure Managed Lustre | Azure NetApp Files |
|---|---|---|
| 位置づけ | HPC/AI向け並列ファイルシステム | 高性能エンタープライズNAS |
| 基盤 | Lustre | NetApp ONTAP |
| プロトコル | Lustreクライアント(POSIX) | NFS / SMB / デュアル |
| 強み | 大規模並列の集約スループット | 低レイテンシと高度なデータ管理 |
| 連携 | Blobの取り込み/書き戻し | スナップショット/レプリケーション |
| 主な用途 | HPC・AI/ML学習 | DB・SAP・汎用高性能共有 |
| AWS相当 | FSx for Lustre | FSx for NetApp ONTAP |
多数ノードからの大規模並列 I/O や AI 学習のデータフィードには Managed Lustre、低レイテンシ・小〜中規模の共有や NFS/SMB が要る用途には NetApp Files を選びます。長期保管は Blob に寄せるのが基本です。
ハンズオン / CLI例
# リソースグループを作成
az group create --name aml-rg --location eastus
# プロバイダーを登録(初回のみ)
az provider register --namespace Microsoft.StorageCache
# Azure Managed Lustre ファイルシステムを作成
# 容量とパフォーマンス階層、専用サブネットを指定する
az amlfs create \
--resource-group aml-rg \
--name aml-fs \
--location eastus \
--sku AMLFS-Durable-Premium-250 \
--storage-capacity 16 \
--zones 1 \
--filesystem-subnet "/subscriptions/<sub-id>/resourceGroups/aml-rg/providers/Microsoft.Network/virtualNetworks/aml-vnet/subnets/aml-subnet" \
--maintenance-window '{"dayOfWeek":"Saturday","timeOfDayUTC":"22:00"}'
# 作成したファイルシステムの情報(マウント情報など)を確認
az amlfs show \
--resource-group aml-rg \
--name aml-fs
Azure Service
Azure Managed Lustreを実務で読む
TL;DRは入口です。実際に選ぶ・使う段階では、何を解決するか、何と比較するか、導入後にどこで詰まるかまで見る必要があります。
解決すること
ストレージ
比較で見る軸
クラウド: Azure / カテゴリ: ストレージ / 難易度: intermediate
導入後に効く点
Blob Storage と連携し、データの取り込みと書き戻しを自動化できる。
先に潰すリスク
サービス単体ではなく、権限、ネットワーク、監視、課金、バックアップを含めて設計する必要がある。
- クラウド
- Azure
- カテゴリ
- ストレージ
- 難易度
- intermediate
- 関連資格
- —
- 設計柱
- performance / cost / operational
判断チェックリスト
- 自社の用途が「ストレージ / performance」に近いか確認する。
- 強みである「Lustre 並列ファイルシステムをフルマネージドで提供する高スループットストレージ。」が本当に評価軸になるか確認する。
- 注意点の「サービス単体ではなく、権限、ネットワーク、監視、課金、バックアップを含めて設計する必要がある。」を運用で吸収できるか確認する。
- 公開値や仕様値は、対象プラン・対象機種・対象リージョンまで確認する。
- 既存システム、ID、ネットワーク、監視、バックアップとの接続方法を先に洗い出す。
- 小さく試してから、本番移行、権限設計、障害時手順、コスト監視を決める。