Cloud Service
Azure Data Box Gateway
オンプレに置く仮想アプライアンスへ書き込むだけで、データを継続的に Azure Storage へ転送。物理デバイス輸送なしに常時クラウドへ流し込めるストレージゲートウェイ。
- 1.オンプレの仮想アプライアンスに SMB/NFS で書くと、自動で Azure Blob/Files へ転送される。
- 2.物理デバイスを郵送する Data Box と違い、ネットワーク経由で継続的に流し込む常時転送型。
- 3.一括の初回移送はデバイス、継続的なバッチ取り込みは Gateway、と役割が分かれる。
解決する課題
オンプレで生成し続けるデータを、特別な転送ツールを書かずに継続して Azure へ送りたい場面で使います。Data Box Gateway は、オンプレの仮想化基盤上に置く仮想アプライアンスです。ローカルのファイル共有として見えるため、アプリやスクリプトはいつものファイル書き込みをするだけで、書いたデータが裏で Azure Storage へ自動転送されます。
- 継続的に発生する大量データ(メディア・ログ・バックアップ・センサーなど)を回線経由で休まず取り込みたい
- アプリ側を作り変えず、いつものファイル共有への書き込みのままクラウドへ送りたい
- 拠点やエッジで一時的にデータを受け、まとめて Azure へ流し込む中継点がほしい
- 一度きりの物理移送ではなく、定常的なクラウドへのデータ供給を仕組み化したい
Data Box Gateway は郵送する物理デバイスではありません。自分の仮想化基盤に展開する**仮想マシン(仮想アプライアンス)**で、ネットワーク経由で常時 Azure へ転送します。一括の初回移送なら物理の Data Box、継続的な流し込みなら Gateway、と使い分けます。
主要概念と用語
- Data Box Gateway: オンプレの仮想化基盤に展開する仮想アプライアンス。ローカル共有への書き込みを Azure Storage へ継続転送する
- 仮想アプライアンス: Hyper-V や VMware などのハイパーバイザー上で動かす仮想マシンとして提供される本体
- 共有(Share): アプライアンス上に作るファイル共有。ここに書いた内容が紐づけたストレージアカウントへ転送される
- SMB / NFS: 共有へアクセスするためのファイル共有プロトコル。クライアントの環境に合わせて選ぶ
- ストレージアカウント: 転送先となる Azure 側のストレージ。共有はここの Blob/Files にマッピングされる
- ローカルキャッシュ: アプライアンスが持つ一時保管領域。書き込みを受けてから Azure へ送り出すまでの中継に使う
- Data Box Edge(現 Azure Stack Edge): Gateway に計算・推論機能を足した物理エッジ機器。Gateway がソフトのみなのに対し、こちらはハードを伴う
仕様・制限・クォータ
- 本体は仮想アプライアンスとして提供され、対応ハイパーバイザー上に展開する。物理デバイスの発送はない
- 転送先は Azure Blob Storage や Azure Files が中心。共有ごとに紐づけるストレージアカウントを指定する
- 共有へのアクセスには SMB / NFS を使い、クライアント側からは通常のファイル共有として見える
- アプライアンスにはローカルキャッシュの容量があり、これを超える流入が続くと転送が追いつかない場合がある
- 同時に作れる共有数や、扱えるデータ量には製品上の上限があるため、設計時に見積もる
- アプライアンスとクライアント、Azure の間でネットワーク到達性と帯域が必要。回線が転送スループットの上限になる
Gateway はネットワーク経由の常時転送です。書き込み量が回線スループットを継続的に上回ると、ローカルキャッシュに溜まって転送が遅延します。流入量と回線帯域のバランスを見積もり、必要なら帯域や流入ペースを調整しましょう。
内部の仕組み
利用の流れは、ポータルで Gateway のリソースを作成し、提供される仮想アプライアンスのイメージをハイパーバイザーへ展開して初期構成(ネットワーク・アクティベーション)を済ませ、アプライアンス上に共有を作成して転送先ストレージアカウントを紐づける、というものです。あとはクライアントがその共有へ SMB/NFS でデータを書き込むと、アプライアンスがローカルキャッシュで受け止め、裏で Azure Storage へ継続的にアップロードします。
- クライアントからの書き込みはローカル共有への通常のファイル操作として行え、アプリの作り替えが要らない
- 書き込まれたデータはまずローカルキャッシュに置かれ、その後に Azure へ非同期で送り出される
- 転送はネットワーク経由で継続的に行われるため、データは時間差でクラウドへ反映される
- 共有とストレージアカウントの紐づけにより、書いた先がそのまま Blob/Files に現れる
物理デバイスを郵送する Data Box と異なり、Gateway は回線越しに常時転送する点が根本的な違いです。初回の一括移送はデバイス、定常的な流し込みは Gateway、と役割が分かれます。
設計パターン / ベストプラクティス
- 継続供給は Gateway、初回一括は物理: 定常的に発生するデータは Gateway で流し込み、過去分の大量な初回移送は物理 Data Box で済ませる使い分けにする
- 流入量と帯域の整合: 書き込みペースと回線スループット、ローカルキャッシュ容量を見比べ、キャッシュが溢れない範囲に収める
- 共有とストレージ設計を先に決める: どの共有をどのストレージアカウント・コンテナーに紐づけるかを事前に設計し、取り込み後の整理コストを下げる
- アプリ非改変での連携: 既存のファイル出力先を Gateway の共有に向けるだけで連携でき、書き込み側を作り替えずに済ませる
- 検証の組み込み: 転送後に Azure 側の件数・容量を書き込み元と突き合わせ、欠損や遅延がないことを確認する
運用・監視
- アプライアンスやリソースの状態はポータルで監視し、転送の滞留やエラーを早めに検知する
- ローカルキャッシュの使用量を継続的に確認し、流入が転送を上回って溜まり続けていないかを見る
- 転送先ストレージの件数・容量を書き込み元と突き合わせ、データが正しく反映されているか検証する
- アプライアンスのソフトウェア更新を計画的に適用し、稼働を維持する
- 回線障害やメンテナンスに備え、書き込みが一時的に滞ってもキャッシュで吸収できる余裕を確保する
コスト
課金は主に、Gateway リソースの利用料金と、転送したデータが収まるAzure Storage の容量・トランザクション料金で構成されます。アプライアンス自体はソフトウェアとしてオンプレの基盤上で動くため、物理デバイスの発送・返送費用は発生しません。
| コスト要因 | 内容 | 抑える工夫 |
|---|---|---|
| Gateway 利用料 | リソースの稼働に対する課金 | 必要な拠点・用途に絞って展開する |
| ストレージ容量 | 転送先 Blob/Files の容量課金 | 不要データを書き込み前に除外する |
| トランザクション | 転送に伴う読み書き操作 | 細かなファイルを束ねて操作数を抑える |
| オンプレ基盤 | アプライアンスを動かす仮想化資源 | 適切なサイズで割り当てる |
- 物理 Data Box のような発送・延長料金はなく、代わりに回線と稼働の継続コストで考える
- 大量データの初回移送だけが目的なら、継続課金の Gateway よりも一度きりの物理デバイスが見合うこともある
セキュリティ
- クライアントから共有へのアクセスは SMB / NFS の認証で制御し、許可した相手だけが書き込めるようにする
- アプライアンスから Azure への転送、および Azure 側での保存は暗号化で保護される
- 転送先ストレージへのアクセスは Microsoft Entra ID + RBAC や鍵の管理で制御する
- アプライアンスのアクティベーションや管理操作には認証が必要で、勝手な構成変更を防ぐ
- 監査要件があるデータは、書き込みと転送のログを保全し、追跡可能性を確保する
共有への書き込みアクセスや転送先ストレージの権限を緩いまま運用するのは危険です。Gateway はオンプレと Azure をつなぐ中継点になるため、共有の認証・ストレージの RBAC・鍵管理を最小権限で固めたうえで運用しましょう。
関連サービス・比較
Azure Data Box Gateway は、同じ Data Box ファミリーの物理デバイス(Azure Data Box)と対になる存在です。どちらもオンプレのデータを Azure へ運びますが、Gateway はネットワーク経由の継続転送、Data Box は物理デバイスの一括移送、という違いがあります。
| 観点 | Data Box Gateway | Azure Data Box |
|---|---|---|
| 形態 | オンプレの仮想アプライアンス | 郵送する物理デバイス |
| 転送方式 | ネットワーク経由の常時転送 | デバイスを輸送するオフライン移送 |
| 主な用途 | 継続的なバッチ取り込み | 大容量の初回一括移送 |
| 所要時間 | 回線スループットに依存 | 輸送日数を含む |
| 転送先 | Blob Storage・Azure Files | Blob Storage・Azure Files |
| 課金の軸 | 稼働とストレージの継続課金 | オーダー単位の利用料と配送費 |
継続的に流し込むなら Gateway、一括で大量に運ぶなら物理 Data Box が基本です。過去分の膨大なデータは物理デバイスで初回移送し、その後の継続供給を Gateway で受け持つ、という組み合わせも有効です。
ハンズオン / CLI例
# リソースグループを作成
az group create --name demo-rg --location japaneast
# 転送先となるストレージアカウントを作成
az storage account create \
--name demogatewaystg \
--resource-group demo-rg \
--location japaneast \
--sku Standard_LRS
# Data Box Gateway のリソース(デバイス枠)を作成
az databoxedge device create \
--name demo-gateway \
--resource-group demo-rg \
--location japaneast \
--sku Gateway
# 作成した Gateway リソースの状態を確認
az databoxedge device show \
--name demo-gateway \
--resource-group demo-rg -o table
# 同じリソースグループ内の Data Box Edge/Gateway リソースを一覧表示
az databoxedge device list \
--resource-group demo-rg -o table
Azure Service
Azure Data Box Gatewayを実務で読む
TL;DRは入口です。実際に選ぶ・使う段階では、何を解決するか、何と比較するか、導入後にどこで詰まるかまで見る必要があります。
解決すること
移行・転送
比較で見る軸
クラウド: Azure / カテゴリ: 移行・転送 / 難易度: intermediate
導入後に効く点
物理デバイスを郵送する Data Box と違い、ネットワーク経由で継続的に流し込む常時転送型。
先に潰すリスク
サービス単体ではなく、権限、ネットワーク、監視、課金、バックアップを含めて設計する必要がある。
- クラウド
- Azure
- カテゴリ
- 移行・転送
- 難易度
- intermediate
- 関連資格
- —
- 設計柱
- operational / cost
判断チェックリスト
- 自社の用途が「移行・転送 / operational」に近いか確認する。
- 強みである「オンプレの仮想アプライアンスに SMB/NFS で書くと、自動で Azure Blob/Files へ転送される。」が本当に評価軸になるか確認する。
- 注意点の「サービス単体ではなく、権限、ネットワーク、監視、課金、バックアップを含めて設計する必要がある。」を運用で吸収できるか確認する。
- 公開値や仕様値は、対象プラン・対象機種・対象リージョンまで確認する。
- 既存システム、ID、ネットワーク、監視、バックアップとの接続方法を先に洗い出す。
- 小さく試してから、本番移行、権限設計、障害時手順、コスト監視を決める。