Cloud Service
Azure Data Box
物理デバイスに大容量データを書き込んで Azure へ郵送し、ネットワーク経由では非現実的な移送をオフラインで実現するデータ転送サービス。AWS Snow Family に相当。
- 1.テラ〜ペタバイト級のデータを物理デバイスで Azure へ郵送して移送する。
- 2.回線が細い・遅い・高コストな環境でも大容量データを現実的な期間で移せる。
- 3.AWS Snow Family(Snowball など)に相当。輸送と保存時暗号化で安全に運ぶ。
解決する課題
大量のデータを Azure へ移したいものの、ネットワーク回線では時間やコストが現実的でない場面で使います。たとえば数十テラ〜ペタバイト級のデータをインターネット経由で送ると、回線速度によっては数週間〜数か月かかったり、回線使用料が高くついたりします。Data Box は、データを物理デバイスに書き込んで郵送することでこの問題を回避します。
- 回線が細い、遅い、または不安定な拠点から大容量データをまとめて移送したい
- データセンターの閉鎖や移行で、初回シード(一括移行)をオフラインで素早く済ませたい
- ネットワーク転送だと帯域コストや所要時間が見合わないペタバイト級の移送を行いたい
- 定期的に発生する大量データ(メディア・ログ・センサーなど)を継続的にバッチで取り込みたい
主要概念と用語
- Data Box: 数十テラバイト級の据え置き型デバイス。回線では非現実的な一括移送に使う、ファミリーの中心的な製品
- Data Box Disk: 数テラバイト級の小型 SSD を複数本セットで送る、より小規模な転送向けの製品
- Data Box Heavy: ペタバイト級の超大容量に対応する大型デバイス。台車付きの筐体で運ぶ
- Data Box Gateway: 物理デバイスではなく、オンプレに置く仮想アプライアンス。書き込んだデータを継続的に Azure へ送る(ネットワーク経由の常時転送)
- インポート(取り込み): オンプレのデータをデバイスに書き込み、Azure へアップロードする方向の転送。最も一般的な用途
- エクスポート(書き出し): Azure 上のデータをデバイスに取り出して持ち帰る、逆方向の転送
- オーダー: ポータルでデバイスの発送を申し込む単位。発送・受領・返送・取り込みまでをこのオーダーで追跡する
- ステージングストレージ: コピー先となる Azure のストレージアカウント。デバイスのデータは最終的にここへ取り込まれる
仕様・制限・クォータ
- 製品ごとに容量帯が異なる: Disk は数テラ級、Data Box は数十テラ級、Heavy はペタ級が目安。移送量に応じて選ぶ
- 取り込み先は Azure Blob Storage や Azure Files などのストレージサービスが中心。製品やリージョンによって対応先が異なる
- データのコピーには SMB / NFS などのファイル共有プロトコルや、製品によっては REST 経由のアクセスを使う
- デバイスはリージョン単位で提供され、利用可否や対応サービスはリージョンによって差がある
- 1 オーダーで運べる容量には上限があり、超える場合は複数オーダーに分割する
- 発送から取り込み完了までは輸送日数を含むため、移送計画にはリードタイムを見込む必要がある
回線で送れるならネットワーク転送が基本です。物理移送が要るときだけ、容量帯で Disk(小)→ Data Box(中)→ Heavy(大) と選びます。常時オンラインでクラウドへ流し続けたいなら、物理デバイスではなく Data Box Gateway が向きます。
内部の仕組み
利用の流れは、ポータルからデバイスをオーダーし、配送されたデバイスを拠点で受け取り、ローカルのファイル共有としてマウントしてデータをコピーし、デバイスを Azure のデータセンターへ返送する、というものです。Azure 側ではデバイスを受領後、指定したストレージアカウント(ステージングストレージ)へデータを取り込み(アップロード)、完了するとデバイス上のデータは安全に消去されます。
- オンプレからの書き込みは SMB / NFS などの共有経由で、通常のファイルコピーと同じ感覚で行える
- データはデバイス上で保存時に暗号化され、輸送中の紛失・盗難に備える
- 取り込み完了後、デバイスは**監査基準に沿って消去(サニタイズ)**されてから次の利用に回される
- オーダーの状態(発送・到着・コピー・取り込み)はポータルで追跡でき、進捗を把握できる
物理デバイスを輸送する点が、回線越しに常時転送する Data Box Gateway との根本的な違いです。一括の初回移送はデバイス、継続的な流し込みは Gateway、と役割が分かれます。
設計パターン / ベストプラクティス
- 初回シードは物理、差分は回線: 大量の初回データは Data Box で移送し、その後の差分はネットワーク同期で追いつかせる(ハイブリッド移送)
- コピー前の整理: 不要データを除外し、ディレクトリ構成を取り込み先に合わせておくと、後段の整理コストを減らせる
- 容量に合わせた製品選択: 移送量を見積もり、Disk / Data Box / Heavy から無駄のないサイズを選ぶ。分割が必要なら複数オーダーを計画する
- リードタイムの確保: 発送・輸送・取り込みの日数を移行計画に織り込み、本番切り替えの期日から逆算する
- 検証の組み込み: コピー時のチェックサムや、取り込み後の件数・容量の突き合わせで、欠損や破損がないことを確認する
Data Box の所要時間には物理輸送の日数が含まれます。締め切り直前にオーダーすると間に合わないことがあるため、移送計画では発送・輸送・取り込みの各リードタイムを早めに見積もりましょう。
運用・監視
- オーダーの進捗(発送・到着・コピー・取り込み)はポータルで一元的に追跡する
- 取り込み完了後は、取り込み先ストレージの件数・容量をコピー元と突き合わせ、欠損がないか検証する
- コピー時に出力されるログやチェックサムを保管し、後から監査・突き合わせができるようにする
- 大規模移行では、複数オーダーやデバイスの受領・返送スケジュールを台帳化して取りこぼしを防ぐ
コスト
課金は主に、デバイスの利用(オーダー)料金と、利用日数を超えた場合の延長料金、そして配送に関わる費用で構成されます。取り込んだデータの保存自体は、通常どおりコピー先のストレージサービスの料金がかかります。
| コスト要因 | 内容 | 抑える工夫 |
|---|---|---|
| デバイス利用料 | オーダー単位で発生 | 適切な容量帯を選び無駄を避ける |
| 延長料金 | 規定の利用日数超過分 | コピー作業を計画的に短期間で済ませる |
| 配送費用 | 発送・返送に関わる費用 | オーダー数を必要最小限にまとめる |
| 保存料金 | 取り込み先ストレージの容量課金 | 不要データを移送前に除外する |
- 回線転送と比較し、帯域コストと所要時間の観点でどちらが得かを移送量から判断する
- デバイスを長く手元に置くほど延長料金がかさむため、コピー作業を段取りよく進める
セキュリティ
- デバイス上のデータは保存時に暗号化され、輸送中の紛失・盗難時もデータが保護される
- 取り込み完了後、デバイスは**監査基準に沿って消去(サニタイズ)**され、データが残らない
- 取り込み先ストレージへのアクセスは Microsoft Entra ID + RBAC や鍵の管理で制御する
- オーダーやデバイスのロック解除には認証情報・パスキーが必要で、第三者が勝手に読み出せない仕組みになっている
- 監査要件があるデータは、コピーと取り込みのログを保全し、追跡可能性を確保する
暗号化やデバイスのロック解除情報を軽視したまま物理デバイスを輸送するのは危険です。輸送中の紛失・盗難はゼロにできないため、保存時暗号化とアクセス情報の厳重な管理を前提に運用しましょう。
Well-Architected の観点
- オペレーショナルエクセレンス(Operational Excellence): 大容量移送を計画的なオーダー・輸送・取り込みのプロセスに落とし込み、進捗追跡と取り込み後の検証を運用に組み込む。リードタイムを見込んだ移行計画で本番切り替えを安全に進める
- コスト面では、回線転送と物理移送の損益分岐を移送量から判断し、容量帯の選定とオーダー数の最適化で無駄を避ける
- セキュリティ面では、保存時暗号化と取り込み後の消去、アクセス情報の管理によって、輸送という物理的リスクを抑える
試験で問われるポイント
- Data Box は物理デバイスでオフラインに大容量データを移送するサービス、という基本目的
- 回線で送れる規模ならネットワーク転送、回線では非現実的な大容量のときに物理移送を選ぶ判断軸
- 容量帯による製品の違い(Disk → Data Box → Heavy の順に大容量)
- 物理デバイスの一括移送と、Data Box Gateway による継続的なネットワーク転送の役割の違い
- インポート(取り込み) が主用途で、エクスポート(書き出し) という逆方向の転送もある点
- AWS では Snow Family(Snowball など) が相当サービスである、という対応関係
関連サービス・比較
Azure Data Box は、AWS の Snow Family(Snowball など)に相当する物理デバイスによるデータ移送サービスです。回線では難しい大容量を郵送で運ぶ、という発想が共通します。
| 観点 | Azure Data Box | AWS Snow Family |
|---|---|---|
| 位置づけ | 物理デバイスでの大容量移送 | 物理デバイスでの大容量移送 |
| 小容量向け | Data Box Disk | Snowball(小容量構成) |
| 大容量向け | Data Box / Data Box Heavy | Snowball / Snowmobile(大規模) |
| 主な取り込み先 | Blob Storage・Azure Files | Amazon S3 |
| 継続転送 | Data Box Gateway で常時転送 | Snowball Edge などの常駐用途 |
| 保護 | 保存時暗号化と取り込み後の消去 | 保存時暗号化とデバイス消去 |
「物理デバイスで大容量データを移送する」役割は Azure Data Box ≒ AWS Snow Family。回線でまかなえるなら、まずはネットワーク転送(Azure なら AzCopy や Storage 同期など)を検討するのが基本です。
ハンズオン / CLI例
# リソースグループを作成
az group create --name demo-rg --location japaneast
# 取り込み先となるストレージアカウントを作成
az storage account create \
--name demoingeststg \
--resource-group demo-rg \
--location japaneast \
--sku Standard_LRS
# Data Box のオーダー(ジョブ)を作成(取り込み先ストレージを指定)
az databox job create \
--resource-group demo-rg \
--name demo-databox-order \
--location japaneast \
--sku DataBox \
--contact-name "Taro Azure" \
--phone 0000000000 \
--email-list takashi.matsuda.0627@gmail.com \
--street-address1 "1-1-1 Sample" \
--city Tokyo \
--postal-code 1000001 \
--country JP \
--storage-account demoingeststg
# オーダーの状態(発送・到着・コピー・取り込み)を確認
az databox job show \
--resource-group demo-rg \
--name demo-databox-order -o table
# 同じリソースグループ内のオーダーを一覧表示
az databox job list \
--resource-group demo-rg -o table
Azure Service
Azure Data Boxを実務で読む
TL;DRは入口です。実際に選ぶ・使う段階では、何を解決するか、何と比較するか、導入後にどこで詰まるかまで見る必要があります。
解決すること
移行・転送
比較で見る軸
クラウド: Azure / カテゴリ: 移行・転送 / 難易度: basic
導入後に効く点
回線が細い・遅い・高コストな環境でも大容量データを現実的な期間で移せる。
先に潰すリスク
サービス単体ではなく、権限、ネットワーク、監視、課金、バックアップを含めて設計する必要がある。
- クラウド
- Azure
- カテゴリ
- 移行・転送
- 難易度
- basic
- 関連資格
- —
- 設計柱
- operational
判断チェックリスト
- 自社の用途が「移行・転送 / operational」に近いか確認する。
- 強みである「テラ〜ペタバイト級のデータを物理デバイスで Azure へ郵送して移送する。」が本当に評価軸になるか確認する。
- 注意点の「サービス単体ではなく、権限、ネットワーク、監視、課金、バックアップを含めて設計する必要がある。」を運用で吸収できるか確認する。
- 公開値や仕様値は、対象プラン・対象機種・対象リージョンまで確認する。
- 既存システム、ID、ネットワーク、監視、バックアップとの接続方法を先に洗い出す。
- 小さく試してから、本番移行、権限設計、障害時手順、コスト監視を決める。