Cloud Service
AWS Snow Family
物理デバイスを輸送して大容量データをオフラインで移送する、ネットワークが細い環境向けのデータ移行サービス群。
- 1.回線が細い・遠い環境では、ネットワーク転送より物理デバイスの輸送のほうが速く安いことがある。
- 2.デバイスにデータをコピーして返送するだけ。実体の移送はAWSが請け負い、到着後にS3へ取り込まれる。
- 3.用途に応じてポータブルな小型から大容量・耐環境性の高いものまで選べ、現地での処理もできる。
解決する課題
数十テラバイト〜ペタバイト級のデータをクラウドへ移す場合、ネットワーク経由の転送は回線速度がボトルネックになります。細い回線では転送に数週間〜数か月かかることもあり、その間の帯域占有や転送料も無視できません。Snow Family は、データを物理デバイスにコピーして輸送するという発想でこの問題を解きます。
- 大容量データを移したいが、回線が細くネットワーク転送だと現実的な時間で終わらない
- 拠点が遠隔地・船舶・工場などで、安定した広帯域回線がない
- 一度きりの大規模なクラウド移行で、帯域を長期間占有したくない
- 現場(エッジ)で発生したデータをローカルで処理してから持ち帰りたい
移行を検討するときは、データ量と利用可能な帯域から転送にかかる日数をざっくり計算します。ネットワークでは到底終わらない、あるいは回線を長期間占有してしまう、という結論になったときが物理移送の出番です。
主要概念と用語
- オフライン移送: ネットワークではなく物理デバイスを輸送してデータを運ぶ方式。回線の太さに依存しないのが最大の特徴
- Snowball Edge: 大容量ストレージや計算リソースを備えたデバイス。データ移送に加え、現地でのコンピューティング処理にも使えるタイプがある
- Snowcone: 小型で軽量・ポータブルなデバイス。設置スペースや電力が限られる現場向け
- Snowmobile: かつて提供されていた超大容量の輸送手段で、現在は新規の選択肢ではない。エクサバイト級という規模感を表す概念として押さえておく
- エッジコンピューティング: 移送だけでなく、デバイス上で前処理や推論などの計算をその場で行う使い方
- インポート / エクスポート: クラウドへ取り込む方向(インポート)と、クラウドから取り出して持ち出す方向(エクスポート)のジョブ
- 耐環境性: 衝撃・粉塵・温度変化に耐える堅牢な筐体で、輸送や過酷な現場での利用を想定した設計
仕様・制限・クォータ
- デバイスは注文(ジョブ作成)して取り寄せ、データをコピーした後に返送する流れで使う
- 1台あたりの保存容量はデバイスの種類によって異なり、小型のポータブルなものから大容量のものまで幅がある
- さらに大量のデータには複数台を並行して使う、あるいはクラスタ構成を組むことができる
- デバイスは堅牢な筐体で、衝撃・粉塵・温度に対する耐環境性を備える
- ネットワーク帯域が許す範囲では、デバイスの一部機能をオンラインでも併用できるが、本来の価値はオフライン移送にある
具体的なデバイス容量・対応リージョン・注文上限などは時期によって変わり、提供終了になる選択肢もあります。設計時は最新の公式情報で必ず確認してください。
内部の仕組み
利用者はまずジョブを作成してデバイスを注文します。届いたデバイスをローカルネットワークに接続し、専用クライアントやS3互換のインターフェース経由でデータをコピーします。コピーが終わったらデバイスを返送し、AWS のデータセンターに到着するとデータがS3 に取り込まれます。エクスポートのジョブでは逆に、クラウド側のデータをデバイスへ書き出してから発送されます。
この一連の流れの肝は、大量データの実体の移動を物理輸送に肩代わりさせる点にあります。回線速度に縛られないため、ネットワークでは非現実的な規模でも、輸送の所要日数というおおむね一定の時間で完了します。一部のデバイスは計算リソースを内蔵しており、現場でのデータ前処理や軽量なアプリ実行といったエッジ処理にも使えます。
返送されたデバイスのデータは、AWS側でS3へ取り込まれます。利用者がクラウド内で再度アップロードし直す必要はありません。
設計パターン / ベストプラクティス
- 一度きりの大規模移行: データセンター閉鎖やクラウド全面移行など、ペタバイト級を一括で運ぶケースに向く
- 複数台の並行利用: 容量が大きいときは複数デバイスやクラスタで取り込みを並列化し、移行期間を短縮する
- エッジでの前処理: 計算機能を持つデバイスを使い、現地でフィルタリングや集計をしてから持ち帰り、運ぶデータ量自体を減らす
- 継続的なハイブリッド利用には別サービス: 一回限りの輸送ではなく常時オンライン連携が必要なら、Snow ではなく Storage Gateway や Direct Connect を検討する
- コピー前のデータ整理: 不要ファイルを除き、ディレクトリ構成を整えてからコピーすると、後工程の取り込み・検証が楽になる
運用・監視
- ジョブの進捗状況(出荷、配送、データコピー、返送、取り込み完了)はマネジメントコンソールやAPIで追跡できる
- デバイスの配送・返送のスケジュールを物流に合わせて管理する
- 大量データのコピーには時間がかかるため、ローカル側のネットワークやディスクI/Oがボトルネックにならないか確認する
- コピー完了後は、件数やサイズの照合でデータの欠落がないかを確認する
- 複数台を使う場合は、どのデバイスにどの範囲のデータを入れたかを台帳として記録しておく
コスト
- 課金は主にデバイスの利用(ジョブ単位)と、規定を超えた利用日数、および返送に関わる費用で構成される
- ネットワーク経由の大量転送と比べ、回線が細い・データ量が大きいケースでは総コストで有利になりやすい
- データがクラウドに取り込まれた後の保存料は、保存先であるS3 側の料金に従う
- デバイスを長く手元に置くほど利用日数の費用が増えるため、コピーを早く終えて返送するほどよい
規定の無料日数を超えると日数に応じた費用が発生します。受け取ったら速やかにコピーして返送するのが、コスト面でもセキュリティ面でも基本です。
セキュリティ
- デバイス上のデータは保存時に暗号化され、鍵は KMS で管理される
- データの暗号化は、利用者のデータがデバイスに書き込まれる段階から適用される
- アクセス権限は IAM で制御し、ジョブの作成やデバイス操作を最小権限に絞る
- 物理デバイスのため、受け取りから返送までの物理的な管理(保管場所・持ち出し管理)も運用に含める
- 返送後、AWS側ではデバイスのデータ消去が行われる
データを格納した物理デバイスは、紛失・盗難そのものがインシデントになり得ます。暗号化に加え、保管と輸送の物理的な管理手順を必ず定めてください。
Well-Architected の観点
- 運用上の優秀性: 移行作業をジョブとして手順化でき、進捗を可視化して管理できる。一回限りの大規模移送を予測可能な期間で完了させやすい
- コスト最適化: 細い回線での長期間の転送や帯域占有を避け、物理輸送で総コストを抑える
- 信頼性: 回線品質に左右されず、輸送の所要日数というおおむね安定した時間で移送が完了する
- セキュリティ: 保存時暗号化とKMSによる鍵管理、IAMでの最小権限、返送後のデータ消去
試験で問われるポイント
- 「回線が細い/遠隔地で、大容量データをクラウドへ移したい」→ Snow Family(物理移送)
- 「ネットワーク転送だと数週間〜数か月かかる規模」というヒントは物理移送のサイン
- 「常時オンラインでハイブリッド利用したい」→ Snow ではなく Storage Gateway
- 「専用線で安定した広帯域がほしい」→ Direct Connect(こちらはオンラインの常設回線)
- 現地で前処理・計算もしたい → 計算機能を持つ Snowball Edge などのエッジ用途
関連サービス・比較
オンラインの常設回線である AWS Direct Connect とよく対比されます。Snow Family は一回限りの物理輸送、Direct Connect は継続的に使う専用線という役割の違いを押さえます。
| 観点 | Snow Family | Direct Connect |
|---|---|---|
| 移送方式 | 物理デバイスをオフライン輸送 | 専用線でオンライン転送 |
| 主な用途 | 一回限りの大容量移行 | 継続的な低レイテンシ接続 |
| 回線への依存 | 回線が細くても物理輸送で完結 | 敷設した回線の帯域に依存 |
| 完了までの時間 | 輸送の所要日数で完結 | 帯域とデータ量しだい |
ハンズオン / CLI例
# データ取り込み用のジョブ(インポート)を作成する例
# 取り込み先となるS3バケットや通知先、住所IDなどを指定する
aws snowball create-job \
--job-type IMPORT \
--resources '{"S3Resources":[{"BucketArn":"arn:aws:s3:::my-migration-bucket"}]}' \
--address-id ADID1234567890 \
--kms-key-arn arn:aws:kms:ap-northeast-1:123456789012:key/abcd1234-... \
--role-arn arn:aws:iam::123456789012:role/SnowballImportRole \
--snowball-capacity-preference T80 \
--shipping-option SECOND_DAY
# 作成済みジョブの一覧と状態を確認
aws snowball list-jobs
# 特定ジョブの進捗・配送状況を確認
aws snowball describe-job --job-id JID-XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX
AWS Service
AWS Snow Familyを実務で読む
TL;DRは入口です。実際に選ぶ・使う段階では、何を解決するか、何と比較するか、導入後にどこで詰まるかまで見る必要があります。
解決すること
移行・転送
比較で見る軸
クラウド: AWS / カテゴリ: 移行・転送 / 難易度: basic
導入後に効く点
デバイスにデータをコピーして返送するだけ。実体の移送はAWSが請け負い、到着後にS3へ取り込まれる。
先に潰すリスク
サービス単体ではなく、権限、ネットワーク、監視、課金、バックアップを含めて設計する必要がある。
- クラウド
- AWS
- カテゴリ
- 移行・転送
- 難易度
- basic
- 関連資格
- SAA-C03
- 設計柱
- operational
判断チェックリスト
- 自社の用途が「移行・転送 / operational」に近いか確認する。
- 強みである「回線が細い・遠い環境では、ネットワーク転送より物理デバイスの輸送のほうが速く安いことがある。」が本当に評価軸になるか確認する。
- 注意点の「サービス単体ではなく、権限、ネットワーク、監視、課金、バックアップを含めて設計する必要がある。」を運用で吸収できるか確認する。
- 公開値や仕様値は、対象プラン・対象機種・対象リージョンまで確認する。
- 既存システム、ID、ネットワーク、監視、バックアップとの接続方法を先に洗い出す。
- 小さく試してから、本番移行、権限設計、障害時手順、コスト監視を決める。