テープと光ストレージの原理 ─ 長期保存とアーカイブ階層
なぜ大量データの長期保存はいまだにテープなのか。LTOの蛇行記録とロボットライブラリ、LTFS、光ディスクのWORMまで原理を押さえ、ビット単価・寿命・遅延でアーカイブ階層を設計する判断軸が掴めます。
- 1.LTOテープは細い磁気テープを往復させながら多数トラックを線形に蛇行記録し、テープ走行中だけ読み書きできるためアクセス遅延は秒〜分単位になる。
- 2.LTFSはテープを2区画に分けインデックスをファイルシステムとして公開し、テープをUSBメモリのように扱えるオープン標準のアーカイブ交換形式である。
- 3.アーカイブ階層はビット単価・保存寿命・アクセス遅延・耐改竄(WORM)の優先度で決まり、ホット層はSSD/HDD、コールド層はテープや光ディスクが担う。
アーカイブを支える物理の前提
アーカイブストレージとは、頻繁には読まないが消してはいけない大量データを、できるだけ安く長く保つ層です。設計判断は突き詰めると四つの軸に集約されます。
ビット単価 : 1GBあたりの初期コスト+電力・冷却・床面積
保存寿命 : 媒体が無交換でデータを保持できる年数
アクセス遅延 : 要求してから最初のバイトが返るまでの時間
耐改竄/法規制 : 一度書いたら書き換えられないWORM保証の有無
この四軸は同時には最適化できません。SSDやHDDは遅延が小さい代わりに通電し続ける必要があり、長期保管では電力と置き換え費用が積み上がります。テープと光ディスクは遅延が大きい代わりに、ドライブから抜けば消費電力ゼロ・物理的にオフラインで保管でき、ビット単価と寿命で優位に立ちます。アーカイブ階層の設計とは、この四軸の優先度に応じて層ごとに媒体を割り当てる作業に他なりません。
LTOテープの線形蛇行記録
現在のデータテープ事実上の標準がLTO(Linear Tape-Open)です。媒体は幅約12.65mmの磁性塗布テープで、HDDのような回転円盤ではなく、リールからリールへテープを直線状に走らせながら長手方向に記録します。これが「線形(リニア)」の意味です。
ヘッドはテープ幅方向に多数のトラックを同時に扱いますが、テープ全長に並ぶトラック数は数千本に及び、一度には書けません。そこで**蛇行記録(サーペンタイン記録)**を使います。
パス1: テープ先頭 -> 末尾 (トラック群Aを記録)
パス2: 末尾 -> 先頭 (ヘッドを少しずらしトラック群Bを記録)
パス3: 先頭 -> 末尾 (トラック群Cを記録)...
末尾と先頭で折り返しながら全幅を埋める = 蛇(serpentine)のような軌跡
折り返しのたびにヘッドをテープ幅方向に微小ステップさせ、往復を繰り返して全トラックを敷き詰めます。テープは伸縮しヘッドとの相対位置がずれるため、媒体には製造時にサーボトラックが焼き込まれており、ヘッドはこのサーボ信号を読んで走行中の位置を常時補正します。書き込みは即時に読み返して検証するread-while-writeで、誤りを検出したらその場で後方に再記録します。
テープはシーケンシャルアクセス媒体です。目的データが現在位置から遠ければ、その位置までテープを物理的に巻き送る必要があり、フルハイトのテープを端から端まで送るだけで1〜2分かかります。HDDの回転待ちとシークがミリ秒なのに対し、テープのアクセス遅延は桁違いに大きい——だからホットデータには使えず、コールドアーカイブ専用になります。
ロボティクスライブラリ ─ 容量をスロットで稼ぐ
テープ1巻の容量には上限がありますが、テープライブラリは数十〜数千スロットのカートリッジ棚と少数のドライブ、そしてカートリッジを掴んで運ぶ**ロボットアーム(ピッカー)**で構成され、ペタバイト〜エクサバイト級の総容量を作ります。
スロット : カートリッジを保管する棚(容量はスロット数で決まる)
ドライブ : 実際に読み書きする装置(性能はドライブ台数で決まる)
ロボット : 要求に応じてスロット<->ドライブ間でカートリッジを搬送
ここに「容量とアクセス並列度を独立に拡張できる」というテープ階層の本質があります。総容量を増やしたければスロットを足し、スループットを増やしたければドライブを足す——両者が分離している点がディスクアレイと根本的に異なります。アクセス遅延には、データ位置までの巻き送り時間に加えて、**ロボットがカートリッジを取り出しドライブへ装填するマウント時間(十秒〜数十秒)**が上乗せされます。
| 軸 | HDDアレイ | テープライブラリ |
|---|---|---|
| 容量拡張 | ディスク追加(容量と並列度が連動) | スロット追加(容量だけ独立に拡張) |
| 性能拡張 | ディスク追加 | ドライブ追加(容量と独立) |
| 待機時電力 | 常時通電 | 棚のカートリッジは電力ゼロ |
| 最初の1バイト | ミリ秒 | マウント+巻き送りで秒〜分 |
LTFS ─ テープをファイルシステムとして見せる
伝統的にテープはバックアップソフト固有の形式で書かれ、その製品がなければ中身を読めませんでした。これを変えたのが**LTFS(Linear Tape File System)**という標準形式です。
LTFSはテープを2つの**区画(パーティション)**に分けます。
インデックス区画 : ファイル名・サイズ・テープ上の記録位置を持つXMLインデックス
データ区画 : ファイルの実体(線形に追記される)
テープを装填するとドライブはまずインデックス区画を読み、その内容をOSへ通常のファイルシステムとしてマウントします。利用者はファイルをコピー&ペーストするだけでテープを読み書きでき、特定ベンダのソフトに縛られません。LTFSはオープン標準なので、別組織が別メーカーのドライブで書いたテープでも、LTFSさえ実装していれば中身を取り出せます。これが長期保存と組織間データ交換でLTFSが重視される理由です。
LTFSはランダムアクセスできるファイルシステムのように見えますが、データ区画への記録は線形追記です。既存ファイルの上書きは原理的にできず、更新は新しい位置への追記とインデックス更新で表現されます。この「追記中心」の制約は、SMRや瓦記録の管理発想とよく似ています。ファイル単位の頻繁な書き換え用途には向きません。
WORMと光ディスク ─ 改竄できないコールド層
金融・医療・公的記録では、保存後に**書き換えられないこと(WORM: Write Once, Read Many)**そのものが要件になります。LTOにはWORMカートリッジがあり、媒体とドライブのファームウェアの両方で上書き・消去を物理的に拒否します。改竄不能性を媒体側で保証する点が、ソフトウェアの権限設定より強い証拠能力を持ちます。
光ディスクはコールドアーカイブのもう一つの選択肢です。データセンタ向けには複数のBlu-ray系ディスクをカートリッジに束ね、ロボットで扱う光ディスクアーカイブが使われます。記録は次の三種に大別できます。
| 種別 | 記録原理 | 書き換え | 代表用途 |
|---|---|---|---|
| ROM(プレス) | 凹凸ピットを物理成形 | 不可 | 配布・大量複製 |
| 追記(-R/M-DISC) | 色素や無機材を不可逆に変質 | 不可(=WORM) | 長期保存・証跡 |
| 書換(-RE) | 相変化材の結晶/非晶を可逆変化 | 可 | 再利用バックアップ |
追記型の中でも無機材料を使う長寿命ディスク(M-DISC等)は、有機色素の劣化や磁気テープの磁化減衰を避ける狙いで、数十年〜百年級の保存をうたいます。光記録は媒体と読み取りの間に磁気のような経年磁化減衰がないため、適切な環境下では磁気テープより環境変動に強いとされる一方、面密度と容量単価ではテープに及ばず、超大容量より「確実に長く・改竄不能に」を優先する用途に向きます。
ビット単価・寿命・遅延で階層を組む
四軸を踏まえると、各媒体の位置づけは次の表のように整理できます。数値は方式の傾向を示す目安です。
| 媒体 | ビット単価 | アクセス遅延 | 保存寿命の目安 | 待機電力 |
|---|---|---|---|---|
| SSD(フラッシュ) | 高い | マイクロ秒 | 通電前提・無通電は数年 | 常時 |
| HDD | 中 | ミリ秒 | 5年級(要通電・交換) | 常時 |
| テープ(LTO) | 低い | 秒〜分 | 保管環境で15〜30年級 | 保管時ゼロ |
| 光ディスク(WORM) | 中〜低 | 秒(マウント含む) | 数十年〜百年級をうたう | 保管時ゼロ |
この差から階層設計の原則が導けます。遅延がコストを支配する層は上に、単価と寿命がコストを支配する層は下に置く。頻繁に読む作業データはSSD/HDDのホット層へ、めったに読まないが長く残す監査ログ・科学データ・メディア原本はテープや光ディスクのコールド層へ振り分けます。クラウドの「アーカイブ階層」が取り出しに数時間を要し料金も安いのは、その裏側がまさにこうしたオフライン媒体だからです。
ランサムウェアはオンラインで到達できるストレージを狙います。テープや光ディスクをドライブから抜いて棚に戻した状態は物理的にネットワークから切り離されたエアギャップであり、暗号化マルウェアが書き換えられません。WORM媒体ならオンライン中でも上書き不能です。バックアップの「3つの複製・2種の媒体・1つはオフサイト」原則で、オフライン媒体が依然として推奨される理由がここにあります。RAIDの冗長化は機器故障には強くても、論理的破壊や暗号化には無力である点と対になる考え方です。
「LTOは線形蛇行(サーペンタイン)記録で折り返しながら全幅を埋める」「テープはシーケンシャル媒体ゆえ遅延は秒〜分」「ライブラリは容量=スロット数・性能=ドライブ台数で独立拡張」「LTFSはインデックス+データの2区画でテープをファイルシステムとして公開するオープン標準」「WORMは媒体側で上書きを拒否し改竄不能を保証」——この対応が頻出です。アーカイブ階層は単価・寿命・遅延・耐改竄の優先度で媒体を割り当てる、という枠組みで覚えると整理しやすくなります。
まとめ
- アーカイブ設計はビット単価・保存寿命・アクセス遅延・耐改竄の四軸のトレードオフであり、層ごとに媒体を割り当てる作業に帰着する。
- LTOテープはテープを往復させる線形蛇行記録で全幅を埋め、サーボ補正とread-while-writeで信頼性を確保するが、シーケンシャル媒体ゆえ遅延は秒〜分になる。
- テープライブラリはスロット(容量)とドライブ(性能)を独立に拡張でき、棚のカートリッジは無電力で保管できる。
- LTFSはテープをインデックス+データの2区画に分けてファイルシステムとして公開し、ベンダ非依存の長期保存・データ交換を可能にする。
- WORM/光ディスクは媒体側で改竄を防ぎ、エアギャップと併せてランサムウェア耐性のあるコールドアーカイブ層を形成する。
低単価・長寿命・オフライン保管という強みで、テープと光ストレージはアーカイブ最下層に残り続けます。上位層のストレージI/Oパスやストレージインターフェースの系譜と併読すると、ホットからコールドまでのストレージ階層全体の役割分担が立体的に見えてきます。
CPU/メモリ/ディスク Article
テープと光ストレージの原理 ─ 長期保存とアーカイブ階層を実務で読む
TL;DRは入口です。実際に選ぶ・使う段階では、何を解決するか、何と比較するか、導入後にどこで詰まるかまで見る必要があります。
解決すること
テープ
比較で見る軸
難易度: advanced / カテゴリ: CPU/メモリ/ディスク / タグ数: 6
導入後に効く点
LTFSはテープを2区画に分けインデックスをファイルシステムとして公開し、テープをUSBメモリのように扱えるオープン標準のアーカイブ交換形式である。
先に潰すリスク
用語だけ覚えても、設計・実装・運用でどこに効くかを確認しないと判断を誤る。
- 難易度
- advanced
- カテゴリ
- CPU/メモリ/ディスク
- タグ数
- 6
判断チェックリスト
- 自社の用途が「テープ / LTO」に近いか確認する。
- 強みである「LTOテープは細い磁気テープを往復させながら多数トラックを線形に蛇行記録し、テープ走行中だけ読み書きできるためアクセス遅延は秒〜分単位になる。」が本当に評価軸になるか確認する。
- 注意点の「用語だけ覚えても、設計・実装・運用でどこに効くかを確認しないと判断を誤る。」を運用で吸収できるか確認する。
- 公開値や仕様値は、対象プラン・対象機種・対象リージョンまで確認する。
- 既存システム、ID、ネットワーク、監視、バックアップとの接続方法を先に洗い出す。
- 小さく試してから、本番移行、権限設計、障害時手順、コスト監視を決める。