データセンター給電アーキテクチャ深掘り:N+1/2N/分散冗長と単一障害点
受電からラックまでの電力系統を単線結線図として読み解き、N+1・2N・分散冗長の違いと「保守中にどこまで耐えるか」を一気に判断できるようになります。
- 1.電力系統は 受電→変圧→ATS→UPS→PDU→ラックPDU の直列パスで、冗長は各段で別々に効くため弱い段がボトルネックになる。
- 2.N+1は予備1台で1故障に耐えるが保守と故障が重なると無冗長、2Nは系統を丸ごと二重化しA/B独立給電で保守中も冗長を維持する。
- 3.分散冗長(N+1相当を共有母線で実現)は2Nより設備効率が高く、Tier IIIは保守時冗長、Tier IVは故障時もフォールトトレラントを要求する。
データセンター給電は「直列パスの最弱段」で決まる
データセンターの可用性を語るとき、サーバーの台数やネットワークの二重化に目が行きがちですが、最終的に IT 機器が落ちるか否かは 電力が途切れずラックまで届くか にかかっています。商用電源からサーバーの電源ユニット(PSU)までは、いくつもの機器を 直列に 通過します。直列パスである以上、どこか一段でも単一障害点(SPOF: Single Point Of Failure)が残れば、その一点で全体が落ちます。冗長設計とは、この直列パスの各段をどう二重化・予備化するかの設計です。
電力の物理的な基礎(電圧・電流・抵抗の関係、直列と並列の振る舞い)は /power/circuit-fundamentals/ を前提とします。受電からトランスまでの上流は三相交流で、相バランスや力率が効率を左右する点は /power/three-phase-power/ を参照してください。
電力系統の単線結線図(SLD)を文章で読む
実務では系統全体を 単線結線図(SLD: Single Line Diagram) で表します。三相の3本を1本の線として簡略化し、機器を上流から下流へ並べた図です。ここでは図の代わりに、2N 構成の代表的なパスを擬似的な系統図として示します。各機器の役割を押さえることが、冗長度を読む第一歩です。
2N構成の単線結線図(A系・B系を完全独立に二重化)
商用電源(Utility) 発電機(Generator)
│ │
┌────┴─────┐ ┌─────┴────┐
受電盤A 受電盤B ←─ 別変電所/別フィーダが理想(共通上流を避ける)
│ │
変圧器A 変圧器B 高圧→低圧(例 6.6kV→210V)
│ │
ATS-A ◀──────┼──────▶ ATS-B 自動切替器(商用↔発電機)
│ │
UPS-A UPS-B 蓄電(バッテリ/フライホイール)で瞬断を吸収
│ │
分電盤A 分電盤B
│ │
PDU-A PDU-B フロア/列単位の配電
│ │
ラックPDU-A ラックPDU-B ラック内の最終分岐(A/B 2系統を各ラックへ)
└────┬───────┘
▼
デュアル電源サーバー(PSU を2台、A系とB系へ別々に接続)
ポイントは末端です。サーバーが 2台の PSU を持ち、片方を A 系ラック PDU、もう片方を B 系ラック PDU へ繋ぐことで、A 系を丸ごと止めてもサーバーは生き続けます。逆に PSU が1台しかない機器を2N 系統に挿しても、その機器自身が SPOF になります。冗長は「最も冗長度の低い段」で決まる、という原則がここに表れます。
A 系と B 系を分けても、両系が同じ商用フィーダ・同じ変電所・同じ発電機・同じ冷却系に依存していれば、その共通点が単一障害点として残ります。これをコモンモード故障と呼びます。真の 2N は受電フィーダ・発電機・UPS・冷却まで遡って独立させて初めて成立します。SLD を描く目的の半分は、この「線がどこで合流するか」を可視化することにあります。
N / N+1 / 2N / 分散冗長 の構成を比較する
冗長方式の名前は「同じ役割の機器を何台用意し、何台までの故障に耐えるか」を表します。負荷を賄うのに必要な台数を N とします。
| 方式 | 台数の考え方 | 耐えられる故障 | 保守時の冗長 | 設備効率 |
|---|---|---|---|---|
| N | 必要ちょうど(予備なし) | 0台(1故障で停止) | なし | 最高(無駄ゼロ) |
| N+1 | 必要台数+予備1台 | 同時1台まで | 保守中は実質N(無冗長) | 高い |
| 2N | 必要台数を丸ごと二重化 | 片系全損まで | 片系保守中も他系で冗長維持 | 低い(50%稼働) |
| 分散冗長(DR) | 共有母線で予備を全系で按分 | 1ブロック分まで | 1ブロック保守中も継続 | 中(2Nより良い) |
N+1 は最も費用対効果が高い方式です。例えば負荷に UPS が3台必要なら4台用意し、どれか1台が壊れても残り3台で賄えます。ただし 故障と保守が重なると弱い。1台を計画停止して点検している最中に別の1台が故障すると、稼働は N−1 となり負荷を支えきれません。N+1 の本質的な弱点はここにあります。
2N は系統そのものを A・B 2系統に分け、それぞれが単独で全負荷を賄えるよう作ります。片系を丸ごと保守で落としても、もう一方が全負荷を持つため 保守中でも冗長度が保たれます(正確には保守中は片系のみなので、その間の追加故障には弱いという議論はありますが、独立した2系統という構造的強さが効きます)。代償は設備効率で、平常時は各系が約50%の負荷しか持たないため、容量の半分が待機に回ります。
分散冗長(DR)── 2N の効率を救う折衷案
分散冗長(Distributed Redundancy) は、専用の予備を1系統まるごと持つ代わりに、予備容量を全系で共有母線を介して按分する 方式です。例えば負荷ブロックを A・B・C の3系統に分け、各系統の容量を「2ブロック分」に取ると、どれか1系統が落ちても残る2系統で3ブロック分の容量を確保できます。
分散冗長(3系統で1ブロック故障に耐える例)
必要負荷 = 3ブロック分
系統数 = 3(A,B,C)
各系容量 = 2ブロック分(= 必要負荷の 2/3 ずつ多めに)
正常時: A,B,C が各1ブロック分を負担(各系は容量の50%稼働)
C故障時: A,B が C の負荷を引き取り、各1.5ブロック分(容量の75%)
→ 各系の上限2ブロック以内に収まり継続可能
設備効率の比較(必要負荷3ブロックを賄うのに必要な総容量):
2N → 6ブロック分(3 × 2系統) …稼働率50%
分散冗長 → 6ブロック分だが系統数を増やすほど…
分散冗長(4系統,各容量1.33) → 5.33ブロック分(稼働率75%)
系統数を増やすほど、1系統故障時に他系へ振り分ける増分が小さくなり、各系を高い稼働率で運用できます。これが分散冗長が「2N に近い可用性を、2N より少ない設備で」実現できる理由です。代償は構成の複雑さで、共有母線(キャッチャーバス(catcher bus)や STS: Static Transfer Switch を介した切替)の設計と保護協調が難しくなります。
ここでの冗長議論は、UPS が常時インバータ給電するオンライン(ダブルコンバージョン)方式を暗黙の前提にしています。整流→蓄電→インバータと一度直流を介すため、商用の瞬断・電圧変動を蓄電側が完全に吸収し、出力が途切れません。冗長度の議論は「途切れない給電を何重に持つか」なので、ラインインタラクティブ等の切替時間がある方式では切替の瞬断そのものが別のリスクになります。
単一障害点と保守時冗長度の比較
可用性を評価する実務的な物差しは2つあります。故障時に耐えられるか(Fault Tolerance) と 保守中に冗長を保てるか(Concurrent Maintainability) です。Uptime Institute の Tier 分類はまさにこの2軸で定義されます。
| 観点 | N+1 | 2N | 分散冗長(DR) |
|---|---|---|---|
| 代表的SPOF | 保守中の母線・予備消費後の構成 | 共通上流(コモンモード)のみ | 共有母線・STSの故障 |
| 保守時冗長 | 失う(実質N運転) | 保つ(他系が全負荷) | 保つ(残系で吸収) |
| 故障時挙動 | 1故障まで吸収 | 片系全損まで吸収 | 1ブロック分まで吸収 |
| 相当Tier目安 | Tier II〜III | Tier IV | Tier III〜IV |
| 主なコスト要因 | 予備1台分 | 全系二重化 | 母線・切替設備 |
「Tier III と Tier IV の違いは?」への正答は冗長台数ではなく能力です。Tier III は Concurrently Maintainable(全要素を無停止で保守できる)が、保守中に故障が重なると停止しうる。Tier IV は Fault Tolerant(任意の1故障が起きても自動で継続)で、コモンモード故障を排除した独立2系統(コンパートメント化)を要求します。N+1 か 2N かという「台数」ではなく、保守可能性と耐故障性という「能力」で線引きされる点が頻出の落とし穴です。
ラック分岐とブレーカ協調 ── 末端の落とし穴
上流をいくら二重化しても、末端のラック PDU とブレーカ設計を誤ると局所的な SPOF が生まれます。代表例が ブレーカトリップの巻き添え です。
- A 系ラック PDU の分岐ブレーカが過電流でトリップすると、その分岐に繋いだ機器の A 系給電が消える。デュアル電源機器なら B 系で生き残るが、シングル電源機器はそこで落ちる。
- 上位ブレーカと下位ブレーカの 保護協調(選択遮断) が取れていないと、末端の1故障で上位ブレーカまで巻き込んで広範囲が停電する。下位ほど早く・小さく切れるよう定格と時限を階段状に設計する必要がある。
- ラック単位の負荷を A/B で偏らせると、片系故障時に残系へ全負荷が乗った瞬間にブレーカ容量を超える。各系を50%以下に抑える(2N の場合)運用ルールが、机上の冗長を実効的な冗長にする。
電力が熱に変わる以上、給電容量の設計は発熱・冷却の設計と不可分です。ラック当たりの電力密度をどう放熱するかは /power/power-thermal-design/ で扱います。給電と冷却の両方が冗長でなければ、一方のコモンモード故障が他方を道連れにします。
まとめ
- データセンター給電は 受電→変圧→ATS→UPS→PDU→ラックPDU→PSU の直列パス であり、冗長度は最弱段で決まる。SLD を描く目的は「線がどこで合流するか(コモンモード)」の可視化にある。
- N+1 は予備1台で1故障に耐えるが、保守と故障が重なると無冗長に陥る費用対効果型。
- 2N は系統を丸ごと二重化し、A/B 独立給電で保守中も冗長を保つ。代償は約50%稼働の設備効率。
- 分散冗長(DR) は予備を共有母線で全系に按分し、2N に近い可用性をより高い稼働率で実現する折衷案。
- Tier III/IV の本質は台数ではなく 保守可能性(Concurrently Maintainable)と耐故障性(Fault Tolerant) という能力。末端のブレーカ保護協調と負荷バランスまで詰めて初めて、机上の冗長が実効的になる。
- 前提となる電気の基礎は /power/circuit-fundamentals/、上流の三相給電は /power/three-phase-power/、発熱・冷却との連動は /power/power-thermal-design/ を参照。
電源 Article
データセンター給電アーキテクチャ深掘り:N+1/2N/分散冗長と単一障害点を実務で読む
TL;DRは入口です。実際に選ぶ・使う段階では、何を解決するか、何と比較するか、導入後にどこで詰まるかまで見る必要があります。
解決すること
データセンター
比較で見る軸
難易度: advanced / カテゴリ: 電源 / タグ数: 6
導入後に効く点
N+1は予備1台で1故障に耐えるが保守と故障が重なると無冗長、2Nは系統を丸ごと二重化しA/B独立給電で保守中も冗長を維持する。
先に潰すリスク
用語だけ覚えても、設計・実装・運用でどこに効くかを確認しないと判断を誤る。
- 難易度
- advanced
- カテゴリ
- 電源
- タグ数
- 6
判断チェックリスト
- 自社の用途が「データセンター / 電源」に近いか確認する。
- 強みである「電力系統は 受電→変圧→ATS→UPS→PDU→ラックPDU の直列パスで、冗長は各段で別々に効くため弱い段がボトルネックになる。」が本当に評価軸になるか確認する。
- 注意点の「用語だけ覚えても、設計・実装・運用でどこに効くかを確認しないと判断を誤る。」を運用で吸収できるか確認する。
- 公開値や仕様値は、対象プラン・対象機種・対象リージョンまで確認する。
- 既存システム、ID、ネットワーク、監視、バックアップとの接続方法を先に洗い出す。
- 小さく試してから、本番移行、権限設計、障害時手順、コスト監視を決める。