PUE/電力効率の指標体系:PUE・DCiE・WUE・損失の積み上げ
PUEが何を測り何を測らないかを境界から押さえ、UPS・PDU・PSUの変換効率を掛け算で積み上げて、AIラック高密度化でどこに電力が消えるかを数値で説明できるようになります。
- 1.PUEは 施設総電力 ÷ IT機器電力 で1.0が理想、DCiEはその逆数(%)。測定境界(IT電力をどこで測るか)を揃えないと比較は無意味になる。
- 2.実効効率は各変換段の効率の積で、UPS×変圧×PDU×PSUを掛けると 商用1Wがチップに届く前に十数%以上が熱として失われる。
- 3.AIラックは1ラック数十kWに達し、冷却がPUEの主因となるため、液冷・高電圧直流配電・PSU高効率化で非IT電力(分母外の損失)を削るのが定石。
PUE は「IT に使われない電力の倍率」を測る
データセンターの電力効率を語る共通言語が PUE(Power Usage Effectiveness) です。定義は単純で、施設全体が消費する総電力を、そのうち IT 機器が消費する電力で割った比です。
PUE = 施設総電力(Total Facility Power) ÷ IT機器電力(IT Equipment Power)
施設総電力 = IT機器電力 + 冷却 + 受変電損失 + 照明 + その他補機
⇒ PUE = 1.0 が理想(IT 以外に1Wも使わない)
⇒ PUE = 1.5 なら IT が1W使うたびに施設全体では1.5W必要
PUE は 1.0 が下限 で、これを下回ることは物理的にありません(IT 以外の消費がゼロでも1.0)。逆数を百分率にしたものが DCiE(Data Center infrastructure Efficiency) で、DCiE = IT機器電力 ÷ 施設総電力 × 100。PUE 1.5 は DCiE 約67%、PUE 2.0 は DCiE 50%に対応します。両者は同じ情報を表裏で表しているだけで、近年は PUE が事実上の標準です。
PUE の数字が独り歩きしやすいのは、分母の「IT 機器電力をどこで測るか」が現場で揺れるためです。The Green Grid は測定点を区別しており、UPS 出力で測る Level 1(粗い)、PDU 出力で測る Level 2、ラック PDU の機器入力(IT 機器の電源コード直前)で測る Level 3(最も厳密)があります。さらに、瞬間値か年間積算(電力量 kWh ベース)かでも値が変わります。下流で測るほど分母が小さくなり PUE は大きく見える一方、上流で測れば配電損失を IT 側に押し込んで PUE を実態より良く見せられます。他社比較や年次比較では、必ず測定点と積算期間をそろえて読みます。
変換段ごとの効率を「積」で積み上げる
商用電源が IT 負荷のチップに届くまでには複数の電力変換段を直列に通ります。各段に効率があり、全体の実効効率は各段効率の積 になります。ここが PUE と並ぶもう一つの損失の源です。給電系統全体の段構成(受電→変圧→ATS→UPS→PDU→ラックPDU→PSU)は /power/datacenter-power-architecture/ で扱った直列パスそのものです。
商用1W が CPU/GPU に届くまでの効率積(代表値)
受変電(変圧器) η ≈ 0.99
UPS(ダブルコンバージョン) η ≈ 0.95 ← 整流→蓄電→インバータで二度変換
PDU/配電 η ≈ 0.99
サーバー PSU(AC→DC) η ≈ 0.94
基板上 VRM(DC→DC, 12V→1V級) η ≈ 0.88
総合効率 = 0.99 × 0.95 × 0.99 × 0.94 × 0.88 ≈ 0.77
⇒ 商用1W のうち約0.77W が実演算に届き、約0.23W は各段で熱になる
掛け算なので、どれか1段を1ポイント改善するより、最も悪い段(上の例では VRM や UPS)を集中的に改善するほうが効きます。各変換段の損失は最終的にすべて熱になり、それを排出するために冷却電力(=PUE の分子側の非IT電力)がさらに必要になる、という二重の損失構造に注意します。UPS の変換損失を減らすため、平常時はインバータを介さず商用を素通しし異常時のみ蓄電に切り替える エコモード(ECO mode) を使う運用もありますが、切替時の瞬断リスクと引き換えになります。
PSU の効率は負荷率で大きく動く
サーバー PSU(AC→DC)の効率は固定値ではなく 負荷率に依存 します。80 PLUS 認証は代表的な負荷点(10/20/50/100%)での効率を規定し、Bronze から Titanium までグレード化しています。
| 80 PLUS グレード | 20%負荷 | 50%負荷 | 100%負荷 |
|---|---|---|---|
| Bronze | 82% | 85% | 82% |
| Gold | 87% | 90% | 87% |
| Platinum | 90% | 92% | 89% |
| Titanium | 92%(10%負荷でも90%) | 94% | 90% |
効率は中負荷(50%付近)で最大、軽負荷と全負荷で落ちる山なりの曲線を描きます。ここに冗長給電(2N でデュアル PSU)の落とし穴があります。A/B 両系に PSU をぶら下げると各 PSU は約50%負荷で動き、ちょうど効率の良い領域に入る一方、片系を過度に空ける設計だと各 PSU が軽負荷側に落ちて効率が悪化します。なお PSU は AC を扱うため力率と高調波も問題になり、入力側には PFC(力率改善)が必須です。皮相・有効・無効の関係は /power/power-factor-reactive-power/ を前提とします。
WUE ── 水の効率という第二の物差し
PUE が電力の物差しなら、WUE(Water Usage Effectiveness) は水の物差しです。WUE = 年間使用水量(L) ÷ IT機器電力量(kWh) で、単位は L/kWh。蒸発冷却(クーリングタワー)は気化熱で熱を捨てるため PUE を下げやすい一方、大量の水を蒸発で消費するので WUE が悪化します。
外気・蒸発冷却に頼ると冷却電力が減り PUE は改善しますが、蒸発させる水(WUE)が増えます。逆に水を使わない空冷チラーは WUE をゼロに近づけられますが、コンプレッサ動力で PUE が悪化します。電力と水は別資源なので、PUE だけを最適化すると水使用が見えなくなります。立地(気候・水資源の制約)に応じて両指標を同時に見るのが現代の設計で、CO2 排出を表す CUE(Carbon Usage Effectiveness)まで含めて評価する流れもあります。
AI ラック高密度化がもたらす制約
従来の汎用サーバーラックは 1 ラック数 kW〜十数 kW でしたが、GPU を満載した AI ラックは 数十 kW、最新世代では1ラック 100kW 超 に達します。電力密度の急上昇は、給電と冷却の両方に新しい制約を課します。
- 空冷の限界:空気の比熱と風量には上限があり、1ラック 30〜50kW 級を超えると空冷だけでは熱を運びきれません。空気の物理的限界(伝導・対流・放射の支配領域)は /power/heat-transfer-cooling/ のとおりで、高密度域では発熱源に近い液体へ熱を移す 液冷(コールドプレート直接液冷/液浸) が前提になります。
- 冷却が PUE の主因:高密度ラックでは IT 電力に対する冷却電力の比率が支配的になります。液冷はチップから直接熱を奪い、ファン動力と冷却ロスを大幅に削るため、空冷で PUE 1.4〜1.6 だった施設が液冷で 1.1 前後まで下がる例があります。PUE 改善とは突き詰めれば 分子の非IT電力(特に冷却)をいかに削るか です。
- 配電損失の顕在化:1ラック数十 kW を低電圧(例 208V/12V)で配ると電流が巨大になり、
P_loss = I^2 Rの銅損が無視できません(電流が2倍なら損失は4倍)。そこで 高電圧直流(HVDC)配電 やラック内 48V バスバーが採用されます。電圧を上げて同電力を低電流で運べば I^2R 損が下がり、変換段も1つ減らせます。
高密度化への PUE 改善レバー(分子=非IT電力を削る順)
1. 冷却方式 空冷 → 液冷(コールドプレート/液浸) …最大の削減余地
2. 配電電圧 低電圧大電流 → HVDC/48Vバスバー …I^2R 銅損を削減
3. UPS 効率 ダブルコンバージョン → エコモード/Li電池 …変換損を削減
4. PSU グレード Gold → Titanium、負荷率を50%付近へ …PSU 損を削減
5. 外気/排熱再利用 自由冷却・廃熱の暖房転用 …冷却電力を削減
「PUE を 1.0 未満にできるか?」への正答は 原理上できない。定義が 施設総電力÷IT電力 で、施設総電力は必ず IT 電力以上だからです(廃熱を外部で再利用しても PUE の定義式は変わらず、それは ERE: Energy Reuse Effectiveness という別指標で評価します)。もう一つの頻出は「PUE が同じなら効率も同じか?」── 否。測定境界(Level 1〜3)と積算期間(瞬時 vs 年間)が違えば同じ 1.3 でも中身は別物です。PUE は施設インフラの相対効率であって、IT 機器自体の演算効率(性能あたり電力)は測らない点も外せません。
まとめ
- PUE = 施設総電力 ÷ IT機器電力、理想は 1.0、下回らない。逆数(%)が DCiE。比較には測定境界(Level 1〜3)と積算期間をそろえることが必須。
- 実効効率は 各変換段(UPS×変圧×PDU×PSU×VRM)の積 で決まり、商用1W のうち2割超がチップに届く前に熱化する。最弱段を狙って改善するのが効率的。
- PSU 効率は負荷率依存で中負荷が最良。80 PLUS のグレードと、デュアル給電時の負荷率設計が実効効率を左右する。
- WUE は水の物差しで、蒸発冷却は PUE と WUE がトレードオフ。電力・水・炭素(CUE)を同時に見るのが現代の評価。
- AI ラックの高密度化(1ラック数十〜100kW超)では 冷却が PUE の主因。液冷・HVDC/48V配電・高効率 PSU・自由冷却で分子の非IT電力を削るのが定石。
- 前提となる給電系統は /power/datacenter-power-architecture/、冷却の物理は /power/heat-transfer-cooling/、PSU 入力の力率は /power/power-factor-reactive-power/ を参照。
電源 Article
PUE/電力効率の指標体系:PUE・DCiE・WUE・損失の積み上げを実務で読む
TL;DRは入口です。実際に選ぶ・使う段階では、何を解決するか、何と比較するか、導入後にどこで詰まるかまで見る必要があります。
解決すること
データセンター
比較で見る軸
難易度: advanced / カテゴリ: 電源 / タグ数: 6
導入後に効く点
実効効率は各変換段の効率の積で、UPS×変圧×PDU×PSUを掛けると 商用1Wがチップに届く前に十数%以上が熱として失われる。
先に潰すリスク
用語だけ覚えても、設計・実装・運用でどこに効くかを確認しないと判断を誤る。
- 難易度
- advanced
- カテゴリ
- 電源
- タグ数
- 6
判断チェックリスト
- 自社の用途が「データセンター / PUE」に近いか確認する。
- 強みである「PUEは 施設総電力 ÷ IT機器電力 で1.0が理想、DCiEはその逆数(%)。測定境界(IT電力をどこで測るか)を揃えないと比較は無意味になる。」が本当に評価軸になるか確認する。
- 注意点の「用語だけ覚えても、設計・実装・運用でどこに効くかを確認しないと判断を誤る。」を運用で吸収できるか確認する。
- 公開値や仕様値は、対象プラン・対象機種・対象リージョンまで確認する。
- 既存システム、ID、ネットワーク、監視、バックアップとの接続方法を先に洗い出す。
- 小さく試してから、本番移行、権限設計、障害時手順、コスト監視を決める。