プラットフォーム接続トポロジ図 ─ CPU・チップセット・I/O
なぜ同じNVMeでもCPU直結とチップセット経由で速度が変わるのか。CPU直結のPCIe・メモリと、DMI経由のSATA/USB/LANの経路と帯域をトポロジ図で整理し、どこがボトルネックかを一目で見抜けます。
- 1.現代のPCはCPUが直接ぶら下げる高速I/O(PCIeレーン群とメモリチャネル)と、チップセット配下にまとめた低速・多数I/O(SATA・USB・LAN等)の二層構造で、両者はDMIという1本のリンクで連結される。
- 2.CPU直結のGPU(x16)やNVMe(x4)はルートコンプレックスへ直接届くが、チップセット配下の全デバイスはDMI(実体はPCIe x4〜x8相当)を共有するため、ここが構造的なボトルネックになり得る。
- 3.ボトルネックの位置は「どこを共有しているか」で決まる。各デバイスの要求帯域とDMIの実効帯域を突き合わせれば、なぜ特定M.2を使うとSATAが消えるか、同時転送で頭打ちになるかが説明できる。
なぜ「CPU直結」と「チップセット経由」を区別するのか
現代のPCの内部配線は、見かけ上たくさんのコネクタが並んでいても、論理的には二層構造です。上層はCPUが自分のピンから直接ぶら下げる高速・少数のI/O、下層はチップセット(PCH/FCH)がまとめて束ねる低速・多数のI/Oです。同じ規格のデバイスでも、どちらの層にぶら下がるかで実効性能が変わります。
この区別が生まれた理由は単純で、CPUのピン数とダイ面積が有限だからです。CPUが提供できるPCIeレーンやメモリチャネルの本数には上限があり、全I/Oを直結すると配線が爆発します。そこで「帯域とレイテンシが効くものだけ直結し、残りは1本のリンクの先に集約する」という役割分担にした。集約役がチップセットで、CPUとチップセットを結ぶ専用リンクがIntelのDMI(Direct Media Interface)、AMD相当がチップセット用リンクです。
かつてのノースブリッジ(メモリ・PCIe担当)はCPUダイに吸収され、現在はPCIeのルートコンプレックスとメモリコントローラがCPU内にあります。残ったサウスブリッジ機能がチップセット1個に集約された。だから「CPU直結=旧ノースブリッジ領域」「チップセット経由=旧サウスブリッジ領域」と読み替えると歴史的な経緯が見通せます。
トポロジ図 ─ どこが何に直結しているか
経路を配線図として描きます。実線が物理リンク、括弧内がリンク幅/規格です。
[DRAM DIMM] [DRAM DIMM]
| |
メモリチャネルA メモリチャネルB ← CPU直結・最速
\ /
+-------[ CPU ]------+
| (ルートコンプレックス) ← 旧ノースブリッジ領域
PCIe x16 | | | PCIe x4
| | |
[ GPU ] | [ NVMe SSD ] ← CPU直結PCIe
|
DMI (x4〜x8相当の1本) ← ここが集約点=隘路候補
|
+----[ チップセット ]----+ ← 旧サウスブリッジ領域
| | | |
SATA×複数 USB×複数 有線LAN 追加PCIe(NVMe/拡張)
| | | |
[HDD/SSD] [周辺機器] [NIC] [M.2など] ← 全部DMIを共有
読み取るべき要点は3つです。第一に、メモリとGPU・主NVMeはCPUに直結し、ルートコンプレックスへ最短で届く。第二に、SATA・USB・LAN・追加M.2はすべてチップセット配下で、CPUへ出るには必ずDMIを通る。第三に、DMIは1本であり、チップセット配下の全トラフィックがこの1本に集約される。トポロジ上の「合流点」がDMIだと一目で分かります。
帯域を数字で突き合わせる
各経路の代表的な実効帯域(片方向)を並べます。世代・製品で変わるため桁の感覚を掴むための概数です。
| 経路 | 規格の例 | 実効帯域(片方向・目安) | 接続先 |
|---|---|---|---|
| メモリチャネル | DDR5-6000 ×2ch | 約 90 GB/s | CPU直結 |
| PCIe x16 (Gen5) | GPU向け | 約 63 GB/s | CPU直結 |
| PCIe x4 (Gen5) | 主NVMe向け | 約 16 GB/s | CPU直結 |
| DMI 4.0 ×8相当 | CPU⇔チップセット | 約 16 GB/s | 集約リンク |
| SATA III | 1ポート | 約 0.6 GB/s | チップセット配下 |
| USB 3.2 Gen2 | 1ポート | 約 1.2 GB/s | チップセット配下 |
| 有線LAN 2.5GbE | 1ポート | 約 0.3 GB/s | チップセット配下 |
注目点は、DMIの帯域がチップセット配下デバイスの合計要求を必ずしも満たさないことです。たとえばDMIが約16GB/sのとき、チップセット側でNVMe(x4で約16GB/s)・USB3.2複数ポート・2.5GbE・SATA複数台を同時にフル稼働させれば、合計要求は容易にDMIの容量を超えます。CPU直結のNVMeが約16GB/sを単独で享受できるのに対し、チップセット配下のNVMeは他のI/Oと帯域を分け合う——これが「同じNVMeでも遅くなる」理由です。
DMIは独自バスに見えて、物理層・プロトコルはPCIeとほぼ同一です。世代で DMI 3.0 = PCIe 3.0 x4相当、DMI 4.0 = PCIe 4.0 x8相当 のように対応し、実効帯域もPCIeの式(レーン数 × 転送レート × 符号化効率)で見積もれます。つまりDMIは「チップセットへ専用に割り当てたPCIeリンク」と理解すれば、帯域計算が他のPCIe経路と同じ土俵に乗ります。
ボトルネックの特定 ─ 共有点を探す手順
性能問題の切り分けは、経路上のどこを共有しているかを辿るだけで体系化できます。次の擬似コードのように判定します。
function ボトルネック判定(デバイスA, デバイスB):
経路A = ルート探索(A → CPU) # 通過するリンクの列
経路B = ルート探索(B → CPU)
共有 = 経路A ∩ 経路B # 集合の積。共通して通るリンク
if 共有 が空:
return "干渉しない(各リンク専有)"
else:
最弱リンク = 共有の中で帯域が最小のもの
if A.要求帯域 + B.要求帯域 > 最弱リンク.帯域:
return f"{最弱リンク} で頭打ち(飽和)"
else:
return "共有はあるが容量内"
集合の積 経路A ∩ 経路B が {DMI} を含めば、AとBはDMIで競合します。GPU(直結x16)とNVMe(直結x4)は共有リンクが空集合なので互いに干渉しませんが、チップセット配下の2台のNVMeは双方ともDMIを通るため、合計がDMI帯域を超えた瞬間に頭打ちになります。「合流点の最弱リンク」が律速という、メモリ階層やネットワークと同じ普遍的な原則です。
チップセット経由はDMIというPCIeリンクを1ホップ余計に通るため、帯域だけでなくレイテンシも増えます。要求がCPU→DMI→チップセット→デバイスと往復し、各ホップでパケットのルーティングとシリアライズが入る。帯域に余裕があっても、小さなランダムI/Oの応答時間はCPU直結NVMeの方が一貫して有利です。NVMe SSDの内部の速さを活かすなら直結スロットへ挿すのが定石です。
レーン資源の配分という制約
CPUが直結できるPCIeレーンの総数は有限(例: デスクトップで20〜28本程度)で、その内訳はおおむね**GPU向けx16・主NVMe向けx4・チップセット用DMI(x4〜x8相当)**に固定的に割り当てられます。残りをどう配るかがマザーボードの設計です。
- GPUを2枚挿すと各x8に落ちる: x16の16レーンを2分割するため。総レーン数が増えるわけではない。
- 特定のM.2を使うとSATAが無効化される: そのM.2スロットがSATAと物理レーン/信号を共有しており、排他構成だから。
- 3枚目以降のNVMeはチップセット配下: CPU直結のx4枠は1〜2本しかなく、超過分はDMIの先へ回るため帯域を共有する。
これらは一見ばらばらの仕様制限に見えますが、すべて有限なレーン資源の分割という1つの原因の表れです。トポロジ図の上で「このデバイスはどの枠を消費し、どのリンクを共有するか」を辿れば、マザーボードのブロック図を読まなくても挙動を予測できます。
「CPU直結=メモリ+PCIe(GPU・主NVMe)、チップセット経由=SATA/USB/LAN/追加M.2」「両者をつなぐDMIは実体がPCIe x4〜x8相当の1本で集約点=ボトルネック候補」「干渉の有無は共有リンクの有無で決まり、律速は共有区間の最弱リンク」「マザーの排他仕様は有限レーン資源の分割の表れ」の4点が核心です。要求帯域の合計とDMI実効帯域を突き合わせて飽和を判定できると応用に強くなります。
まとめ
- PCのI/Oは、CPU直結の高速・少数(メモリ・GPU・主NVMe)と、チップセット配下の低速・多数(SATA・USB・LAN・追加M.2)の二層構造で、両者はDMI1本で連結される。
- DMIは実体がPCIe x4〜x8相当のリンクで、チップセット配下の全トラフィックがここに集約されるため、合計要求が容量を超えると構造的ボトルネックになる。
- 2デバイスが干渉するかは経路の共有リンクの有無で決まり、律速は共有区間の最弱リンク。CPU直結同士は専有のため干渉せず、チップセット配下同士はDMIで競合する。
- マザーボードの排他仕様(SLI時x8化、M.2とSATAの排他など)は、有限なPCIeレーン資源を分割している直接の帰結であり、トポロジ図を辿れば予測できる。
経路の最小単位であるレーンとパケットの中身はPCI Expressの原理、直結が効く理由の裏にある速度差はメモリ階層図が掘り下げます。データがどこをどう流れて計算へ届くかは、キャッシュとメモリ階層と併せて見ると全体像が掴めます。
CPU/メモリ/ディスク Article
プラットフォーム接続トポロジ図 ─ CPU・チップセット・I/Oを実務で読む
TL;DRは入口です。実際に選ぶ・使う段階では、何を解決するか、何と比較するか、導入後にどこで詰まるかまで見る必要があります。
解決すること
プラットフォーム
比較で見る軸
難易度: advanced / カテゴリ: CPU/メモリ/ディスク / タグ数: 6
導入後に効く点
CPU直結のGPU(x16)やNVMe(x4)はルートコンプレックスへ直接届くが、チップセット配下の全デバイスはDMI(実体はPCIe x4〜x8相当)を共有するため、ここが構造的なボトルネックになり得る。
先に潰すリスク
用語だけ覚えても、設計・実装・運用でどこに効くかを確認しないと判断を誤る。
- 難易度
- advanced
- カテゴリ
- CPU/メモリ/ディスク
- タグ数
- 6
判断チェックリスト
- 自社の用途が「プラットフォーム / チップセット」に近いか確認する。
- 強みである「現代のPCはCPUが直接ぶら下げる高速I/O(PCIeレーン群とメモリチャネル)と、チップセット配下にまとめた低速・多数I/O(SATA・USB・LAN等)の二層構造で、両者はDMIという1本のリンクで連結される。」が本当に評価軸になるか確認する。
- 注意点の「用語だけ覚えても、設計・実装・運用でどこに効くかを確認しないと判断を誤る。」を運用で吸収できるか確認する。
- 公開値や仕様値は、対象プラン・対象機種・対象リージョンまで確認する。
- 既存システム、ID、ネットワーク、監視、バックアップとの接続方法を先に洗い出す。
- 小さく試してから、本番移行、権限設計、障害時手順、コスト監視を決める。