TL

VXLAN とオーバーレイネットワークの原理

物理配線をまたいで同じL2を延ばせる仕組みが腑に落ちる。L3の上にL2をトンネル化するVXLANの内部、24ビットVNIによる分離、VTEPとフラッディング、EVPNでのMAC学習までを原理から押さえられる。

応用VXLANオーバーレイEVPNVTEPデータセンター最終更新: 2026-06-21
TL;DR要点だけ先に
  • 1.VXLANはイーサネットフレームをUDP(宛先ポート4789)で包み、L3ネットワークの上にL2セグメントをトンネル化する。VTEPがカプセル化・脱カプセル化を担う。
  • 2.24ビットのVNIでセグメントを識別するため、論理ネットワークは約1677万個まで作れる。802.1Qの12ビット(4094個)の上限を桁違いに超える。
  • 3.宛先MACの位置を学習する手段が課題で、初期方式はマルチキャスト等でBUMトラフィックをフラッディングする。EVPN(BGP)はMAC到達情報をコントロールプレーンで配り、フラッディングを排除する。

なぜ「L2 を L3 の上に乗せる」必要があるのか

データセンターでは、物理的に離れたサーバー間でも同じL2セグメント(同一サブネット・同一ブロードキャストドメイン)に見せたい場面が頻発します。仮想マシンのライブマイグレーションはIPを保ったまま別ラックへ移したいし、マルチテナント環境ではテナントごとに独立したL2を多数用意したい。ところが素のL2は、スパニングツリーで冗長リンクを止める非効率や、MACテーブルとブロードキャストの規模限界を抱え、巨大ファブリックには向きません。

そこで発想を逆転させます。物理網は ルーティングされたL3(IP)ファブリック として安定に作り、その上に L2セグメントをトンネルとして重ねる。下層の物理網を アンダーレイ、その上に論理的に張るネットワークを オーバーレイ と呼びます。VXLAN(Virtual eXtensible LAN, RFC 7348)は、イーサネットフレームをまるごとIPパケットの中に封入してアンダーレイ上を運ぶ、代表的なオーバーレイ方式です。

オーバーレイの本質は「カプセル化」

オーバーレイとは、ある通信の単位(ここではL2フレーム)を別の通信の単位(IP/UDPパケット)の中身として運ぶことです。元のフレームは中継網にとってはただのペイロードで、中継ルータは外側のIPヘッダだけ見て普通に転送します。この封入の階層構造は /network/protocol-encapsulation/ の延長で、VXLANは「L2 over L3」という一段重い封筒を足した形だと捉えられます。

VXLAN カプセル化:フレームを UDP で包む

VXLANは、元のイーサネットフレーム(宛先MAC〜ペイロード、ただし元フレームのFCSは除く)を VXLANヘッダ → UDP → 外側IP → 外側イーサネット の順で包み直します。外側から見れば、これは普通のUDPパケットにすぎません。だからアンダーレイのルータやスイッチはVXLANを一切知らなくてよく、IPで配送できればそれで足ります。

[外側イーサネット] 宛先MAC | 送信元MAC | EtherType=0x0800
[外側IP]          送信元IP=送信VTEP | 宛先IP=受信VTEP
[UDP]             送信元ポート=ハッシュ値 | 宛先ポート=4789
[VXLANヘッダ(8B)] フラグ | 予約 | VNI(24bit) | 予約
[内側イーサネット] 元の宛先MAC | 元の送信元MAC | ...(元フレームそのもの)
[内側ペイロード]   ARP/IP/...(テナントの実トラフィック)

ポイントは2つあります。第一に、UDPの 宛先ポートは 4789 固定(IANA割り当て)で、受信側はこれを見てVXLANと判定します。第二に、UDPの 送信元ポートは内側フレームのハッシュから生成 します。これは中継網のECMP(等コストマルチパス)が、送信元/宛先ポートを含む5タプルでフロー分散するのを利用するためで、内側フローごとに別の送信元ポートを振ることで、外側1組のVTEP間でも複数物理経路へ均等に散らせます。

50バイトのオーバーヘッドが MTU を食う

VXLANは外側イーサ(14)+外側IP(20)+UDP(8)+VXLAN(8)で、IPv4なら 50バイト をフレームに上乗せします(IPv6アンダーレイならさらに増える)。テナントが標準1500バイトのフレームを送ると、外側は1550バイトに膨れ、途中でフラグメントや破棄を招きます。実務ではアンダーレイをジャンボフレーム(例 1600〜9000バイト)にしてこの50バイトを吸収するのが定石です。フレーム長とMTUの関係は /network/mtu/ を参照してください。

24 ビット VNI:論理ネットワークの桁が変わる

VXLANヘッダの中核が VNI(VXLAN Network Identifier) です。24ビット幅で、これがセグメントの識別子になります。同じVNIに属する内側フレームだけが互いに同じL2セグメントとして扱われ、VNIが違えばL2では完全に分離されます。受信VTEPは脱カプセル化のとき、VNIを見て「このフレームはどのセグメント(どのMACテーブル)に属するか」を決めます。

桁の違いが効きます。802.1QのVLAN IDは12ビットで実用上1〜4094の 約4千個 が上限でした(その内部は /network/vlan-trunking-internals/ を参照)。VXLANのVNIは24ビットなので 2^24 = 16777216約1677万個 のセグメントを区別できます。クラウドのように数万テナントを収容する基盤では、この4千の壁を超えること自体がVXLANを採用する直接の動機になります。

観点802.1Q (VLAN)VXLAN
識別子のビット幅12ビット (VID)24ビット (VNI)
論理セグメント数約4094個約1677万個
配送される層L2(同一物理網内)L3(IPで広域に配送)
物理トポロジ依存トランク配線に依存IP到達性さえあればよい
カプセル化フレームに4Bタグ挿入フレームをUDPで封入(+50B)

VTEP:トンネルの出入口

カプセル化と脱カプセル化を実際に行う主体が VTEP(VXLAN Tunnel End Point) です。VTEPはハイパーバイザの仮想スイッチ内のソフトウェア実装でも、物理スイッチのハードウェア実装(ハードウェアVTEP)でもよく、いずれもアンダーレイ上で 自分のIPアドレス を1つ持ちます。送信VTEPは内側フレームを包んで宛先VTEPのIPへ送り、受信VTEPはVNIを見て該当セグメントへ元フレームを取り出します。

VTEPが解くべき本質的な問題は 「ある宛先MACが、どのVTEPの背後にいるか」 です。これはL2スイッチが「あるMACがどのポートの先にいるか」を学習するのと同型の問題で(/network/ethernet-switching-internals/ のMAC学習と同じ構図)、VXLANではポートの代わりに リモートVTEPのIP を学ぶことになります。内側MAC → リモートVTEPのIP という対応表をどう作るか、ここがVXLANの設計上の分かれ道です。

VTEP が保持する対応表(概念)
  VNI 5000:
    内側MAC aa:bb:cc:00:00:01 → ローカル(自分の配下)
    内側MAC aa:bb:cc:00:00:02 → リモートVTEP 10.0.0.7
    内側MAC aa:bb:cc:00:00:03 → リモートVTEP 10.0.0.9

フラッディングによる学習:BUM トラフィックの問題

宛先MACの位置がまだ分からないとき、L2は伝統的に フラッディング で解決します。VXLANでも初期方式(データプレーン学習)はこれを踏襲し、宛先不明ユニキャスト・ブロードキャスト・マルチキャスト(頭文字から BUMトラフィック と総称)を、同じVNIに属する全VTEPへ届けます。受信側は元フレームの送信元MACと、外側IPの送信元(リモートVTEP)を結びつけて学習します。

問題は「全VTEPへどう届けるか」です。代表的に2方式あります。

方式BUMの配り方特徴・課題
マルチキャストモードVNIをアンダーレイのマルチキャストグループに対応づけ、IGMP/PIMで配送アンダーレイにマルチキャスト運用が必須。設計・運用が重い
ヘッドエンドレプリケーション送信VTEPが全リモートVTEPへユニキャストで複製送信アンダーレイは単純なIPのみで済むが、VTEP数に比例して複製負荷が増える

マルチキャストはVNIごとにグループを割り当て、ブロードキャストの届く範囲をグループで再現します(マルチキャストの基礎は /network/multicast-broadcast/)。一方ヘッドエンドレプリケーションはVTEP側で全宛先へコピーを撒くため、台数が増えるほど送信負荷が膨らみます。どちらにせよ フラッディングに依存する限り、規模拡大とともにムダな複製トラフィックが増える のが根本課題です。

EVPN:コントロールプレーンで MAC を配る

この課題を断ち切るのが EVPN(Ethernet VPN) です。発想は単純で、「MACの位置を当て推量のフラッディングで学ぶのをやめ、各VTEPが知っている MAC ↔ 自分のIPMP-BGP で能動的に広告し合う」。つまりデータプレーン学習(フラッディング)を、コントロールプレーン学習(ルーティングプロトコルでの配布)に置き換えます。

EVPNではVTEPがBGPピアとなり、配下で学習した内側MAC(必要に応じてIPも)を Type 2 ルート(MAC/IP Advertisement) としてBGPで広告します。受信したVTEPは 内側MAC → 広告元VTEPのIP を表に直接書き込めるので、宛先不明ユニキャストのフラッディングが原理的に不要になります。ブロードキャスト/マルチキャスト用の配送グループも Type 3 ルート(Inclusive Multicast) で明示的にメンバを把握でき、BUMの扱いも制御プレーン主導になります。

EVPN は「L2 を L3 のように扱う」

EVPNの肝は、MACアドレスをBGPの広告対象(ルート)として運ぶ点です。これにより、IPの経路をBGPで配るのと同じ枠組みで、L2の到達性(どのMACがどのVTEPにいるか)を配れます。結果として、新しいサーバーやVMが現れた瞬間にそのMACがBGPで全VTEPへ伝わり、初回通信からフラッディングなしで届く。フラッディング起点の学習に比べ、収束が速く・無駄な複製が少なく・大規模に伸びるのがEVPN-VXLANが現代データセンターの標準になった理由です。

VNI とアンダーレイ MTU の取り違えに注意

オーバーレイの障害で多いのが、テナント側からは見えないアンダーレイ要因です。MTU不足で1550バイトの外側パケットが途中破棄されると、テナントには「大きい通信だけ詰まる」という不可解な症状として現れます。また両端VTEPのVNIマッピング不一致は、フレームが別セグメントへ漏れる・届かない原因になります。切り分けでは「内側で再現するか」「外側VTEP間でpingが通り、かつ大きいサイズのDFビット付きpingが通るか」を分けて確認します。

試験・面接で問われる要点

「VXLANのカプセル化と宛先ポートは」→ イーサフレームをUDPで封入、宛先ポート4789。「VNIのビット幅と意義は」→ 24ビット、約1677万セグメントで802.1Qの4094を超える。「VTEPの役割は」→ カプセル化/脱カプセル化を行い、内側MACとリモートVTEPのIPを対応づける。「データプレーン学習の課題は」→ BUMフラッディングが規模とともに増える。「EVPNが解くものは」→ MAC到達情報をMP-BGPで配るコントロールプレーン学習でフラッディングを排除。この5点を構造で言えれば上級。

まとめ

VXLANは、イーサネットフレームをUDP(4789)で包んでL3ファブリックの上に運ぶ「L2 over L3」のオーバーレイです。物理網はIPで安定に作り、その上に論理L2を重ねることで、配線に縛られず広域に同一セグメントを延ばせます。セグメントは24ビットのVNIで識別し、約1677万個という802.1Qを桁違いに超える論理ネットワークを収容できます。トンネルの出入口であるVTEPが封入と取り出しを担い、その中心課題は 内側MAC → リモートVTEPのIP をどう学ぶかにあります。初期方式はBUMトラフィックのフラッディングに頼りましたが、規模とともに無駄が増える。これを断つのがEVPNで、MAC到達情報をMP-BGPのルートとして配り、フラッディングなしの高速・大規模なL2延伸を実現します。「物理はL3で固め、論理L2はカプセル化で重ね、到達情報はBGPで配る」——この三段で捉えれば、現代データセンターのオーバーレイは一本の筋で読み解けます。

ネットワーク Article

VXLAN とオーバーレイネットワークの原理を実務で読む

TL;DRは入口です。実際に選ぶ・使う段階では、何を解決するか、何と比較するか、導入後にどこで詰まるかまで見る必要があります。

解決すること

VXLAN

比較で見る軸

難易度: advanced / カテゴリ: ネットワーク / タグ数: 5

導入後に効く点

24ビットのVNIでセグメントを識別するため、論理ネットワークは約1677万個まで作れる。802.1Qの12ビット(4094個)の上限を桁違いに超える。

先に潰すリスク

用語だけ覚えても、設計・実装・運用でどこに効くかを確認しないと判断を誤る。

数字・仕様の読み方
難易度
advanced
カテゴリ
ネットワーク
タグ数
5

判断チェックリスト

  • 自社の用途が「VXLAN / オーバーレイ」に近いか確認する。
  • 強みである「VXLANはイーサネットフレームをUDP(宛先ポート4789)で包み、L3ネットワークの上にL2セグメントをトンネル化する。VTEPがカプセル化・脱カプセル化を担う。」が本当に評価軸になるか確認する。
  • 注意点の「用語だけ覚えても、設計・実装・運用でどこに効くかを確認しないと判断を誤る。」を運用で吸収できるか確認する。
  • 公開値や仕様値は、対象プラン・対象機種・対象リージョンまで確認する。
  • 既存システム、ID、ネットワーク、監視、バックアップとの接続方法を先に洗い出す。
  • 小さく試してから、本番移行、権限設計、障害時手順、コスト監視を決める。

次に確認する観点

VXLANオーバーレイEVPNVTEPデータセンターVXLANオーバーレイEVPN