ノード - DAY ONE: VPN VM 2 DCI DCI EVPN Day One: VPN POC EVPN IETF RFC 7432 Day One E. RFC 7432:EV

ノードの障害

ノードの障害をシミュレートするため、Ixia トラフィックフローが開始されてから PE11 の電源をオフにすると、トラフィックフローへの影響が測定されます。

ラボのメモ PE ルーターに物理的アクセスがない場合、あるいはシャーシの電源をオフにしたくない場合は、CLI からノードの障害をシミュレートすることができます。まず、ユーザー root としてシェルに入ります。

cse@PE11> start shell user root Password:********

root@PE11%

ifconfig コマンドを使用して、各インターフェイスを停止します。最良の方法は、以下に示すように、テキストエディタでコマンドのリストを作成し、CLI セッションに一度にまとめて貼り付けることです。最終行の後で必ず改行してください。

ifconfig xe-1/0/0 down ifconfig xe-1/2/0 down ifconfig xe-1/1/0 down ifconfig xe-2/0/0 down ifconfig ae0 down ifconfig ae1 down

ノードを再開する準備ができたら、キーワードの down を up に置換して、

これらのコマンドを繰り返します。この方法は、リンクと障害と復旧のテストでも利用できます。

結果

パケットの損失を最小限に抑えるいくつかのメカニズムが、トポロジーのコアレイヤーにあります。まず、PE11 に障害が発生すると、PE11 で終端された LSP が停止し、個々のヘッドエンド PE に RSVP パスエラーメッセージで通知されます。レイヤー 2 とレイヤー 3 の両方のトラフィックの場合、データセンター 2 の PE が PE11 へのネクストホップ LSP を削除し、

エイリアシングのため PE12 に転送し続けます。

同時に、OSPF を介して PE11 のループバックアドレスへのリーチャビリティが失われ、600 ミリ秒後に PE11 と P1 間の MP-BGP セッションの BFD タイマーの期限が切れます。その結果、P1 ルーターは、以前に PE11 がアドバタイズしたすべての EVPN ルートと IP VPN ルートを取り消します。上記のリンクの障害テストケースと同様に、PE12 がローカル ES の DF になります。

IxNetwork 統計の結果は次のとおりです。

テスト対象のデータセンター 1 からのすべてのアウトバウンドフローは、CE10 が障害を検出し、PE12 へのリンクのみに切り替えるまでの時間に影響されています。PE12 がデータセンター 2 へのトラフィックを転送またはフラッドしたため、レイヤー 2 フローは 155 ミリ秒以内に復旧しました。レイヤー 3 フローでは、フローが最小限の中断（今回は 155 ミリ秒）でルーティングされるように、各マルチホーム PE ルーターを同じ IP アドレスと MAC アドレスを使用して構成しています。

データセンター 2 からデータセンター 1 へのインバウンドレイヤー 2 フローは、80 ミリ秒以内に復旧しました。障害に先立ち、データセンター 2 の PE は、データセンター 1 の 2 台の PE からデータセンター 1 のすべてのホストの MAC アドバタイズメントを受信しています。そのため、PE21 と PE22 では、データセンター 1 にある宛先のネクストホップが PE12 のみに向かうように更新されています。

データセンター 2 とリモートサイトからのインバウンドレイヤー 3 フローは、それぞれ 1.88 秒と 876 ミリ秒で復旧しました。これらのフローは、P1 によって以前にアドバタイズされた EVPN MAC/IP ルートと IP VPN ホストルートを取り消して、IP VPN VRF からルートを削除するため、インバウンドレイヤー 2 フローよりも復旧に時間がかかります。データセンター 1 にある CE10 のホスト宛てのトラフィックフローは今度は PE12 に転送され、ARP によって不明な宛先を検出します。PE12 は、ARP 応答をスヌープしてから、EVPN MAC/IP アドバタイズメントと IP VPN ホストルートの更新をすべてのリモート PE に送信します。

ノードの復旧

Ixia トラフィックフローが再開し、PE11 の電源がオンになると、トラフィッ

クフローへの影響が測定されます。

結果

PE11 xe-1/0/0 インターフェイスと CE10 xe-0/0/0 インターフェイスは、

リンクがアップして起動すると、180 秒のホールドアップタイマーで設定されています。この設定は、PE11 が OSPF 隣接状態を作り、RSVP-TE LSP を起動し、P1 への MP-BGP セッションを確立する時間を確保するために、このシナリオでは非常に重要です。この間、PE11 は EVPN ネイバーを認識します。しかしながら、PE11 のネイバーは、前のアクセスリンクの切断テストケースと同様に、アクティブな ESI がないため PE11 を認識しません。ホールドアップタイマーがなければ、PE11 がすべての制御プロトコルの初期化を完了するまで（本書のネットワーク構成の場合、約 2.5 分間）、

CE10 はブラックホールにトラフィックを転送してしまいます。

ホールドアップタイマーが切れると、PE11 と CE10 間で稼働する LACP によって、リンクの両端でトラフィックの送受信を行えるようになります。

これは、PE11 と CE10 でホールドアップタイマーにわずかな差があると、

パケットの損失を引き起こす可能性があるため、重要です。例えば、PE11 が受信の準備を整える前に CE10 がトラフィックの送信を開始してしまう場合やその逆が考えられます。テストによって、LACP を使用すると、PE と CE 間に 1 つしかリンクがない場合でも、このシナリオでのパケットの損失が大幅に減ることがわかります。

IxNetwork 統計の結果は次のとおりです。

データセンター 1 からデータセンター 2 にルーティングされるトラフィックフローは、509 ミリ秒以内に復旧しました。データセンター 1 からリモートサイトにルーティングされるトラフィックフローは、

18 ミリ秒以内に復旧しました。アクセスインターフェイスが起動する前は、PE11 の IRB インターフェイスは停止しており、PE11 の IP VPN VRF に存在するのは、リモートサイトの PE31 の 31.1.1/24 ネットワークへのルートだけになります。アクセスインターフェイスが初期化されると、VRF の転送状態が設定され、トラフィックが転送されます。

データセンター 2 からデータセンター 1 にルーティングされるトラフィックフローは、354 ミリ秒で復旧しました。PE11 のアクセスインターフェイスが起動すると、データセンター 2 の PE が PE11 からの EVPN の更新を受信し、新しいネクストホップを利用するために IP VPN VRF のエントリを更新します。

レベル 2 トラフィックフローへの影響は、データセンター 2 へのアウトバウンドが 2 ミリ秒、データセンター 2 からのインバウンドが 55 ミリ秒とわずかなものでした。

その他のすべてのトラフィックフローには影響はありませんでした。

高可用性テストの概要

以下の表は、各高可用性テストのパケット損失の最悪のケースをまとめたものです。結果は、トラフィックのタイプ別（レイヤー 2 とレイヤー 3）、

トラフィックの方向別（インバウンドとアウトバウンド）、サイト別（データセンターとリモートサイト）に分類されています。

表 4.1 高可用性テストの結果概要

テストケース DC2 への DC1 アウトバウンド L2 フロー

DC2 からの DC1 インバウンド L2 フロー

DC2 への DC1 アウトバウンド L3 フロー

DC2 からの DC1 インバウンド L3 フロー

リモートサイトへの DC1

アウトバウンド L3 フロー

リモートサイトからの DC1 インバウンド L3 フローアクセスリンク

の障害 109 ミリ秒 345 ミリ秒 116 ミリ秒 1.17 秒 109 ミリ秒 2.19 秒

アクセスリンク

の復旧 0 0 1 ミリ秒 144 ミリ秒 0 0

ノードの障害 155 ミリ秒 80 ミリ秒 155 ミリ秒 1.88 秒 155 ミリ秒 876 ミリ秒ノードの復旧 2 ミリ秒 55 ミリ秒 509 ミリ秒 354 ミリ秒 18 ミリ秒 0

ドキュメント内 DAY ONE: VPN VM 2 DCI DCI EVPN Day One: VPN POC EVPN IETF RFC 7432 Day One E. RFC 7432:EVPN VPN EVPN Day One EVPN EVPN EVPN Juniper Networks Books www (ページ 82-86)