ノードの障害
ノードの障害をシミュレートするため、Ixia トラフィック フローが開始さ れてから PE11 の電源をオフにすると、トラフィック フローへの影響が測 定されます。
ラボのメモ PE ルーターに物理的アクセスがない場合、あるいはシャーシの電源をオフ にしたくない場合は、CLI からノードの障害をシミュレートすることがで きます。まず、ユーザー root としてシェルに入ります。
cse@PE11> start shell user root Password:********
root@PE11%
ifconfig コマンドを使用して、各インターフェイスを停止します。最良の 方法は、以下に示すように、テキスト エディタでコマンドのリストを作成 し、CLI セッションに一度にまとめて貼り付けることです。最終行の後で 必ず改行してください。
ifconfig xe-1/0/0 down ifconfig xe-1/2/0 down ifconfig xe-1/1/0 down ifconfig xe-2/0/0 down ifconfig ae0 down ifconfig ae1 down
ノードを再開する準備ができたら、キーワードの down を up に置換して、
これらのコマンドを繰り返します。この方法は、リンクと障害と復旧のテ ストでも利用できます。
結果
パケットの損失を最小限に抑えるいくつかのメカニズムが、トポロジーの コア レイヤーにあります。まず、PE11 に障害が発生すると、PE11 で終端 された LSP が停止し、個々のヘッドエンド PE に RSVP パス エラー メッ セージで通知されます。レイヤー 2 とレイヤー 3 の両方のトラフィックの 場合、データ センター 2 の PE が PE11 へのネクスト ホップ LSP を削除し、
エイリアシングのため PE12 に転送し続けます。
同時に、OSPF を介して PE11 のループバック アドレスへのリーチャビリ ティが失われ、600 ミリ秒後に PE11 と P1 間の MP-BGP セッションの BFD タイマーの期限が切れます。その結果、P1 ルーターは、以前に PE11 がアドバタイズしたすべての EVPN ルートと IP VPN ルートを取り消しま す。上記のリンクの障害テスト ケースと同様に、PE12 がローカル ES の DF になります。
IxNetwork 統計の結果は次のとおりです。
テスト対象のデータ センター 1 からのすべてのアウトバウンド フ ローは、CE10 が障害を検出し、PE12 へのリンクのみに切り替える までの時間に影響されています。PE12 がデータ センター 2 へのトラ フィックを転送またはフラッドしたため、レイヤー 2 フローは 155 ミリ秒以内に復旧しました。レイヤー 3 フローでは、フローが最小 限の中断(今回は 155 ミリ秒)でルーティングされるように、各マ ルチホーム PE ルーターを同じ IP アドレスと MAC アドレスを使用し て構成しています。
データ センター 2 からデータ センター 1 へのインバウンド レイヤー 2 フローは、80 ミリ秒以内に復旧しました。障害に先立ち、データ センター 2 の PE は、データ センター 1 の 2 台の PE からデータ セン ター 1 のすべてのホストの MAC アドバタイズメントを受信していま す。そのため、PE21 と PE22 では、データ センター 1 にある宛先の ネクスト ホップが PE12 のみに向かうように更新されています。
データ センター 2 とリモート サイトからのインバウンド レイヤー 3 フローは、それぞれ 1.88 秒と 876 ミリ秒で復旧しました。これらの フローは、P1 によって以前にアドバタイズされた EVPN MAC/IP ルートと IP VPN ホスト ルートを取り消して、IP VPN VRF からルー トを削除するため、インバウンド レイヤー 2 フローよりも復旧に時 間がかかります。データ センター 1 にある CE10 のホスト宛てのトラ フィック フローは今度は PE12 に転送され、ARP によって不明な宛 先を検出します。PE12 は、ARP 応答をスヌープしてから、EVPN MAC/IP アドバタイズメントと IP VPN ホスト ルートの更新をすべ てのリモート PE に送信します。
ノードの復旧
Ixia トラフィック フローが再開し、PE11 の電源がオンになると、トラフィッ
ク フローへの影響が測定されます。
結果
PE11 xe-1/0/0 インターフェイスと CE10 xe-0/0/0 インターフェイスは、
リンクがアップして起動すると、180 秒のホールドアップ タイマーで設定 されています。この設定は、PE11 が OSPF 隣接状態を作り、RSVP-TE LSP を起動し、P1 への MP-BGP セッションを確立する時間を確保するた めに、このシナリオでは非常に重要です。この間、PE11 は EVPN ネイバーを 認識します。しかしながら、PE11 のネイバーは、前のアクセス リンクの切 断テスト ケースと同様に、アクティブな ESI がないため PE11 を認識しま せん。ホールドアップ タイマーがなければ、PE11 がすべての制御プロトコ ルの初期化を完了するまで(本書のネットワーク構成の場合、約 2.5 分間)、
CE10 はブラック ホールにトラフィックを転送してしまいます。
ホールドアップ タイマーが切れると、PE11 と CE10 間で稼働する LACP に よって、リンクの両端でトラフィックの送受信を行えるようになります。
これは、PE11 と CE10 でホールドアップ タイマーにわずかな差があると、
パケットの損失を引き起こす可能性があるため、重要です。例えば、PE11 が受信の準備を整える前に CE10 がトラフィックの送信を開始してしまう 場合やその逆が考えられます。テストによって、LACP を使用すると、PE と CE 間に 1 つしかリンクがない場合でも、このシナリオでのパケットの損 失が大幅に減ることがわかります。
IxNetwork 統計の結果は次のとおりです。
データ センター 1 からデータ センター 2 にルーティングされるトラ フィック フローは、509 ミリ秒以内に復旧しました。データ センター 1 からリモート サイトにルーティングされるトラフィック フローは、
18 ミリ秒以内に復旧しました。アクセス インターフェイスが起動す る前は、PE11 の IRB インターフェイスは停止しており、PE11 の IP VPN VRF に存在するのは、リモート サイトの PE31 の 31.1.1/24 ネッ トワークへのルートだけになります。アクセス インターフェイスが 初期化されると、VRF の転送状態が設定され、トラフィックが転送 されます。
データ センター 2 からデータ センター 1 にルーティングされるトラ フィック フローは、354 ミリ秒で復旧しました。PE11 のアクセス イン ターフェイスが起動すると、データ センター 2 の PE が PE11 からの EVPN の更新を受信し、新しいネクスト ホップを利用するために IP VPN VRF のエントリを更新します。
レベル 2 トラフィック フローへの影響は、データ センター 2 へのア ウトバウンドが 2 ミリ秒、データ センター 2 からのインバウンドが 55 ミリ秒とわずかなものでした。
その他のすべてのトラフィック フローには影響はありませんでした。
高可用性テストの概要
以下の表は、各高可用性テストのパケット損失の最悪のケースをまとめた ものです。結果は、トラフィックのタイプ別(レイヤー 2 とレイヤー 3)、
トラフィックの方向別(インバウンドとアウトバウンド)、サイト別(デー タ センターとリモート サイト)に分類されています。
表 4.1 高可用性テストの結果概要
テスト ケース DC2 への DC1 アウトバウンド L2 フロー
DC2 からの DC1 インバウンド L2 フロー
DC2 への DC1 アウトバウンド L3 フロー
DC2 からの DC1 インバウンド L3 フロー
リモート サイ トへの DC1
アウトバウンド L3 フロー
リモート サイ トからの DC1 インバウンド L3 フロー アクセスリンク
の障害 109 ミリ秒 345 ミリ秒 116 ミリ秒 1.17 秒 109 ミリ秒 2.19 秒
アクセス リンク
の復旧 0 0 1 ミリ秒 144 ミリ秒 0 0
ノードの障害 155 ミリ秒 80 ミリ秒 155 ミリ秒 1.88 秒 155 ミリ秒 876 ミリ秒 ノードの復旧 2 ミリ秒 55 ミリ秒 509 ミリ秒 354 ミリ秒 18 ミリ秒 0