ExpressRoute のエッジ ルーターのメンテナンス通知に関する説明

Shin Iizuka

2022 年 1 月 24 日 追記

本ページに記載の内容は古い情報となります。
メンテナンス時の挙動に関する最新の情報は、以下のブログをご参照ください。
https://jpaztech.github.io/blog/network/expressroute-maintenance/


本日、ExpressRoute のエッジ ルーターにおけるメンテナンスのお知らせがお客様に送信されました。

お知らせにもあるとおり、今回のメンテナンスにおいてお客様のサービスに影響が発生することは想定しておりません。この点についてはご安心いただければと思います。ただ、送信されたお知らせの文面は最低限のものですので、どのようなメンテナンスが予定されており、どういった理由で影響がないのかなど、本ブログ記事にてご説明をさせていただきます。

これまでにも何度か実施されているメンテナンスと同じですので、内容についてはご存知の方もいらっしゃるかと思いますが、参考になりましたら幸いでございます。

メンテナンスの内容

ExpressRoute は、非常に簡単に図示しますと、以下のようなアーキテクチャになっております。エッジ ルーター (MSEE) とよばれる物理ルーターが 2 台 Azure 側に存在しており、それぞれ、回線プロバイダーのルーターと接続されています。

※ L2 モデルのプロバイダーをご利用の場合は、プロバイダーのスイッチを経て、L3 レベルではお客様のルーターと接続されています。以下の説明における「プロバイダーのルーター」という表現についても、L2 モデルのプロバイダーをご利用の場合は、お客様が構築されている BGP ルーターと読み替えていただければと思います。

メンテナンスの対象

今回、メンテナンスが発生するのは、MSEE (図における黄色のルーター) です。このルーターにおいて、片方ずつメンテナンスが実施されます。各ロケーションにおいて、数時間ずつ (東京および大阪では 6 時間ずつ) 計 2 回のメンテナンス ウィンドウが通知されておりますが、最初のウィンドウで片方のルーター、後のウィンドウでもう片方のルーターのメンテナンスが行われます。

つまり、冗長性を考慮し、片方ずつ十分に時間をわけてメンテナンスを行うことが予定されています。

メンテナンス時の挙動

ExpressRoute においては、プロバイダーのルーターと、MSEE との間で必ず BGP による動的な経路交換が行われており、ある経路がダウンした場合に、別の経路に切り替わるよう冗長性も BGP によって確保されています。

実際にメンテナンスが行われるタイミングでは、MSEE はいきなり応答を停止するのではなく、プロバイダーやお客様のルーターに対して BGP の Administrative Shutdown を明示的に通知します。プロバイダーのルーターはこれを受けて、経路を能動的に切り替えます。

Administrative Shutdown の通知が MSEE から送信されないと、プロバイダーやお客様のルーターにとっては、MSEE からの応答が突然なくなるため、タイムアウトになるまで再接続を試みたのちに、経路が切り替わります (つまり、MSEE が応答を停止してから、プロバイダーのルーターがタイムアウトと判断するまでの間、通信断が発生します)。

このような通信断を防ぐために、MSEE は Administrative Shutdown を明示的に通知し、プロバイダーのルーターがタイムアウトを待たずに、ダウンタイムなしで経路を切り替えるようにしています。

よくある質問

「BGP が構成されていれば問題ない」という記載があったが、BGP が構成されているかどうかはどうやって判断すればよいか。

ExpressRoute おいては、経路の交換を行う手段が BGP しかありません。したがって、現在 ExpressRoute をご利用いただけているようであれば、必ず BGP は構成されています。BGP なしで ExpressRoute を利用することはできませんので、BGP の利用の有無をあらためて確認する必要はありません。

現在利用している ExpressRoute 回線は冗長化されているか。

ExpressRoute は、「1 回線」作成すると、必ず内部的には 2 本の物理的な回線が構成され、2 台の MSEE が利用されます。つまり、シングル構成になっていることは原則ありません。

ただし、L2 モデルのプロバイダー (お客様自身で BGP ルーターを構成いただく必要があるプロバイダー) をご利用いただいており、ルーターを片方の回線にしか接続していない、片方の回線しか BGP の Neighbor を確立していないなど、極めて例外的な構成を取っている場合に限っては、今回のメンテナンスにあたって通信影響が生じます。

このような構成は、SLA が担保されない、弊社として保証していない特殊な構成であり、プロバイダーまたはお客様にて意図的に構成するものです。ご利用の ExpressRoute の環境が冗長構成されているかは、プロバイダーまたはお客様のネットワーク担当者にご確認ください。

ExpressRoute Gateway の SKU と影響の有無は関係あるか。特に、Basic SKU の Gateway だと問題があるなどは考えられるか。

Gateway の SKU がどれであっても、今回のメンテナンスに伴う影響の有無には関係ありません。Gateway は上記の図でいう青色の部分ですが、今回のメンテナンス対象である MSEE は黄色の部分であり、Gateway の SKU とは特に関係がありません。

ExpressRoute と接続しているルーターにおいて、エラーなどが発生する可能性はあるか。

MSEE から BGP の Administrative Shutdown の通知を送信しますので、通知を受け取り、BGP のセッションを切断したことを示すログなどが記録されることが想定されます。ルーターの監視を行っている場合は、メンテナンス期間中にこのようなログが記録されることをあらかじめご認識いただけますと幸いです。

メンテナンス期間が数時間取られているが、この時間中ずっと切断されたままになるのか

いいえ、この時間の中の一部のタイミングでのみ、一時的な切断が発生します。また切断といっても、上述のとおり、冗長化された回線の片方ずつの切断ですので、実質的な通信影響は想定されません。