4. Data Center Routing Overview (データセンタールーティングの概要)

このセクションでは, 3つの一般的なタイプのデータセンタープロトコル設計の概要を提供します -- Layer 2 のみ, ハイブリッド Layer L2/L3, および Layer 3 のみ。

4.1 L2-Only Designs (L2 のみの設計)

当初, ほとんどのデータセンター設計では, [IEEE8021D-1990] で最初に定義された Spanning Tree Protocol (STP) をループフリートポロジーの作成に使用し, セクション 3.1 で説明した従来の DC トポロジーの変形を利用していました。当時, 多くの DC スイッチは Layer 3 ルーティングプロトコルをサポートしていないか, 追加のライセンス料でサポートしていたため, 設計の選択に影響を与えました。[IEEE8021D-2004] の最新版で Rapid Spanning Tree Protocol (RSTP) が導入され, [IEEE8021Q] で指定された Multiple Spanning Tree Protocol (MST) により, より大きなトポロジーでの収束, 安定性, 負荷分散が向上する多くの拡張が行われましたが, プロトコルの基本的な部分の多くは, 大規模 DC での適用性を制限しています。STP とその新しい変種は, パス選択にアクティブ/スタンバイアプローチを使用するため, セクション 3.2 で説明したように水平方向にスケーリングされたトポロジーに展開することは困難です。さらに, オペレーターは, 不適切な配線, 設定ミス, または単一デバイス上の欠陥のあるソフトウェアによって引き起こされる問題による大規模な障害を多く経験しています。これらの障害は, スパニングツリードメイン全体に定期的に影響を与え, プロトコルの性質上, トラブルシューティングが非常に困難でした。これらの理由から, そして現在ほとんどすべての DC トラフィックが IP であり, 外部接続のためにネットワークエッジで Layer 3 ルーティングプロトコルを必要とするため, STP を利用する設計は通常, 大規模 DC オペレーターのすべての要件を満たしません。[IEEE8023AD] などのリンクアグリゲーションプロトコルのさまざまな拡張, 一般に Multi-Chassis Link-Aggregation (M-LAG) として知られているものは, ループ防止のバックアップとして STP に依存しながら, アクティブ-アクティブネットワークパスを持つ Layer 2 設計を使用することを可能にしました。このアプローチの主な欠点は, ほとんどの実装で2を超えて線形にスケーリングする能力がないこと, 標準ベースの実装がないこと, デバイス間で状態を同期する際の障害ドメインリスクが追加されることです。

最近, [RFC6325] で Transparent Interconnection of Lots of Links (TRILL) プロトコルが導入されたことにより, STP なしで大規模で水平方向にスケーラブルな L2 のみのネットワークを構築することが可能になったことに注意する必要があります。TRILL は, STP が大規模 DC 設計のために持つ多くの問題を解決しますが, 実装の数が限られていること, そしてそれをサポートする特定の機器を必要とすることが多いため, その適用性が制限され, そのような設計のコストが増加しています。

最後に, ベース TRILL 仕様も M-LAG アプローチも, Layer 2, Ethernet ベースのソリューションの操作に非常に有害な共有ブロードキャストドメインの問題を完全に排除していません。後の TRILL 拡張が, 主に [RFC7067] で概説されたアプローチに基づいて, この問題ステートメントを解決するために提案されていますが, これはファブリックの構築に使用できる利用可能な相互運用可能な実装の数をさらに制限します。したがって, TRILL ベースの設計には REQ2, REQ3, REQ4 を満たす上で問題があります。

4.2 Hybrid L2/L3 Designs (ハイブリッド L2/L3 設計)

オペレーターは, ネットワークの Tier 1 または Tier 2 部分にルーティングプロトコルを実装し, Layer 2 ドメインを多数の小さなドメインに分割することにより, データプレーン障害の影響を制限し, 大規模トポロジーを構築しようとしてきました。この設計により, データセンターはスケールアップできましたが, 複数のネットワークプロトコルを管理する複雑さを犠牲にしています。以下の理由から, オペレーターはネットワークのアクセス (Tier 3) またはアクセスとアグリゲーション (Tier 3 と Tier 2) の両方の部分で Layer 2 を保持しています:

直接 Layer 2 隣接を必要とするか, 非 IP プロトコルを使用するレガシーアプリケーションのサポート。
仮想マシンが別の Tier 3 スイッチに移動したときに IP アドレスの保存を必要とする仮想マシンのシームレスなモビリティ。
簡素化された IP アドレッシング = データセンターに必要な IP サブネットが少なくなる。
アプリケーションロードバランシングは, Layer 2 Direct Server Return (DSR) などの特定の機能を実行するために直接 Layer 2 到達可能性を必要とする場合があります。[L3DSR] を参照。
L2 および L3 対応スイッチ間の継続的な CAPEX の違い。

4.3 L3-Only Designs (L3 のみの設計)

ネットワークの Tier 3 まで IP ルーティングを活用するネットワーク設計も人気を集めています。これらの設計の主な利点は, L2 ブロードキャストドメインを制限した結果としての, ネットワークの安定性とスケーラビリティの向上です。一般的に, Open Shortest Path First (OSPF) [RFC2328] などの Interior Gateway Protocol (IGP) が, このような設計の主要なルーティングプロトコルとして使用されます。データセンターの規模が大きくなり, サーバー数が数万台を超えるにつれて, このような完全にルーティングされた設計がより魅力的になっています。

L3 のみの設計を選択すると, ネットワークが大幅に簡素化され, REQ1 と REQ2 の達成が容易になり, 大規模な Layer 2 隣接と大規模な Layer 3 サブネットがネットワークのスケーラビリティと安定性に比べてそれほど重要ではないネットワークで広く採用されています。アプリケーションプロバイダーとネットワークオペレーターは, さまざまなオーバーレイまたはトンネリング技術を使用して, 以前に大規模な Layer 2 ドメインを推進していた要件のいくつかを満たす新しいソリューションを開発し続けています。