3. Data Center Topologies Overview (Aperçu des topologies de centres de données)
3. Data Center Topologies Overview (Aperçu des topologies de centres de données)
Cette section fournit un aperçu de deux types généraux de conceptions de centres de données -- hiérarchiques (également connues sous le nom de "basées sur des arbres") et basées sur Clos.
3.1 Traditional DC Topology (Topologie traditionnelle de centre de données)
Dans l'industrie des réseaux, un choix de conception courant pour les centres de données ressemble généralement à un arbre (inversé) avec des liaisons montantes redondantes et trois couches de hiérarchie, à savoir les couches core, agrégation/distribution et accès (voir Figure 1). Pour répondre aux besoins en bande passante, chaque couche supérieure, du serveur vers la sortie du centre de données ou le WAN, a une densité de ports et une capacité de bande passante plus élevées où le core fonctionne comme le "tronc" de la conception basée sur un arbre. Pour maintenir une terminologie uniforme et pour la comparaison avec d'autres conceptions, dans ce document, ces couches seront appelées tiers Tier 1, Tier 2 et Tier 3, au lieu de couches core, agrégation ou accès.
+------+ +------+
| | | |
| |--| | Tier 1
| | | |
+------+ +------+
| | | |
+---------+ | | +----------+
| +-------+--+------+--+-------+ |
| | | | | | | |
+----+ +----+ +----+ +----+
| | | | | | | |
| |-----| | | |-----| | Tier 2
| | | | | | | |
+----+ +----+ +----+ +----+
| | | |
| | | |
| +-----+ | | +-----+ |
+-| |-+ +-| |-+ Tier 3
+-----+ +-----+
| | | | | |
<- Servers -> <- Servers ->
Figure 1: Topologie réseau typique de centre de données
Malheureusement, comme indiqué précédemment, il n'est pas possible de faire évoluer une conception basée sur un arbre à un degré suffisamment important pour gérer des conceptions à grande échelle en raison de l'impossibilité d'acquérir des dispositifs Tier 1 avec une densité de ports suffisamment grande pour faire évoluer suffisamment Tier 2. De plus, des mises à niveau continues ou le remplacement des dispositifs de niveau supérieur sont nécessaires à mesure que la taille du déploiement ou les exigences en bande passante augmentent, ce qui est complexe sur le plan opérationnel. Pour cette raison, REQ1 est en place, éliminant ce type de conception de la considération.
3.2 Clos Network Topology (Topologie réseau Clos)
Cette section décrit une conception commune pour une topologie évolutive horizontalement dans les centres de données à grande échelle afin de répondre à REQ1.
3.2.1 Overview (Aperçu)
Un choix courant pour une topologie évolutive horizontalement est une topologie Clos pliée, parfois appelée "fat-tree" (par exemple, [INTERCON] et [ALFARES2008]). Cette topologie présente un nombre impair d'étages (parfois appelés "dimensions") et est généralement composée d'éléments uniformes, par exemple des commutateurs réseau avec le même nombre de ports. Par conséquent, le choix de la topologie Clos pliée satisfait REQ1 et facilite REQ2. Voir la Figure 2 ci-dessous pour un exemple de topologie Clos pliée à 3 étages (3 étages en comptant l'étage Tier 2 deux fois, lors du traçage d'un flux de paquets):
+-------+
| |----------------------------+
| |------------------+ |
| |--------+ | |
+-------+ | | |
+-------+ | | |
| |--------+---------+-------+ |
| |--------+-------+ | | |
| |------+ | | | | |
+-------+ | | | | | |
+-------+ | | | | | |
| |------+-+-------+-+-----+ | |
| |------+-+-----+ | | | | |
| |----+ | | | | | | | |
+-------+ | | | | | | ---------> M liens
Tier 1 | | | | | | | | |
+-------+ +-------+ +-------+
| | | | | |
| | | | | | Tier 2
| | | | | |
+-------+ +-------+ +-------+
| | | | | | | | |
| | | | | | ---------> N Liens
| | | | | | | | |
O O O O O O O O O Serveurs
Figure 2: Topologie Clos pliée à 3 étages
Cette topologie est souvent également appelée réseau "Leaf and Spine", où "Spine" est le nom donné à l'étage intermédiaire de la topologie Clos (Tier 1) et "Leaf" est le nom de l'étage d'entrée/sortie (Tier 2). Pour l'uniformité, ce document fera référence à ces couches en utilisant la notation "Tier n".
3.2.2 Clos Topology Properties (Propriétés de la topologie Clos)
Voici quelques propriétés clés de la topologie Clos:
-
La topologie est entièrement non-bloquante, ou plus précisément non-interférante, si M >= N et surabonnée par un facteur de N/M sinon. Ici M et N sont respectivement le nombre de ports uplink et downlink pour un commutateur Tier 2 comme indiqué dans la Figure 2.
-
L'utilisation de cette topologie nécessite un support du plan de contrôle et de données pour ECMP avec un fan-out de M ou plus.
-
Les commutateurs Tier 1 ont exactement un chemin vers chaque serveur dans cette topologie. C'est une propriété importante qui rend la summarisation de route dangereuse dans cette topologie (voir Section 8.2 ci-dessous).
-
Le trafic circulant de serveur à serveur est équilibré en charge sur tous les chemins disponibles en utilisant ECMP.
3.2.3 Scaling the Clos Topology (Mise à l'échelle de la topologie Clos)
Une topologie Clos peut être mise à l'échelle soit en augmentant la densité de ports des éléments réseau, soit en ajoutant plus d'étages, par exemple en passant à un Clos à 5 étages, comme illustré dans la Figure 3 ci-dessous:
Tier 1
+-----+
Cluster | |
+----------------------------+ +--| |--+
| | | +-----+ |
| Tier 2 | | | Tier 2
| +-----+ | | +-----+ | +-----+
| +-------------| DEV |------+--| |--+--| |-------------+
| | +-----| C |------+ | | +--| |-----+ |
| | | +-----+ | +-----+ +-----+ | |
| | | | | |
| | | +-----+ | +-----+ +-----+ | |
| | +-----------| DEV |------+ | | +--| |-----------+ |
| | | | +---| D |------+--| |--+--| |---+ | | |
| | | | | +-----+ | | +-----+ | +-----+ | | | |
| | | | | | | | | | | |
| +-----+ +-----+ | | +-----+ | +-----+ +-----+
| | DEV | | DEV | | +--| |--+ | | | |
| | A | | B | Tier 3 | | | Tier 3 | | | |
| +-----+ +-----+ | +-----+ +-----+ +-----+
| | | | | | | | | |
| O O O O | O O O O
| Serveurs | Serveurs
+----------------------------+
Figure 3: Topologie Clos à 5 étages
Le petit exemple de topologie de la Figure 3 est construit à partir de dispositifs avec un nombre de ports de 4. Dans ce document, un ensemble de dispositifs Tier 2 et Tier 3 directement connectés avec leurs serveurs attachés sera appelé un "cluster". Par exemple, DEV A, B, C, D et les serveurs qui se connectent à DEV A et B, sur la Figure 3 forment un cluster. Le concept de cluster peut également être un concept utile comme une seule unité de déploiement ou de maintenance qui peut être exploitée à une fréquence différente de celle de l'ensemble de la topologie.
En pratique, le Tier 3 du réseau, qui est généralement des commutateurs Top-of-Rack (ToRs), est l'endroit où le surabonnement est introduit pour permettre l'empaquetage de plus de serveurs dans le centre de données tout en répondant aux exigences de bande passante pour différents types d'applications. La principale raison de limiter le surabonnement à une seule couche du réseau est de simplifier le développement d'applications qui autrement devraient tenir compte de plusieurs pools de bande passante: dans le rack (Tier 3), entre les racks (Tier 2) et entre les clusters (Tier 1). Comme le surabonnement n'a pas de relation directe avec la conception du routage, il n'est pas discuté plus en détail dans ce document.
3.2.4 Managing the Size of Clos Topology Tiers (Gestion de la taille des tiers de la topologie Clos)
Si la taille d'un réseau de centre de données est petite, il est possible de réduire le nombre de commutateurs dans Tier 1 ou Tier 2 d'une topologie Clos par un facteur de deux. Pour comprendre comment cela pourrait être fait, prenons Tier 1 comme exemple. Chaque dispositif Tier 2 se connecte à un seul groupe de dispositifs Tier 1. Si la moitié des ports sur chacun des dispositifs Tier 1 ne sont pas utilisés, il est alors possible de réduire le nombre de dispositifs Tier 1 de moitié et de simplement mapper deux liaisons montantes d'un dispositif Tier 2 vers le même dispositif Tier 1 qui étaient auparavant mappées vers différents dispositifs Tier 1. Cette technique maintient la même bande passante tout en réduisant le nombre d'éléments dans Tier 1, économisant ainsi sur le CAPEX. Le compromis, dans cet exemple, est la réduction de la taille maximale du centre de données en termes de nombre total de serveurs de moitié.
Dans cet exemple, les dispositifs Tier 2 utiliseront deux liaisons parallèles pour se connecter à chaque dispositif Tier 1. Si l'une de ces liaisons échoue, l'autre reprendra tout le trafic de la liaison défaillante, entraînant potentiellement une forte congestion et une dégradation de la qualité de service si la procédure de détermination du chemin ne prend pas en compte la quantité de bande passante, car le nombre de dispositifs Tier 1 en amont est probablement supérieur à deux. Pour éviter cette situation, les liaisons parallèles peuvent être regroupées dans des groupes d'agrégation de liaisons (LAGs), par exemple [IEEE8023AD], avec des paramètres d'implémentation largement disponibles qui désactivent l'ensemble du "faisceau" lors d'une défaillance d'une seule liaison. Des techniques équivalentes qui imposent le "partage du destin" sur les liaisons parallèles peuvent être utilisées à la place des LAGs pour obtenir le même effet. En conséquence d'un tel partage du destin, le trafic de deux liaisons défaillantes ou plus sera rééquilibré sur la multitude de chemins restants qui est égale au nombre de dispositifs Tier 1. Cet exemple utilise deux liaisons pour la simplicité, avoir plus de liaisons dans un faisceau aura moins d'impact sur la capacité lors d'une défaillance d'une liaison membre.