# Global Server Load Balancing (GSLB): Dienste weltweit orchestrieren
TL;DR / Management Summary Während lokaler Loadbalancer den Traffic innerhalb eines Rechenzentrums verteilt, sorgt Global Server Load Balancing (GSLB) für die Verteilung über Kontinente hinweg. Ein Senior Admin nutzt GSLB (meist via DNS oder Anycast), um User zum geografisch nächsten RZ zu leiten (Latenz-Optimierung) und um im Falle eines Totalausfalls eines Standorts den Traffic vollautomatisch global umzuleiten. Es ist die ultimative Form der Hochverfügbarkeit für globale Unternehmen.
# 1. Konzepte des GSLB
DNS als Schiedsrichter.
In 90% der Fälle wird GSLB über das DNS-Protokoll realisiert.
- Request: User fragt
wiki.dean. - GSLB Controller: Prüft die Quell-IP des Users.
- Entscheidung:
- User kommt aus Berlin -> Antwort: IP des RZ Frankfurt.
- User kommt aus New York -> Antwort: IP des RZ Virginia.
- Health Check: Ist das RZ Frankfurt offline, liefert der GSLB Controller für den Berliner User automatisch die IP von Virginia zurück.
# 2. Anycast vs. DNS-GSLB
Zwei Wege zum Ziel.
# 1. Anycast (Artikel 576)
Mehrere Standorte haben die exakt gleiche IP. Das BGP-Routing im Internet leitet das Paket zum physisch nächsten Hop.
- Vorteil: Extrem schnell, kein DNS-Caching Problem.
- Nachteil: Komplexes BGP-Management erforderlich.
# 2. DNS-GSLB (Standard)
Der DNS-Server antwortet dynamisch mit unterschiedlichen IPs.
- Vorteil: Einfach zu implementieren (z.B. via Cloudflare oder AWS Route 53).
- Nachteil: TTL-Verzögerung bei Standort-Schwenks.
# 3. Deep Dive: Geo-IP Routing & Proximity
Die beste User-Experience.
Professionelle GSLB-Systeme (wie F5 BIG-IP DNS) nutzen Latenz-Tabellen.
- Aktion: Der GSLB-Controller misst die RTT (Round-Trip-Time) von verschiedenen Punkten im Internet zu Ihren RZs.
- Ergebnis: Ein User wird nicht nach Entfernung (km), sondern nach der besten Internet-Anbindung (Latenz) geroutet.
# 4. Day-2 Operations: Disaster Recovery Schwenk
Den ‘Big Red Button’ vorbereiten.
GSLB ist der Schlüssel zum standortübergreifenden DR (Artikel 606).
- Workflow:
- Haupt-RZ brennt ab.
- Monitoring erkennt Ausfall.
- GSLB ändert alle DNS-Einträge weltweit in Sekunden auf das Backup-RZ.
- User arbeiten weiter, ohne IPs oder VPN-Tunnel manuell ändern zu müssen.
# 5. Troubleshooting & “War Stories”
Wenn die Welt auf dem Kopf steht.
# Top 3 Fehlerbilder
-
Symptom: User in Deutschland landen auf dem US-Server.
- Ursache: Der User nutzt einen öffentlichen DNS (wie
8.8.8.8). Der GSLB-Server sieht nur die IP des Google-Resolvers (USA) und nicht die des Users. - Lösung: Nutzung von EDNS-Client-Subnet (ECS). Der Resolver gibt einen Teil der User-IP an den GSLB weiter.
- Ursache: Der User nutzt einen öffentlichen DNS (wie
-
Symptom: “Flapping” zwischen Standorten.
- Ursache: Identische Latenzwerte zu beiden RZs. Das System springt bei jeder kleinen Schwankung hin und her.
- Lösung: Hysterese und feste Prioritäten (Tiering) einführen.
-
Symptom: Kapazitäts-Überlauf am kleinen Standort.
- Fix: Nutzen Sie “Overflow-Routing”. Wenn RZ-A zu 80% ausgelastet ist, schickt GSLB neue User zu RZ-B, auch wenn die Latenz dort höher ist.
# “War Story”: Die “DNS-Caching” Katastrophe
Ein Admin verließ sich für sein DR auf ein GSLB-System mit einer TTL von 1 Stunde. Das Ereignis: Ein Stromausfall im Haupt-RZ legte alles lahm. Der GSLB schaltete sofort um. Das Ergebnis: Die Hälfte der User konnte 60 Minuten lang nicht arbeiten, da ihre Firmen-PCs oder lokalen ISPs die “alte” (tote) IP noch im Cache hatten. Lehre: Für GSLB-Infrastrukturen sind TTLs von 30 bis 60 Sekunden Pflicht. GSLB ist nur so agil wie sein langsamster Cache.
# 6. Monitoring & Reporting
Die globale Verfügbarkeit.
# Global Health Dashboard
Überwachen Sie in Echtzeit:
User Distribution by Region.Active Data Centers.Average Global Latency.
# 7. Fazit & Empfehlung
GSLB ist die Versicherung gegen regionale Katastrophen.
- Empfehlung: Nutzen Sie Cloud-basierte GSLB Lösungen (z.B. Cloudflare Load Balancing), da diese weltweit verteilt sind und selbst nicht ausfallen können.
- Wichtig: Sorgen Sie dafür, dass Ihre Applikations-Daten (Datenbanken) zwischen den Standorten repliziert werden (Artikel 659), bevor Sie einen GSLB-Schwenk initiieren – eine laufende App ohne aktuelle Daten ist wertlos.
# Anhang: Cheatsheet (GSLB Strategien)
| Strategie | Logik | Anwendungsfall |
|---|---|---|
| Failover | Primär / Sekundär | Klassisches DR |
| Geolocation | Nach Land / IP | Compliance (Datenhoheit) |
| Proximity | Beste Latenz | Performance (Web-Apps) |
| Weighted | % Verteilung | Migrationen / Canary |