# AWS Lambda – Function Deployment
Kurzfassung: Eine DR-Site stellt Ressourcen für Failover/Restores bereit. Ziel: entkoppelter Standort mit ausreichender Kapazität, sicherer Anbindung, getesteten Repos/Proxies und klaren Betriebsprozessen.
# 1. Zweck & Zielbild
- DR-Site übernimmt kritische Workloads bei Ausfall des Primärstandorts.
- Ressourcen (Compute/Storage/Netz) reichen für priorisierte Services.
- Klare Umschalt- und Betriebsprozesse, regelmäßig getestet.
# 2. Voraussetzungen
- Standortwahl: Entfernung/Risiko, Energie/Redundanz, Anbindung (WAN/VPN/Direct).
- Hardware/Hypervisor kompatibel, Kapazitätsplan (Artikel 773) für DR-Workloads.
- Netzdesign (VLAN/VRF, Routing, DNS, Firewall) und Security (MFA, getrennte Admin-Kreise).
# 3. Risiken / Backout
- Zu geringe Kapazität → RTO verfehlt.
- Schlechte Anbindung → langsame Replika/Restores.
- Gemeinsame Vertrauensdomäne → Ransomware-Risiko.
- Backout: Prioritäten senken (nur kritisch), Ressourcen erweitern, Anbindung verbessern, Admin-Trennung nachziehen.
# 4. Umsetzung (Schritte)
- Architektur: DR-Cluster/Hosts, Repos (immutable), Proxies/Gateways, Netzwerk-Segmente, Management-Zugänge.
- Connectivity: VPN/Private Link, QoS/BWLimit, MTU testen; getrennte Admin-Wege.
- Repos/Proxies: SOBR-Extent/Cloud Tier, Hardened Repo; Proxies lokal für Replika/Restore (Artikel 785/810).
- Security: RBAC, getrennte Credentials, Immutability/Encryption, Audit/Logging (822).
- Operation: Runbooks für Failover/Failback, Wartung, Patch-Management; Monitoring/Alerts angebunden.
- Tests: Replikation/Copy/Restore aus DR, Failover-Drill (Artikel 803/804), RTO/RPO messen.
# 5. Verify / Tests
- Replikationsläufe erfolgreich, RPO im Soll.
- Restore/Failover in DR-Site funktioniert, Netz/DNS korrekt.
- Monitoring zeigt vollständige Abdeckung (Proxies/Repos/Hosts).
# 6. Runbooks
- Failover: Kriterien, Reihenfolge, Netz/DNS-Umstellung, Kommunikation.
- Failback: Delta zurück, Tests, geplante Umschaltung.
- Netz-/Anbindungsstörung: Fallback-Pfade, Limits, Incident.
# 7. Monitoring / Alerts
- DR-Cluster-Health, Repos/Proxies, RPO-Delta, Link-Status, Immutability.
- Alerts bei Ausfall/Degradation, fehlgeschlagenen Replika/Restores, Kapazität >80 %.
# 8. Governance
- DR-Design dokumentieren, Ownership klar; regelmäßige DR-Übungen.
- Trennung von Admin-Kreisen (Primär vs. DR), Zugriffskontrolle.
- Audits/Reviews für Security, Kapazität, Kosten.
# 9. Links & Quellen
- Artikel 799/800 (Replika), 807 (Offsite), 826 (Immutable), 773 (Kapazität), 803/804 (Failover), Veeam DR Guides.