# Serverless Computing – FaaS
Kurzfassung: Ein DR-Plan definiert, welche Services wie schnell (RTO) und wie aktuell (RPO) wiederhergestellt werden. Daraus folgen passende Technologien (Backup/Replika), Runbooks, Tests und ein Governance-Rahmen.
# 1. Zweck & Zielbild
- Dokumentierte, abgestimmte RTO/RPO-Ziele pro Service.
- Technische Maßnahmen (Backups, Replikation, DR-Site) passend zu den Zielen.
- Regelmäßig getestete Wiederanlaufpfade mit klaren Rollen.
# 2. Voraussetzungen
- Inventar/Kritikalität der Services, Abhängigkeiten (DB/Auth/Netz/Storage) erfasst.
- Ressourcen/Standorte für DR (Repos, Proxies, DR-Site) vorhanden.
- Kommunikation/Oncall/Stakeholder definiert.
# 3. Risiken / Backout
- Unrealistische Ziele → Plan scheitert im Ernstfall.
- Fehlende Tests → Annahmen falsch.
- Ressourcen im DR nicht ausreichend → RTO verfehlt.
- Backout: Ziele neu verhandeln, Prioritäten anpassen, Ressourcen/Technik nachziehen.
# 4. Umsetzung (Schritte)
- RTO/RPO festlegen: Mit Business priorisieren, Klassen definieren (z. B. Kritisch, Hoch, Standard).
- Maßnahmen ableiten: Backup-Frequenz, Replikation (Artikel 799/800), Offsite/Immutability (826/807), Failover-Runbooks (803/804).
- Ressourcen planen: DR-Site (Artikel 830), Kapazität/Netz, Lizenzen.
- Runbooks erstellen: Pro Klasse/Service, inkl. Netz/DNS, Freigaben, Checks.
- Tests: Tabletop + technische Tests (Restore/Faliover), RTO/RPO messen.
- Dokumentation: Plan, Annahmen, Verantwortliche, Kommunikationswege, Versionierung.
# 5. Verify / Tests
- RTO/RPO-Messungen aus Tests im Soll.
- Runbooks funktionieren, Abhängigkeiten berücksichtigt.
- Nach größeren Änderungen erneute Tests.
# 6. Runbooks
- Plan-Update: Nach Incidents/Änderungen RTO/RPO prüfen, Plan anpassen.
- RTO verfehlt: Engpass identifizieren (Netz/Storage/Automation), Maßnahmen priorisieren.
- RPO verfehlt: Frequenz/Transport anpassen, Bandbreite erhöhen, Jobs splitten.
# 7. Monitoring / Alerts
- RPO-Delta, Replika-/Backup-Fehler, DR-Site-Health.
- Alerts bei RPO-Verletzung, fehlgeschlagenen Tests, Ressourcen-Engpässen.
- KPI: tatsächliche RTO/RPO aus Übungen.
# 8. Governance
- Plan versionieren, mindestens jährlich reviewen; Business-Abnahme.
- Rollen/Vertretungen klar, Freigabeprozess für Failover/DR-Tests.
- Evidenz von Tests/Änderungen revisionssicher ablegen.
# 9. Links & Quellen
- Artikel 799/800 (Replikation), 803/804 (Failover), 765/806/807 (Offsite/Cloud), 826 (Immutability), interne DR-Policy.