# Machine Learning Operations (MLOps)
Kurzfassung: Backup- und DR-Kosten hängen an Lizenzen, Storage-Klassen, Retention und Egress. Ziel: das passende Lizenzmodell, effizientes Tiering/Lifecycle, klare Retention und laufendes Kosten-Monitoring.
# 1. Zweck & Zielbild
- Vorhersehbare Kosten, keine Überraschungen bei Storage/Egress/Lizenzen.
- Ressourcen passend zu RPO/RTO dimensioniert, ohne Überprovisionierung.
- Transparente Reports für Finanzen/Management.
# 2. Voraussetzungen
- Übersicht über geschützte Workloads/Skalierung, Lizenzmodelle (z. B. VUL).
- Storage-Optionen (On-Prem, Cloud-Klassen, Immutable) und Preise bekannt.
- Monitoring/Tagging, um Kosten zuzuordnen.
# 3. Risiken / Backout
- Zu aggressive Retention/Offsite → hohe Storage/Egress-Kosten.
- Falsches Lizenzmodell → mehr zahlen als nötig.
- Unkontrollierte Rehydration/Restore aus Cloud → Egress-Spitzen.
- Backout: Retention/Lifecycle anpassen, Lizenzmodell prüfen, Offload begrenzen oder andere Klasse nutzen.
# 4. Umsetzung (Schritte)
- Lizenzwahl: Passendes Veeam-Modell (Sockets, VUL) je Wachstum/Hybrid; jährliche Review.
- Storage-Klassen/Tiering: Performance für aktuelle Points, Capacity/Archive für Alt-Daten; Object Lock/Immutability einkalkulieren.
- Retention/GFS: An Business/Compliance ausrichten, unnötig lange Aufbewahrungen vermeiden; GFS gezielt.
- Lifecycle/Offload: Cloud-Lifecycle (IA/Archive), BWLimit/Fenster; vermeiden von unnötigen Rehydrationen.
- Kostentransparenz: Tags/Kostenstellen, Reports (monatlich) mit Storage/Egress/License-Usage; Alerts bei Überschreitung.
- Optimierungen: Kompression/Dedupe (Artikel 798), Splitting von schlecht komprimierbaren Daten, Offsite-Frequenz anpassen.
# 5. Verify / Tests
- Kostenreport entspricht Nutzung, keine unerwarteten Peaks.
- Restore/Offload-Tests zeigen kalkulierbare Egress-Kosten.
- Lizenzen reichen für geplantes Wachstum.
# 6. Runbooks
- Kosten-Alarm: Lifecycle/Retention justieren, Storage-Klasse wechseln, unnötige Rehydration stoppen.
- Lizenz knapp: Upgrade planen, ausgediente Workloads entfernen, Konsolidieren.
- Budget-Review: Varianten durchrechnen (Tiering, Frequenz, Klasse), Entscheidung dokumentieren.
# 7. Monitoring / Alerts
- Storage-Verbrauch pro Tier, Egress/Requests, Lizenzverbrauch, Offload/Restore-Volumen.
- Alerts bei Budget-/Schwellwert-Überschreitung, ungeplanten Rehydrationen.
# 8. Governance
- Kosten/Retention-Entscheidungen versionieren, Finance-Review regelmäßig.
- Tags/Kostenstellen verpflichtend für neue Jobs/Repos.
- Dokumentation von Lifecycle/Offload-Regeln, Audit von Egress.
# 9. Links & Quellen
- Artikel 795/827 (Tiering/Synthetic), 806/807 (Cloud/Offsite), 825 (3-2-1), 798 (Compression/Dedupe), Veeam Licensing Guide, Cloud-Provider Pricing.