# Cloud FinOps: Strategien zur Kosten-Optimierung & Budget-Kontrolle
TL;DR / Management Summary In der Cloud ist der Klick auf “Erstellen” ein Klick auf “Bezahlen”. FinOps (Cloud Financial Management) ist die Disziplin, die operative Agilität mit finanzieller Verantwortung verbindet. Ein Senior Admin verlässt sich nicht auf das Glück, sondern implementiert Budget-Alarme, nutzt Reserved Instances für Grundlasten und identifiziert “Zombie-Ressourcen” (ungenutzte Festplatten oder IP-Adressen), um die Cloud-Rechnung monatlich um bis zu 30% zu senken.
# 1. Die drei Säulen von FinOps
Informieren, Optimieren, Operieren.
- Inform: Wer verursacht welche Kosten? Nutzung von Tags (z.B.
Dept: Marketing,Project: Website). - Optimize: Wo können wir sparen? (Rechts-Sizing von VMs, Nutzung von Spot-Instanzen).
- Operate: Kontinuierliche Überwachung und Automatisierung der Kostenkontrolle.
# 2. Praktische Sparmaßnahmen
Low Hanging Fruits.
# 1. Rightsizing
Prüfen Sie, ob Ihre VMs wirklich die zugewiesene CPU/RAM Leistung nutzen.
- Aktion: Eine VM mit 10% Durchschnittslast sollte auf einen kleineren Instanz-Typ herabgestuft werden.
# 2. Orphaned Resources (Vampire) löschen
Suchen Sie nach Ressourcen, die Geld kosten, aber nicht genutzt werden:
- Unattached EBS Volumes: Festplatten von gelöschten VMs.
- Unused Elastic IPs: Reservierte IPs ohne VM.
- Old Snapshots: Sichern Sie alte Stände in den Glacier-Storage (Artikel 633).
# 3. Deep Dive: Reserved Instances (RI) vs. Spot
Einkaufen wie ein Profi.
- On-Demand: Flexibel, aber am teuersten. (Ideal für Entwicklung/Tests).
- Reserved Instances: Sie verpflichten sich für 1-3 Jahre.
- Ersparnis: Bis zu 70%.
- Einsatz: Für Datenbanken und Core-Infrastruktur.
- Spot Instances: Sie bieten auf ungenutzte Cloud-Kapazität.
- Ersparnis: Bis zu 90%.
- Gefahr: Der Provider kann die VM jederzeit mit 2 Minuten Vorwarnung löschen.
- Einsatz: Nur für zustandslose Batch-Verarbeitung oder Render-Jobs.
# 4. Day-2 Operations: Automatisierte Budget-Alarme
Sicherungen für das Konto.
Konfigurieren Sie in AWS oder Azure harte Grenzen:
- Warnung 1: Bei 50% des Monatsbudgets.
- Warnung 2: Bei 80% des Monatsbudgets.
- Kritisch: Wenn die prognostizierten Kosten das Budget um 20% übersteigen.
# 5. Troubleshooting & “War Stories”
Wenn die Rechnung explodiert.
# Top 3 Kostenfallen
-
Symptom: Massive Rechnung für “Data Transfer”.
- Ursache: Traffic zwischen verschiedenen Regionen (Egress) oder Nutzung von öffentlichen IPs statt privatem Peering.
- Lösung: Platzieren Sie Ressourcen in der gleichen Availability Zone.
-
Symptom: Managed Services (PaaS) sind 10x teurer als erwartet.
- Ursache: Falsches Performance-Level gewählt (z.B. Provisioned IOPS bei einer Test-DB).
-
Symptom: Entwicklungsumgebungen fressen das Budget am Wochenende.
- Fix: Nutzen Sie ein Auto-Stop Script, das alle Test-VMs am Freitag um 18:00 Uhr herunterfährt.
# “War Story”: Die “Schatten”-Datenbank
Ein Entwickler erstellte eine mächtige Test-Datenbank in Azure, um eine Migration zu testen. Er nutzte die höchste Performance-Stufe (Premium). Er vergaß, den Dienst nach dem Test zu löschen. Das Ergebnis: Die Datenbank kostete 50 Euro – pro Tag. Da niemand die Kosten-Dashboards prüfte, fiel der Fehler erst 3 Monate später auf. Die Kosten: 4.500 Euro für ein leeres Test-System. Lehre: Implementieren Sie einen “Resource-Sweeper”. Jede Ressource ohne Ablaufdatum-Tag muss vom System automatisch markiert oder gelöscht werden.
# 6. Monitoring & Reporting
Kosten-Transparenz.
# AWS Cost Explorer / Azure Advisor
Nutzen Sie die KI-Empfehlungen der Provider.
- KPI:
Cost Per Unit of Business Value. (z.B. Kosten pro Bestellung im Onlineshop).
# 7. Fazit & Empfehlung
FinOps ist ein Teil der IT-Kultur, kein einmaliges Projekt.
- Empfehlung: Nutzen Sie Tags für absolut jede Ressource in der Cloud. Ohne Tags gibt es keine Zuweisung.
- Wichtig: Machen Sie die Kosten für die Entwickler sichtbar. Nur wer die Kosten seiner Architektur sieht, wird diese optimieren.
# Anhang: FinOps Checkliste (Monatlich)
- [ ] Alle ungenutzten Snapshots gelöscht?
- [ ] Nicht verbundene IP-Adressen freigegeben?
- [ ] Rightsizing-Empfehlungen geprüft?
- [ ] Reserved Instances Coverage überprüft?
- [ ] Budget-Alarme noch aktuell?