# Proxmox Lifecycle Management: Snapshots, Retention & Pruning

TL;DR / Management Summary Ein unkontrolliertes Wachstum von Snapshots und Backups führt unweigerlich zum Stillstand des Rechenzentrums. Wir implementieren eine strikte Retention Policy: Kurzzeit-Sicherheit via Snapshots (max. 48h) und Langzeit-Archivierung via Backups (GFS-Schema). Ein Senior Admin nutzt die Pruning-Funktion von Proxmox, um veraltete Sicherungen vollautomatisch zu löschen und so die Storage-Kapazität für produktive Workloads freizuhalten.

# 1. Das GFS-Prinzip für Proxmox

Die Hierarchie der Backups.

Nutzen Sie das Grandfather-Father-Son (GFS) Modell (Artikel 645) für Ihre Backup-Jobs:

Keep Daily: 7-14 (Die letzten zwei Wochen).
Keep Weekly: 4 (Der letzte Monat).
Keep Monthly: 12 (Das letzte Jahr).
Wirkung: Sie haben jederzeit Zugriff auf aktuelle Fehlerstände und steuerrechtliche Archivdaten.

# 2. Snapshot-Hygiene

Den Host nicht verstopfen.

Ein Snapshot ist kein Backup. Er belegt Platz auf dem produktiven SAN/ZFS.

Regel: Snapshots sollten nur für operative Änderungen genutzt werden (z.B. vor einem Software-Update).
Automatische Bereinigung: Nutzen Sie ein Script, das Snapshots ohne das Label keep nach 3 Tagen automatisch löscht.

# 3. Deep Dive: Pruning in Proxmox & PBS

Intelligentes Löschen.

Seit Proxmox 7.x ist das Pruning direkt in die Backup-Jobs integriert.

Datacenter -> Backup -> [Job wählen] -> Retention.
Geben Sie die Werte für keep-daily, keep-weekly etc. ein.
Vorgang: Nach jedem erfolgreichen Backup-Lauf prüft Proxmox die Kette und löscht die ältesten Stände, die nicht mehr in das Schema passen.

# 4. Day-2 Operations: Garbage Collection (PBS)

Physischen Platz freigeben.

Wenn Sie den Proxmox Backup Server nutzen, werden beim Pruning nur die Index-Dateien gelöscht.

Aktion: Konfigurieren Sie einen wöchentlichen Garbage Collection Job auf dem PBS.
Ergebnis: Erst jetzt werden die physischen Datenblöcke (Chunks) von der Festplatte gelöscht, die von keiner VM mehr referenziert werden.

# 5. Troubleshooting & “War Stories”

Wenn die Policy versagt.

# Top 3 Fehlerbilder

Symptom: Speicherplatz wird trotz Pruning nicht frei.
- Ursache: Die Garbage Collection auf dem PBS wurde nicht gestartet.
- Lösung: GC manuell starten oder Schedule prüfen.
Symptom: Wichtige Backups wurden gelöscht.
- Ursache: Zu aggressive Pruning-Regeln (z.B. keep-last: 1 für einen wöchentlichen Job).
- Fix: Nutzen Sie die “Notes” Funktion in Proxmox, um wichtige Backups zu schützen. Markierte Backups werden vom Pruning ignoriert.
Symptom: Hoher I/O Wait am Wochenende.
- Ursache: Alle Backup-Retention-Jobs und Garbage Collections laufen gleichzeitig.

# “War Story”: Die “Snapshot-Inception”

Ein Admin sicherte eine VM, die selbst hunderte interne Snapshots hatte (z.B. eine verschachtelte Proxmox-Instanz). Das Ereignis: Er wunderte sich, warum das Backup der 100 GB VM plötzlich 2 TB groß war. Die Ursache: Da das Backup-Tool jeden Snapshot-Zustand des Gast-Dateisystems als “geänderte Blöcke” sah, wurde die Deduplikation ausgehebelt. Lehre: Bereinigen Sie Snapshots innerhalb von VMs, bevor Sie ein Infrastruktur-Backup auf Hypervisor-Ebene durchführen.

# 6. Monitoring & Reporting

Füllstände im Dashboard.

# Dashboard Check

Überwachen Sie Datacenter -> Summary.

KPI: Storage Growth Rate. Wächst der Speicher linear oder exponentiell?
Aktion: Passen Sie die Retention an, wenn die Kurve zu steil nach oben zeigt.

# 7. Fazit & Empfehlung

Lifecycle-Management ist die Versicherung gegen “Disk-Full” Panics.

Empfehlung: Nutzen Sie das GFS-Schema konsequent. Es ist der sicherste Kompromiss aus Sicherheit und Kosten.
Wichtig: Sichern Sie Ihre Retention-Settings in Ihrer Dokumentation. Ein versehentlicher Klick auf “Keep Last: 1” kann Jahre an Unternehmens-Historie löschen.

# Anhang: Cheatsheet (Pruning Parameter)

Feld	Empfehlung	Zweck
`keep-last`	3	Schutz vor Fehlern vor 5 Minuten
`keep-daily`	30	Tägliches Recovery
`keep-monthly`	12	Jahresabschluss
`keep-yearly`	1	Langzeit-Archiv