# Proxmox Lifecycle Management: Snapshots, Retention & Pruning

TL;DR / Management Summary Ein unkontrolliertes Wachstum von Snapshots und Backups führt unweigerlich zum Stillstand des Rechenzentrums. Wir implementieren eine strikte Retention Policy: Kurzzeit-Sicherheit via Snapshots (max. 48h) und Langzeit-Archivierung via Backups (GFS-Schema). Ein Senior Admin nutzt die Pruning-Funktion von Proxmox, um veraltete Sicherungen vollautomatisch zu löschen und so die Storage-Kapazität für produktive Workloads freizuhalten.


# 1. Das GFS-Prinzip für Proxmox

Die Hierarchie der Backups.

Nutzen Sie das Grandfather-Father-Son (GFS) Modell (Artikel 645) für Ihre Backup-Jobs:


# 2. Snapshot-Hygiene

Den Host nicht verstopfen.

Ein Snapshot ist kein Backup. Er belegt Platz auf dem produktiven SAN/ZFS.


# 3. Deep Dive: Pruning in Proxmox & PBS

Intelligentes Löschen.

Seit Proxmox 7.x ist das Pruning direkt in die Backup-Jobs integriert.

  1. Datacenter -> Backup -> [Job wählen] -> Retention.
  2. Geben Sie die Werte für keep-daily, keep-weekly etc. ein.
  3. Vorgang: Nach jedem erfolgreichen Backup-Lauf prüft Proxmox die Kette und löscht die ältesten Stände, die nicht mehr in das Schema passen.

# 4. Day-2 Operations: Garbage Collection (PBS)

Physischen Platz freigeben.

Wenn Sie den Proxmox Backup Server nutzen, werden beim Pruning nur die Index-Dateien gelöscht.


# 5. Troubleshooting & “War Stories”

Wenn die Policy versagt.

# Top 3 Fehlerbilder

  1. Symptom: Speicherplatz wird trotz Pruning nicht frei.

    • Ursache: Die Garbage Collection auf dem PBS wurde nicht gestartet.
    • Lösung: GC manuell starten oder Schedule prüfen.
  2. Symptom: Wichtige Backups wurden gelöscht.

    • Ursache: Zu aggressive Pruning-Regeln (z.B. keep-last: 1 für einen wöchentlichen Job).
    • Fix: Nutzen Sie die “Notes” Funktion in Proxmox, um wichtige Backups zu schützen. Markierte Backups werden vom Pruning ignoriert.
  3. Symptom: Hoher I/O Wait am Wochenende.

    • Ursache: Alle Backup-Retention-Jobs und Garbage Collections laufen gleichzeitig.

# “War Story”: Die “Snapshot-Inception”

Ein Admin sicherte eine VM, die selbst hunderte interne Snapshots hatte (z.B. eine verschachtelte Proxmox-Instanz). Das Ereignis: Er wunderte sich, warum das Backup der 100 GB VM plötzlich 2 TB groß war. Die Ursache: Da das Backup-Tool jeden Snapshot-Zustand des Gast-Dateisystems als “geänderte Blöcke” sah, wurde die Deduplikation ausgehebelt. Lehre: Bereinigen Sie Snapshots innerhalb von VMs, bevor Sie ein Infrastruktur-Backup auf Hypervisor-Ebene durchführen.


# 6. Monitoring & Reporting

Füllstände im Dashboard.

# Dashboard Check

Überwachen Sie Datacenter -> Summary.


# 7. Fazit & Empfehlung

Lifecycle-Management ist die Versicherung gegen “Disk-Full” Panics.


# Anhang: Cheatsheet (Pruning Parameter)

Feld Empfehlung Zweck
keep-last 3 Schutz vor Fehlern vor 5 Minuten
keep-daily 30 Tägliches Recovery
keep-monthly 12 Jahresabschluss
keep-yearly 1 Langzeit-Archiv

# Referenzen