# Proxmox VM Snapshots & Backups: Schutz für Ihre Workloads
TL;DR / Management Summary Ein Datenverlust in der Virtualisierung ist oft final. Wir nutzen ein zweistufiges Modell: Snapshots für das schnelle Rollback bei administrativen Fehlern (Minuten-Horizont) und Backups (via Proxmox Backup Server) für die langfristige Datensicherung und Disaster Recovery (Tage/Wochen-Horizont). Ein Senior Admin versteht, dass ein Snapshot kein Backup ist und automatisiert Sicherungen nach der 3-2-1 Regel (Artikel 604).
# 1. VM Snapshots
Die Kurzzeit-Versicherung.
Snapshots speichern den aktuellen Zustand einer VM (CPU, RAM, Disk).
- Technik: Redirect-on-Write (ZFS) oder qcow2-Snapshots.
- Aktion:
VM -> Snapshots -> Take Snapshot. - Wichtig: Snapshots belegen Platz auf dem gleichen Storage wie die VM. Wenn das SAN stirbt, ist auch der Snapshot weg.
# 2. Proxmox Backup-Typen (VZDump)
Daten sicher wegschreiben.
Proxmox bietet drei Modi für Sicherungen:
- Stop: VM wird heruntergefahren. Sicherste Methode für Konsistenz. (Max. Downtime).
- Suspend: VM wird kurz angehalten. (Mittlere Downtime).
- Snapshot (Standard): Sichert die VM im laufenden Betrieb via QEMU-Live-Backup. (Keine Downtime).
# 3. Deep Dive: Proxmox Backup Server (PBS) integration
Deduplikation ist der Schlüssel.
Anstatt bei jedem Backup die volle VM-Größe (z.B. 100 GB) zu sichern, nutzt der PBS Block-Deduplikation.
- Effekt: Das tägliche Backup einer 1 TB Fileserver-VM dauert nur Sekunden und belegt nur wenige Megabyte (das “Delta”).
- Vorteil: Sie können hunderte Versionen vorhalten, ohne den Speicher zu sprengen.
# 4. Day-2 Operations: Restore-Szenarien
Der Moment der Wahrheit.
# 1. Full Restore
Überschreibt die bestehende VM oder erstellt eine neue VM mit einer neuen ID.
- Aktion:
Storage -> Backups -> Restore.
# 2. Live-Restore (PBS Feature)
Die VM startet sofort aus dem Backup-Archiv, während die Daten im Hintergrund auf das produktive Storage kopiert werden.
- Vorteil: Der Server ist nach 30 Sekunden wieder online, auch wenn der Restore 2 Stunden dauert.
# 5. Troubleshooting & “War Stories”
Wenn die Sicherung klemmt.
# Top 3 Fehlerbilder
-
Symptom: Snapshot schlägt fehl mit “VM is locked”.
- Ursache: Ein vorheriger Task (z.B. Backup oder Disk-Move) hängt noch.
- Lösung:
qm unlock <vmid>in der Shell.
-
Symptom: Backup ist extrem langsam (< 10 MB/s).
- Ursache: Bandbreiten-Limit in den Datacenter-Optionen oder langsames Ziel-Storage (NFS/CIFS).
- Fix: Backup-Traffic in ein eigenes VLAN schieben.
-
Symptom: Restore einer Windows-VM bootet nicht.
- Lösung: Prüfen Sie, ob der richtige Disk-Controller (VirtIO vs. IDE) beim Restore gewählt wurde.
# “War Story”: Der “Snapshot-Friedhof”
Ein Admin nutzte Snapshots als Backup-Ersatz und behielt für jede VM 50 Snapshots über ein Jahr hinweg. Das Ergebnis: Die Disk-Performance des Clusters sank um 80%. Beim Versuch, einen Snapshot zu löschen, fror der gesamte Host für 2 Stunden ein, da Milliarden von Blöcken gemergt werden mussten. Lehre: Snapshots sind für Stunden, Backups für Jahre. Löschen Sie Snapshots spätestens nach 48 Stunden!
# 6. Monitoring & Reporting
Statistiken der Sicherheit.
# Backup Reports
Konfigurieren Sie Email-Berichte unter Datacenter -> Backup -> Jobs -> Notifications.
- KPI:
Success Rate. Jeder fehlgeschlagene Job muss ein Ticket im Support-System eröffnen.
# 7. Fazit & Empfehlung
Sicherung ist Pflicht, Testen ist Kür.
- Empfehlung: Nutzen Sie den Proxmox Backup Server (PBS). Es gibt keine effizientere Methode für Proxmox-Umgebungen.
- Wichtig: Führen Sie monatlich einen Proberestore durch. Ein Backup, das sich nicht wiederherstellen lässt, hat den Wert Null.
# Anhang: Cheatsheet (vzdump)
| Aufgabe | Befehl |
|---|---|
| VM sofort sichern | vzdump <vmid> --storage local-backup |
| Backup-Inhalt listen | proxmox-backup-client list |
| Lock entfernen | qm unlock <vmid> |
| Restore via CLI | qmrestore <file> <newid> |