# Snapshot Management: Die Kunst der Point-in-Time Sicherung
TL;DR / Management Summary Ein Snapshot ist eine Momentaufnahme des Zustands eines Datenträgers zu einem exakten Zeitpunkt. Er basiert auf der Copy-on-Write (CoW) oder Redirect-on-Write Technologie und benötigt initial fast keinen Speicherplatz. Ein Senior Admin nutzt Snapshots für schnelle Rollbacks vor riskanten Updates und als Basis für konsistente Backups. Wichtigste Regel: Ein Snapshot ist kein Backup, da er physisch auf den gleichen Festplatten liegt wie die Originaldaten!
# 1. Einführung & Technologien
Wie Snapshots ‘zaubern’.
Anstatt Daten zu kopieren, merkt sich das System den Zustand der Metadaten (Pointer).
- Copy-on-Write (CoW): Wenn ein Block geändert wird, wird der alte Block erst an eine andere Stelle kopiert, bevor er überschrieben wird. (z.B. LVM).
- Redirect-on-Write (RoW): Neue Daten werden einfach an eine freie Stelle geschrieben, der Snapshot-Pointer zeigt weiterhin auf den alten Block. (z.B. ZFS, Proxmox, NetApp). Dies ist performanter!
# 2. Snapshots in Proxmox (QEMU/ZFS)
Sicherheit per Mausklick.
Proxmox nutzt Snapshots für VMs und Container.
- Include RAM: Sichert auch den Zustand des Arbeitsspeichers. Ermöglicht das Fortsetzen der VM an exakt der gleichen Stelle.
- ZFS Snapshots: Wenn die VM auf einem ZFS-Pool liegt, sind Snapshots fast instantan und haben keinen Performance-Impact.
# CLI Kommando (Shell)
# Erstellt einen Snapshot der VM 100
qm snapshot 100 "Vor_Update_XY" --description "Riskantes Kernel-Update"
# 3. Deep Dive: VSS (Windows) & Quiescing
Konsistenz sicherstellen.
Ein Snapshot der Hardware ist wertlos, wenn die Applikation (z.B. SQL) gerade Daten im RAM hält.
- Quiescing: Der Backup-Agent weist das OS an, alle Schreibvorgänge kurz einzufrieren (flushing caches).
- VSS (Volume Shadow Copy Service): Das Standard-Framework unter Windows (Artikel 453). Jede professionelle Backup-Software triggert VSS, bevor der Hardware-Snapshot erfolgt.
# 4. Day-2 Operations: Snapshot-Hygiene
Den ‘Snapshot-Sumpf’ vermeiden.
Einer der häufigsten Gründe für Performance-Probleme im RZ sind verwaiste Snapshots.
- Problem: Je älter ein Snapshot, desto mehr Platz belegt er (da sich immer mehr Daten vom Original unterscheiden).
- Performance: Bei herkömmlichem Storage (nicht ZFS) sinkt die I/O-Leistung mit jedem aktiven Snapshot linear ab.
- Regel: Snapshots sollten maximal 24-48 Stunden existieren. Alles andere gehört in ein echtes Backup-System (Artikel 613).
# 5. Troubleshooting & “War Stories”
Wenn der Snapshot das System killt.
# Top 3 Fehlerbilder
-
Symptom: VM friert beim Erstellen des Snapshots für 30 Sekunden ein.
- Ursache: “VM Stun”. Der Hypervisor braucht zu lange, um den RAM auf die Disk zu schreiben.
- Lösung: Schnellere Disk-Subsysteme (SSDs) nutzen oder auf RAM-Sicherung verzichten.
-
Symptom: Speicherplatz am Host läuft schlagartig voll.
- Ursache: Ein vergessener Snapshot sammelt alle Änderungen eines Monats.
- Fix:
zfs list -t snapshotprüfen und alte Stände löschen.
-
Symptom: Datenbank meldet “Log Corruption” nach Rollback.
- Ursache: Snapshot wurde ohne Quiescing/VSS erstellt.
# “War Story”: Der “Forever-Snapshot”
Ein Admin erstellte einen Snapshot einer VM vor einem Datenbank-Update. Das Update gelang, er vergaß den Snapshot. Das Ergebnis: Ein Jahr später war das Backup-Storage voll. Die Suche ergab, dass die VM durch den Snapshot 500 GB “Delta-Daten” angesammelt hatte. Beim Versuch, den Snapshot zu löschen (Mergen), war der Host für 4 Stunden ausgelastet, da er die Datenblöcke eines ganzen Jahres umschichten musste. Lehre: Implementieren Sie einen Snapshot-Monitor, der Sie täglich per Mail über Snapshots informiert, die älter als 3 Tage sind.
# 6. Monitoring & Reporting
Inventur der Momentaufnahmen.
# Snapshot Auditor Script (Bash)
# Findet alle Snapshots in Proxmox, die älter als 7 Tage sind
pvesh get /cluster/resources --type vm | jq -r '.[] | .vmid' | while read id; do
qm listsnapshot $id | grep -v "current" | awk '$4 < (strftime("%s") - 604800) {print "VM " id " has old snapshot"}'
done
# 7. Fazit & Empfehlung
Snapshots sind ein Werkzeug für das operative Management, nicht für die Datensicherung.
- Empfehlung: Nutzen Sie Snapshots konsequent vor jeder administrativen Änderung.
- Wichtig: Löschen Sie den Snapshot sofort, nachdem Sie den Erfolg Ihrer Arbeit verifiziert haben (meist nach 1-2 Stunden).
# Anhang: Cheatsheet
| System | Befehl / Pfad |
|---|---|
| Proxmox | qm snapshot <vmid> <name> |
| ZFS | zfs snapshot <pool/dataset>@<name> |
| Windows | vssadmin list shadows |
| LVM | lvcreate -s -n <name> -L <size> <path> |