# Backup Validation & Verification: Integritätsschutz für den Ernstfall

TL;DR / Management Summary Ein Backup-Job, der mit “Success” beendet wurde, garantiert nur, dass die Daten übertragen wurden. Er garantiert nicht, dass die Daten auf dem Zielspeicher noch lesbar sind oder dass sie logisch konsistent sind. Wir nutzen Verification Jobs, um Bit-Rot (schleichender Datenverlust durch Hardwarefehler) zu erkennen, und Validation Jobs, um die bootfähige Nutzbarkeit der Daten zu prüfen. Ein Senior Admin plant diese Jobs so ein, dass sie die tägliche Backup-Performance nicht beeinträchtigen, aber dennoch lückenlos alle Datenbestände abdecken.


# 1. Einführung & Definitionen

Integrität ist kein Zufall.

  1. Checksum Verification (Integrität): Prüft, ob der geschriebene Block noch identisch zum gelesenen Block ist. Erkennt Hardware-Fehler.
  2. Logical Validation (Konsistenz): Prüft, ob das Dateisystem oder die Datenbank innerhalb des Backups fehlerfrei ist.
  3. Boot Validation (Verfügbarkeit): Startet die VM in einer Sandbox (Artikel 640).

# 2. Verification in Proxmox / PBS

Der blockbasierte Check.

Der Proxmox Backup Server (PBS) nutzt eine extrem effiziente Verification-Engine.

# Manueller Start via Shell
proxmox-backup-manager verify --repository my-repo --all

# 3. Deep Dive: Bit-Rot & Silent Data Corruption

Der Feind im Verborgenen.

Bit-Rot tritt auf, wenn magnetische oder elektrische Ladungen auf der Disk über Jahre schwächer werden.


# 4. Day-2 Operations: Ressourcen-Planung

Die Last des Prüfens.

Ein Verification-Job muss jedes Byte vom Speicher lesen.


# 5. Troubleshooting & “War Stories”

Wenn der Check Fehler findet.

# Top 3 Fehlerbilder

  1. Symptom: Verification schlägt fehl mit “Manifest mismatch”.

    • Ursache: Das Index-File (Manifest) passt nicht mehr zu den Daten-Chunks.
    • Lösung: Prüfen Sie das Dateisystem des Backup-Servers (z.B. zpool status).
  2. Symptom: Job dauert unendlich lange.

    • Ursache: Zu viele kleine Chunks auf langsamen mechanischen Platten.
    • Fix: Nutzen Sie SSDs für den PBS-Index oder vergrößern Sie den RAM des Backup-Servers.
  3. Symptom: “Bad Chunks” nach Stromausfall.

    • Lösung: Löschen Sie die betroffenen Snapshots und starten Sie ein neues Full-Backup (Active Full) der betroffenen VMs.

# “War Story”: Der schweigende Sterbe-Prozess

Ein Admin sicherte 200 VMs auf ein großes RAID-6 System. Er verzichtete auf Verification-Jobs, um die Performance nicht zu drücken. Das Ergebnis: Ein Controller-Fehler schrieb über Monate hinweg falsche Paritätsdaten. Als ein Restore nötig war, stellte sich heraus, dass 30% aller Backup-Ketten korrupt waren. Lehre: Ohne regelmäßige Verification ist ein Backup-Storage nur ein Hoffnungsspeicher. Die Last der Prüfung ist der Preis für die Sicherheit.


# 6. Monitoring & Reporting

Statusberichte.

# Compliance Reporting

Integrieren Sie die Verification-Ergebnisse in Ihren wöchentlichen Bericht (Artikel 641).


# 7. Fazit & Empfehlung

Verification ist der wichtigste Wartungs-Task nach dem eigentlichen Backup.


# Anhang: Cheatsheet

Aufgabe Pfad / Befehl
PBS Verify Job Datastore -> Verify Jobs
Letzte Ergebnisse Datastore -> Summary
Log Analyse grep "error" /var/log/proxmox-backup/tasks/...
ZFS Integrity zpool scrub <poolname>

# Referenzen