# Proxmox HA Orchestrierung: Ressourcen, Gruppen & intelligente Priorität

TL;DR / Management Summary Ein einfacher Failover ist gut, ein orchestrierter Failover ist besser. Mit HA Groups steuern wir exakt, welche VMs auf welchen Knoten schwenken dürfen. Durch den Einsatz von Prioritäten stellen wir sicher, dass bei einem Host-Ausfall der Domain Controller vor dem Datenbank-Server startet. Ein Senior Admin nutzt diese Werkzeuge, um Ressourcen-Engpässe zu vermeiden und die Abhängigkeiten der Applikations-Stacks (Artikel 641) im Cluster abzubilden.


# 1. HA Ressourcen verstehen

Was wird überwacht?

Eine HA-Ressource in Proxmox kann sein:


# 2. HA Gruppen: Die Schwenk-Domains

Den Aktionsradius begrenzen.

Standardmäßig schwenkt eine VM auf jeden freien Knoten im Cluster.


# 3. Deep Dive: Prioritäten & Startreihenfolge

Wer darf zuerst?

In den Einstellungen einer HA-Ressource können Sie eine Priority (0-1000) vergeben.


# 4. Day-2 Operations: ‘No-Failback’ Strategien

Unnötiges Wandern vermeiden.

Standardmäßig schwenkt eine VM sofort wieder auf ihren “Lieblings-Host” zurück, sobald dieser wieder online ist (Failback).


# 5. Troubleshooting & “War Stories”

Wenn die Logik gegen die Realität verliert.

# Top 3 Fehlerbilder

  1. Symptom: VM startet nicht am Ersatz-Knoten trotz hoher Priorität.

    • Ursache: Der Host ist in der HA-Gruppe als Maintenance markiert oder hat einen fehlerhaften Storage-Mount.
    • Lösung: ha-manager status prüfen.
  2. Symptom: Zwei VMs starten gleichzeitig und überlasten die Disk (Boot-Sturm).

    • Fix: Nutzen Sie die Start-Verzögerung (Startup Delay) in den VM-Optionen zusätzlich zur HA-Priorität.
  3. Symptom: VM wandert im 5-Minuten Takt zwischen Hosts hin und her.

    • Ursache: Flapping-Gateway oder ungleiche Load-Werte in der Gruppe.

# “War Story”: Der “Blindstart” des SQL-Servers

Ein Admin setzte den SQL-Server auf Priorität 1000, den Domain Controller auf 0. Das Ereignis: Stromausfall. Der Cluster startete neu. Das Ergebnis: Der SQL-Server startete zuerst. Da der Domain Controller noch nicht online war, konnte der SQL-Dienst den Service-Account nicht validieren und verweigerte den Start. Der Admin musste morgens alle SQL-Dienste manuell neustarten. Lehre: Prioritäten spiegeln die logische Abhängigkeit wider. Die Infrastruktur (Authentifizierung) muss immer vor der Applikation kommen.


# 6. Monitoring & Reporting

Dashboard-Status.

# HA Group View

Prüfen Sie im Datacenter-Dashboard:


# 7. Fazit & Empfehlung

Intelligentes Ressourcen-Management macht den Unterschied zwischen einem “Haufen VMs” und einem “professionellen Service”.


# Anhang: Cheatsheet (Priority Schema)

Tier Priorität Beispiel-Dienste
Tier 0 1000 PVE-Manager, DNS, DC
Tier 1 800 SAN-Controller, Storage-Gateways
Tier 2 500 DB-Cluster, Message-Queues
Tier 3 100 App-Server, Web-Backends

# Referenzen