# eBPF – Kernel Programming
Kurzfassung: Mehrere Proxies erhöhen Durchsatz und Resilienz. Ziel ist eine skalierbare Architektur mit passender Platzierung, Transport-Modi, Load-Balancing und klaren Betriebs-/Failover-Regeln.
# 1. Zweck & Zielbild
- Skalierbare Backups/Replicas, keine Single Proxy Bottlenecks.
- Redundanz pro Standort/Segment, automatisches Balancing.
- Transport-Modi optimal genutzt (SAN/HotAdd bevorzugt).
# 2. Voraussetzungen
- Topologie/Standorte bekannt, Bandbreite/Storage-Pfade klar.
- Proxies mit ausreichender CPU/RAM/NIC, Treiber aktuell.
- RBAC und Netz/Firewall-Regeln für alle Proxies (Artikel 821/779).
# 3. Risiken / Backout
- Ungleichmäßige Verteilung → einzelne Proxies überlastet.
- Falscher Modus (NBD) wegen Platzierung → langsame Jobs.
- Zu viele Proxies → Management/Fehlerquellen steigen.
- Backout: Auto-Balancing/Weights anpassen, Proxies konsolidieren, Transport-Modi prüfen.
# 4. Umsetzung (Schritte)
- Kapazität planen: Tasks pro Proxy (ca. 2/ vCPU), Anzahl pro Standort; Reserve für Ausfälle.
- Platzierung: Nahe an Hypervisor/Storage, dedizierte Backup-NIC/VLAN.
- Transport-Modi: Pro Proxy konfigurieren (SAN/HotAdd bevorzugt), Logs auf Fallback prüfen.
- Balancing: Automatische Proxy-Auswahl in Jobs; bei Bedarf Affinity/Exclusions, Weights.
- Netz/Storage: QoS/BWLimit, MTU-Check, SAN-Zoning/Datastore-Zuordnung korrekt.
- Betrieb: Patchen/Rotation ohne Downtime (Maintenance-Fenster), Health-Checks automatisieren.
# 5. Verify / Tests
- Durchsatz-/Load-Tests pro Proxy, Jobs nutzen gewünschten Modus.
- Failover-Test: Proxy offline, Jobs laufen über andere weiter.
- Restore-Test über verschiedene Proxies.
# 6. Runbooks
- Proxy down/slow: Tasks auf andere Proxies verschieben, Ursache fixen, ggf. temporär mehr Slots anderswo.
- Mode-Fallback: Platzierung/Zoning prüfen, Proxy neu zuordnen.
- Überlast: Neue Proxies hinzufügen, Jobs/Waves splitten, BWLimit.
- Maintenance: Proxy aus Rotation nehmen, nach Patch wieder aktivieren.
# 7. Monitoring / Alerts
- Task-Queue, CPU/IO/Netz pro Proxy, Transport-Mode-Stats, Fallback-Quote.
- Alerts bei Proxy-Disconnect, hoher Fallback auf NBD, dauerhafter Überlast, unbalanciertem Load.
# 8. Governance
- Design/Settings versionieren, Reviews bei Änderungen.
- Kapazitätsplanung (Artikel 773) regelmäßig mitwachsen lassen.
- Rollen/Owner pro Standort, Patch-/Lifecycle-Plan.
# 9. Links & Quellen
- Artikel 785/810 (Proxies/Data Mover), 791 (Scheduling), 799/800 (Replication), 779 (Netz), Veeam Transport/Proxy Best Practices.