# Network Visualization: Dashboards für Bandbreite & Traffic-Trends
TL;DR / Management Summary Ein Administrator darf niemals raten, wie viel Bandbreite gerade verbraucht wird. Während die Echtzeit-Graphen auf Switchen (Artikel 728) nur den Moment zeigen, ermöglichen Network Graphs in Grafana die Analyse von Trends über Wochen und Monate. Wir nutzen Daten aus SNMP, NetFlow und dem Proxmox Metrics Server, um ein umfassendes Bild des Datenflusses zu zeichnen. Ein Senior Admin nutzt diese Dashboards zur Kapazitätsplanung und zur Erkennung von Schatten-IT (z.B. unautorisierte Cloud-Syncs).
# 1. Datenquellen für die Visualisierung
Vom Zähler zum Pixel.
- SNMP (Layer 2/3): Liefert die
ifInOctetsundifOutOctetsZähler der Switch-Ports. (Basis für klassische Bandbreiten-Graphen). - NetFlow / sFlow (Layer 4): Liefert Infos über Quellen und Ziele. (Basis für “Top-Talker” Dashboards).
- OPNsense / Proxmox: Liefern aggregierte Werte der virtuellen Schnittstellen.
# 2. Dashboard-Design in Grafana
Was wir wirklich sehen müssen.
Importieren Sie bewährte Dashboards (z.B. für Cisco oder Ubiquiti) und passen Sie diese an:
- Backbone Health: Zeigt die Auslastung der Core-Uplinks (10G/40G).
- WAN Ingress/Egress: Gegenüberstellung von Download und Upload Ihres Internetanschlusses.
- Error Rate Graph: Visualisiert Paketverluste oder CRC-Fehler (Artikel 723).
# 3. Deep Dive: Trend-Analyse & Forecasting
Die Zukunft vorhersagen.
Grafana bietet mathematische Funktionen wie derivation oder linear_regression.
- Aktion: Berechnen Sie das durchschnittliche Wachstum Ihres Traffics.
- Nutzen: Das Dashboard meldet: “Bei aktuellem Wachstum wird der 1G Uplink zum Marketing-Büro in 3 Monaten gesättigt sein”.
# 4. Day-2 Operations: Custom Alerting
Wenn die Kurve die Decke durchbricht.
Ein Graph ist wertlos, wenn niemand hinsieht.
- Regel: Wenn
Bandwidth_Usage> 90% für 10 Minuten -> Warnung. - Regel: Wenn
Unicast_Flooding(Broadcast-Traffic) sprunghaft ansteigt -> Kritischer Alarm (Möglicher Loop, Artikel 729).
# 5. Troubleshooting & “War Stories”
Wenn die Graphen ‘rauschen’.
# Top 3 Fehlerbilder beim Grafing
-
Symptom: Graphen zeigen unrealistische Spitzen (z.B. 100 Gbit/s auf einem 1G Port).
- Ursache: SNMP-Counter-Overflow (32-bit Counter läuft über).
- Lösung: Nutzen Sie zwingend 64-bit Counter (HC-Counter) via SNMP v2c/v3.
-
Symptom: Zeitlicher Versatz zwischen verschiedenen Graphen.
- Ursache: Fehlender NTP-Sync zwischen den Knoten und dem Monitoring-Server.
-
Symptom: Dashboard lädt nicht (“Too many points”).
- Fix: Nutzen Sie
aggregateWindowin InfluxDB (Artikel 698), um Daten vor der Anzeige zu glätten.
- Fix: Nutzen Sie
# “War Story”: Der “Stille” Backup-Mord
In einem Unternehmen wurde das Internet jeden Morgen um 9 Uhr extrem langsam. Der Router-Graph zeigte 100% Last. Die Diagnose: Wir schauten in das Grafana-Heatmap Dashboard. Die Entdeckung: Wir sahen, dass der Traffic exakt zum Zeitpunkt des Schichtwechsels im Vertrieb anstieg. Die Ursache: Ein neuer Kollege hatte seine private 2 TB Foto-Sammlung auf den Desktop kopiert, was einen automatischen OneDrive-Sync über die schmale Leitung auslöste. Lehre: Nur durch die Kombination von Zeit-Achse und Port-Sichtbarkeit lassen sich menschliche Fehler von technischen Defekten unterscheiden.
# 6. Monitoring & Reporting
Management Dashboards.
# Der ‘Daily Traffic’ Report
Generieren Sie eine Zusammenfassung für die IT-Leitung:
Peak Bandwidth Utilization.Total GB Transferred per Day.Top Switch Port Errors.
# 7. Fazit & Empfehlung
Visualisierung ist das Gewissen der Administration.
- Empfehlung: Nutzen Sie das
WorldmapPlugin in Grafana, um Standorte und deren ISP-Connectivity zu visualisieren. - Wichtig: Verwenden Sie einheitliche Einheiten (Bits/s statt Bytes/s), um Verwirrungen beim Vergleich mit Provider-Verträgen zu vermeiden.
# Anhang: Die 5 wichtigsten Panels
- WAN Throughput (Gaugometer).
- Core-Switch Backbone Load (Graph).
- VLAN-Specific Traffic (Stacked Area Chart).
- Interface Error Heatmap.
- DNS Latency Scatter Plot.