# OPNsense Troubleshooting: Methodische Fehlersuche für Admins
TL;DR / Management Summary Netzwerkfehler sind oft komplex und verstecken sich hinter Symptomen wie “Internet ist langsam” oder “Server X nicht erreichbar”. Wir nutzen einen Layer-für-Layer Ansatz (OSI-Modell). Senior Admins nutzen die in OPNsense integrierten Werkzeuge wie Packet Capture, MTR (My Traceroute) und die Live-Log Ansicht, um Probleme präzise zwischen Client, Firewall und ISP zu isolieren. Wer die Diagnostics-Tools beherrscht, reduziert die MTTR (Mean Time To Repair) massiv.
# 1. Der methodische Ansatz
Vom Kabel zur Applikation.
- Physical (Layer 1): Interfaces Up/Down? (
Interfaces -> Overview). - Data Link (Layer 2): ARP-Eintrag vorhanden? (
Diagnostics -> Network -> ARP Table). - Network (Layer 3): Ping zum Gateway und zum Ziel? (
Diagnostics -> Network -> Ping). - Transport (Layer 4): Port offen? (
Diagnostics -> Network -> Port Probe). - Application (Layer 7): Logs prüfen! (
System -> Log-Files).
# 2. Die wichtigsten Diagnostics-Tools
Bordmittel effektiv nutzen.
# 1. Packet Capture (Der ‘Röntgenblick’)
Diagnostics -> Packet Capture.
Wenn Sie wissen wollen, ob ein Paket die Firewall überhaupt verlässt:
- Wählen Sie das WAN Interface.
- Filter: Ziel-IP des Servers.
- Aktion: Wenn Sie Pakete rausgehen sehen, aber keine Antworten kommen, liegt der Fehler außerhalb Ihrer Firewall.
# 2. MTR (My Traceroute)
Diagnostics -> Network -> Traceroute.
Kombiniert Ping und Traceroute.
- Vorteil: Zeigt Paketverluste an jedem einzelnen Hop im Internet an. Ideal, um ISP-Probleme nachzuweisen.
# 3. Port Probe (Nmap Lite)
Prüfen Sie, ob ein interner Server einen Port wirklich offen hat, ohne ein Tool auf dem Client zu installieren.
# 3. Deep Dive: ARP & NDP (Layer 2 Troubleshooting)
Wer ist wer im LAN?
Wenn der Ping fehlschlägt, prüfen Sie die ARP-Tabelle.
- Status: Incomplete: OPNsense schickt Anfragen (Who has IP…?), aber niemand antwortet.
- Ursache: Gerät ist offline, Firewall am PC blockt ARP, oder VLAN-Mismatch.
- Status: OK: Die MAC-Adresse wird angezeigt. Das Problem liegt auf Layer 3 (Regeln).
# 4. Day-2 Operations: Log-Korrelation
Fehlerursachen im Text finden.
Nutzen Sie die Suchfunktion in den System-Logs:
charon: Für VPN-Probleme.unbound: Für DNS-Probleme.dhcpd: Für IP-Zuweisungsprobleme.configd: Wenn die GUI-Aktionen nicht ausgeführt werden.
# 5. Troubleshooting & “War Stories”
Wenn die Tools ‘Alles OK’ sagen.
# Top 3 Fehlerbilder
-
Symptom: Ping geht, aber Webseiten/SSH nicht.
- Ursache: MTU/MSS Problem. Pakete sind zu groß für den Pfad (besonders bei PPPoE oder VPN).
- Lösung:
MSS Clampingam Interface auf1350setzen.
-
Symptom: Sporadische Verbindungsabbrüche im gesamten LAN.
- Ursache: IP-Konflikt (z.B. ein zweiter Router mit der gleichen IP wie die OPNsense).
- Tool:
arp -aam Client beobachten. Wenn die MAC für das Gateway springt -> Konflikt!
-
Symptom: Firewall reagiert extrem träge.
- Ursache: Disk-I/O Wait oder RAM-Mangel durch Suricata/ntopng.
- Lösung:
top -SHin der Shell prüfen.
# “War Story”: Der “unsichtbare” Switch-Loop
Ein Kunde klagte über einen Totalausfall des Netzwerks. Die OPNsense-CPU war bei 10% (niedrig!), aber kein Traffic kam durch.
Die Entdeckung via Shell: netstat -i zeigte Millionen von “Input Errors” an einem LAN-Port. Ein unmanaged Switch im Büro hatte einen Loop. Die OPNsense-CPU war zwar nicht ausgelastet, aber der interne Switch-Chip der Firewall-Hardware war durch die Broadcast-Flut blockiert.
Lehre: Schauen Sie bei Netzwerkproblemen immer zuerst auf die Interface-Fehler-Zähler, nicht nur auf die CPU-Last.
# 6. Monitoring & Reporting
Selbstdiagnose automatisieren.
# Health Dashboard
Fügen Sie das Widget “System Information” hinzu und achten Sie auf den Load Average.
- KPI: Ein Load Average über der Anzahl Ihrer CPU-Kerne deutet auf Überlastung hin.
# 7. Fazit & Empfehlung
Troubleshooting ist eine Kunst, die man lernen kann.
- Empfehlung: Nutzen Sie den “Live View” (Artikel 557) als allererstes Tool bei jedem Problem. 90% aller Fehler sind simple Regel-Blocks.
- Wichtig: Dokumentieren Sie “seltsame” Fehler in Ihrem internen Wiki. Ein gelöstes MTU-Problem spart beim nächsten Mal Stunden an Arbeit.
# Anhang: Cheatsheet (Die 10-Sekunden Diagnose)
| Befehl (Shell) | Zweck |
|---|---|
top -SH |
Was frisst CPU/RAM? |
pftop |
Welche Verbindung läuft gerade? |
netstat -rn |
Wie sieht die Routing-Tabelle aus? |
ifconfig |
IP und Link-Status aller NICs |
clog /var/log/filter/latest.log |
Letzte Firewall-Blocks sehen |