# OPNsense Troubleshooting: Methodische Fehlersuche für Admins

TL;DR / Management Summary Netzwerkfehler sind oft komplex und verstecken sich hinter Symptomen wie “Internet ist langsam” oder “Server X nicht erreichbar”. Wir nutzen einen Layer-für-Layer Ansatz (OSI-Modell). Senior Admins nutzen die in OPNsense integrierten Werkzeuge wie Packet Capture, MTR (My Traceroute) und die Live-Log Ansicht, um Probleme präzise zwischen Client, Firewall und ISP zu isolieren. Wer die Diagnostics-Tools beherrscht, reduziert die MTTR (Mean Time To Repair) massiv.

# 1. Der methodische Ansatz

Vom Kabel zur Applikation.

Physical (Layer 1): Interfaces Up/Down? (Interfaces -> Overview).
Data Link (Layer 2): ARP-Eintrag vorhanden? (Diagnostics -> Network -> ARP Table).
Network (Layer 3): Ping zum Gateway und zum Ziel? (Diagnostics -> Network -> Ping).
Transport (Layer 4): Port offen? (Diagnostics -> Network -> Port Probe).
Application (Layer 7): Logs prüfen! (System -> Log-Files).

# 2. Die wichtigsten Diagnostics-Tools

Bordmittel effektiv nutzen.

# 1. Packet Capture (Der ‘Röntgenblick’)

Diagnostics -> Packet Capture. Wenn Sie wissen wollen, ob ein Paket die Firewall überhaupt verlässt:

Wählen Sie das WAN Interface.
Filter: Ziel-IP des Servers.
Aktion: Wenn Sie Pakete rausgehen sehen, aber keine Antworten kommen, liegt der Fehler außerhalb Ihrer Firewall.

# 2. MTR (My Traceroute)

Diagnostics -> Network -> Traceroute. Kombiniert Ping und Traceroute.

Vorteil: Zeigt Paketverluste an jedem einzelnen Hop im Internet an. Ideal, um ISP-Probleme nachzuweisen.

# 3. Port Probe (Nmap Lite)

Prüfen Sie, ob ein interner Server einen Port wirklich offen hat, ohne ein Tool auf dem Client zu installieren.

# 3. Deep Dive: ARP & NDP (Layer 2 Troubleshooting)

Wer ist wer im LAN?

Wenn der Ping fehlschlägt, prüfen Sie die ARP-Tabelle.

Status: Incomplete: OPNsense schickt Anfragen (Who has IP…?), aber niemand antwortet.
- Ursache: Gerät ist offline, Firewall am PC blockt ARP, oder VLAN-Mismatch.
Status: OK: Die MAC-Adresse wird angezeigt. Das Problem liegt auf Layer 3 (Regeln).

# 4. Day-2 Operations: Log-Korrelation

Fehlerursachen im Text finden.

Nutzen Sie die Suchfunktion in den System-Logs:

charon: Für VPN-Probleme.
unbound: Für DNS-Probleme.
dhcpd: Für IP-Zuweisungsprobleme.
configd: Wenn die GUI-Aktionen nicht ausgeführt werden.

# 5. Troubleshooting & “War Stories”

Wenn die Tools ‘Alles OK’ sagen.

# Top 3 Fehlerbilder

Symptom: Ping geht, aber Webseiten/SSH nicht.
- Ursache: MTU/MSS Problem. Pakete sind zu groß für den Pfad (besonders bei PPPoE oder VPN).
- Lösung: MSS Clamping am Interface auf 1350 setzen.
Symptom: Sporadische Verbindungsabbrüche im gesamten LAN.
- Ursache: IP-Konflikt (z.B. ein zweiter Router mit der gleichen IP wie die OPNsense).
- Tool: arp -a am Client beobachten. Wenn die MAC für das Gateway springt -> Konflikt!
Symptom: Firewall reagiert extrem träge.
- Ursache: Disk-I/O Wait oder RAM-Mangel durch Suricata/ntopng.
- Lösung: top -SH in der Shell prüfen.

# “War Story”: Der “unsichtbare” Switch-Loop

Ein Kunde klagte über einen Totalausfall des Netzwerks. Die OPNsense-CPU war bei 10% (niedrig!), aber kein Traffic kam durch. Die Entdeckung via Shell: netstat -i zeigte Millionen von “Input Errors” an einem LAN-Port. Ein unmanaged Switch im Büro hatte einen Loop. Die OPNsense-CPU war zwar nicht ausgelastet, aber der interne Switch-Chip der Firewall-Hardware war durch die Broadcast-Flut blockiert. Lehre: Schauen Sie bei Netzwerkproblemen immer zuerst auf die Interface-Fehler-Zähler, nicht nur auf die CPU-Last.

# 6. Monitoring & Reporting

Selbstdiagnose automatisieren.

# Health Dashboard

Fügen Sie das Widget “System Information” hinzu und achten Sie auf den Load Average.

KPI: Ein Load Average über der Anzahl Ihrer CPU-Kerne deutet auf Überlastung hin.

# 7. Fazit & Empfehlung

Troubleshooting ist eine Kunst, die man lernen kann.

Empfehlung: Nutzen Sie den “Live View” (Artikel 557) als allererstes Tool bei jedem Problem. 90% aller Fehler sind simple Regel-Blocks.
Wichtig: Dokumentieren Sie “seltsame” Fehler in Ihrem internen Wiki. Ein gelöstes MTU-Problem spart beim nächsten Mal Stunden an Arbeit.

# Anhang: Cheatsheet (Die 10-Sekunden Diagnose)

Befehl (Shell)	Zweck
`top -SH`	Was frisst CPU/RAM?
`pftop`	Welche Verbindung läuft gerade?
`netstat -rn`	Wie sieht die Routing-Tabelle aus?
`ifconfig`	IP und Link-Status aller NICs
`clog /var/log/filter/latest.log`	Letzte Firewall-Blocks sehen