Troubleshooting

Aus Freifunk München
Wechseln zu: Navigation, Suche

Troubleshooting ist die systematische Suche nach Ursachen für Fehler nach dem Ausschlussprinzip und deren Behebung. Das klassische Vorgehen besteht darin, dass man die Symptome feststellt, die der Fehler verursacht. Symptome sind Abweichungen eines erwarteten Verhaltens vom gemessenen Verhalten. In einem zweiten Schritt wird eine konkrete These formuliert, weshalb der Fehler aufgetreten ist. Im dritten Schritt wird diese These bewiesen oder widerlegt. Wird sie widerlegt, so kann mit den bei der Fehlersuche gewonnenen Erkenntnissen eine neue These formuliert werden. Die Tiefe der Fehlersuche bis zur Beseitigung ist kompetenzabhängig, d.h., nötigenfalls ist ein Experte hinzu zu ziehen, wenn man für die gefundenen Symptome keine Erklärung mehr findet.

In diesem Beitrag werden Freifunk-spezifische Probeme dargestellt. Wo nur symptomatische Behandlungen dargestellt sind, fehlt eine fundierte Begründung der Ursachen mit einer konkreten Lösung, die nur ein Experte liefern kann.

Freifunk-Router funktionert nicht am Gastzugang bei Fritzbox[Bearbeiten | Quelltext bearbeiten]

Symptome[Bearbeiten | Quelltext bearbeiten]

Ein geflashter, konfigurierter und über WAN-Port angeschlossener Freifunk-Router an LAN 4 einer Fritzbox 7390/7490 funktioniert unter Umständen nicht, wenn der Gastzugang aktiviert wurde.

Gründe[Bearbeiten | Quelltext bearbeiten]

Die Fritzbox macht in diesem Modus Port 100xx dicht. Der Node kann nicht zu einem Gateway verbinden und bekommt somit keine Freifunk-IPv4.

Lösung[Bearbeiten | Quelltext bearbeiten]

Haken unter WLAN->Gastzugang->bei "Internetanwendungen beschränken: Nur Surfen und Mailen erlaubt" rausnehmen. Wichtig: Freifunk Router danach aus- und wieder einschalten.

Nextnode anzeigen[Bearbeiten | Quelltext bearbeiten]

Um sich anzeigen zu lassen, mit welchem Knoten man verbunden ist, kann man sich dessen Statusseite im Browser anzeigen lassen.

Dafür wird die nextnode-Adresse benutzt, die je nach Segment (ffmuc, welcome oder umland) unterschiedlich ist:

ffmuc -> http://[fdef:ffc0:4fff::1]/cgi-bin/status
welcome -> http://[fdef:ffc0:4fff:1::1]/cgi-bin/status
umland -> http://[fdef:ffc0:4fff:2::1]/cgi-bin/status

Router wird auf der Karte sporadisch als offline angezeigt[Bearbeiten | Quelltext bearbeiten]

Symptome[Bearbeiten | Quelltext bearbeiten]

Der Router wird für Minuten bis Stunden auf der Knotenkarte als offline angezeigt. In dieser Zeit ist er per SSH auch nicht zu erreichen. Wird der Router auf der Karte wieder angezeigt, dann sieht man an der Uptime, dass der Router nicht neu gestartet ist. Nach einem SSH-Login sieht man ebenfalls, dass der Router durchgelaufen ist. Der Router hat eine nicht all zu gute WLAN-Meshverbindung (in der Karte tendenziell rötlich) und er ist per LAN-Kabel an ein Modem mit eigener Internetverbindung angesteckt von der man ggf. verifiziert hat, dass sie auch funktioniert (z.B. angesteckter Laptop).

Praxisbeispiel hier

Möglichkeit: VPN-meshing ist nicht aktiviert[Bearbeiten | Quelltext bearbeiten]

Grund[Bearbeiten | Quelltext bearbeiten]

VPN-meshing ist nicht aktiviert. Wahrscheinlich wurde das Setzen des entsprechenden Häkchens bei der Konfiguration vergessen. Über den WLAN-Mesh kann der Router aber noch immer über einen Nachbarknoten mit der Welt sprechen. Bricht die (schlechte) Verbindung ab, dann ist der Router nicht mehr erreichbar und er wird als offline angezeigt. Da er weiter läuft, kann er über den Nachbarknoten auch wieder kommunizieren, wenn die WLAN-Meshverbindung wieder steht.

Lösung[Bearbeiten | Quelltext bearbeiten]

Das VBN-Meshing muss reaktiviert werden. Entweder geht man zum Router, versetzt ihn in den Konfigurationsmodus und setzt in der Web-Oberfläche das Häkchen bei VBN-Meshing. Oder man schaltet das VPN-Meshing per SSH ein, wenn die Verbindung gerade wieder funktioniert.

Möglichkeit: andere Gründe[Bearbeiten | Quelltext bearbeiten]

Grund[Bearbeiten | Quelltext bearbeiten]

Der die Kartenanzeige hat nicht funktioniert oder der an sich einwandfrei laufende Router hat keine Daten an die Karte geschickt (warum auch immer). Eine schlechte Internetverbindung via LAN ist wenig wahrscheinlich, da zeitgleich die WLAN-Meshverbindung ausfallen müsste, damit die Symptome auftreten.

Lösung[Bearbeiten | Quelltext bearbeiten]

Zunächst ist nachzuweisen, dass das VPN-Meshing aktiv ist. In diesem Fall sollte ein SSH-Login auch dann möglich sein, wenn der Knoten als offline angezeigt wird. Dies widerspricht allerdings der Symptombeschreibung. Dann kann man einen Spezialisten konsultieren (und die gewonnenen Erkenntnisse hier hinterlegen!).

Ein Router startet häufig durch (Stand Juli 2016)[Bearbeiten | Quelltext bearbeiten]

Symptome[Bearbeiten | Quelltext bearbeiten]

Ein Router "bricht" immer wieder zusammen und startet häufig neu. Häufig bedeutet mehr als ca. viermal bis sechsmal täglich, im Extremfall mehrfach pro Stunde. Meist handelt es sich um das auf den Treffen verkaufte Gerät TP-Link WR841N. WLAN-meshing ist eingeschaltet, der Router hängt i.d.R. selbst am Internet. Ausgeschlossen wurde, dass jemand den Stecker zieht.

Sichtbar wird dies durch ein Sägezahn-Muster in der Grafik zum Traffic in Grafana (Klicke den Knoten auf der Knotenkarte an und klicke dann in eine der Grafiken, z.B. "Clients (1 Tag)", eine neue Tab übertitelt mit Grafana öffnet sich im Browser, suche nach der Grafic "traffic" und schränke ggf. den Betrachtungszeitraum auf 6 bis 24 Stunden ein).

Beachte: Seltene Abbrüche fallen den Nutzern normalerweise nicht auf. Dass auf der Knotenkarte ein Client angezeigt wird bedeutet nur, dass er verbunden ist, nicht, dass der Anwender gerade im Internet surft. Insofern sind wenige Durchstarter pro Tag (insb. zu betriebsarmen Zeiten) zwar unschön aber nicht den Betrieb gefährdend und meist tolerierbar. Bei mehreren Durchstartern pro Stunde in Umgebungen mit vielen Clients werden die Nutzer die Ausfälle jedoch bemerken.

Praxisbeispiel hier. Der Effekt wurde u.a. auch in Gauting festgestellt und mit surfen in der Knotenkarte findet man auch relativ leicht Router.

Hinweis: Dem Autor wurde mehrfach gesagt, dass dies auch ein Resultat davon ist, dass das Segment zu groß ist. Dieses Problem kann natürlich nicht Router-seitig behoben werden. Insofern sind die nachfolgenden Lösungsvorschläge oft nur Workarounds und Provisorien. (Stand Juli 2016)

Möglichkeit: Zu viele Clients[Bearbeiten | Quelltext bearbeiten]

Grund[Bearbeiten | Quelltext bearbeiten]

Ein 841-er Gerät kann i.d.R. Verbindungen zu 10 bis 15 Clients halten. Es reicht, wenn ein Client am Router eingebucht ist, der Nutzer muss nicht im Internet surfen. Werden es zeitweise mehr bzw. sind es um die 15, so kann der Router abstürzen.

Die technischen Hintergründe sind von einem Experten zu ergänzen.

Lösung[Bearbeiten | Quelltext bearbeiten]

Die symptomatische Lösung besteht darin, ein stärkeres Gerät aufzustellen.

Möglichkeit: Überlastung durch zu viele WLAN-Meshe[Bearbeiten | Quelltext bearbeiten]

Grund[Bearbeiten | Quelltext bearbeiten]

Erfahrungsgemäß hat ein 841-er-Router Probleme, wenn er mit mehr als zwei Geräten per WLAN Meshverbindungen halten soll.

Die technischen Hintegründe sind von einem Experten zu ergänzen.

Lösung[Bearbeiten | Quelltext bearbeiten]

Die Anzahl der WLAN-Meshverbindungen muss reduziert werden. Ansätze:

  • Man kann zunächst beim betroffenen Knoten das WLAN-Mesh ausschalten und prüfen, ob damit die Symptome abklingen. Dies ist keine Option, wenn der betroffene Knoten keinen eigenen Anschluss ans Internet per VPN-Mesh hat oder der Knoten einen anderen Router per WLAN-Mesh versorgen muss.
  • Man kann das WLAN-Meshing bei benachbarten Knoten ausschalten, die das WLAN-Meshing nicht benötigen.
  • Man kann versuchen, ein schwaches 841-er Modell durch ein stärkeres Gerät zu ersetzen.

Die Lösungsansätze verstehen sich zum Dokumentationszeitpunkt (Juli 2016) als Workaround bis Freifunk-seitig eine dauerhafte Abhilfe geschaffen werden kann.

Möglichkeit: Zu viel Datenverkehr auf Kanal 6[Bearbeiten | Quelltext bearbeiten]

Hinweis: Der Autor gibt hier nur das wieder, was ihm gesagt wurde, er kann das Szenario nicht kompetent beurteilen. Daher: Experten bitte Falschaussagen korrigieren und dann diesen Hinweis entfernen.

Grund[Bearbeiten | Quelltext bearbeiten]

Die WLAN-Dichte vor Ort ist sehr hoch und man hat sehr viel Datenverkehr auf dem von Freifunk-Routern genutzten Kanal 6 und benachbarten Kanälen. 6 bis 8 WLANs sind nicht zu viel. Ein Indiz kann eine dichte Bebauung sein. Der Nachweis von vielen WLANs ist durch eine Messung (z.B. mit der Android-App wifi Analyzer) möglich. Der Router ist dann sehr damit beschäftigt Datenpakete (von anderen WLAN-Routern und deren Clients) auszusortieren, die nicht für ihn bestimmt sind.

Lösung[Bearbeiten | Quelltext bearbeiten]

  • Sofern auf einem anderen Kanal weniger Datenverkehr ist, kann ein Experte erwägen, den Kanal umzustellen. Dies kann bei größeren Mesh-Netzen problematisch werden, da dann alle Router angepasst werden sollten.
  • Ein stärkeres Gerät mit mehr Rechenleistung kann in der Lage sein, die überflüssigen Datenpakete auszusortieren.
  • Der Umstieg von einem unidirektional sendenden Gerät auf ein Gerät mit Richtwirkung (z.B. Loco Nanostation) kann hilfreich sein, da dann u.U. nicht mehr alle störenden Sender empfangen werden.

Siehe hierzu auch WLAN Tuning 2,4GHz. Letztendlich wird man experimentieren müssen.

Router mesht nach einiger Zeit nicht mehr per WLAN[Bearbeiten | Quelltext bearbeiten]

Symptome[Bearbeiten | Quelltext bearbeiten]

Ein Router mesht per WLAN mit seinen Nachbarn. Nach einiger Zeit (Stunden) sind die WLAN-Meshe auf der Knotenkarte nicht mehr sichtbar. Evtl. fällt auch auf, dass die Anzahl der Clients auf 0 oder 1 (falls ein Gerät an einem LAN-Port des Freifunk-Routers als Client hängt) fällt, sodass der Verdacht entsteht, dass das WLAN ausgefallen ist. Ein Reboot behebt das Problem für einige Stunden.

Ein zweiter Router (egal ob Freifunk oder nicht) steht sehr nahe (< 1m) bei diesem Router, evtl. ist er am Freifunk-Router angesteckt, evtl. sendet er auch auf Kanal 6.

Praxisbeispiel hier.

Grund[Bearbeiten | Quelltext bearbeiten]

Unklar (s. Praxisbeispiel). Möglicherweise stört der sehr nahe stehende zweite Router das Signal, sodass nach einiger Zeit der Router in einem undefinierten Zustand endet, der sein WLAN behindert.

Lösung[Bearbeiten | Quelltext bearbeiten]

Im konkreten Praxisbeispiel hat geholfen, den zweiten Router außer Betrieb zu nehmen.

Evtl. hilft auch ein Kanalwechsel des zweiten Routers oder, dass man ihn weiter weg vom Freifunk-Router aufstellt. Dies wurde jedoch nicht in der Praxis getestet, sodass auch keine Entfernungsangabe gemacht werden kann. - Bitte hier ergänzen, wenn damit Erfahrungen gemacht wurden.


Bricked Router, Firmware lässt sich nicht aktualisieren[Bearbeiten | Quelltext bearbeiten]

Symptome[Bearbeiten | Quelltext bearbeiten]

Ein Router lässt sich über die graphische Oberfläche nicht mehr ansprechen, er funktioniert gänzlich nicht mehr oder eine Firmware, von der man weiß, dass sie kompatibel ist, wird von der Hersteller-Firmware beim versuchten Flashen mit einer Fehlermeldung abgelehnt. Letzteres kann derzeit (Anfang 2017) bei Routern TP-Link WR841 v11 passieren, wenn zwar auf der Schachtel v11 steht, auf dem Router aber 11/EU.

Grund[Bearbeiten | Quelltext bearbeiten]

Die Gründe können vielfältig sein, z.B. wurde die Firmware (wie auch immer) zerstört. Evtl. wurde auch herstellerseitig eine Firmware installiert, die (beabsichtigt oder versehentlich) den gewünschten upgrade nicht erlaubt.

Lösung[Bearbeiten | Quelltext bearbeiten]

Die Firmware kann per TFTP eingespielt werden, eine Beschreibung findet sich im Artikel Router mit TFTP flashen.