Der Computer mit Ubuntu Server 9.04 friert das gesamte Netzwerk regelmäßig ein

2

Ich habe einen kopflosen Computer mit Ubuntu Server 9.04, den ich für die Dateifreigabe im Netzwerk und als privaten Webserver verwende. Hin und wieder verliere ich meine Internetverbindung auf meinem Laptop, der sich im selben Netzwerk befindet. Wenn ich das überprüfe, ist das gesamte Netzwerk ausgefallen und keines der angeschlossenen Geräte kann erreicht werden. Wenn ich jedoch den Ubuntu-Server ausstecke (und damit neu starte), nimmt das gesamte Netzwerk den Betrieb wieder auf, als wäre nie etwas passiert. Es kommt ein- oder zweimal alle zwei Monate vor.

Ich habe mir die Syslogs angesehen und dort gibt es nichts zu sehen. Das Syslog stoppt plötzlich um 20.45 Uhr und wird dann um 21.15 Uhr mit den Kernel-Boot-Meldungen fortgesetzt. In dem Moment habe ich den Ein-Schalter gedrückt, um den Computer zu booten.

BloodPhilia
quelle

Antworten:

3

Ich habe gesehen, wie Netzwerkkarten den Verstand verloren haben und billige Switches durch Ruckeln (Senden eines endlosen Frames) oder durch Senden übermäßiger Low-Level-Ethernet-Flusskontrollsignale blockiert wurden. Leider können diese Arten von MAC / PHY-Hardware-Fehlern vom Ethernet-Treiber des Hosts unbemerkt bleiben, sodass in Ihren Protokollen nichts angezeigt wird. Ebenfalls bedauerlich ist die Tatsache, dass keiner dieser Fehler in einer typischen Sniffer-Spur sichtbar wäre, da die Flusskontrollsignale nicht wirklich "Ethernet-Frames" sind und Sniffer generell nur Frames erfassen, die innerhalb der normalen Größengrenzen liegen.

Wenn dies das nächste Mal passiert, ist es interessant zu sehen, ob das Problem einfach dadurch behoben wird, dass die Ethernet-Verbindung des Ubuntu-Servers zum Netzwerk getrennt wird. Wenn dies der Fall ist, tritt das Problem dann wieder auf, wenn Sie das Ethernet-Kabel wieder einstecken?

Das Löschen der Verbindung kann ausreichen, um die Chips der Netzwerkkarte zurückzusetzen, um das Problem zu beheben. Wenn das Problem jedoch wieder auftritt, sobald Sie das Ethernet wieder anschließen, können Sie versuchen, das Ethernet-Kabel vom Ubuntu-Server direkt mit einem Sniffer an das Ethernet anzuschließen Maschine (hoffentlich haben Sie eine Maschine mit Auto-MDI-X oder einem Crossover-Kabel zur Hand). Dann können Sie versuchen, Frames aufzunehmen. Wenn Sie in der Lage sind, Frames zu erfassen, geben diese möglicherweise einen Hinweis darauf, wo der Fehler bei der Netzwerkkarte, dem Treiber, dem Netzwerkstapel oder einer netzwerkbenutzenden Anwendung liegt.

Sie können auch andere Personen mit der gleichen Art von NIC (oder zumindest dem gleichen NIC-Chipsatz) bei Google suchen, um festzustellen, ob andere das gleiche Problem haben. Natürlich ist es immer gut, sicherzustellen, dass Sie den neuesten Treiber für Ihre Karte haben.

Verfügt Ihr Ubuntu-Server ohne Kopf über eine Grafikkarte oder können Sie eine vorübergehend einsetzen? Wenn es das nächste Mal passiert, können Sie ein Display, eine Tastatur und eine Maus anschließen und sehen, was Sie vor Ort auf dem Host lernen können . Ist der Host-Kernel in Panik oder komplett eingefroren, oder ist nur die Netzwerk-E / A abgespritzt? Wenn der Host grundsätzlich verwendbar ist (mit Ausnahme des Netzwerks), können Sie tcpdump oder Wireshark darauf ausführen und sehen, was es über das Netzwerk zu tun glaubt.

Beachten Sie, dass Sie nicht einmal eine grafische Konsole verwenden müssen, um herauszufinden, was auf dem Ubuntu-Server läuft. Wenn Ihr Computer beispielsweise über einen seriellen Anschluss verfügt (oder Sie einen USB-Seriell-Adapter anschließen können), den Sie als seriellen Konsolenterminalanschluss konfigurieren können, können Sie einen anderen Computer an diesen Anschluss anschließen und von der Shell aus stöbern. Wenn Sie eine andere Netzwerkkarte haben, die Sie in diese Box einbauen könnten, könnten Sie die andere Netzwerkkarte in ein separates isoliertes Netzwerk einbinden, mit dem Sie SSH oder VNC in die Box einbinden können nicht den ganzen Linux-Netzwerkstack).

Ich würde vorschlagen, eine qualitativ hochwertigere Netzwerkkarte in Ihrem Server zu installieren oder den wahrscheinlich von Ihnen zu Hause verwendeten Switch der Consumer-Klasse durch einen Switch der Enterprise-Klasse zu ersetzen, der so konzipiert ist, dass er Ports abtrennt, die das Netzwerk überlasten.

Update: Es wurden einige zusätzliche Vorschläge zur Diagnose / Fehlerbehebung hinzugefügt. Wenn es sich jedoch um die Art von NIC-Hardwarefehlermodi handelt, an die ich denke, bezweifle ich, dass jemand andere als die Ingenieure, die diesen NIC-Chipsatz entwickelt haben, große Hoffnung auf ein Debugging haben würde.

Spiff
quelle
Danke für deine schnelle Antwort! Gibt es keine Möglichkeit zu diagnostizieren, was dies auslöst?
BloodPhilia
Ich habe nur ein paar weitere Ideen für die Diagnose hinzugefügt. Wenn es sich jedoch um die Art von NIC-Hardwarefehler handelt, die ich vermute, sind die einzigen Personen, die dies wirklich diagnostizieren können, die NIC-Chipsatzingenieure, die sie erstellt haben.
Spiff
Vielen Dank für die Eingabe, ich werde alle Optionen überprüfen, aber aus Ihrer Antwort schließe ich, dass meine Netzwerkkarte fehlerhaft sein könnte. Oder schließe ich falsch? +1 erstmal für die Mühe und akzeptiere, wenn ich es gelöst bekomme! Vielen Dank!
BloodPhilia
Ich würde es noch nicht als "Schlussfolgerung" bezeichnen. Es ist einfach die beste Arbeitshypothese, die ich Ihnen basierend auf Ihrer Beschreibung und meiner Erfahrung anbieten kann. Ich sollte auch erwähnen, dass ich gesehen habe, wie einwandfrei funktionierende Netzwerkkarten den Verstand verloren haben, wenn das Hostsystem in Panik geriet oder einfriert. Ihre eigentliche Ursache könnte also etwas anderes sein, das eine Panik oder ein Einfrieren verursacht Effekt zweiter Ordnung.
Spiff