Hallo Bewohner von Server Fault
Ich habe ein irritierendes Problem mit einem LAN von ungefähr 100 Computern, 2 Windows-Domänenservern und 12 VoIP-Telefonen. Seit ihrer Installation vor ungefähr einem Jahr stellen wir jede Woche fest, dass sich ein VoIP-Telefon zurücksetzt - gelegentlich während eines Anrufs. Gleichzeitig treten auf Computern häufig Anzeichen für einen vorübergehenden Verbindungsverlust auf: Einfrieren des Explorers beim Zugriff auf Netzwerkfreigaben, Fehler in unserer Verwaltungssoftware aufgrund eines Verbindungsverlusts zum Datenbankserver.
Ich habe eine Wireshark-Überwachung der Verbindung zwischen der VoIP-PBX und dem Rest des Netzwerks durchgeführt. Wireshark nimmt eine Ansammlung von erneut übertragenen TCP-Paketen auf, wenn wir einen Neustart des Telefons aufzeichnen. Das Wireshark-Protokoll zeigt ungefähr 2 Cluster von Neuübertragungen pro Tag an, die von 5 Paketen bis zu Hunderten reichen. Diese befinden sich in jedem Cluster hauptsächlich zwischen der TK-Anlage und einigen VoIP-Telefonen, sind jedoch nicht immer gleich eingestellt. Häufig werden Neuübertragungen gleichzeitig an Telefone gesendet, die an denselben Switch angeschlossen sind. Manchmal werden Neuübertragungen jedoch auch gleichzeitig an Telefone an entgegengesetzten Enden des Netzwerks gesendet. Bei der Weiterleitung von TCP-Datenverkehr kommt es normalerweise zu einigen gleichzeitigen Neuübertragungen, beispielsweise zwischen Client-Computern und den Dateiservern.
Die Spitzenwerte bei erneuten Übertragungen und Zurücksetzen des Telefons korrelieren nicht gut mit einer hohen Netzwerkbelastung. Sie scheinen tagsüber etwas häufiger aufzutreten, aber meistens abends, wenn der Verkehr abnehmen sollte. Sie treten relativ oft spät in der Nacht auf, wenn die meisten Computer ausgeschaltet sind und der Datenverkehr am geringsten sein sollte.
Haben Sie Ideen, die Ihnen bei der Diagnose der Ursache solcher Probleme helfen könnten? Eine Sache, die ich noch nicht ausprobiert habe, aber sollte, ist die Aktualisierung der Firmware aller Switches.
quelle
Antworten:
TCP-Neuübertragungen sind normalerweise auf eine Überlastung des Netzwerks zurückzuführen. Suchen Sie zum Zeitpunkt des Problems nach einer großen Anzahl von Broadcast-Paketen. Wenn der Prozentsatz des Broadcast-Verkehrs in Ihrer Erfassung über 3% des gesamten erfassten Verkehrs liegt, liegt definitiv eine Überlastung vor. Suchen Sie im Netzwerk nach Broadcasts der physischen Schicht (ARP) und der Netzwerkschicht (Namensauflösung). Wenn Sie ein hohes Broadcast-Verkehrsaufkommen feststellen, können Sie es anhand der Erfassungsdaten zur Quelle zurückverfolgen.
quelle
arp
- und um nur die gesendeten zu sehen, mit einem Filter voneth.addr==ff:ff:ff:ff:ff:ff
Wenn Sie Verkehrsstatistiken für Ihre Switches erstellen, können Sie feststellen, dass Sie in bestimmten Zeiträumen über oder nahezu überlastet sind. Dies kann zu erneuten Versuchen führen, wenn die Antworten nicht innerhalb des anfänglichen Zeitlimits (häufig 3 Sekunden) zurückkommen. Dies erhöht die Überlastung vorübergehend, bis die Mechanismen zur Reduzierung der Überlastung greifen.
Suchen Sie nach Personen, die Streaming-Medien verwenden, da diese die Bandbreite schnell aufsaugen können.
Möglicherweise können Sie das Problem für die Telefone durch Traffic-Shaping abmildern. Dadurch wird das Problem nur auf andere Benutzer übertragen.
quelle
Klingt für mich wie eine Spanning Tree-Schleife oder ein Broadcast-Sturm, besonders wenn die Neuübertragungen und die Probleme auf demselben Switch lokalisiert sind (was sich unterscheidet). Wie lauten die Portstatus auf Ihrem L2-Gerät, wenn dies passiert? Wahrscheinlich ein schlechter Switch oder eine schlechte Root-Bridge-Priorität? Interessantes Problem.
quelle
Sie haben das Problem wahrscheinlich gelöst, seit es so lange her ist, aber im Grunde müssen Sie "Port Fast" für die Ports aktivieren, die Endpunkte haben (VoIP-Telefone, Workstations, Server). Ein Telefon kann PDUs senden. Wenn dieser Typ also neu startet, kommt es zu einer STP-Konvergenz. Dadurch wird die FDB-Tabelle geleert und alle Geräte durchlaufen den 4/5-STP-Spaß. Indem sie Ports mit Endpunkt in "Port Fast" setzen, überspringen sie das Warten und gehen direkt in den Weiterleitungsmodus.
quelle
Hoffentlich befinden sich Ihre Telefone in einem anderen Subnetz und VLAN als die anderen Computer?
quelle
Es könnte sich auch um ein defektes Gerät handeln, beispielsweise um einen defekten Schalter. Korrelieren die erneuten Übertragungen mit Telefonen / Computern auf einem bestimmten Switch oder Teil des Netzwerks?
Nur um meine Antwort ein wenig zu erweitern. Nicht alle Schalter sind gleich, auch wenn sie dieselben Spezifikationen haben. Einige sind in der Lage, eine viel höhere Last zu bewältigen als andere, weil sie schnellere Prozessoren im Inneren haben. Es kann sein, dass Ihre Schalter nicht ganz auf dem neuesten Stand sind.
Ich würde damit beginnen, einige Ihrer schwierigsten VOIP-Telefone an ihren eigenen physischen Schalter anzuschließen und zu prüfen, ob die Zurücksetzungen auf diesen fortgesetzt werden. Wenn es verschwindet, sind Sie auf dem Weg, es sehr bald zu lösen.
quelle