Ich habe in den letzten Tagen ein Problem mit Paketverlust und Netzwerkstabilität für eine Handvoll Endbenutzer in einem internen Netzwerk verfolgt ... Diese Probleme sind letzte Woche aufgetaucht, aber der Standort wurde vor sechs Wochen vom Blitz getroffen .
Ich sah einen Paketverlust von 5-10% zwischen einem Stapel von vier Cisco 2960 und mehreren PCs und Telefonen auf der anderen Seite eines 77-Meter-Laufs. Die PCs wurden inline mit den Telefonen über eine Amtsleitung ( Switchport-Konfigurations-Pastebin ) betrieben. In Client-Server-Anwendungen und in der Microsoft Exchange-Konnektivität wurden Anrufe abgebrochen und unterbrochen.
Ich habe die üblichen Schritte zur Fehlerbehebung aus der Ferne versucht und einen lokalen Techniker in den Pausen der Benutzer- und Produktionsaktivität Folgendes ausführen lassen:
- Kabel zwischen Wandbuchse und Gerät wechseln.
- Wechseln Sie die Patchkabel zwischen dem Patchfeld und den Switch-Ports.
- Probieren Sie verschiedene Switch-Ports im 2960-Stack aus.
- Endbenutzergeräte durch bekanntermaßen funktionsfähige Geräte (neue Telefone, verschiedene PCs) wechseln.
- Löschen Sie die Switch-Port-Schnittstellenzähler und überwachen Sie Inkrementierungsfehler genau. ( Pastebin Ausgabe von
sh int
) - Durchforstet die Geräteprotokolle und Observium RRD-Diagramme . Keine Verbindungsprobleme von der Switch-Seite.
- Ändern Sie die Steckdosenleisten auf der Endbenutzerseite.
- Testkabel läuft vom Cisco 2960 mit
test cable-diagnostics tdr int Gi4/0/9
(sauber) * - Das Testkabel läuft mit einem Tripp-Lite-Kabeltester. (reinigen)
- Führen Sie eine Diagnose für die Switch-Stack-Mitglieder aus. (reinigen)
Am Ende waren drei Änderungen an den Switch-Ports erforderlich, um eine stabile Lösung zu finden. Die einzig logische Schlussfolgerung ist, dass einige Cisco 2960-Switch-Ports schlecht oder schuppig sind ... Nicht tot, aber auch nicht konsistent im Verhalten. Ich bin es nicht gewohnt, dass einzelne Ports auf diese Weise sterben.
Was kann ich noch testen oder überprüfen, um festzustellen, ob diese Geräte defekt sind?
Was ist der Best-Practice-Ansatz, um dies zu überprüfen?
Ist es üblich, dass einzelne Ports Probleme haben und nicht eine zusammenhängende Bank von Ports?
Übrigens - show cable-diagnostics tdr int Gi4/0/14
ist sehr cool ...
Interface Speed Local pair Pair length Remote pair Pair status
--------- ----- ---------- ------------------ ----------- --------------------
Gi4/0/14 1000M Pair A 79 +/- 0 meters Pair B Normal
Pair B 75 +/- 0 meters Pair A Normal
Pair C 77 +/- 0 meters Pair D Normal
Pair D 79 +/- 0 meters Pair C Normal
quelle
Total output drops: 1461
Antworten:
Während Banken von Häfen häufig einen ASIC gemeinsam nutzen, muss jeder seinen eigenen PHY haben. Wenn der PHY beschädigt wurde, könnte er ein Problem haben, während seine Nachbarn dies nicht tun.
Trotzdem sind Leistungsabfälle ein seltsames Symptom für ein physisches Problem - nicht unmöglich, aber nicht typisch. Ungeachtet von Halbduplex-Verbindungen haben Ausgangsverluste normalerweise mehr mit Puffererschöpfung als mit physischen Problemen zu tun.
Weitere Informationen erhalten Sie möglicherweise, indem Sie eine Paketerfassung auf der anderen Seite des Kabels einrichten. Es wird erwartet, dass sich ein schlechter PHY mit einer bestimmten Anzahl von Fehlern der physischen Schicht (schlechter CRC, Runt / Riese usw.) auf einer oder beiden Seiten der Verbindung manifestiert.
Alles in allem klingt es so, als hätten Sie genug eliminiert, um die Renditen zu verringern. Ich würde eine RMA empfehlen, wenn Sie einen Vertrag haben.
quelle
Ja, ein einzelner Port kann schlecht sein, aber ich erinnere mich, dass Sie das gesamte Modul ersetzen müssen. (Vorsichtsmaßnahme: Es ist lange her, dass ich bedeutende Cisco-Arbeit geleistet habe ...)
Ich bin mir nicht sicher, ob es helfen kann, aber schauen Sie sich FITB von Laurie Denness an, einer der Ops-Ingenieure bei Etsy.
quelle