Sollte die Netzwerkhardware so eingestellt sein, dass sie Geschwindigkeiten oder feste Geschwindigkeiten automatisch aushandelt?

90

Wir hatten kürzlich ein kleines Problem mit dem Netzwerk, bei dem mehrere Server zeitweise die Netzwerkkonnektivität auf eine ziemlich schmerzhaft zu lösende Art und Weise verlieren (erfordert einen harten Neustart). Dies geschieht seit ungefähr zwei Wochen scheinbar zufällig auf verschiedenen Servern. Kein bestimmtes Muster, das wir daran erkennen konnten.

Nachdem wir uns damit beschäftigt hatten, stellten wir fest, dass der Switch 100 Mbit / s für den problematischen Port meldete:

Das klingt bemerkenswert nach dem, was in Joel Spolskys Artikel Five Whys passiert ist

Michael verbrachte einige Zeit mit einem Post-Mortem und stellte fest, dass das Problem ein einfaches Konfigurationsproblem auf dem Switch war. Es gibt mehrere mögliche Geschwindigkeiten, mit denen ein Switch kommunizieren kann (10, 100 oder 1000 Megabit / Sekunde). Sie können die Geschwindigkeit entweder manuell einstellen oder den Switch automatisch die höchste Geschwindigkeit aushandeln lassen, mit der beide Seiten arbeiten können. Der fehlgeschlagene Schalter war auf automatische Verhandlung eingestellt. Dies funktioniert normalerweise, aber nicht immer, und am Morgen des 10. Januar war dies nicht der Fall.

Wir haben die automatische Verhandlung auf unserer Netzwerkhardware jetzt deaktiviert und auf eine feste Rate von 1000 Mbit / s (Gigabit) festgelegt.

Meine Fragen an diejenigen mit mehr Erfahrung in der Vernetzung von Serverhardware:

  1. Wie häufig treten bei moderner Netzwerkhardware Probleme mit der automatischen Verhandlung auf?
  2. Wird es als gute Standard-Netzwerkpraxis angesehen, die automatische Verhandlung zu deaktivieren und feste Geschwindigkeiten beim Einrichten des Netzwerks festzulegen?
Jeff Atwood
quelle
Haben Sie die automatische Verhandlung auf Ihren Servern ebenfalls deaktiviert und auf 1000 / full festgelegt?
James
22
Dies ist nur ich, aber wenn ich auf Ihr Problem stoßen würde, würde ich mich fragen, warum der Switch und der Server nicht die höchste Prioritätsgeschwindigkeit (1000 / full) aushandeln. Das sagt mir, dass etwas kaputt ist und wenn Sie die Verknüpfung auf eine bestimmte Geschwindigkeit zwingen, vertuschen Sie nur ein Problem.
Doug Luxem
es gibt einige Plattformen (insbesondere Solaris 9) , die in bekannten Szenarien Probleme mit Auto - Negotiation - ich nur mit etwas gemacht in den letzten zehn Jahren, obwohl verwenden autoneg
warren
Etwas, das mich beinahe pink gefärbt hätte: serverfault.com/questions/328105/ethernet-interface-errors
nixnotwin

Antworten:

101
  1. Ich habe noch kein Problem mit der automatischen Aushandlung von Netzwerkgeschwindigkeiten festgestellt, das nicht darauf zurückzuführen ist, dass entweder (a) die manuelle Einstellung an einem Ende der Verbindung nicht mit der automatischen Einstellung am anderen Ende übereinstimmt oder (b) eine fehlerhafte Komponente der Verbindung vorliegt ( Kabel, Anschluss usw.).

  2. Dies hängt vom Administrator ab, aber meine Erfahrung hat gezeigt, dass bei manueller Angabe der Verbindungsgeschwindigkeiten und Duplexeinstellungen Geschwindigkeitsinkongruenzen auftreten können. Warum? Weil es fast unmöglich ist, die verschiedenen Verbindungen zwischen Switches und Servern zu dokumentieren und diese Dokumentation dann zu befolgen, wenn Sie Änderungen vornehmen. Die meisten Fehler, die ich gesehen habe, sind auf 1 (a) zurückzuführen, und Sie geraten erst in diese Situation, wenn Sie die Geschwindigkeits- / Duplexeinstellungen manuell vornehmen.

Wie in der Cisco-Dokumentation erwähnt :

Wenn Sie die automatische Aushandlung deaktivieren, werden Verknüpfungen und andere Probleme mit der physischen Ebene ausgeblendet. Deaktivieren Sie die automatische Aushandlung nur für Endgeräte, z. B. ältere Gigabit-Netzwerkkarten, die keine automatische Gigabit-Aushandlung unterstützen. Deaktivieren Sie die Autonegotiation zwischen Switches nicht, es sei denn, dies ist unbedingt erforderlich, da Probleme mit der physischen Schicht unerkannt bleiben und zu Spanning Tree-Schleifen führen können.

Es sei denn, Sie sind bereit, ein Änderungsverwaltungssystem für Netzwerkänderungen einzurichten, das die Überprüfung von Geschwindigkeit / Duplex erfordert (und die Flusskontrolle nicht vergessen), oder Sie sind bereit, mit gelegentlichen Abweichungen umzugehen, die durch die manuelle Angabe dieser Einstellungen auf allen Netzwerkgeräten entstehen. dann bleibe bei der Standardkonfiguration von auto / auto.

Überlegen Sie sich in Zukunft, die Fehler an den Switch-Ports mit MRTG zu überwachen, damit Sie diese Probleme erkennen können, bevor Sie ein Problem haben.

Bearbeiten: Ich sehe eine Menge Leute, die auf Verhandlungsfehler bei alten Geräten verweisen. Ja, dies war vor langer Zeit ein Problem, als die Standards erstellt wurden und nicht alle Geräte ihnen folgten. Sind Ihre Netzwerkkarten und Switches weniger als 10 Jahre alt? Wenn ja, dann ist dies kein Problem.

Doug Luxem
quelle
6
Kakteen sind im Wesentlichen MRTG ohne Konfigurationsprobleme, es sollte also gut sein. Beginnen Sie einfach mit der Überwachung von Empfangsstörungen und -fehlern, TX-Kollisionen usw. Einer oder mehrere dieser Zähler sind "hoch", wenn Sie ein Verhandlungsproblem haben. Hoch im Verhältnis zum Verkehrsaufkommen im Hafen.
Doug Luxem
2
@EK - Die Konfiguration muss auf dem Switch und dem Gerät erfolgen. Das Austauschen des Geräts (oder möglicherweise nur das Aktualisieren von Treibern / Firmware), das Verschieben von Ports oder das Austauschen des Switches sind dann Anliegen hinsichtlich nicht übereinstimmender Einstellungen. Ich bin mir nicht sicher, warum Sie so viele Fehler sehen - wir führen hier HP, Cisco, Extreme und Juniper aus, und ich sehe keine Probleme bei der automatischen Aushandlung. Die einzigen Probleme, die ich gesehen habe, sind, wenn ein Ende der Verbindung manuell eingestellt wird. Wie in den Cisco-Dokumenten erwähnt, haben Sie möglicherweise einige zugrunde liegende L1-Probleme?
Doug Luxem
7
Meine Erfahrungen mit HP-, Cisco- und Dell-Switches stimmen mit DLux überein. Ich gehe davon aus, dass es vielen anderen Menschen genauso geht. Netzwerke, in denen Admins aus religiösen Gründen festgelegte Port-Geschwindigkeiten / Duplex immer weit mehr Probleme mit Nichtübereinstimmungen hatten als Netzwerke, in denen alles auf automatische Abstimmung eingestellt war.
Evan Anderson
3
@Whisk WAN-Links sind eine andere Geschichte. Wenn Sie von einem Anbieter Ethernet-Links erhalten, müssen diese häufig manuell hergestellt werden oder es wird ein Transceiver verwendet, der die automatische Aushandlung nicht unterstützt. Diese müssen von Fall zu Fall behandelt werden.
Doug Luxem
3
Ich denke, die Abstimmung ist etwas irreführend, da einige Leute den Luxus von Hardware von 1 oder 2 Anbietern haben (oder nur wenig Erfahrung haben) und nie ein Problem sehen, während andere wie ich Geräte von vielen verschiedenen Anbietern geerbt haben, die dies tun sich in bestimmten Kombinationen schlecht benehmen.
James Ryan
23
  1. Sehr häufig habe ich im Laufe der Jahre zahlreiche Probleme mit verschiedenen Arten von Hardware gehabt.

  2. Wenn das Setup statisch ist (z. B. ein Server-Rack) und Sie nicht glauben, dass es Änderungen geben wird, ist es meiner Meinung nach eine gute Idee, die Geschwindigkeiten und Duplex-Einstellungen manuell vorzunehmen. Solange es gut dokumentiert ist, damit zukünftige Probleme abgewendet werden können.

BEARBEITEN:

Zur Verdeutlichung: Ich befürworte nicht die Verwendung manueller Geschwindigkeiten in Ihrem gesamten Netzwerk. Ich würde sagen, dass in 95% der Fälle auto / auto der richtige Weg ist. Ich sage nur, ich hatte Probleme mit Duplex / Geschwindigkeit und es gibt kleine Teile meines Netzwerks (z. B. eines unserer Server-Racks), die größtenteils manuelle Einstellungen haben. Wir betreiben ein sehr streng kontrolliertes LAN mit nicht genutzten Ports, die heruntergefahren werden, und MAC-Filtern an den meisten Ports, sodass es nicht sehr schwierig ist, die Geschwindigkeit im Auge zu behalten.

einstiien
quelle
5
Ich habe das gleiche Problem gefunden, aber möglicherweise haben nur 1/100 Server Probleme bei der automatischen Aushandlung. In kleineren Netzwerken ist dies normalerweise nicht zu bemerken, in größeren jedoch ärgerlich.
Dave Drager
+1 - Auch ich habe im Laufe der Jahre das Popup-Fenster für das Problem der automatischen Verhandlung gesehen. Die Standardisierung des Teams bei der Deaktivierung der automatischen Verhandlung für alle Switches hat dieses Problem für uns beseitigt.
Joe Doyle
Dem ist nichts hinzuzufügen, außer dass ich wiedergeben kann, dass ich zahlreiche Probleme gesehen habe. Wenn jemand anderes Informationen darüber hat, warum die automatische Aushandlung so (relativ) regelmäßig fehlschlägt, würde ich sie gerne hören.
Schof
@dave also die Chancen des Autonegotiate-Problems steigen mit der Größe und Komplexität des Netzwerks - das macht Sinn. Außerdem haben wir unser kleines Server-Rack-Netzwerk im letzten Jahr um das Dreifache erweitert ...
Jeff Atwood
4
@ Jeff Atwood: Nur wenn sich die "Größe" darauf bezieht, bessere Chancen für das Hinzufügen eines Geräts mit defektem Autonegotiate-Verhalten zu haben, würde sich das Problempotential erhöhen. Dies ist nicht wie ein Überfluten von Frames oder Broadcast-Verkehr. Die Autonegotiation erfolgt ausschließlich zwischen jedem Client-Gerät und jedem Switch-Port.
Evan Anderson
15

Ich glaube, wenn die Autonegotiation eine Stunde am Tag oder einen Monat lang funktioniert hat und dann aus irgendeinem Grund "etwas passiert", dass das Setzen der Verbindung auf feste Geschwindigkeit "das Problem behebt", gibt es ein Problem, das nicht gelöst, sondern umgangen wird. Ich schätze, ich sehe es so, dass der Link als vorübergehende Lösung festgelegt wird, bis das eigentliche Problem behoben ist.

dimitri.p
quelle
durchaus möglich; Wir haben bereits eine Reihe anderer Fehlerbehebungsmaßnahmen durchgeführt, um dies auszuschließen, aber ich war besorgt, dass Joels Team das gleiche Problem hatte, wie in "Five Whys" dokumentiert. Es scheint ziemlich weit verbreitet ..
Jeff Atwood
7
Ich bin damit einverstanden, dass das Problem mit der automatischen Aushandlung "häufig" auftritt, aber in den meisten Fällen, nachdem es eine "Weile" funktioniert hat. Das ist es, was mich dazu veranlasst, weitere Nachforschungen anzustellen, anstatt die feste Verbindung als "Lösung" zu verwenden. Ich meine ... wenn Ihr Auto, das "gut läuft", unruhig wird, es sei denn, es erwärmt sich 10 Minuten lang, würden Sie dies nicht sagen Sie selbst "Hey, es wird älter und jetzt muss es 10 Minuten lang warm werden" Sie würden es in
Kauf
15

Also die Schritte zur Fehlerbehebung (nehmen Sie an, dass Sie nach jedem anhalten und warten, bis das Problem erneut auftritt):

  1. Überprüfen Sie die Protokolle auf dem Switch, um festzustellen, warum 100M verwendet werden.
  2. Wenn Sie es immer noch ausführen, deaktivieren Sie den extrem schlechten "Windows Load Balancing" -Bullshit, den Joel ständig pusht. Die Funktionsweise besteht darin, den Cache des Switches zu brechen und ihn zu zwingen, jedes Paket per Software zu verarbeiten. Ihr Switch ist für die Weiterleitung von Paketen in der Hardware ausgelegt und benötigt nur die CPU, um herauszufinden, welchen physischen Pfad ein unbekannter Verkehrsfluss nehmen muss (in -> asic -> out), und programmieren Sie die Hardware dafür (lesen Sie: a Der Rechner hat eine bessere CPU als Ihr Switch. Machen Sie keine dummen Dinge, die die CPU Ihres Switches härter arbeiten lassen. Der Windows-Lastenausgleich funktioniert, indem der Switch diese Entscheidung trifft und den Hardware-Cache für jedes Paket neu installiert. Das kann dieses bestimmte Problem nicht beheben, aber es nervt mich aus den Podcasts ... Entschuldigung.
  3. Stellen Sie sicher, dass die Konfiguration auf beiden Seiten übereinstimmt
  4. Google für Autoneg-Fehler auf Ihrem Switch - Sie sind nicht der einzige, der versucht, Autoneg auf dem von Ihnen verwendeten Computer auszuführen, es sei denn, Sie haben es selbst erstellt
  5. Ersetzen Sie das Kabel durch ein Cat5e-Kabel oder ein besseres - idealerweise funktioniert ein Kabel, von dem Sie wissen, dass es funktioniert, wie das, an das Ihre Workstation angeschlossen ist. Versuchen Sie nicht, Cat5 zu verwenden, oder irgendeinen Mist, den jemand hergestellt hat. Verwenden Sie einen, der tatsächlich geformte Enden aus einer Verpackung hat.
  6. Port verschieben - Versetzen Sie den Server an einen anderen Port am selben Switch
  7. Tauschen Sie die Netzwerkkarte aus - verwenden Sie einen anderen Stapel, der zu einem anderen Zeitpunkt bestellt wurde

Zu diesem Zeitpunkt haben Sie die Konfiguration, die physischen Ports, an die Sie angeschlossen sind, und die Verkabelung zwischen ihnen beseitigt. Wenn es immer noch passiert, können einige andere Ursachen sein:

  1. Kabelführung - Achten Sie auf EM-Störungen durch Ihre Wechselstromkabel und verlegen Sie sie an verschiedenen Seiten des Racks.
  2. Kühlung - Stellen Sie sicher, dass Ihre Umgebungstemperatur nicht etwa 90 Grad beträgt und Ihre NIC-Karten nicht in den Modus "Lieber Gott, lass mich nur dieses eine Paket weiterleiten" fallen. Ich habe gehört, aber nicht gesehen, dass Cisco-Router das schnelle Umschalten und Weiterleiten von Paketen über die CPU einstellen, wenn sie beispielsweise überhitzt sind.
  3. Ersetzen Sie den Switch durch etwas, das nicht saugt. Überprüfen Sie, wie viel Bandbreite Ihre Hosts insgesamt pro Sekunde sprechen, und überprüfen Sie dann die Nennkapazität der Rückwandplatine Ihres Switches. 7 Hosts von 48, die alle 1.0G übertragen, reichen aus, um beispielsweise ein Cisco 3750 zu stoppen. Auch sein sehr vorsichtig über die cheapo ferner liefen Netzwerk - Anbieter: D-Link, Linksys, Dell, Intel und HP. Niemand, der das Netzwerk ernsthaft behandelt, nimmt diese Typen ernst, und nicht, weil "nie jemand wegen der Verwendung von Cisco entlassen wurde", sondern weil "die Leute sich daran erinnern, dass ein Intel-Switch mit 20/48 Ports über 2 Jahre ausfällt" oder "ich habe früher ausschließlich ProCurve und verwendet" schimpfen darüber, wie böse Cisco war, bis ich tatsächlich Cisco benutzte. Zu diesem Zeitpunkt habe ich aufgehört, weniger zu kaufen ". Cisco gilt als MittelklasseNetzwerkanbieter, was sagt Ihnen das über die Jungs unter Cisco ...? :-)

Hintergrund / warum meine Antwort am besten ist: Ich arbeite als Netzwerk- / Systemingenieur in der Finanzbranche und habe folgende Erfahrungen mit unserem kleinen globalen Netzwerk (15 Niederlassungen, 8 Rechenzentren) gesammelt:

Alle unsere LAN-Ports sind autoneg, da wir die Geräte an beiden Enden steuern und auf beide Seiten zugreifen können. Dies kann so einfach sein, als würde man jemanden anrufen und die Einstellungen überprüfen lassen. In drei Jahren fiel nur einer unserer internen Ports aufgrund eines Autoneg-Fehlers aus, und das lag an einem fehlerhaften Kabel - es verschwand, nachdem das Kabel ausgetauscht wurde.

Wir hatten weitaus mehr Probleme, als die Vorgänger 100 / full auf ihren NICs fest codiert hatten, und haben diese Tatsache nicht dokumentiert. Setzen Sie im nächsten Hauptfenster alles auf auto / auto zurück und haben Sie seitdem keine Probleme damit.

An den paar Orten, an denen wir eine Kupferübergabe von einem Netzbetreiber für unser WAN erhalten haben? Sie sollten ziemlich oft damit rechnen, dass eine kupferne WAN / Internet-Verbindung die ganze Zeit über nicht funktioniert - zum Teil, weil Sie keine Ahnung haben, was sich auf der anderen Seite befindet. Einige alte Extreme-Switches, die eine fehlerhafte Firmware für Autoneg haben, aber MPLS-Tagging? Ein 5-Dollar-Medienkonverter, weil das 200.000-Dollar-Ciena-Edge-Gerät Ihres ISP einfach zu großartig ist, um Ethernet über Twisted Pair bereitzustellen? Entscheiden Sie im Voraus, wie damit umgegangen werden soll, und halten Sie sich daran. Erwarten Sie dann, dass ein Trottel im Netzbetreiber es an einem Samstag um 22 Uhr ändert, da die vereinbarte Konfiguration nie dokumentiert wurde und einige Richtlinien zu befolgen sind.

Im Ernst, erhalten Sie eine Glasfaserübergabe von Ihrem ISP.

James Cape
quelle
2
Ich bin gerade zum Lesen gekommen - ausgezeichnete Antwort.
Helvick,
Hervorragende Antwort.
Rushino
2
Nur damit die endgültige Antwort irgendwo hier ist, waren es schlechte Broadcom-Fahrer. Wir konnten kein Set finden, das funktionierte. Der Wechsel zu Intel-NICs hat das Problem zu 100% behoben. blog.serverfault.com/2011/03/04/broadcom-die-mutha
Jeff Atwood
@ JeffAtwood Ist das das gleiche Problem? Ich dachte, dieser wurde schließlich auf einen Stromsparmodus am Schalter zurückgeführt ...
James Cape
14

Das Netzwerk, für das ich verantwortlich bin (zusammen mit ein paar anderen Leuten), besteht aus ca. 40 Servern, über 1000 Arbeitsstationen (verteilt auf einem ziemlich großen Campus) und ca. 1000 WAPs, die sich auch über einen großen Bereich mit unterschiedlichen Typen und Altersgruppen erstrecken von Netzwerkgeräten.

Wie dimitri.p sagte, ist es normalerweise ein Hinweis auf ein anderes Problem, wenn etwas plötzlich nicht mehr automatisch verhandelt werden kann. Das manuelle Einstellen des Anschlusses ist vergleichbar mit dem Anlegen eines Pflasters an jemanden, der in den Darm gestochen wurde - dies könnte die Blutung stoppen, aber es liegt mit Sicherheit ein Schaden darunter.

Meine übliche Checkliste:

  • Hat sich an der Maschine etwas geändert? Fahrer? Einstellungen auf Betriebssystem- oder BIOS-Ebene? Vielleicht war Autoneg im Betriebssystem deaktiviert?
  • Haben Sie die Patchkabel ausgetauscht und die Kabelführung überprüft (wenn es sich um einen Logner handelt, der mehr als ein Rack umfasst?)
  • Haben Sie getestet, ob der Switch-Port fehlerhaft ist oder ausfällt?
  • Könnte die Netzwerkkarte schlecht laufen?

Wir, in der Regel nie autoneg auf Servern deaktivieren (oder irgendetwas anderes im Rechenzentrum) , es sei denn es eine Situation ist , wo alle anderen möglichen Ursachen beseitigt wurden, zogen wir Switch - Ports, geändert Kabel, testeten die NIC etc. und es gibt keine andere Wahl. In diesem Fall wird es zu Tode dokumentiert. Dies passiert sehr selten und normalerweise bei Geräten, auf die wir keinen Zugriff haben, um BIOS- und Betriebssystemeinstellungen zu überprüfen.

Die Workstations und APs sind eine andere Geschichte. Ein fehlerhaftes Autoneg ist ein klassisches Zeichen für eine schlechte Kabelführung, und oft müssen wir die Geschwindigkeit und den Duplex-Modus manuell einstellen, bis der Sommer beginnt, in dem neue Kabel in den Wänden verlegt werden.

Jason Antman
quelle
Wir haben Kabel und Ports auf einem "problematischen" Server wiederholt ausgetauscht und sind auf die Verwendung von "in the box" -Netzwerktreibern (Server 2008 R2) zurückgekehrt. Dies geschieht auch auf mehreren Servern mit identischer Konfiguration. Es fällt mir schwer, mich zu versöhnen: "Mach das nie!" und "mach das immer!" in den Antworten auf die gleiche Frage.
Jeff Atwood
@ Jeff: Ich bin mit der Frage vertraut, die Sie und Ihr Team ursprünglich gestellt haben ( serverfault.com/questions/104791 ). Ich bin gespannt , ob das Problem dem Switch-Port oder dem NIC-Port auf den problematischen Servercomputern folgt. . Was ist die Marke / das Modell der Netzwerkkarte / des Chipsatzes überhaupt?
Evan Anderson
1
@ Jeff - Einige Antworten sind nicht binär :) Es ist Do it, wenn Sie müssen, bis Sie eine Chance haben, herauszufinden, was das Problem ist.
dimitri.p
@evan tritt auf jedem Web-Tier-Server auf und folgt keinem Switch-Port oder keiner Ethernet-Karte. Wenn es nach dieser Änderung immer noch ein Problem gibt, handelt es sich um ein Softwareproblem. Die Server sind Lenovo RS110 x6 und Lenovo RD120 x2.
Jeff Atwood
1
Nur um sicherzugehen, dass die endgültige Antwort irgendwo hier ist: Es war ein Treiberproblem bei Broadcom. Wir konnten es mit keinem bekannten Treibersatz beheben. Die einzige "Lösung" bestand darin, auf Intel-Netzwerkkarten umzusteigen.
Jeff Atwood
10

Dies ist ein Netzwerk-Mythos. Unsere Netzwerk-Leute schwören auf diesen Quatsch, weil Bay-Switches 1998 nicht mit Cisco oder so verhandeln würden. Anstatt die Standardeinstellung für 99,999% der Geräte auf der Erde zu verwenden, haben wir diese lächerliche Konfigurationsmanagementübung und einen großen Sündenbock für die Zeiten, in denen ein NIC-Treiber-Update die Einstellungen zurücksetzt, um automatisch zu verhandeln, und alles passiert.

Es ist amüsanter, da viele unserer Server zweifelhafte Funktionen wie NIC-Teaming verwenden, die verhindern, dass Sie im unwahrscheinlichen Fall eines Switch-Ausfalls den Netzwerkzugriff verlieren, und Sie gleichzeitig einem weitaus wahrscheinlicheren Softwarefehler aussetzen. (Die Fahrer saugen immer)

Zur Verteidigung der Netzwerk-Leute laufen viele Server mit Windows-Standard-NIC-Treibern, die normalerweise nicht funktionieren. Wenn Sie Probleme mit der automatischen Aushandlung haben und Ihre Ausrüstung nicht mit der Clinton-Administration übereinstimmt, aktualisieren Sie diese NIC-Treiber.

duffbeer703
quelle
1
Es waren letztendlich schlechte Treiber, aber die einzige Lösung, die wir finden konnten, war der Wechsel zu Intel-Netzwerkkarten. Wir haben jetzt eine lebenslange Rache gegen Broadcom-NICs.
Jeff Atwood
10

Sie sollten automatisch verhandeln. Wenn Sie einen Switch haben, der nicht zuverlässig automatisch verhandelt, kaufen Sie einen besseren Switch.

Gigabit soll automatisch verhandeln, und dazu gehört auch die automatische Crossover-Erkennung (MDI-X).

Es ist garantiert , dass 100baseT fehlschlägt, wenn ein Ende auf auto und das andere auf manual eingestellt ist. Dies entspricht den Spezifikationen. Wenn Sie ein Ende zu 100 zwingen / Voll dann das andere Ende wird auf 100 / Halb Autonegotiation Sie eine Duplex - Mismatch zu geben.

Alnitak
quelle
9

Normalerweise stelle ich Server so ein, dass sie repariert werden, da ich gesehen habe, dass Netzwerkgeräte auf 10 / halb anstatt auf 1000 / voll verhandeln.

Auch einige CoLos stellen ihre Schalter nicht auf Verhandlung, sondern nur auf 1000 / full ein.

mrdenny
quelle
7

Das Deaktivieren der automatischen Aushandlung in einer nicht getesteten Erstkonfiguration ähnelt der Voodoo-Programmierung - Sie ändern etwas ohne guten Grund. Wenn Sie nach dem Testen feststellen, dass eine Duplex- oder Geschwindigkeitsinkongruenz vorliegt oder der Port übermäßig fehlerhaft ist, führen Sie eine andere Fehlerbehebung durch und beheben Sie die Konfiguration, falls erforderlich.

Wenn Sie einen Treiber aktualisieren oder Hardware austauschen, kann nicht garantiert werden, dass Ihre Einstellungen auf der Serverseite beibehalten werden.

Stellen Sie beide Seiten des Links zum Aushandeln ein oder korrigieren Sie beide Seiten. Wenn Sie die Geschwindigkeits- und Duplexeinstellungen auf einigen Geräten korrigieren, geben diese ihre Funktionen nicht mehr an ihre Kollegen weiter. Ich weiß nicht, was der Ethernet-Standard darüber sagt, was zu tun ist, wenn eine Seite Funktionen ankündigt und die andere Seite nicht, und das bedeutet wahrscheinlich, dass viele Implementierer es auch nicht wissen. Einige wählen den kleinsten gemeinsamen Nenner, der 10-halb ist, und andere gehen davon aus, dass alles in Ordnung ist, und wählen die schnellstmögliche Geschwindigkeit.

Es gibt einige moderne Hardwarekomponenten, die die automatische Aushandlung bei Gigabit-Kupfer-Ethernet nicht unterstützen, wie (zumindest einige) Cisco-Switches mit Kupfer-SFPs.

jaredg
quelle
Die 6748-SFP-Module unterstützen Autoneg. Sie erlauben es nur nicht, mit etwas anderem als 1000 / full zu verhandeln. :-)
James Cape
6

Vor vielen Jahren habe ich einige Zeit bei 3com verbracht, um den technischen Support für fast alle Netzwerkgeräte zu übernehmen. Es ist erstaunlich, wie oft dieses Problem aufgetreten ist, und es war so ziemlich das Standardverfahren, alles manuell festzulegen.


quelle
4
Die operative Aussage in dieser Antwort lautet "Vor vielen Jahren". 10/100 Autonegotiation ist nicht dasselbe wie die heutige Gigabit-Autonegotiation.
Evan Anderson
1
Du liegst absolut richtig! Dies war in der Tat "vor vielen Jahren", und im Nachhinein erinnere ich mich nicht daran, dass dies mit einem der Gigabit-Geräte, die zu dieser Zeit ziemlich neu waren, annähernd so oft passiert ist.
4

Ich hatte viele Probleme mit der automatischen Aushandlung. Viele bedeuten natürlich alle paar Monate einen, aber das ist ein Problem, das in meinem Buch zu viele sind.

Probleme bei der automatischen Aushandlung sind schwer zu finden, insbesondere wenn es sich bei den Mitarbeitern, die mit Netzwerk, Servern, Anwendungen und Datenbanken befasst sind, um vier verschiedene Teams handelt. Normalerweise verbringen die letzten beiden viel Zeit damit, hin und her zu gehen, sich gegenseitig schlechte Leistung vorzuwerfen und über Messungen zu lügen, und manchmal werden sie den Servern vorgeworfen, die sich die Ausgabe von "top" genau ansehen und sagen, dass alles stimmt gut mit dem Server.

Dies geht so lange weiter, bis die Angelegenheit zu einem Punkt eskaliert, an dem ein "Experte" (tatsächlich jemand, der ein Generalist ist und daher Netzwerke, Hardware, Betriebssysteme, Datenbanken, Frameworks und Anwendungen versteht) dem Problem zugewiesen wird und das Problem findet innerhalb von fünf oder zehn Minuten.

Meine eigene Faustregel lautet also, wann immer ich die Möglichkeit habe, etwas dagegen zu unternehmen, IMMER feste Geschwindigkeiten für Produktionsserver, Switches und Router festzulegen. Nicht-Produktionsserver haben ebenfalls keinen Root-Zugriff, wenn sie für die Benutzer ausreichend getrennt sind.

Switches, die den Desktop- / Notebook-Zugriff verwalten, können automatisch ausgehandelt werden, und es gibt Ausnahmen von der Regel. Um nur eines zu erwähnen: Wenn im Netzwerk viele Änderungen stattfinden, ist es besser, die automatische Einstellung beizubehalten und die Dinge im Auge zu behalten.

Ein weiterer Punkt, der nützlich sein kann , ist die Überwachung der Sache , unabhängig davon, welche Wahl Sie in Bezug auf die automatische Aushandlung treffen . Konfigurieren Sie einfach Nagios oder What-Have-You, um den Status aller wichtigen Ports im Auge zu behalten. Sie überwachen diese Netzwerkgeräte ohnehin schon, oder?

Daniel C. Sobral
quelle
4

Grobe. Ich habe 3com-NICs mit 100 MBit / s gesehen, die keine Verbindung mit mehr als 10 MBit / s herstellen würden, wenn Sie die Geschwindigkeit oder Duplex erzwingen würden. Sie konnten nur dann die volle Geschwindigkeit erreichen, wenn sie automatisch verhandeln ließen, obwohl der Treiber die Einstellungen 100 MB Full und 100 MB Half hatte.

Bei vielen NIC-Treibern können Sie nicht 1000 MB angeben. Die einzigen Auswahlmöglichkeiten sind 10, 100, Auto. Wieder zwingen Sie, Auto zu tun, wenn Sie volle Geschwindigkeit wollen. So verhält sich beispielsweise der Broadcom netXtreme 57xx Gigabit-Treiber.

Sie können Gigabit leicht auf den Switch zwingen, aber ich denke, Sie werden gezwungen sein, die meisten Netzwerkkarten automatisch aushandeln zu lassen.

pplrppl
quelle
5
Die Gigabit-Spezifikation erfordert eine automatische Verhandlung.
Duffbeer703
3
  1. Nach meiner Erfahrung (meistens 3Com- und HP-Geräte, nicht viel Cisco) verursacht die automatische Aushandlung keine großen Probleme.

  2. Ähnlich wie bei mrdenny stelle ich Server normalerweise auf die höchste Geschwindigkeit ein (wir haben noch einige bei 100), Vollduplex und lasse den Schalter dann auf Auto. Da Server und Workstations unterschiedliche Geschwindigkeiten aufweisen, ziehe ich es vor, die Schalter automatisch zu aktivieren und sie an den Endpunkt anpassen zu lassen.

Ward
quelle
2
Wenn Sie bei Cisco-Geräten die Geschwindigkeit auf dem Host manuell einstellen und den Schalter auf "Auto" lassen, steigt die Wahrscheinlichkeit, dass Probleme auftreten. Ciscos bevorzugen Auto-Auto oder manuell-manuell
einstiien
Nicht nur Cisco - alles funktioniert besser, wenn beide Enden der Verbindung übereinstimmen.
James
3

Ich hatte einige Probleme mit der Autonegotiation in einem Heim-Setup und das Problem war die Verkabelung, insbesondere die Netzwerkkabel, die in einer Schleife mit zu kleinem Durchmesser aufgerollt sind oder die zu nahe an Stromkabeln liegen.

Aber ich denke, diese Vorschläge sind für Ihr Setup etwas zu trivial. ;)

macbirdie
quelle
2

Ich habe kürzlich in Network Warrior von Gary Donahue darüber gelesen. Basierend auf diesem Handbuch müssen der Switch und die Netzwerkkarte auf Auto-Negotiation eingestellt sein, damit die Auto-Negotiation ordnungsgemäß funktioniert. Wenn Sie die Netzwerkkarte auf eine bestimmte Geschwindigkeit und einen bestimmten Duplexmodus einstellen und den Server bei der automatischen Aushandlung belassen, funktioniert dies nicht ordnungsgemäß. Die automatische Aushandlung ist ein Protokoll, das beide Seiten verwenden müssen, damit die Einstellungen ordnungsgemäß funktionieren.

Wenn Sie die Geschwindigkeit und den Duplexmodus explizit einstellen möchten, müssen Sie dies an beiden Enden der Verbindung tun.

Bob Weber
quelle
Es hängt davon ab, ob Sie von der neuen Gigabit-Autonegotiation sprechen - sie unterscheidet sich grundlegend von der alten 10/100-Autonegotiation.
Jeff Atwood
1

Meine Faustregel ist, für alles außer für Router-Links die automatische Verhandlung zu verwenden, es sei denn, Sie haben speziell ein Problem (wie aktuelle Broadcom-Karten ... BAH!).

Wenn Sie beispielsweise zwei Router über Ethernet verbunden haben, stellen Sie die Geschwindigkeit an beiden Enden manuell ein.

Aaron C. de Bruyn
quelle
2
Warum sollten Sie die Geschwindigkeit zwischen Routern manuell einstellen?
Amok
Ich nehme an, es ist Gewohnheit. Wenn Sie jedoch über Nicht-Ethernet-Verbindungen nachdenken, müssen Sie normalerweise die Geschwindigkeit einstellen.
Aaron C. de Bruyn