Ich arbeite in einem großen Unternehmen, in dem wir viele Legacy-Systeme verwenden. Um einige der Systeme zu beachten: HP-UX 10.20, Windows 2000, VMEBus-Systeme, Systeme, die vor mehr als 30 Jahren entwickelt wurden und nicht über TCP / IP-Protokolle kommunizieren, und mehr.
Während der gesamten Arbeitswoche sind wir ständig mit diesen Legacy-Systemen konfrontiert, die die Kommunikation untereinander verlieren. Normalerweise ist ein Neustart eines Systems, um zu versuchen, die Kommunikation wiederherzustellen, der letzte Ansatz. Es ist allgemein bekannt, dass ein Neustart eines Systems nur ein „Allheilmittel“ für ignorante Mitarbeiter ist. Ich habe mich gefragt, ob der Neustart eines Systems (Legacy oder nicht) zur Wiederherstellung einer fehlgeschlagenen Kommunikationslinie jemals Gültigkeit hat.
Mir ist klar, dass das Erneuern von IP-Adressen in Windows die Netzwerkkommunikation effektiv wiederherstellen sollte. Aber besteht die Möglichkeit eines tieferen Problems im zugrunde liegenden Betriebssystem, das beschädigt werden und einen Neustart erfordern könnte? Ein ausgefallener Socket, der eine Zeitüberschreitung aufweist, nicht geschlossen wird oder möglicherweise nicht versucht, die Verbindung wiederherzustellen?
Ein Neustart scheint mir eine praktikable Lösung zu sein, wenn ein so komplexes Netzwerk von Fehlanpassungssystemen vorhanden ist. Aber (zumindest an meinem Arbeitsplatz) wenn ein System neu gestartet wird und alles auf magische Weise wieder funktioniert, ist es immer ein „Zufall“. niemals eine Lösung. Gedanken?
quelle
Bei Failover-Clustern (ich verwende RedHat Cluster) ist ein Neustart aus mehreren Gründen eine gute Sache:
Es ist Teil des Hochverfügbarkeitsprotokolls "STONITH" (Shoot The Other Node in The Head), bei dem ein nicht reagierender Host zwangsweise getrennt / neu gestartet wird. Stellen Sie besser sicher, dass es ordnungsgemäß eingerichtet ist und ordnungsgemäß funktioniert. Wenn etwas schief geht, können Sie Computer mehrmals neu starten, es sei denn, das Problem ist offensichtlich.
Das System ist so optimiert, dass ein Knoten ausfällt, aber es ist nicht sehr gut - tatsächlich ist es scheiße -, wenn man herausfindet, dass sich ein Knoten nur schlecht verhält. Das Verschieben eines Dienstes auf einen anderen Knoten dauert einige Sekunden. Wenn sich der aktuelle Knoten schlecht verhält, ist das Ziehen des Steckers der sicherste und schnellste Weg, dies zu tun. Andernfalls könnte der Cluster versuchen, die Dinge zu gut zu machen, und auf eine Bestätigung warten, die niemals kommen wird.
quelle
Da sich Ihre Frage über mehrere Betriebssysteme erstreckt, kann es keine einzige richtige Antwort geben.
Ich kann dies für Windows 2000-Systeme sagen: Ich habe Tausende von ihnen ausgeführt und kann mich nur an eine Handvoll Fälle erinnern, in denen die Kommunikation fehlgeschlagen war UND das System nicht vollständig blockiert war. Oft wird dies durch einfaches Deaktivieren / erneutes Aktivieren der NIC ohne Kontakt zur Außenwelt behoben, gefolgt von einem Treiberupdate und / oder dem Ersetzen der Netzwerkkarte durch etwas weniger kitschiges.
(IOW, ich habe es nur mit alten Buggy-Treibern und / oder NICs von Markenherstellern gesehen.)
quelle