Angenommen, das System ist eine Red-Hat-Variante, eine x86-Architektur. Nehmen Sie keine Kühlungsprobleme an.
Kann eine sehr hohe Belastung des Computers zu einem Neustart führen?
Ich verstehe, dass eine Maschine sicher nicht mehr reagiert. Aber kann es tatsächlich neu starten?
Wenn ja, wie geschieht dies?
Dies könnte sicherlich der Fall sein, aber ein automatischer Neustart ist normalerweise mit Hardware- / Softwareproblemen wie Überhitzung oder Kernel-Fehlern verbunden. Daher ist es möglich, dass eine hohe Last eine Überhitzung verursacht, die zu einem Neustart führt. In jedem Fall sollten Sie die Protokoll- oder Kernel-Dumps untersuchen, um die genaue Ursache zu ermitteln.
quelle
Ich denke, die Antwort ist, dass nein, eine hohe Last alleine KEINEN Systemneustart verursacht. Es handelt sich um ein Hardware- oder Softwareproblem mit einer Beschreibung. Selbst wenn es unter hoher Last immer ausfällt, ist es die hohe Last, die ein anderes Problem auslöst. Ich weiß, dass dies keine große Hilfe ist, aber es beantwortet die Frage, die ich denke :-)
quelle
Ein System- Soft-Neustart wird ausgeführt, wenn 'Neustart' ausgeführt wird oder der entsprechende Systemaufruf aufgerufen wird. Wenn Sie keinen Watchdog haben, der einen Neustart auslöst, wird dies nicht passieren.
Aber sicher und eine Art harter Neustart / Reset kann aufgrund von Hardwareproblemen passieren.
Auf einem vernünftigen System wird aufgrund der hohen Auslastung kein Neustart durchgeführt. Schauen Sie sich dmesg, / var / log / messages an, um das Problem aufzuspüren.
quelle
Das ist mir schon mehrmals passiert.
Ich habe drei verschiedene Problemkategorien mit einer höheren Last als der, für die die Maschine ausgelegt ist:
In diesem Fall ist das System fehlerhaft, da der Speicher schnell auf die Festplatte ausgetauscht werden muss. Dadurch reagiert der Server nicht mehr, bis das Problem behoben ist. Wenn Sie den Server für eine Weile nicht benötigen, wird er möglicherweise wieder normal. Wenn der Speicher knapp wird, können Sie das Problem Nr. 2 eingeben oder der Kernel beschließt schließlich, einen Prozess abzubrechen (möglicherweise, weil ein
malloc()
zurückgegebenerNULL
und der Programmierer diesen Fall nicht überprüft haben und Sie eine SEGV erhalten ...).Dies würde ich das übliche Ergebnis für eine Last nennen, die den kritischen Punkt Ihres Kernels erreicht. Ein Ort, an dem der Kernel nicht einmal einen Speicherpuffer für sich selbst zuweisen kann. Dies ist selten, wenn Sie über eine große (ausreichende) Auslagerungsdatei verfügen. Es kann jedoch sein, dass Ihre Prozesse ohne Unterbrechung immer mehr Speicher zuweisen. (Als Entwickler, der gelegentlich in meinem eigenen Code vorkommt, muss ich einen Neustart erzwingen, wenn ich ihn nicht früh genug abfange, da ich den Prozess nicht stoppen und den Speicher freigeben kann ... IRIX hatte etwas, um solche Schurkenprozesse automatisch zu töten, was ich wirklich cool fand.)
Jetzt hatte ich zwei Fälle von automatischem Neustart. In einem Fall habe ich vor einiger Zeit in einer Firma einen VPS verwendet, und wenn Sie versucht haben, zu viel Speicher zu verwenden, hat das VPS-System die gesamte Maschine zerstört! Ihr Computer würde also gewaltsam ausgeschaltet. Ich sehe immer noch ein ähnliches Verhalten bei anderen VPS. Bei modernen ist es jedoch wahrscheinlicher, dass der Kernel einen Prozess beendet, weil er zu viel Speicher benötigt. Dieser Prozess wäre also gescheitert. Das VPS selbst würde immer noch laufen ... aber ziemlich nutzlos sein (keine Dämonen laufen darauf ...)
Auf meiner Hardware hatte ich das Problem des automatischen Neustarts. Normalerweise aus zwei Gründen: Überlastung oder Zugriff auf eine Hardware entweder falsch (falsche Software) oder zu schnell (was auch als falsch angesehen werden könnte, denke ich ...) Also hatte ich einen Computer, der nur ab und zu neu gestartet wurde wenn meine Last zu lange zu hoch wurde. Ich habe keine Ahnung, warum es passieren würde, aber ich habe seitdem einen anderen Computer und habe das Problem nicht wieder erlebt.
Und ich hatte auch einen anderen automatischen Neustart, bei dem der "falsche" Zugriff auf die Videokarte irgendwie einen "Hardware" -Reset auf das Motherboard schickte. Dies führt auch zu einem automatischen Neustart. Wenn irgendetwas auf Ihrem Computer dies tut (möglicherweise aufgrund einer "leichten" Inkompatibilität mit einem Treiber), kann es auch auf diese Weise automatisch neu gestartet werden ...
quelle
Auf einem System ohne Watchdog-Software sind die wahrscheinlichsten Ursachen für einen spontanen Neustart hardwarebezogene Probleme, nämlich Hitzeprobleme oder Stromprobleme in einer Komponente. Moderne Hardware wird häufig im Notfall ausgeschaltet, wenn die internen Sensoren Temperaturen ab einem bestimmten Punkt melden. Stromprobleme in einer Komponente können dazu führen, dass das Netzteil zurückgesetzt wird (mit größerer Wahrscheinlichkeit wird eine Sicherung oder ein Kondensator durchgebrannt), oder es können Wärmeprobleme auftreten, die auf die erste Quelle zurückzuführen sind.
Wie andere Antworten festgestellt haben, kann eine hohe Last diese Situationen auslösen. Höchstwahrscheinlich ist die Ursache des Problems eine Komponente, die nicht vollständig ausgefallen ist, aber nicht die vollständigen Spezifikationen erfüllt. ZB ein CPU-Kühler, der nicht genug kühlt. (Du hattest einen Job....)
Linux neigt eher zur Panik als zum spontanen Neustart, wenn es sich um Software usw. handelt. Sie haben einen schönen Bildschirm voller Daten, nach denen Sie suchen können, um einen Hinweis darauf zu erhalten, wo ein Problem liegen könnte. Überprüfen Sie alle Ihre Protokolle.
Meine Erfahrung besagt, Hardware zu überprüfen, insbesondere hitzebedingt. Finden Sie Überwachungssoftware für Ihre Hardware. Stellen Sie sicher, dass die Software ein Protokoll schreibt. Führen Sie eine schwere Last aus. Suchen Sie nach Spitzen, die mit dem Herunterfahren zusammenfallen. Höchstwahrscheinlich wird es kurz vor dem Zurücksetzen einen Höhepunkt erreichen oder beim Zurücksetzen immer noch ansteigen
quelle