Mein Arch-Computer hängt sich manchmal auf und reagiert plötzlich in keiner Weise auf Maus oder Tastatur. Der Cursor ist eingefroren. Strg-Alt-Backsp stoppt X11 nicht und Strg-Alt-Entf tut genau nichts. Die Darstellungen der CPU-, Netzwerk- und Festplattenaktivität in conky und icewm werden nicht mehr aktualisiert. In wenigen Minuten schaltet sich der Lüfter ein. Die einzige Möglichkeit, den Computer dazu zu bringen, etwas zu tun, besteht darin, die Stromversorgung auszuschalten.
Beim Hochfahren zeigen die CPU-Temperaturmonitore 70 bis 80 ° C an. Vor dem Hang habe ich normalerweise Aktivitäten mit geringer Intensität ausgeführt, wie z. B. Surfen im Internet bei etwa 50 ° C.
Die Protokolle zeigen nichts Besonderes im Vergleich zu einem normalen Herunterfahren. Memory Checker läuft einwandfrei ohne Fehler.
Wie kann ich untersuchen, warum es aufgelegt hat? Gibt es zusätzliche Informationen, die ich für einen Hinweis finden kann? Gibt es etwas, das weniger drastisch ist als das Ausschalten, um eine Aktion zu starten, wenn nur eine begrenzte Anzahl von Signaltönen zu hören ist, aber möglicherweise einen Hinweis gibt?
Die Maschine ist ein Gateway P6860 17 "-Laptop (sperrig, aber leistungsstark) und es wird Arch 64-Bit ausgeführt (Stand März 2011). Ich hatte Arch für eine lange Zeit ohne dieses Problem und wechselte für ungefähr eine Woche zu Ubuntu Dann zog er sich zu einer neuen Installation von Arch zurück. Dann begannen die Vorhänge.
UPDATE: Ja, sicher ist es überhitzt. Bei einer bestimmten Temperatur funktionieren Maus und Tastatur nicht mehr und werden manchmal nach einigen Minuten Abkühlung wieder funktionsfähig. Bei einer höheren Temperatur passieren schlimmere Dinge, wie die völlige Nichtreagibilität, einschließlich des Ignorierens von SysRq. Diesem Zustand folgt kurz ein plötzliches Ausschalten. Ich habe das Problem durch den Kauf eines neuen Computers 8D gelöst
quelle
ctrlaltdel hard
Ihre/etc/rc.local
Akte ein. Wenn das System abstürzt, versuchen Sie es mit Strg-Alt-Entf. Wenn es immer noch nichts tut, wissen Sie sicher, dass der Kernel nicht mehr läuft. Sie haben einen Hardware- oder Treiberfehler.In Bezug auf das Einfrieren gibt es einige Optionen:
Verwenden einer seriellen Schnittstelle, wenn Ihre Box eine hat, um den Speicherauszug zu erhalten, indem Sie
console=ttyS0
die Boot-Optionen wie hier beschrieben erweitern . Sie benötigen einen zweiten Computer mit einer seriellen Schnittstelle und einem Nullmodemkabel, um die Speicherauszugsdatei abzufangen.Verwenden Sie netconsole, um den Dump über das Netzwerk abzurufen ( siehe hier) .
Wenn Sie kexec / kdump auf diese Weise verwenden, erhalten Sie einen lokalen Speicherauszug ( siehe hier) .
In Bezug auf das Problem des sauberen Ausschaltens schlage ich vor, dass Sie den magischen SysRq-Schlüssel verwenden , um die Disks zu synchronisieren, sie zu entfernen und dann die Box neu zu starten (die Buchstaben sind diejenigen, die Sie zusammen mit alt eingeben sollten) -sysrq.
Bearbeiten: Wenn Sie die oops / trace in der lkml veröffentlichen, sollten Sie eine aktuelle (vorzugsweise die neueste) Version des Kernels und keine proprietären Module verwenden.
quelle