Das Thinkpad wird nach 10 Minuten starker Beanspruchung heruntergefahren

8

Vor weniger als zwei Jahren habe ich ein Lenovo Thinkpad R500 gekauft .

Bei starker Auslastung der CPU wird manchmal ein Neustart beschlossen (wobei Ubuntu kurz die Meldung "Herunterfahren" anzeigt).

Ein Linux-Widget zeigt mir die CPU-Temperatur. Der PC startet normalerweise neu, wenn die Temperatur des ersten Kerns über 100 ° C liegt, aber manchmal scheint es, dass er noch nicht 80 ° C erreicht hat.

Seit ich von Ubuntu 2010.10 32bit auf Ubuntu 2011.04 64bit umgestiegen bin, stürzt es viel häufiger ab.

Im Büro benutze ich einen Laptop-Kühler .

Ich habe auf 800 MHz untertaktet und meinen Lüfter so eingestellt, dass er immer mit maximaler Geschwindigkeit läuft (mit sichtbaren Ergebnissen: mehr Lärm und mehr geblasene Luft), aber es verhindert nicht, dass es zu Abstürzen kommt:

cpufreq-selector -c 0 -f 800000
cpufreq-selector -c 1 -f 800000
sudo rmmod thinkpad_acpi
sudo modprobe thinkpad_acpi fan_control=1
sudo thinkfan -n -c alwaysmax-thinkfan.conf

Es gibt keinen Staub. Ich habe großzügig Luft in die Lüftungsschlitze an den Seiten und unter den Laptop gesprüht. Ich habe auch innen gereinigt, nachdem ich die Tastatur und den Rahmen entfernt habe.

Wie kann ich herausfinden, wo das Problem liegt?

Nicolas Raoul
quelle
Sie könnten zuerst ein BIOS-Update versuchen. Als nächstes müssen Sie die maximale Taktrate senken. Sie können sehen, wie es in thinkwiki geht . Das Deaktivieren des Sensors ist eine schlechte Idee, da es dann Ihre CPU verbrennen kann.
Egon
Meinen Sie "Ist es normal, dass ein Thinkpad abstürzt, wenn die CPU auf 100% steht" oder "Ist es normal, dass ein Thinkpad abstürzt, wenn die CPU auf 100 ° steht"?
Flimzy
@Flimzy: 100%. Mein vorheriger Computer war in der Lage, Zahlen für Tage zu zerbröckeln, CPU 100%
Nicolas Raoul
1
Wenn Sie sich der Herausforderung stellen möchten, können Sie den CPU-Kühlkörper mit einer neueren (und qualitativ hochwertigeren) Wärmeleitpaste ersetzen. Dies ist kein normales Verhalten , selbst bei Ihrem Laptop mit Standardeinstellungen ohne zusätzliches Kühlkissen. Und wie Nicholas Raoul betont, müssen Sie etwas reparieren, wenn Sie Ihren Computer nicht über einen längeren Zeitraum bei 100% Last halten können.
Durchbruch

Antworten:

8

Vergessen Sie das Thinkpad für einen Moment. Es ist nicht normal, dass ein Laptop über einen längeren Zeitraum bei 100% CPU abstürzt, aber es ist normal, dass fast alle Maschinen heruntergefahren werden, wenn eine überwachte Komponente eine kritische Temperatur erreicht.

Es bedeutet einfach, dass Ihre Lüfter / Kühlung nicht ausreichen oder dem Job gewachsen sind.

Erstens, wie Egon in den Kommentaren sagte, suchen Sie nach einem BIOS-Update. Wenn andere sich über ähnliche Probleme beschwert haben, veröffentlichen Hersteller normalerweise Updates, die entweder bestimmte Komponenten übertakten oder die Lüftergeschwindigkeit / -schwellen erhöhen.

Wenn dies nicht hilft, sollten Sie nach Staub und Schmutz suchen, der die Lüfter verstopft.

Wenn Sie jemanden mit ähnlichen Problemen finden, können Sie sich direkt beim Hersteller beschweren.

Es ist möglich, dass der Sensor falsch ist, aber es ist immer schwer zu beweisen, außer durch Öffnen und Verwenden eines Thermometers.

... Außerdem bin ich nicht auf dem Laufenden, habe aber über Linux-Stromprobleme gelesen, die offensichtlich dazu führen würden, dass sich mehr Wärme aufbaut - dies sollte jedoch nur die Akkulaufzeit beeinflussen ... aber es löst sich nicht das zugrunde liegende Problem in Bezug auf die Kühlung Ihres Laptops.

William Hilsum
quelle
4

In Ubuntu ist ein Fehler aufgetreten, der möglicherweise damit zusammenhängt:

https://bugs.launchpad.net/bugs/751689

Einige Leute haben berichtet, dass sie es lösen können, indem sie aspm erzwingen oder den Lüfter auf volle Geschwindigkeit bringen. Ich vermute, das Problem ist, dass diese Thinkpads ein fehlerhaftes BIOS haben, das sich weigert, den Lüfter mit voller Geschwindigkeit zu betreiben, und sie erzeugen zusätzliche Wärme, da die GPU darauf angewiesen ist, dass ASPM die GPU in die Warteschlange stellt, um in einen Zustand niedrigerer Leistung zu gelangen, wenn sie nicht verwendet wird Die jüngsten Linux-Kernel respektieren jedoch die Tatsache, dass das BIOS meldet, dass ASPM nicht unterstützt wird, und deaktiviert es daher, wodurch die GPU mehr Wärme abgibt.

psusi
quelle
+1 Dieser Fehlerbericht enthält großartige Tipps und hat mir ermöglicht zu verstehen, dass mein Problem schlimmer ist: Selbst nachdem ich meinen Lüfter auf "immer maximale Geschwindigkeit" mit thinkfanund Untertakten auf 800 MHz eingestellt habe, stürzt er immer noch ab. Neu: Es stürzt sogar ab, wenn die CPU-Temperatur noch 70 ° C beträgt
Nicolas Raoul
Könnte ein Zeichen für Schäden durch Hitze sein.
Geselle Geek
2

Etwas, das andere bisher nicht erwähnt haben: Funktioniert der Lüfter? Kannst du hören, wie es startet und beschleunigt, wenn die CPU heißer wird?

Installieren Sie ein Sensorüberwachungspaket. lm-sensorsstellt den Befehlszeilenbefehl bereit sensors, muss jedoch zuerst ausgeführt werden sudo /usr/sbin/sensors-detect- es gibt auch GUI-Optionen. Thinkpads haben eine gute ACPI-Unterstützung für ihre Fans, oder zumindest für jeden, den ich seit 2004 besitze. Ein Vorteil davon ist, dass Sie auch CPU-Temperaturanzeigen erhalten. Mein T61p meldet die Geschwindigkeit des einzelnen Lüfters, die CPU-Kerntemperaturen (über den internen Sensor), die Temperatur der Mini-PCI (dh der WLAN-Karte), die Temperatur des Mainboards und die GPU-Temperatur.

Wenn der Lüfter nicht startet, haben Sie Ihren (ersten) Schuldigen. Sie müssen es ersetzen lassen. Es ist auch möglich, es selbst zu tun, wenn die Garantie für die Maschine abgelaufen ist, aber es ist eine ärgerliche kleine Operation. Tun Sie es auf einer guten Arbeitsfläche mit guter Beleuchtung, holen Sie sich ein Servicehandbuch und befolgen Sie die Anweisungen genauestens. Sie möchten diesen Teil der Maschine nicht gefährden.

Wenn der Lüfter nicht starten , können Sie den Luftstrom fühlen , da es voller Geschwindigkeit erreicht? Bei vielen Thinkpads befindet sich der Auspuff auf der linken Seite mit Einlässen hinten und / oder unten.

Reinigen Sie den Kühlkanal regelmäßig? Mein Chef und ich haben identische Thinkpads, aber seine waren früher 10 ° C heißer. Er ist Raucher und hat die Lüftungsschlitze nicht regelmäßig gereinigt. Staub ist ein großartiger Isolator, und selbst wenn Ihr Lüfter auf Hochtouren läuft, wird der Luftstrom dem Kühlkörpermetall nicht genügend Wärme entziehen. Zum Reinigen der Lüftungsschlitze verwende ich ein schweres manuelles Luftgebläse, wie es Fotografen verwenden ( mein persönlicher Favorit - billiger als Luft in einer Dose, umweltfreundlicher und überraschend gut trainiert). Setzen Sie die Düse auf den Lufteinlass und blasen Sie wiederholt. Wenn Sie dies zum ersten Mal tun, tun Sie dies im Freien und / oder tragen Sie eine Maske. Wahnsinnige Staubmengen treten aus der Abluftöffnung aus. Bei mir kommen auch Federn aus den linken Lautsprecherlöchern.

Im Folgenden finden Sie grundlegende Überlegungen, die für Sie wahrscheinlich nicht zutreffen, da Sie das Problem beenden können, indem Sie den Laptop kühlen und / oder die CPU-Geschwindigkeit verringern. Sie sollten sich mit ziemlicher Sicherheit auf den Wärmeaspekt konzentrieren.

Wenn die CPU-, GPU- usw. Temperaturen alle nominal sind, der Lüfter sich frei einschaltet und seine Arbeit erledigt und die Maschine bei harter Arbeit immer noch abstürzt, gibt es andere (traurigere) Diagnosen. Die Hauptverdächtigen in abnehmender Reihenfolge der Wahrscheinlichkeit sind: beschädigter Speicher, beschädigte CPU, beschädigtes Mainboard oder ein Netzteil, das nicht genügend Strom liefert.

Sie können den Speicher leicht genug testen. Booten memtest86+Sie einfach in , was Sie unter Ubuntu installieren können (es wird in Ihrem GRUB-Boot-Menü angezeigt) und lassen Sie es seinen Job machen. Wenn es toten Speicher findet, haben Sie zwei Möglichkeiten: Ersetzen Sie den Speicher oder weisen Sie Linux an, den beschädigten Bereich nicht zu verwenden , wenn der Schaden gering ist . Wenn Sie den Speicher ersetzen müssen, stellen Sie sicher, dass der gesamte Speicher Ihres Thinkpad nicht integriert ist. Einige haben ihren gesamten Arbeitsspeicher in SODIMM-Steckplätzen, andere haben eine fest auf dem Mainboard installierte Menge. Wenn Ihr integrierter RAM beschädigt ist, muss das Mainboard ersetzt werden.

Das Gleiche gilt, wenn festgestellt wird, dass die CPU oder das Mainboard beschädigt sind, aber ich weiß nicht, wie ich das sicherstellen soll. Ich hatte noch nie Probleme dieser Art auf meinen ansonsten ziemlich missbrauchten Thinkpads.

Alexios
quelle
Der Lüfter funktioniert, vor kurzem habe ich ihn so eingestellt, dass er immer mit maximaler Geschwindigkeit läuft thinkfan. Er ist ziemlich laut und bläst Luft. Ich habe Staub an den Seiten, in den Lüftungsschlitzen unter dem Laptop und im Inneren durch Entfernen der Tastatur entfernt Ich benutze Luft in einer Dose und sprühe sie großzügig in die Lüftungsschlitze. Aber ich sende das Betriebssystem immer noch zum Neustart, wenn die Last etwas hoch ist ...
Nicolas Raoul
1

Zwei Dinge, die Sie tun können:

  1. Hardware-Seite: Staub reinigen

    Da Ihr Laptop ungefähr 2 Jahre alt ist, kann sich im Kühlsystem viel Staub angesammelt haben. Sie haben zwei Möglichkeiten: Reinigen Sie den Laptop selbst oder geben Sie ihn zur Reinigung an einen lokalen Computer-Servicepunkt.

  2. Softwareseite: Versuchen Sie es mit Undervolting

Schauen Sie sich das Linux-PHC-Projekt an . Sehr oft werden die Standardspannungen von Prozessoren deutlich über dem angemessenen Wert eingestellt. Dies war bei meinem Thinkpad der Fall.

ruckelt
quelle
1

Unterhaltsame Tatsache über Thinkpads (zumindest mein Modell): Die GPU befindet sich physisch sehr nahe an der CPU und kann somit den CPU-Wärmesensor auslösen, obwohl die GPUs für eine höhere Temperatur konfiguriert sind. Wenn Sie Ihr Widget so einstellen, dass auch die GPU angezeigt wird, stellen Sie möglicherweise fest, dass diese Zahl genauso hoch ist, wenn nicht sogar höher.

Viele Modelle von Thinkpad verfügen über "umschaltbare" Grafiken. Wenn Sie die High-End-Karte unter Linux verwenden, sollten Sie die proprietären Catalyst-Treiber installieren, da ich festgestellt habe, dass die generischen einen Fehler aufweisen, der dazu führt, dass sich die GPU schnell erwärmt.

Yamikuronue
quelle
Interessant! Ich mache jedoch keine Spiele oder etwas, das viel grafische Leistung erfordert. Ich verwende die Dateisystemverschlüsselung von Ubuntu, bin mir aber ziemlich sicher, dass die GPU nicht verwendet wird.
Nicolas Raoul
Es spielt keine Rolle; Ich war überhitzt, nur mit KDE. Es ist die Tatsache, dass die generischen Treiber einen schrecklichen Fehler haben, der die GPU viel zu sehr ausführt. Haben Sie die proprietären Treiber ausprobiert?
Yamikuronue