Laptop läuft ~ 30 ° heißer als normal; CPU / Load ist angeblich normal. Was könnte dies verursachen und wie kann ich es diagnostizieren?

10

Ich verwende das neueste Arch Linux auf meinem ThinkPad t420-Laptop und habe ein zeitweise auftretendes Hitzeproblem, bei dem meine Temperatur von ~ 45 ° C auf ~ 75-90 ° C ansteigt und dort bleibt, bis ich neu starte.

Ich habe mehrere Diagnose - Tools ausgeführt werden , einschließlich der offensichtlichen htopund andere , die googeln vorgeschlagen hat, einschließlich powertop, iostatsund sicherlich andere , die ich mich nicht erinnern. Bisher habe ich keine offensichtlichen Probleme festgestellt und angeblich keine Unterschiede bei den Anzeigen, ob mein Computer normal läuft oder sich in diesem heißen Zustand befindet.

Ich habe auch die meisten verdächtigen Prozesse einzeln getötet (Datenbanken und andere Dämonen), in der Hoffnung, den verborgenen Schuldigen zu finden, ohne Erfolg.

Über diese Versuche hinaus weiß ich nicht, wo ich mit der Fehlerbehebung beginnen soll . Ich hoffe, jemand könnte mich in die richtige Richtung weisen, um nach dem tieferen Thema zu suchen.

Um genau zu sein, meine Frage ist nicht, wie ich meine Maschine kühlen soll, sondern was könnte eine konstante Wärmeänderung von über 30 Grad in einem System verursachen, in dem (angeblich) CPU und Last normal sind? Und mit welchen Tools / Praktiken könnte ich es diagnostizieren?

Einige Hinweise, die hilfreich sein könnten:

  • Ich kann das System kühlen (z. B. indem ich die Lüftersteuerung vollständig ausschalte), aber es erwärmt sich sofort wieder, wenn es in Ruhe gelassen wird. Dies scheint darauf hinzudeuten, dass die Wärmespeicherung kein Problem darstellt, sondern dass ständig etwas Wärme erzeugt wird.
  • Die CPU-Auslastung und -Last werden htopnach dem Eintritt in diesen heißen Zustand wie gewohnt gemeldet . Dies schließt Kernel-Threads ein. Demnach htopist das System im Wesentlichen inaktiv (1-2% systemweite CPU-Auslastung, eine Last von 0,10).
  • Mein Computer verwendet integrierte Intel HD-Grafiken und verfügt über keine andere Grafikkarte . Eine nVidia-Karte war eine Option für dieses Modell, wie von @braiam angegeben; Ich habe mich nicht dafür entschieden.
  • @terdon hat die CPU-Governor-Einstellungen aufgerufen. Meine CPUs sind auf eingestelltpowersave
  • Mein spezieller Prozessor ist ein 2,7 GHz Core i7-2620M.

Bearbeiten : Zum Zeitpunkt des Schreibens dieser Frage funktionierte meine Fancontrol nicht richtig und lief auch bei hohen Temperaturen kontinuierlich mit einem mittleren Drehzahlbereich (3900 U / min). Auf Vorschlag von @Alex und @JustDanyul wurde dies behoben. Das zugrunde liegende Problem bleibt jedoch weiterhin bestehen.

Nummern 1311407
quelle
1
Wie slm impliziert, ist die einzig mögliche Erklärung, wenn die CPU im Leerlauf ist, aber die Kerntemperatur zu hoch ist, dass überschüssige Wärme nach einem bestimmten Ereignis nicht abgeführt wurde - das einzige, was dort erhebliche Wärme erzeugen kann, ist die CPU. Stellen Sie sich vor, Sie schalten einen Ofenbrenner voll ein, um etwas Wasser zu kochen, setzen dann einen Deckel auf und drehen den Brenner auf niedrig: Das Wasser kocht ständig, weil die Wärme nicht so schnell abgeführt werden kann, wie der niedrige Brenner es ersetzt, solange der Deckel ist an . Nehmen Sie es auseinander und reinigen Sie es, wenn es so schlimm ist. Nur Luft zu blasen hilft an dieser Stelle wahrscheinlich nicht viel.
Goldlöckchen
Ich werde es auf jeden Fall auseinander nehmen und reinigen, da ich vermute, dass ich Probleme mit dem Luftstrom habe, aber da es so ist, wird die CPU nach dem Ereignis, das die extreme Temperaturänderung verursacht, auf unbestimmte Zeit eine konstant hohe Temperatur aufrechterhalten. Selbst wenn Sie den Deckel auf dem Topf lassen, sinkt die Wassertemperatur irgendwann. Mein Temp trifft eine Nummer und bleibt einfach dort, konstant bei dieser Nummer, für immer, bis ich neu starte. Es gibt keinen allmählichen Aufbau von Wärme, der darauf hindeutet, dass es Probleme mit der Ableitung gibt. Ich bin den ganzen Morgen unter voller Arbeitsbelastung gelaufen und sitze bei 41 Grad.
Nummern1311407
Anders ausgedrückt, meine Temperatur reguliert sich unter erwarteter Belastung normal. Wenn ich hart kompiliere, kann es bis zu 60, 70 Grad heiß werden, aber wenn es fertig ist, wird es abkühlen.
Nummern1311407
Neben dem Lüfter möchten Sie möglicherweise die Wärmeleitpaste erneut auftragen. Billigere Wärmeleitpaste löst sich mit der Zeit auf.
BlueRaja - Danny Pflughoeft
1
Vielleicht ist das eine dumme Frage, aber haben Sie zufällig ACPI deaktiviert? Ich hatte vor einiger Zeit ähnliche Probleme mit einem alten PC, der nicht mit dieser Option gestartet wurde. Nach dem Deaktivieren wurde er schließlich gestartet, war aber auch überhitzt.
Alko

Antworten:

6

Der Fan

Meins macht das auch mit Fedora 14. Versuchen Sie, eine komprimierte Dose Luft zu holen und die Lüftungsschlitze auf der Rückseite und Seite des Gehäuses auszublasen.

Außerdem möchten Sie in regelmäßigen Abständen die Tastatur entfernen und Druckluft direkt auf die Flügel des Lüfters blasen. Sie werden mit Staub zusammengebacken und beginnen, seine Wirksamkeit zu beeinflussen, indem sie ihn beschweren.

Das Beste an den Thinkpads sind die Servicehandbücher! Sie zeigen Ihnen, wie Sie Ihren Laptop abreißen und wieder zusammenbauen können.

Schlechter Prozess

Die andere Sache, die mir aufgefallen ist, ist, dass ich gelegentlich einen Prozess habe, der schief gelaufen ist und 100% eines der Kerne verbraucht. Wenn Sie diesen Vorgang beenden, wird die Temperatur normalerweise wieder normal.

Sie können htopoder verwenden, um topzu sehen, um welchen Prozess es sich handelt, und ihn entweder von ihrem oder von einem Terminal aus beenden, indem Sie ihn verwenden PID.

was sonst?

Weitere Tipps zum Abrufen der Temperaturwerte für die verschiedenen Komponenten Ihres Laptops finden Sie in meiner Antwort auf diese Fragen und Antworten zu U & L. Die Fragen und Antworten tragen den Titel: So erhalten Sie die Kerntemperatur von Haswell i7-Kernen in i3status .

slm
quelle
Dies ist definitiv etwas, was ich tun sollte, aber das Seltsame für mich ist, warum es nur manchmal in den heißen Zustand wechselt und bis zum Neustart bestehen bleibt, wodurch das Problem sofort behoben wird. Es scheint, dass etwas passieren muss, das die anhaltende Veränderung der Wärme auslöst. Ich habe htop ohne Erfolg ausgeführt. Die CPU-Auslastung ist normal.
Nummern1311407
Vielleicht signalisieren einige Wakes mit dem Kernel?
Braiam
1
@slm danke, das habe ich nicht ausprobiert. Ich werde dies tun, wenn es das nächste Mal heiß wird und die Ergebnisse melden.
Nummern1311407
1
@ numbers1311407: Der Grund, warum ein Neustart das Problem schnell löst, könnte sein, dass dadurch die CPU für einige Sekunden ausgeschaltet wird und die Temperatur unter den Grenzwert fällt. Die CPU ist immer heißer als die Umgebung, unabhängig von der Umgebung.
Goldlöckchen
1
Bitte beachten Sie, dass Sie im topBefehl "1" drücken können, um die Last der einzelnen Kerne anzuzeigen.
Christian Stewart
3

Dies ist eher ein langer Kommentar, aber Sie sollten einen Blick auf thinkwiki.org werfen. Es ist die Ressource für Linux auf ThinkPads. Was die Temperatur angeht, hatte ich ähnliche Probleme mit meinem t4500 und habe es durch Spielen gelöst

  1. Der CPU-Regler, der die CPU-Frequenzskalierung steuert. Sie haben folgende Möglichkeiten:

    • Die Leistung hält die CPU auf der höchstmöglichen Frequenz
    • Powersave hält die CPU auf der niedrigstmöglichen Frequenz
    • Userspace exportiert die verfügbaren Frequenzinformationen auf Benutzerebene (über das Dateisystem / sys) und ermöglicht die Steuerung der CPU-Frequenz im Benutzerbereich
    • Ondemand skaliert die CPU-Frequenzen entsprechend der CPU-Auslastung (wie die Daemons zur Skalierung der Benutzerraumfrequenz, jedoch im Kernel).
    • Konservativ verhält sich wie der On-Demand, erhöht jedoch die Frequenz Schritt für Schritt

    Mit ondemand läuft Ihre CPU nur bei Bedarf mit der höchsten Geschwindigkeit. Im Idealfall ist dies für Sie völlig transparent. Ihre Maschine arbeitet einfach so schnell wie nötig für die aktuellen Aufgaben. Um es zu aktivieren, tun Sie es

    sudo echo ondemand > /sys/devices/system/cpu/cpu0/cpufreq/scaling_governor
    
  2. Lüftersteuerung. Es gibt ein sehr schönes Dienstprogramm namens " Simple ThinkPad Fan Control ", mit dem Sie die Auslösetemperaturen, die die Drehzahl des Lüfters ändern, fein einstellen können. Schauen Sie sich auch die Informationen hier an .

terdon
quelle
Danke, das ist sehr hilfreich. Ich bin schon einmal auf dieses Wiki gestoßen, habe aber nie wirklich zur Kenntnis genommen, was es genau war.
Nummern1311407
Nur zu beachten, alle meine CPUs laufen inpowersave
Nummern 1311407
1

Ich denke, dass es ein Problem gibt, was Sie als "heiß" empfinden. Für das Thinkpad t420 ( laut Foren ) liegt die Temperatur bei 80-85 ° C und wir vergessen die nVidia-Karte, die ebenfalls zu einem Temperaturanstieg führen kann (tatsächlich funktioniert die Optimus-Konfiguration möglicherweise nicht gut und zwingt Ihre CPU, GPU-Arbeit zu leisten). Das heißt, Ihre maximal tolerierte CPU- Temperatur beträgt 100 ° C (wenn sie dort ankommt, wird das System heruntergefahren), während die Umgebungstemperatur zwischen 10,0 ° C und 35,0 ° C liegt . Das heißt, wenn sich Ihr Laptop in Reichweite befindet, ist alles in Ordnung (mit Ausnahme der Lebensdauer Ihres Akkus und Laptops).

Nun wollten Sie auf mögliche Verdächtige hinweisen. In diesem Zusammenhang würde ich sagen, dass die schlechte Implementierung von nVidia unter Linux möglicherweise Arbeit auf Ihre CPU bringt, die aufgrund ihres berüchtigten On-Demand-Systems Optimus, das Ihrer aktuellen Situation zu entsprechen scheint, nicht in htop (oder irgendwo anders) angezeigt wird. es funktioniert gut bis zu einem Moment, es beginnt einfach ohne Kontrolle zu heizen). Sie sollten Ihre Installation aktualisieren, bis Sie Bumblebee vollständig konfiguriert haben. Mit können bbswitchSie die nVidia-Karte nach Belieben deaktivieren und sehen, wie es geht.

Um Bumblebee for Arch zu installieren, finden Sie das Paket im Repository. Wenn Sie es noch nicht installiert haben.

Braiam
quelle
Ich habe mich auf diesem Computer nicht für die nVidia-Karte entschieden. Entschuldigung, das hätte in der Frage klarer sein sollen. Und obwohl 80-85 nicht zu heiß ist , ist es immer noch heißer als Mitte der 40er Jahre, was mein Computer normalerweise bei einer typischen leichten Arbeitslast ausführt. Mein Problem besteht darin, festzustellen, welche Phantombedingung "einsetzt" und bewirkt, dass meine konsistente 45 eine konsistente 80-85 ist.
Nummern1311407
1

Sensoren zeigen, wie mein Lüfter mit ~ 3900 U / min mitsummt

Auch bei Temperaturen wie ~ 75-90 ° C?

Durch manuelles Hochfahren des Lüfters wird die Maschine vorübergehend gekühlt

Ein Problem ist also nur, dass die Lüftergeschwindigkeit nicht automatisch funktioniert?

Vergessen Sie das Auto, Sie können die Temperatur korrekt ablesen und die Lüftergeschwindigkeit manuell steuern, oder? Wenn dies der Fall ist, müssen Sie nur ein funktionierendes Lüftersteuerungsskript finden oder ein eigenes ausrollen (Temperatur abfragen und Geschwindigkeit gemäß einer Tabelle temp[i]=speed[i]einstellen. Wenn Sie eine höhere Geschwindigkeit einstellen, halten Sie diese für eine Weile, auch wenn die Temperatur sinkt Wenn Sie die Geschwindigkeit verlangsamen müssen, tun Sie dies langsam und Schritt für Schritt.

In Bezug auf die Umfrage wäre es am besten, einen Temperaturüberwachungs-Daemon zu haben, der thermische Änderungsereignisse auslöst, und das Lüftersteuerungsskript, das auf diese Ereignisse wartet, obwohl ich es (vielleicht zu Unrecht) einmal war, acpidaber heutzutage weiß ich es nicht.

In beiden Fällen (Ihr eigenes / vorhandenes Skript) darf der Lüfter nicht anhalten, obwohl Sie mit der Lösung nicht vertraut sind. Behalten Sie immer die Temperatur und die Drehzahl im Auge.

Lösen Sie dieses autoProblem zuerst. Wenn die Überhitzung weiterhin besteht, können Sie sich auf die Ursache konzentrieren.

bearbeiten

Möglicherweise möchten Sie ein Tool ausprobieren lttng, mit dem Sie Statistiken des gesamten Systems im Laufe der Zeit erfassen können. Die Einrichtung ist jedoch möglicherweise nicht einfach und in Bezug auf die Speicherung teuer, wenn Sie sie für längere Zeit erfassen müssen.

Alex
quelle
Sie haben Recht, dass meine Fancontrol, wenn überhaupt, schlecht funktioniert. Ich werde versuchen, es richtig reagieren zu lassen, aber das Beheben wird die zugrunde liegende Ursache nicht lösen. Ich könnte das Ding den ganzen Tag bei maximal 6400 U / min loslassen und ein bisschen abkühlen, aber es ist die Ursache, die ich ansprechen möchte.
Nummern 1311407
1

Da das manuelle Hochfahren des Lüfters das Problem löst, ist dies ein ausgezeichneter Ort, um mit der Fehlerbehebung zu beginnen, da dies darauf hindeutet, dass die automatische Lüftersteuerung nicht funktioniert.

Jetzt führen Sie Arch Linux aus, eine brillante Distribution (ja, ich führe sie auch aus) mit einem großartigen Wiki. Also, ich muss fragen, hast du RTFM? ; p

https://wiki.archlinux.org/index.php/Lenovo_ThinkPad_T420#Fans

Soweit ich sehen kann, müssen Sie:

  1. Aktivieren Sie das Kernelmodul thinkpad_acpi
  2. Installieren und konfigurieren Sie die thinkfan-Anwendung über die AUR
  3. Aktivieren Sie den thinkfan-Systemdienst

Wurde das alles getan?

UPDATE Ich bin froh zu hören, dass Ihr Lüfter jetzt richtig funktioniert, anstatt sich nur um ein fröhliches Medium zu drehen. (Ich nehme an, dies hat das Problem gelöst, dass Ihre Maschine bei Temperaturen über 80 Grad läuft?)

In Bezug auf die Beantwortung der Ursache für eine Temperaturänderung um 30 Grad bin ich versucht zu fragen: Könnte es nicht daran liegen, dass Ihr Lüfter nicht richtig funktioniert hat?

Lasst uns das postulieren,

  • Der Prozessor arbeitet nicht härter als normal
  • Die Temperaturschwankungen werden jetzt durch Lüfterdrehzahlschwankungen ersetzt

Wäre es nicht sicher anzunehmen, dass es überhaupt kein Problem gibt und dass das Problem einfach darin besteht, dass Ihr Lüfter auf einem Niveau läuft, auf dem er gerade noch zurechtkommt? Und kleine Änderungen der Umgebungstemperatur usw., die die Grenzen ihrer Möglichkeiten überschreiten?

Zum Beispiel hatte ich einen Acer-Laptop und an warmen Tagen drehte sich der Lüfter "ständig" auf und ab. Ich wette, wenn mein Lüfter es nicht selbst einstellen könnte, hätte ich auch ziemlich große Temperaturschwankungen gesehen :)

JustDanyul
quelle
Ich habe gerade thinkfan installiert. Vielen Dank für die Hinweise. Ja, das detaillierte Arch-Wiki ist ein großer Vorteil der Distribution. Ich war tausendmal dort, aber ich bin nie über eine Seite gestolpert oder habe daran gedacht, nach einer Seite zu suchen, die meinem genauen Modell gewidmet ist, und hatte noch nie gesehen, dass thinkfan erwähnt wurde. Schönes kleines Drehbuch. That being said, ist dies nicht meine eigentliche Problem lösen: Wie kann ich die Ursache meiner ungewöhnlich hohe Temperatur diagnostizieren? Selbst wenn ich die Fancontrol deaktiviert und das Ding bei maximaler Drehzahl losgeschnitten habe, ist es nur ein Bandaid für das eigentliche Problem der mysteriösen Hitze.
Nummern 1311407
Nein, das Problem besteht weiterhin unverändert. Ich sitze gerade hier bei 42 Grad. Wenn mein Wärmezustand auftritt, werde ich die gleichen Prozesse ausführen, die Umgebung wird gleichwertig sein, nichts wird sich angeblich geändert haben, aber meine Temperatur wird von konstant 42 auf konstant 75+ steigen. Ich kann es abkühlen: Stellen Sie es auf einen Laptop-Kühler, schalten Sie die Fancontrol aus, damit es sich mit 6500 U / min drehen kann usw. Aber wenn ich aufhöre, erwärmt es sich wieder auf 75+. Der Lüfter bei maximaler Drehzahl ist ohnehin nur geringfügig schneller als er war. Es zu beheben war eine gute Sache, aber keine Lösung für das zugrunde liegende Problem.
Nummern 1311407