CPU-Hardwarefehler in Ubuntu 17.04

12

Kann mir jemand erklären, welche Fehlermeldungen ich erhalten habe, als ich in dmesg gesucht habe? Ich bin neu in Ubuntu und in der Linux-Welt.

[ 7.802351] CPU4: Core temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802352] CPU0: Core temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802353] CPU5: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802354] CPU0: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802354] CPU4: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802356] CPU1: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802356] mce: [Hardware Error]: Machine check events logged
[ 7.802362] mce: [Hardware Error]: CPU 4: Machine Check: 0 Bank 128: 00000000880a0003
[ 7.802363] mce: [Hardware Error]: TSC 99561677c
[ 7.802385] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 1 microcode ba
[ 7.802387] mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 128: 00000000880a0003
[ 7.802387] mce: [Hardware Error]: TSC 995616be4
[ 7.802388] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 0 microcode ba
[ 7.802389] CPU2: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802390] CPU6: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802391] CPU3: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802392] CPU7: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.826359] CPU4: Core temperature/speed normal
[ 7.826359] CPU0: Core temperature/speed normal
[ 7.826360] CPU2: Package temperature/speed normal
[ 7.826361] CPU6: Package temperature/speed normal
[ 7.826361] CPU0: Package temperature/speed normal
[ 7.826362] CPU4: Package temperature/speed normal
[ 7.826363] mce: [Hardware Error]: Machine check events logged
[ 7.826367] mce: [Hardware Error]: CPU 4: Machine Check: 0 Bank 128: 00000000880b0002
[ 7.826368] mce: [Hardware Error]: TSC 99916f004
[ 7.826369] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 1 microcode ba
[ 7.826369] mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 128: 00000000880b0002
[ 7.826370] mce: [Hardware Error]: TSC 99916f2ca
[ 7.826370] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 0 microcode ba
[ 7.826400] CPU1: Package temperature/speed normal
[ 7.826401] CPU5: Package temperature/speed normal
[ 7.826402] CPU3: Package temperature/speed normal
[ 7.826402] CPU7: Package temperature/speed normal
[ 467.922330] CPU4: Core temperature above threshold, cpu clock throttled (total events = 73)
[ 467.922331] CPU0: Core temperature above threshold, cpu clock throttled (total events = 73)
[ 467.922332] CPU7: Package temperature above threshold, cpu clock throttled (total events = 86)
[ 467.922333] CPU3: Package temperature above threshold, cpu clock throttled 

Ich verwende Ubuntu 17.04 mit 4.10.0-29-generic kernal

M. Voyles
quelle
oder es ist ein Software-Fehler, den ich in meinem Protokoll eines neuen Lenovo T480S habe, siehe bugs.launchpad.net/ubuntu/+source/linux/+bug/1781924
Rolf Schumacher

Antworten:

8

Die CPU ist überhitzt und geht in MCE (Machine Check Events) ... dh es stürzt ab. Wenn Sie im Syslog keine anderen temperaturbedingten Ereignisse sehen, liegt dies wahrscheinlich daran, dass Ihr CPU-Kühler / Lüfter / Wärmerohr / Wärmeleitpaste die Aufgabe nicht erfüllt.

  • Überprüfen Sie das Syslog mit diesem terminalBefehl ...

    grep -i -e temp -e therm /var/log/syslog*
    
  • Wenn die Maschine sehr schmutzig / staubig ist, kann dies eine wichtige Rolle bei der Überhitzung der Maschine spielen. Reinigen Sie es.

  • Wenn Ihr Computer über Intel-Prozessoren verfügt, stellen Sie sicher, dass diese intel-microcodeinstalliert sind.

    sudo apt-get update
    sudo apt-get install intel-microcode
    reboot
    
  • Installieren Sie es thermald, um die Temperatur zu kontrollieren.

    sudo apt-get update
    sudo apt-get install thermald
    reboot
    
  • Überprüfen Sie Ihre BIOS-Version. Geben Sie Ihr BIOS beim Einschalten ein und notieren Sie sich die Versionsnummer. Rufen Sie die Website des Herstellers mit der Marke / dem Modell Ihres Computers auf. Gehen Sie zum Abschnitt Support / Downloads und prüfen Sie, ob es ein neueres BIOS gibt.

  • Schließlich und sehr wahrscheinlich, wenn es sich um eine ältere Maschine handelt, muss die Wärmeleitpaste, die sich zwischen den Prozessoren und ihrem Wärmerohr- / Lüfterkühler befindet, erneut angewendet werden. Dies erfordert einige technische Erfahrung.

Heynnema
quelle
1
Welchen Einfluss hat das intel-micorocodeauf die Temperatur?
gene_wood
@gene_wood Wie ich bereits erwähnte, handelt es sich wahrscheinlich um ein Staub-, Lüfter- oder Wärmeleitungsproblem, und die Überprüfung des Mikrocodes ist nur ein weiterer Schritt, um das Problem aus der Ferne zu diagnostizieren. Der alte Mikrocode der CPU kann verschiedene Probleme verursachen. Sekunden, um danach zu suchen.
Heynnema