Ich benutze Debian GNU / Linux 7.8 (keuchend). Während ich heute mein MATLAB-Programm ausführe, habe ich diese Meldung im Terminal erhalten.
Message from syslogd@sas21 at Jul 18 16:40:49 ...
kernel:[1747708.091929] Uhhuh. NMI received for unknown reason 20 on CPU 4.
Message from syslogd@sas21 at Jul 18 16:40:49 ...
kernel:[1747708.091932] Do you have a strange power saving mode enabled?
Message from syslogd@sas21 at Jul 18 16:40:49 ...
kernel:[1747708.091932] Dazed and confused, but trying to continue
Ich erinnere mich auch, dass ich dazwischen einen Piepton gehört habe.
Was bedeutet das? Und was soll ich weiter machen?
linux
linux-kernel
power-management
dexterdev
quelle
quelle
Antworten:
Dies ist ein nicht maskierbarer Interrupt (NMI), der normalerweise durch ein Hardwareereignis auf Ihrem System ausgelöst wird. In diesem Fall sieht es so aus, als ob das spezifische NMI nicht konfiguriert ist, und obwohl es das NMI empfangen hat, weiß es nicht, was es damit tun soll, und ignoriert es einfach.
Was solltest du weiter tun?
quelle
Das Problem scheint zu sein, dass das Ende des Interrupts nicht richtig kommuniziert wird.
Stellen Sie für libvirt sicher, dass
eoi
aktiviert ist:In der Befehlszeile für KVM, die übersetzt wird
Dies scheint für uns mit
-M q35
Host-CPU-Passthrough und Standardkonfiguration ansonsten zu funktionieren (RTC-Interrupts in der Warteschlange, PIT-Interrupts gelöscht, HPET nicht verfügbar).quelle
virt-install
ist das entsprechende Flag--features eoi=on
. Das Testen in meiner eigenen Umgebung schien es nicht zu lösen.Ich habe dieses Verhalten auf einem Gast einer virtuellen KVM-Maschine gesehen, auf dem Debian 9.0 (Stretch) mit dem Hardwaretyp PC-Q35 ausgeführt wird. Der Gastgeber ist ein AMD Turion.
Online werden verschiedene Lösungen vorgeschlagen (siehe z. B. diesen Thread ), darunter die folgenden
<timer name='kvmclock' present='no'/>
zum Gast).In meinem Fall hat das Umschalten auf eine QEMU-emulierte CPU das Problem behoben. Dazu habe ich die folgende Zeile aus meiner VM-XML-Datei entfernt:
<cpu mode='host-passthrough'/>
quelle
Möglicherweise wird die CPU zu heiß und generiert winzige Fehler oder vermasselt einige Anweisungen, aber diese unkritischen Fehler können vom Kernel intern immer noch behoben werden.
Ich habe ähnliche Nachrichten erhalten, aber in meinem Fall weiß ich, dass die GPU zu warm wird. Ich habe mir einen hochauflösenden Livestream auf meinem PC angesehen. Ich weiß zufällig, dass die GPUs ziemlich alt und schwach sind, daher erschien dies in meinem Fehlerprotokoll:
und viele, viele mehr
quelle
Ich habe das gleiche Problem seit einigen Tagen auf meinem KVM / QEMU-Host, auf dem Debian 8.6 mit Kernel 3.16.0-4-amd64 ausgeführt wird. Dies ist Teil meines Protokolls:
Dies begann nach der Installation von BOINC (aktuelle Aufgabe ist Collatz Conjecture). Ich erlaube BOINC derzeit, 99% der CPU zu übernehmen.
Meine Vermutung bezüglich der Ursache dieser Meldungen ist also, dass die CPU gesättigt ist und nicht genügend Zeit erhält, um (Hardware-) Interrupts richtig zu behandeln. In Ihrem speziellen Fall kann ein anderer Prozess oder eine äußere Ursache der Schuldige sein. YMMV.
quelle