"Mce: [Hardwarefehler]: Maschinenprüfungsereignisse protokolliert" wird im Syslog angezeigt. Was sollte ich tun?

19

Ich habe die neueste Version von OSSEC (2.8.1) installiert und E-Mail-Benachrichtigungen aktiviert. Und ich bekomme eine Menge solcher Benachrichtigungen, die besagen, dass ein Hardwarefehler vorliegt und etwas mit mce zu tun hat:

OSSEC HIDS Notification.
2015 Apr 04 20:09:22

Received From: Bath-Towel->/var/log/syslog
Rule: 1002 fired (level 2) -> "Unknown problem somewhere in the system."
Portion of the log(s):

Apr  4 20:09:21 Bath-Towel kernel: [ 1873.680872] mce: [Hardware Error]: Machine check events logged



 --END OF NOTIFICATION

Was genau bedeutet das? Wofür steht mce? Und sollte ich mir wegen dieses offensichtlichen Hardwarefehlers Sorgen machen?


Informationen zum Betriebssystem:

Description:    Ubuntu 14.10
Release:    14.10
Eric Carvalho
quelle
Sie müssen ein wenig in ossec lesen, siehe die Regeln - ossec-docs.readthedocs.org/en/latest/manual/rules-decoders . Das Webinterface hilft, da es eine Reihe von Erklärungen enthält - ossec.net/wiki/index.php/OSSECWUI:Install
Panther
ossec wird hier wahrscheinlich schlecht oder gar nicht unterstützt, da es nicht in den Ubuntu-Repositories enthalten ist
Panther
1
Hier geht es überhaupt nicht um OSSEC. Sie haben diese Benachrichtigung erhalten, weil OSSEC im Syslog das Wort "error" gefunden hat. Obwohl ich nicht denke, dass es nicht zum Thema gehört, erhalten Sie wahrscheinlich mehr Hilfe von Unix & Linux oder Server Fault .
Eric Carvalho
4
@ bodhi.zazen Alles, was Sie tun müssen, um auf dem neuesten Stand zu sein, ist Ubuntu. Das heißt natürlich nicht, dass Sie eine Antwort bekommen.
Seth,

Antworten:

23

Maschinenüberprüfungsausnahme :

Eine Machine Check Exception (MCE) ist eine Art Computerhardwarefehler, der auftritt, wenn die Zentraleinheit eines Computers ein Hardwareproblem erkennt.

Auf Ihrem Computer ist ein Hardwarefehler aufgetreten, und der Kernel hat ein Ereignis in einem Puffer protokolliert. Mit können Sie mcelogdie Maschinenprüfereignisse protokollieren und anzeigen. Aus der mcelogManpage :

X86-CPUs melden von der CPU erkannte Fehler als MCEs (Machine Check Events). Dies können Datenverfälschungen in den CPU-Caches, im Hauptspeicher durch einen integrierten Speichercontroller, Datenübertragungsfehler auf dem Front-Side-Bus oder der CPU-Verbindung oder andere interne Fehler sein. Mögliche Ursachen können kosmische Strahlung, instabile Netzteile, Kühlungsprobleme, defekte Hardware, nicht ordnungsgemäß funktionierende Systeme oder Pech sein.

Die meisten Fehler können von der CPU durch interne Fehlerkorrekturmechanismen behoben werden. Nicht korrigierte Fehler führen zu Ausnahmen bei der Maschinenüberprüfung, die Prozesse abbrechen oder die Maschine in Panik versetzen können. Eine kleine Anzahl von korrigierten Fehlern ist normalerweise kein Grund zur Sorge, eine große Anzahl kann jedoch auf einen zukünftigen Ausfall hinweisen.

Wenn ein korrigierter oder wiederhergestellter Fehler auftritt, schreibt der x86-Kernel einen Datensatz, der den MCE beschreibt, in einen internen Ringpuffer, der über das Gerät / dev / mcelog verfügbar ist. mcelog ruft Fehler aus / dev / mcelog ab, decodiert sie in ein für Menschen lesbares Format und druckt sie auf der Standardausgabe oder optional im Systemprotokoll aus.

Wenn Sie keinen Absturz bemerkt haben, wurde der Fehler wahrscheinlich erfolgreich behoben. Trotzdem rate ich Ihnen zu installieren mcelog, um solche Ereignisse im Auge zu behalten:

sudo apt-get install mcelog

Die Ereignisse werden in protokolliert /var/log/mcelog. Sie können auch ausführen:

sudo mcelog --client

um den mcelogDaemon nach Fehlern abzufragen .

Eric Carvalho
quelle
2
Ich frage mich, warum MCE-Fehler nicht einfach direkt in ein Systemprotokoll geschrieben werden ... wahrscheinlich aus einem guten Grund, vielleicht
Xen2050
2
@ Xen2050 Da die Dekodierung der Nachricht von der Architektur abhängig ist und nicht immer von den Hardwareherstellern dokumentiert wird. Der Fehler könnte sogar vom PCIe-Bus erzeugt werden.
Mircea Vutcovici
4
@ Xen2050: Auf meinem Fedora 25-Computer werden die MCE-Nachrichten in das Journal geschrieben, mit dem ich sie sehen kann journalctl -b.
Martin Ueding