Watchdog / 0-Prozess mit meiner gesamten CPU plötzlich

8

Ich habe eine neue Installation von Ubuntu 12.04, ich habe es für etwa eine Woche ausgeführt. Heute bemerkte ich plötzlich, dass mein Computer alle 5 Sekunden einfriert. Ich habe den Computer neu gestartet und bekomme das immer noch. Ich glaube, es ist ein Prozess namens Watchdog / 0, der alle Ressourcen nutzt. Siehe die beigefügten Bilder.

Wie kann ich das aufhalten? Ich kann meinen Computer so kaum benutzen.

siehe CPU-Treffer 100% im Leerlauf Es ist der Watchdog-Prozess

AKTUALISIEREN

Nun, ich habe gerade einen Kaltstart durchgeführt (Herunterfahren, Trennen und Wiedereinstecken und Einschalten) und es scheint das Problem behoben zu haben. Nach dem Betrachten der Manpage für Watchdog scheint es, dass dieser Prozess während eines Neustarts fortgesetzt werden kann? Also ist es eher ein sanfter Neustart? Warum das passiert, weiß ich nicht.

jeffery_the_wind
quelle

Antworten:

4

Hier ist eine kurze Zusammenfassung dessen, was es tut:

Das Watchdog-Programm schreibt /dev/watchdogalle zehn Sekunden. Wenn das Gerät geöffnet, aber nicht innerhalb einer Minute beschrieben wird, wird der Computer neu gestartet. Diese Funktion ist verfügbar, wenn der Kernel mit Unterstützung für 'Software Watchdog' erstellt wurde (Standard in Debian-Kerneln).

Es mag zwar nützlich erscheinen, ist aber für die Zuverlässigkeit Ihres Systems nicht wirklich entscheidend. Darüber hinaus führt es zu unnötigen Aufweckvorgängen, die wiederum zu einer kürzeren Batterieleistung führen können. Sie können es einfach deaktivieren, indem nmi_watchdog=0Sie die Kernel-Boot-Parameter in hinzufügen /etc/default/grub.

Pietrek
quelle
Danke, das klingt nach einer guten Lösung. Ich frage mich, warum es alle paar Sekunden die gesamte CPU-Auslastung verschlang.
jeffery_the_wind
Hat bei mir leider nicht funktioniert. Watchdog ist immer noch da, nachdem die Zeile zu / etc / defaults / grub hinzugefügt wurde.
Twigmac
Ich denke es sollte sein /etc/default/grub?
Mark E. Haase
3

Mein Server ist ein Dell R320, 12 Kerne, Watchdog-CPU stark entladen, Durchschn. 68% CPU-Auslastung.

Das Hinzufügen der folgenden Treiber zur Blacklist-Konfigurationsdatei hat /etc/modprobe.d/blacklist.confmein Problem behoben

schwarze Liste acpi_pad
schwarze Liste mei
schwarze Liste sb_edac
schwarze Liste i7core_edac
feifan.overflow
quelle
2

Dies könnte mit https://bugs.launchpad.net/ubuntu/+source/watchdog/+bug/1010855 oder https://bugzilla.kernel.org/show_bug.cgi?id=42981 zusammenhängen

Auf meinem System wird das Problem durch einen Neustart behoben, der jedoch nach einigen Stunden wieder auftritt.

Paul Gear
quelle
Weitere Neuigkeiten zu diesem Problem: Als ich den Kernel auf dem betreffenden System (ein Dell R720 mit 16 Kernen) auf 3.8.0-31.46 ~ präzise1 (Tipp: Verwenden Sie das Paket linux-image-generic-lts-raring) aktualisierte, war das Problem ging weg.
Paul Gear
Tatsächlich sieht es so aus, als ob Linux-Image-Current-Generic langfristig eine bessere Wahl sein könnte, da es nicht vom Namen der aktuellen Version abhängt.
Paul Gear
1

Ich konnte den Wachhund beruhigen, indem ich mit der Kernel-Version zurücktrat. Daher musste ich das Grub-Menü wie in dieser Frage und Antwort beschrieben sichtbar machen .

Nachdem Sie beim Start einen früheren Kernel ausgewählt hatten, war der Watchdog ruhig. Dann wurde rtkit-deamon jedoch total verrückt und aß die gleiche Menge an CPU wie der Watchdog zuvor.

Twigmac
quelle
0

Nach diesem Link http://osdir.com/ml/ubuntu-bugs/2013-08/msg09026.html habe ich Folgendes getan:

1) gelöscht (nach dem Sichern) /lib/modules/3.13.0-24-generic/kernel/drivers/char/ipmi/ipmi_watchdog.ko

2) Zeile in /boot/config-3.13.0-24-generic mit "IPMI" und "watchdog" auskommentiert

Und jetzt scheint das Problem weg zu sein.

Beachten Sie, dass Sie möglicherweise die Kernel-Version von 3.13.0-24-generic mit dem uname -rBefehl im Terminal ändern müssen, um den aktuell verwendeten Kernel abzurufen .

Lukasz Cholewa
quelle
0

Ich habe versucht, @ feifan.overflow zu beantworten, aber es hat nicht funktioniert. Vielleicht muss ich es neu starten, um die Änderungen zu übernehmen.

Der folgende Befehl hat bei mir funktioniert.

Ich verwende ein Debian Wheezy auf einem Dell PowerEdge (scheint eine gewisse Inkompatibilität zu sein).

rmmod acpi_pad
Cleber Reizen
quelle