Ich sehe Prozesse auf meinem SGI Altix 450, auf denen SLES 10.1 ausgeführt wird, scheinbar nicht mehr ausgeführt werden (dh stundenlang keine weitere Ausgabe in den Protokollen bereitstellen). An dieser Stelle möchte ich den fehlerhaften Prozess beenden, damit ich ihn neu starten kann. Oben zeigt, dass sich der Prozess im Status (R) befindet. Obwohl, wenn ich versuche, es zu töten, nichts passiert. Selbst wenn ich kill -9 benutze, bleibt es immer noch. Was kann ich in diesem Fall tun, außer den Computer neu zu starten?
9
Antworten:
Es ist möglich, dass der Prozess abgebrochen wird, aber darauf gewartet wird, dass das übergeordnete Element seinen Rückgabewert erfasst. In diesem Fall befindet es sich nach dem Töten im Zustand 'Z' und nicht im Zustand 'R'. In diesem Fall sollten Sie den
ppid
Prozess mithilfe desps
Befehls finden und auch den übergeordneten Prozess beenden (wenn Sie wirklich sicher sind, dass er keine Probleme verursacht).Der andere Fall könnte sein, dass der Prozess aus irgendeinem Grund neu gestartet wird, nachdem er wie tty getötet wurde. In diesem Fall sollte sich die Prozess-ID jedes Mal ändern, wenn Sie -9 beenden. Überprüfen Sie, ob sich die Prozess-ID jedes Mal ändert, wenn Sie versuchen, sie zu beenden.
quelle
Der Prozess wartet auf eine Systemressource, vielleicht NFS? das erlaubt es nicht, loszulassen. Würde gerne einige Lösungen dafür hören, die über meine hinausgehen ...
Starten Sie die Box neu oder lassen Sie den Prozess herumstehen.
Ich frage mich, ob Sie den Prozess möglicherweise über kill -STOP {PID} stoppen können, um zu verhindern, dass mehr CPU verbraucht wird.
Ein Neustart sollte auch bei einem anderen angehaltenen Prozess möglich sein, erfordert jedoch möglicherweise einen Listenport oder ein gemeinsam genutztes Speichersegment, das vom anderen Prozess noch verwendet wird.
quelle
ls
Befehl auf einem s3fs-Mount ausführe. Derls
Prozess wird nicht einmal mit töten,kill -9
bis ich das Absteigen mitumount -l
Hast du dmesg schon überprüft? Ich habe das nach einer Kernel-Panik gesehen; Die einzige Möglichkeit zur Wiederherstellung besteht darin, neu zu starten (vorzugsweise bald) - und dann einen gepatchten Kernel zu erhalten.
Normale nicht abtötbare Prozesse befinden sich im D-Zustand, nicht in R.
quelle