Ich habe eine Box auf Linode, die sich seltsam verhält. Hin und wieder werden CPU- und Festplatten-E / A-Vorgänge zu 100% ausgeführt, und der Server reagiert nicht mehr und muss gestartet werden. Ich würde gerne besser untersuchen, was los ist, aber ich weiß nicht, wie ich herausfinden kann, wer für all diese CPU und I / O verantwortlich ist. Ich verwende Gentoo 2.6.18.
quelle
sort -nr
wäre besser, numerisch zu sortieren (zumindest auf meinen Ubuntu / Debian-Boxen)Wenn Sie darauf achten, wird ein binäres Protokoll erstellt, das so ziemlich alles enthält, was Sie sich wünschen. Anschließend können Sie mit einem Top wie gui die Zeitscheiben des Tages durchgehen (standardmäßig werden die Daten alle 5 Minuten erfasst). http://www.atcomputing.nl/Tools/atop/
quelle
Ich denke, dass Munin eines der wichtigsten Überwachungsinstrumente ist, mit denen Sie Informationen über die Aktivitäten Ihrer Box erhalten. Es gibt auch einige Befehlszeilentools wie sar , iostat, ps, top für eine solche Verwendung.
quelle
Die anderen Antworten haben Ihnen nur gezeigt, wie Sie sehen können, was gerade vor sich geht, was nicht hilft, wenn das System neu gestartet wurde.
Wenn Sie möchten, dass diese Informationen für die Nachwelt erfasst werden (oder für die Abrechnung oder für eine andere Verwendung, die Sie möglicherweise auch haben), ist Prozessabrechnung das, was Sie möchten.
Hier ist ein HOWTO, das ich gefunden habe, aber ich bin ehrlich - es ist ein Jahrzehnt her, seit ich Prozessabrechnung verwendet habe.
http://tldp.org/HOWTO/Process-Accounting/
quelle
Ein benutzerfreundlicherer Ansatz für die Lösung von shawn zur Echtzeitüberwachung:
Dies bietet eine statische Ansicht der 20 wichtigsten Prozesse, die alle 1 Sekunde aktualisiert werden. Die Option "c" im Befehl ps gibt den Namen der ausführbaren Datei des Prozesses und nicht den gesamten Befehl args aus. Sie können diese Option weglassen, wenn Sie stattdessen die gesamten Befehlsinformationen benötigen. Spalte% Speicherauslastung wurde ebenfalls hinzugefügt.
quelle
Hat Gentoo nicht auch den Befehl "top"?
sollte dir die laufenden Statistiken geben, von denen Programme die meiste Last verursachen.
quelle
top
zu sehen, wer der Schuldige ist. Ich möchte später noch einmal nachsehen, welcher Prozess dies getan hat.