Fehlerbehebung bei der Linux-Leistung - Mein Server hat sein Mojo verloren

0

Ich habe eine Maschine, die ich zu beheben versuche - könnte ein Hardwareproblem sein, könnte möglicherweise ein Softwareproblem sein. Es ist ein Dell PowerEdge 2950 (mit ein paar Dual-Core-Xeons mit 3,5 GHz), auf dem ich gerade CentOS 6.2 installiert habe.

Wenn ich 'dd if = / dev / zero von = / dev / null' mache, erhalte ich Übertragungsraten von ungefähr 30 MB / s. Auf anderen ähnlichen Computern erhalte ich 500 MB / s oder sogar 1,2 GB / s. Es stimmt also eindeutig etwas nicht - soweit ich das beurteilen kann, muss die CPU-Leistung der Maschine aufgebraucht werden (dd führt keine E / A-Vorgänge aus), aber weder mpstat noch sar zeigen mir etwas Offensichtliches. Es gibt auch keine Nachrichten in / var / log / messages oder / var / log / dmesg, die mich darüber informieren, wie ich Interrupts oder ähnliches erneut präsentiere.

Ich habe keine Ahnung mehr - die Maschine ist eindeutig krank, aber ich kann nicht herausfinden, wie. Ich würde jede gute Idee lieben, um Dinge zu versuchen!

Alistair Bell
quelle
Bei der Fehlerbehebung handelt es sich um eine Fehlerbehebung, unabhängig davon, um welches Problem es sich handelt. Entfernen Sie alle Vorurteile, die Sie möglicherweise haben, beschreiben Sie jede Möglichkeit, ungeachtet der Wahrscheinlichkeit, detailliert, ordnen Sie die Möglichkeiten locker so an, wie es am wahrscheinlichsten ist, und beginnen Sie, sie durchzuarbeiten. Wenn Sie beispielsweise den Verdacht haben, dass das Betriebssystem fehlerhaft ist, entfernen Sie das Betriebssystem, indem Sie in einer LiveCD-Umgebung booten. Dann testen.
Bon Gart

Antworten:

0

Besorgen Sie sich eine Live-CD und beginnen Sie mit ein paar grundlegenden Tests.

Beginnen Sie mit memtest (um sicherzustellen, dass Ihr RAM in Ordnung ist) und arbeiten Sie sich nach unten. Ich würde vorschlagen smartmontools, einen erweiterten Test durchzuführen. Suchen Sie nach Problemen im Zusammenhang mit dem Alter und vor dem Ausfall - ich finde, dass dies der Hauptgrund dafür ist, dass Festplatten langsamer werden.

Diese Frage zu serverfault schlägt einige Tools vor , die Sie ebenfalls ausprobieren sollten. Hier sind die Suchparameter, die ich verwendet habe, wenn Sie SF nach weiteren Ideen durchsuchen möchten.

Schließlich haben Sie versucht, nur die Laufwerke mit bekannten guten auszutauschen, um zu sehen, ob dies einen Unterschied macht?

Geselle Geek
quelle
Ich werde es versuchen, wenn ich morgen wieder im Büro bin ... aber ich bin mir ziemlich sicher, dass es nicht die Festplatten sind. dd von / dev / zero nach / dev / null berührt die Festplatte nirgendwo.
Alistair Bell