Akzeptabler Lastdurchschnitt

9

Wir haben unseren neuen Linux / Exim / Spamassassin-Mailserver am Freitag bereitgestellt (immer eine gute Idee, ihn am Tag vor einem langen Wochenende bereitzustellen, wenn keine Administratoren da sind). Die Last lag im 15-Minuten-Durchschnitt bei 1,3.

Die Maschine reagiert und E-Mails werden in angemessener Zeit zugestellt. Können wir davon ausgehen, dass dies akzeptabel ist?

Wie wird eine bestimmte Lastmenge als akzeptabel oder nicht akzeptabel angesehen? Welche Metriken werden verwendet?

Zimmy-DUB-Zongy-Zong-DUBBY
quelle
3
Wie viele CPUs, wie viel RAM? Läuft es mit x / GDM?
Tim Howland
Wie viel Post bearbeiten Sie täglich?
Baumgart

Antworten:

11

Grundlegende Faustregel: Wenn das System reagiert, wenn es rechtzeitig funktioniert, ist alles in Ordnung.

Lasten unter zwei sind keine große Sorge. Ich hatte Systeme, die vier oder fünf erreichten und immer noch einwandfrei funktionieren, obwohl dies ein Indikator dafür wäre, dass es viele Warteschlangenprobleme mit dem Netzwerk oder den Laufwerken gibt (E / A-Probleme können hohe Lasten verursachen, obwohl das System sehr reaktionsschnell ist).

Überprüfen Sie regelmäßig die Länge Ihrer E-Mail-Warteschlange und die Protokolle auf unzustellbare Probleme und Probleme dieser Art. Wenn die Lieferwarteschlange relativ niedrig bleibt, ist das in Ordnung.

Sie können viel mit dem Abrufen von Festplattendurchschnitten und Netzwerk-E / A-Informationen umgehen, aber wenn Sie keine Zustellungsprobleme sehen (ich habe die Nachricht vor fünfzehn Minuten gesendet und sie ist noch nicht eingetroffen!) Und Sie können über die Konsole am System arbeiten ( oder ssh) ohne viel Latenz sollte es dir gut gehen.

Bart Silverstrim
quelle
18

Der Lastdurchschnitt ist ein Wert, der eine Vorstellung von der Anzahl der Prozessoren gibt, die der Kernel benötigt, um alle Aufgaben bei Bedarf ausführen zu können, ohne zu warten.
In Ihrem Fall, wenn Sie 2 oder mehr CPU / Core haben. Es gibt kein Problem. Wenn Sie nur 1 CPU mit 1 Kern haben, bedeutet dies, dass zwischen dem Zeitpunkt, zu dem Ihre App ausgeführt werden soll, und dem Zeitpunkt, zu dem der Kernel sie ausführt, zu viel Zeit liegt. Ein Laden> "Anzahl CPU / Kern" ist für ein Mailsystem kein Problem, bis es zu lange einen zu hohen Wert erreicht.
Natürlich sind sie keine Regel und kein Wert, und während Sie Ihre Post in kurzer Zeit erhalten, ist es in Ordnung. Aber Sie müssen wahrscheinlich anfangen, Ihren Server genau zu betrachten, wenn die Last für einen "langen" Zeitraum (~ 1 Stunde) zu oft höher als 2 * CPU / Core ist.
Auch für einen Mailserver ist dies kein großes Problem, aber es bedeutet, dass Ihr Server etwas überlastet ist.

Radius
quelle
+1 tolles und interessantes Zeug!
Marco Demaio
3
Ich füge einen Link zu einer ziemlich guten Webseite hinzu blog.scoutapp.com/articles/2009/07/31/…
Radius
3

Wie immer bei Fragen zum Tuning gibt es keine Ja / Nein-Antworten, alles hängt davon ab :-)

Allerdings klingt eine Last von 1,3 nicht hoch, insbesondere wenn Sie eine Multi-Core-CPU-Konfiguration haben. Wenn die Ladungsnummer mit der Anzahl der Kerne übereinstimmt, ist für alle Kerne immer ein Prozess zur Ausführung bereit.

Letztendlich, wenn, wie Sie sagen, die Nachrichten rechtzeitig zugestellt werden, ist die Leistung in Ordnung :-)

top

Sie erhalten grundlegende Messdaten in nahezu ausreichender Echtzeit.

dr-jan
quelle
3
htop ist noch besser und leichter zu lesen
Antoine Benkemoun
3

Ein Lastdurchschnitt, der geringer ist als die Anzahl der CPUs, die Sie haben, bedeutet, dass CPUs herum sitzen und nichts zu tun haben. Gleich bedeutet, dass sie alle im Moment arbeiten. Größer bedeutet, dass es Prozesse gibt, die ausgeführt werden könnten, aber in der Warteschlange stehen bleiben.

Für super zeitkritische Dinge wie einen Voip-Server oder einen Memcache soll die durchschnittliche Auslastung deutlich unter der Anzahl der Kerne liegen. Für asynchrone Dinge, die mit gelegentlichen Backups (wie E-Mails) leben können, können Sie problemlos die vierfache Anzahl von Kernen ausführen.

Die größte Einschränkung ist, dass Prozesse, die auf Festplatten- oder Netzwerk-E / A warten, aber ansonsten ausgeführt werden können, weiterhin im Lastdurchschnitt angezeigt werden. Wenn Sie also einen Apache-Server haben, der JPGs an 56.000 Benutzer spoonfeed, können Sie einen viel höheren Lastdurchschnitt ausführen, als wenn er PHP- / Was auch immer-Skript-Antworten auf einen Proxy / Loadbalancer über ein Gigabit-LAN ​​zurückgibt. In Ihrem Fall wird bei einer SMTP-Verbindung zu einem langsamen Mailserver, dessen Übertragung eines Anhangs ewig dauert, ein 1-Prozess in der Ausführungswarteschlange angezeigt, der jedoch zwanzig Mal unterbrochen werden kann, um eine schnelle einzeilige E-Mail ohne Probleme an Google Mail zu senden.

Push kommt zum Schieben, Lastdurchschnitt ist wie beim DOW. Es misst in keiner Weise die "Wirtschaft", die Leute verwenden sie nur als sehr lose korrelierte Metrik, weil es einfach ist, darüber zu sprechen. Konzentrieren Sie sich auf die Überwachung von Metriken, die Ihnen wirklich wichtig sind, z. B. die Tiefe der Übermittlungswarteschlange und Nachrichten pro Sekunde.

Kagenut
quelle
2

Wie viele Kerne hast du? cat / proc / cpuinfo | grep Prozessor | wc -l

(Einschränkung: Hyperthreading sieht aus wie mehr Kerne, ist es aber nicht)

Wenn Ihr Lastlevel unter Ihrer Prozessoranzahl liegt, sind Sie im Allgemeinen in Ordnung.

Werfen Sie auch einen Blick nach oben und drücken Sie '1', um die individuelle Auslastung jeder CPU zu beobachten.

Joel K.
quelle
1

Ja, das ist ziemlich akzeptabel und im Allgemeinen mit einem E-Mail-Filter zu erwarten.

Unser Setup ist etwas anders. Wir haben einen separaten Server für SpamAssassin, während auf unserem POP-Server ClamAV ausgeführt wird, um nach Viren zu suchen. Der POP-Server wird im Allgemeinen unter einer Serverlast von 2 ausgeführt, erreicht jedoch gelegentlich Spitzen von bis zu 10 oder mehr. Unser SpamAssassin-Server hingegen lief früher ungefähr 2, bis wir auch die Openprotect.com-Filter installiert haben, als er die CPU-Auslastung verdoppelte und jetzt unter ungefähr 5 mit Spitzen über 15 läuft. Dies ist immer noch akzeptabel, da wir dies nicht tun Verzögerungen bei E-Mails, die zu einer wachsenden E-Mail-Warteschlange führen (wir verwenden qmail für eingehendes SMTP), und es gibt immer noch Platz, um CPU-Auslastung / Arbeitsspeicher zu sparen.

Zufälligerweise empfehle ich Munin für die Überwachung Ihrer Server. Es macht einen großartigen Job, indem es historische Daten visuell demonstriert und Ihnen zeigt, welche Ressourcen Sie sparen müssen. Die Überwachung in Echtzeit mit Top (1) hilft Ihnen nicht viel. :) :)

Übrigens, die Bereitstellung am Freitag vor dem langen Wochenende ist eine großartige Möglichkeit, das ganze Wochenende durchzuarbeiten. Besonders für kritische Systeme wie einen Mailserver.

Ernie
quelle
Siehe auch collectd, wie hier erwähnt: serverfault.com/questions/67234/…
Warren
0

Wie ist der Speicherverbrauch? Ist es stabil oder wächst es?

Die Last scheint nicht außerhalb der Norm zu liegen. Wenn der Mailserver reagiert und die Mail durchläuft, würde ich sagen, dass die einzige Messung des Fehlers über den Speicherverbrauch hinaus wäre, wenn die falschen E-Mails durchkommen (Spam).

Wohlgemerkt, heute wäre Ihr erster richtiger Test. Ich würde es heute wahrscheinlich leicht überwachen. Wenn etwas schief gehen wird, wäre jetzt die richtige Zeit.

Highstead
quelle