Nagios-Grafiklösungen gegen Munin / Cacti / Ganglia

9

Ich habe ein Nagios-Server-Setup für die Überwachung von ~ 30 Windows-Servern. Ich möchte einige Trenddiagramme hinzufügen. Ich habe gelesen, dass Nagios-Grafik-Plugins einfach sind und viele Leute separate, eigenständige Diagramm- / Trend-Tools verwenden.

Was sind die Einschränkungen der Nagios-Grafik-Plugins gegenüber eigenständigen Produkten wie Ganglien / Munin / Kakteen?

Ich interessiere mich für bestimmte Funktionen und Vorteile, die Standalone-Pakete bieten, und Nagios-Grafik-Plugins nicht.

Sumek
quelle
Sie sollten auch Zabbix in Betracht ziehen ... serverfault.com/q/109595/2039
sebthebert
Probieren Sie die opsview Community Edition aus, die auf Nagios basiert. Sie können in verschiedenen Linux-Varianten installieren oder VM herunterladen. opsview.com/downloads/download-opsview-community
Matias Dominoni
Für die Aufzeichnung: Ich habe Nagiosgraph ausprobiert und bin dann dabei geblieben. Ich bin ziemlich zufrieden mit dem, was es bietet
Sumek

Antworten:

7

Da Sie bereits eine Nagios-Installation haben, sollten Sie Nagiosgraph oder pnp4nagios in Betracht ziehen.

Nagiosgraph und pnp4nagios machen einen ziemlich guten Job beim Zeichnen von Nagios-Leistungsdaten. Nagiosgraph verfolgt einen parameterbasierten Konfigurationsansatz, pnp4nagios einen vorlagenbasierten Ansatz.

  • Beide erkennen automatisch neue Hosts / Dienste, wenn sich die Nagios-Konfiguration ändert
  • Beide machen das Zoomen von Grafiken
  • Beide bieten Diagramme, wenn Sie mit der Maus über bestimmte Hosts / Dienste fahren
  • Beide bieten viele Möglichkeiten, Ihre Daten zu schneiden und zu würfeln
  • Erkennen und grafisch darstellen Sie die kritischen und Warnstufen, die Sie bereits in Nagios definiert haben
  • Beide können direkt in den Nagios-Rahmen eingebettet werden, um nahtlos und übersichtlich vom aktuellen Status zum Verlauf und zurück zu navigieren

Das Schneiden und Würfeln der Daten ist ziemlich wichtig, imho. Sie können beispielsweise alle Dienste auf einem einzelnen Host oder alle Hosts mit einem bestimmten Dienst anzeigen oder beliebige Sammlungen von Diagrammen für beliebige Hosts und Dienste anzeigen.

Die Installation ist nicht trivial, aber nicht schwierig. Viel hängt davon ab, wie sehr Sie die Dinge anpassen möchten. Nagiosgraph ist beispielsweise 'install.pl' oder 'rpm -i nagiosgraph.rpm' oder 'dpkg -i nagiosgraph.deb'. pnp4nagios ist './configure; machen; make install '.

n2rrd kann auch einige dieser Dinge tun, aber es ist nicht so ausgefeilt und erfordert mehr Arbeit zum Konfigurieren.

rrdtool hat Macken bei der Datenspeicherung, und jedes System hat Stichprobenprobleme. rrdtool führt standardmäßig einige Datenglättungen durch, Sie können jedoch bei Bedarf zusätzlich zu den Durchschnittswerten auch Maxima und / oder Minima erfassen (und grafisch darstellen).

Jeder rrdtool-basierte Ansatz leidet unter Daten- / Diagramm-Stalenität, da das Schema in jeder rrd-Datei statisch ist und die meisten Systeme den rrd-Dateinamen verwenden, um die Daten zu identifizieren. Daten gehen normalerweise nie verloren, wenn sich ein Hostname oder ein Dienstname ändert. Die rrd-Dateien sind noch auf der Festplatte vorhanden. Einige Benutzeroberflächen bieten jedoch Möglichkeiten zum Anzeigen veralteter rrd-Dateien, andere erfordern eine manuelle Verwaltung über die Befehlszeile. Bei vielen Installationen ist dies nur ein Problem bei der anfänglichen Konfiguration des Systems. In dynamischen Umgebungen (z. B. Überwachung virtueller Maschinen mit einer Lebensdauer von nur wenigen Monaten) kann dies jedoch mühsam werden.

eine letzte Anmerkung. Der Trend besteht eigentlich aus zwei Teilen: Datenerfassung und Datenanzeige. Wenn Sie ein eigenständiges Grafiksystem verwenden, anstatt Ihre vorhandene Nagios-Installation zu erweitern, müssen Sie möglicherweise zusätzliche Komponenten auf Ihren Windows-Computern installieren, um die Daten zu erfassen.

Matthew Wall
quelle
13

Ich stimme mit Lynxman überein. NAGIOS ist für sofortige qualitative Daten (ist X OK oder nicht?); Munin ist für historische quantitative Daten (wie voll ist X jetzt und wie voll war es dieses Jahr?). Alle meine NAGIOS-Installationen, von denen einige mehrere hundert Dienste überwachen, sind mit Munin-Systemen verbunden, um die quantitative Überwachung durchzuführen.

Beachten Sie auch, dass Munin spezielle Hooks zum Einspeisen von Daten in NAGIOS hat. Es versteht das Konzept von WARNING- und KRITISCHEN Schwellenwerten, und wo eine Benachrichtigung (und ein Blick auf die "Big Board" von NAGIOS) erforderlich ist, ist es sehr einfach, dass eine einzelne Munin-Variable den Status eines einzelnen NAGIOS-Dienstes informiert.

Der übliche Arbeitsablauf besteht darin, dass niemand die Munin-Diagramme betrachtet, bis NAGIOS benachrichtigt, dass ein Schwellenwert überschritten wurde. Dann werden die Munin-Diagramme von unschätzbarem Wert, um herauszufinden, ob etwas im Laufe der Zeit langsam hochgefahren ist oder ob dies nicht der Fall ist -blaue Zunahme, oder wir haben einen wöchentlichen Auf- und Ab-Zyklus, dessen Amplitude langsam zunimmt, oder was.

Wie Lynxman sagt, ist der UNIX-Weg "eine Aufgabe, ein Werkzeug". Das Erstellen einer Toolchain aus Munin und NAGIOS funktioniert für mich sehr gut, um quantitative und qualitative Überwachung sowie Benachrichtigungen bereitzustellen. Es hat auch den deutlichen Vorteil , die Schnittstellen sauber zu halten: wenn Sie auf NAGIOS schauen, sehen Sie einen einfachen Überblick darüber , wie gut die Dinge funktionieren jetzt , ohne historische Daten die Ansicht unübersichtlich; Wenn Sie sich munin ansehen, sehen Sie historische Informationen zu dem Problem, die für Ihre Analyse bereit sind, ohne dass "Host ist ausgefallen" oder "sshd spricht nicht mit mir" -Fehler die Ansicht überladen.

MadHatter
quelle
3

Nagios Grafik-Plugins sind, wie Sie sagen, sehr eingeschränkt, sie bieten eine sehr einfache rrdtool-Oberfläche und das UI-Design ist ein bisschen kontraintuitiv, es ist im Grunde ein Hack über Nagios, versucht, das nur zum Spaß zu verwenden, aber es ist mehrmals ohne Vorwarnung kaputt gegangen.

Wenn Sie sich für ein eigenständiges Produkt (insbesondere Munin oder Ganglien) entscheiden, erhalten Sie eine große Auswahl an Dienstleistungen, die Nagios nicht erbringen können. Da das Unix-Mantra es besser ist, in nur einer Sache gut zu sein, als in vielen gut zu sein, ist Nagios erstaunlich Überwachung und Munin / Ganglien / Kakteen sind erstaunlich grafisch.

Luchsmann
quelle
Was steckt in einer Vielzahl von Diensten, die Nagios nicht leisten kann ? Das interessiert mich.
Sumek
Mit Nagios ist es sehr einfach, Ihre Grafikdaten zu verlieren. Es ist auch sehr einfach für das Plugin, die Grafikdaten zu einem bestimmten Zeitpunkt zu beenden. Es gibt Ihnen keine Möglichkeit, in eine bestimmte Zeit zu zoomen (was alle anderen tun) gibt Ihnen nicht die Möglichkeit, komplizierte aggregierte Graphen zu
erstellen
Was meinen Sie damit, dass Sie Ihre Grafikdaten leicht verlieren können ? Ein kurzer Blick auf Google zeigt, dass alle 5 genannten Lösungen (Ganglien, Munin, Kakteen, PNP-Graphen, Nagiosgraphen) rrdtool zum Speichern von Diagrammdaten verwenden.
Sumek
Ja, Sumek, ich beziehe mich darauf, dass das Grafiktool auf Nagios wieder ein Hack ist, und wenn es eine Nichtübereinstimmung zwischen dem rrd-Dateinamen und den Grafikinformationen gibt, wird es kaputt gehen, wenn Sie es versuchen möchten, leiden Sie unter den Schmerzen wie ich tat und dann zu einer echten Lösung wie Munin bewegen :)
Lynxman
2

Bei Stack Overflow verwenden wir n2rrd , ein Nagios-Plugin zur grafischen Darstellung von Leistungsdaten. Bis zu einem gewissen Grad würde ich Lynxman zustimmen, dass es ein sehr hackiges Gefühl hat.

Jedoch:

  • Mit n2rrd können Sie Cacti die grafische Darstellung anhand der Daten anstelle der mit n2rrd gelieferten Datei rrd2graph.cgi durchführen lassen
  • n2rrd mit der Datei rrd2graph.cgi unterstützt das Zoomen
  • Was komplizierte Aggregatdiagramme betrifft - Sie manipulieren die rrd-Diagramme grundsätzlich von Hand und können damit tun, was Sie wollen.

Die rrd-Diagramme werden gemäß den Servernamen gespeichert. Wenn Sie also den Namen von etwas ändern, verlieren Sie die Daten ... Sie können die Dateien jederzeit einfach umbenennen, indem Sie sie mit Symlinks verknüpfen, und Sie verlieren die Daten nicht.

Ich habe einige Beispiele für diese Grafiken in meinem letzten Blog-Beitrag " Einige Tipps für bessere RRD-Grafikserver- Fehler" veröffentlicht. Außerdem enthält die n2rrd-Seite sowohl die Cacti-Demo als auch rrd2graph.

Ich denke, das Fazit ist, dass die Nagios-Route möglicherweise in ein oder zwei Funktionen fehlt, aber ziemlich vollständig ist, wenn es Ihnen nichts ausmacht, sich mit den Details des Schreibens von rrd-Vorlagen selbst die Hände schmutzig zu machen *. Es wird wahrscheinlich mehr Zeit in Anspruch nehmen, aber es wird dazu anregen, mehr Fachwissen in rrd zu entwickeln.

Kyle Brandt
quelle
1
* [nicht referenzierter Fußnotenfehler]: Was wolltest du dort hinzufügen, Kyle? forschende Köpfe müssen es wissen!
MadHatter
0

Ich fordere genaue Daten und die Datenanzeige von rrd ist nicht genau - sie ist normalisiert! Für die meisten Benutzer ist dies in Ordnung, da sie zunächst keine sehr genauen Daten verwenden. Sie verwenden Daten, deren Abtastraten oft auf einer Minute oder länger liegen, und das gibt Ihnen keine sehr genaue Beschreibung dessen, was passiert. Dies bedeutet auch, dass Sie Ihre Daten möglicherweise nie sehen, wenn Sie irgendwo einen Spitzenwert in Ihren Daten haben.

Bedenken Sie Folgendes: Angenommen, Ihr GB-Netzwerk summt mit etwa 10 MB / s und plötzlich tritt für einige Minuten eine Spitze von 100 MB / s auf. Beachten Sie auch, dass es sich bei einer Spitze von nur 30 Sekunden möglicherweise nicht einmal um eine Abtastrate von einigen Minuten handelt. Wenn Sie sich die Daten für den Tag ansehen, wird diese "Spitze" möglicherweise nur als 15 MB / s angezeigt, obwohl der tatsächliche Wert auch von einer Reihe anderer Faktoren abhängt. Es ist auch sehr wahrscheinlich, dass Sie davon ausgehen, dass Ihr Netzwerk glücklich ist, wenn dies nicht der Fall ist!

Was für mich noch frustrierender ist, sind die Daten, die auf die physische Breite des Diagramms und den Bereich der x-Achse normalisiert sind. Was dies bedeutet, ist die Spitze, die ich erwähnt habe, die Sie nicht gesehen haben? Wenn Sie hineinzoomen, erscheint es auf magische Weise! Ich bleibe bei Gnuplot - die Grafiken sind vielleicht nicht so hübsch, aber sie sind absolut solide und Gnuplot ändert die Daten nie, bevor sie angezeigt werden.

-Kennzeichen

markiere seger
quelle
0

Ich finde, dass die Verwendung von pnp4nagios für die grafische Darstellung recht gut funktioniert. Es unterstützt auch das Zoomen. Es ist nicht am einfachsten zu implementieren, aber nichts mit Nagios ist es jemals.

Matthew Thode
quelle