Green-IT: Wie gehen Sie bei Ihrer Systemüberwachung mit Ausschaltsystemen um?

7

Viele von Ihnen haben wahrscheinlich Green-IT- Projekte abgeschlossen oder erwägen dies mit dem Ziel, inaktive oder nicht benötigte Systeme auszuschalten , wenn der Bedarf an Computerressourcen gering ist:

Wie sind Sie mit dieser Situation bei Ihrer Systemüberwachung umgegangen ? Ich interessiere mich besonders für Lösungen für Nagios .

Eine Idee ist, Ausfallzeiten in Nagios für die Poweroff-Hosts einzuplanen. Der Nachteil dieser Lösung besteht jedoch darin, dass die Hosts weiterhin in der Ansicht "Probleme" der Nagios -Webschnittstellen aufgeführt sind. Gibt es eine bessere Lösung ohne diese "Verschmutzung" (dh in der Ansicht "Probleme" werden nur echte Probleme angezeigt, die von einem Systemadministrator gewartet werden müssen).

Eine saubere Lösung wäre ein neuer Host-Status "Green-IT Poweroff". Aber AFAIK das gibt es doch nicht, oder? Haben Sie weitere Empfehlungen oder Lösungen? Wie lässt sich eine dynamische IT-Umgebung am besten überwachen?

Knweiss
quelle
Haben Sie versucht, ein Netzwerksteuerungssystem zu verwenden, das dies unterstützt? Ich denke, es wäre etwas, mit dem sich Nagios befassen oder das sie dokumentieren müssten (vielleicht ein Skript, um sie für die Überwachung auszuschalten)?
TomTom
Wartungshosts sind bereits mit einem eindeutigen Symbol gekennzeichnet, und Benachrichtigungen werden deaktiviert. Mir ist nicht klar, wonach Sie mehr suchen.
uSlackr
2
@uSlackr Ich möchte nicht Dutzende / Hunderte von Hosts in der Problemansicht sehen - auch wenn sie keine Benachrichtigungen senden.
Knweiss
In Bezug auf das Problem mit der Ansicht "Probleme": Wenn wir uns darauf beschränken, nur die Ansicht "Nicht behandelte" Dienste / Hosts zu verwenden, können Sie die Poweroff-Hosts ausblenden, indem Sie sie einfach bestätigen, z. B. mit "Green-IT".
Knweiss

Antworten:

2

Der einfache Weg:

Es gibt integrierte Filter für die Statusansicht oben auf der Seite. Sie können die Administratoren einfach "unbestätigte" Probleme oder Probleme auf Hosts beobachten lassen, die sich nicht in geplanten Ausfallzeiten befinden. Oder eine beliebige andere Anzahl von Kombinationen.

Wenn Sie mit dem Filtern der CGI-Ansicht wirklich wild werden möchten, finden Sie im Abschnitt "HOST AND SERVICE FILTER PROPERTIES" von cgiutils.h im Quellcode eine vollständige Liste der verfügbaren Filter.

Der harte Weg:

Siehe die Dokumente zur adaptiven Überwachung . Mit dieser Option können Sie die Nagios-Konfiguration im laufenden Betrieb ändern, da Systeme automatisch ein- und ausgeschaltet werden. Sie können beispielsweise die Prüfzeiträume anpassen, die Prüfbefehle in eine check_dummy-Variante ändern, Ereignishandler aktivieren / deaktivieren usw.

Keith
quelle
Oh, ich habe vergessen zu erwähnen: Die Filter sind ein Bitfeld, wenn das nicht offensichtlich ist. Um mehrere Filter anzuwenden, müssen Sie deren Werte addieren.
Keith
0

Ich denke, Sie benötigen ein wenig benutzerdefinierte Entwicklung, um eine neue Statusansicht zu erstellen, mit der Hosts mit geplanten Ausfallzeiten aus der Liste der Problemserver entfernt werden. Ich vermute, dass jemand in der Nagios Dev Community gegen eine Gebühr zur Verfügung steht.

uSlackr
quelle