Wie kann ich geplante Ausfallzeiten auf Nagios stornieren?

12

Ich habe einen Nagios 3.5.1-Monitor für eine Reihe von Servern. Bei einer Aktion wie einem Drupal- oder Wordpress-Core-Upgrade habe ich die Websites heruntergefahren und Nagios auf geplanten Ausfall eingestellt.

Manchmal beende ich die 2-Stunden-Standardeinstellung und möchte einen Ausfall nicht ignorieren. Wie kann ich Nagios mitteilen, dass ich fertig bin, und die geplante Ausfallzeit stornieren ?

Bildbeschreibung hier eingeben Bildbeschreibung hier eingeben

Rick
quelle

Antworten:

19

Wählen Sie in der linken Spalte der Nagios-Benutzeroberfläche (unter "System") "Ausfallzeit" aus. Auf dieser Seite werden alle geplanten Ausfallzeiten aufgelistet und können einzeln gelöscht werden.

Paul Haldane
quelle
2

Auf der linken Seite befindet sich unter "System" ein Link "Ausfallzeit". es geht um /cgi-bin/extinfo.cgi?type=6. Klicken Sie dort auf das Papierkorbsymbol für die betreffende Ausfallzeit.

Zufällig möchten Sie möglicherweise den Unterschied zwischen "geplanten" und "flexiblen" Ausfallzeiten untersuchen, oder besser gesagt, in Anbetracht Ihres Anwendungsfalls klingt eine "Bestätigung" so, wie Sie es sich eigentlich gewünscht haben.

BMDan
quelle
Wenn Sie Ausfallzeiten nachverfolgen, wirkt sich eine Bestätigung anders auf die Berichte aus als geplante Ausfallzeiten. Da es sich also wirklich um geplante Ausfallzeiten handelt, ist dies die geeignetere Maßnahme.
LSD
Gutes Argument. Das Löschen einer Ausfallzeit wirkt sich jedoch weitaus stärker auf Berichte aus, oder?
BMDan
Aus der Dokumentation geht hervor, dass die Ausfallzeit nur vor dem ursprünglich geplanten Ende endet, die Ausfallzeit jedoch weiterhin für die Berichterstellung verbleibt. "Wenn die Ausfallzeit aktuell gültig ist, wird die geplante Ausfallzeit überschritten."
lsd
Weiter unten wird dokumentiert, dass die Berichterstellung geplante Ausfallzeiten nur berücksichtigt, wenn Sie auch die Überprüfungen deaktivieren. Gut.
lsd
0

Ich habe erfolgreich "Ausfallzeit-ID" von 251 auf 348 auf meinem Centos-Server mit dem folgenden Befehl gelöscht / abgebrochen:

for i in `seq 251 348`; do 
  /bin/printf "[%lu] DEL_SVC_DOWNTIME;$i\n" `date +%s` > /var/spool/nagios/cmd/nagios.cmd; 
done
Samuel Recebov
quelle