Was ist die Strategie zum Erkennen von Zeitverschiebungen in einem Linux-basierten Rechenzentrum?

14

Was ist die Strategie zur Erkennung der Zeitverschiebung in allen Linux-basierten Rechenzentren? Dies ist ein schwierigeres Problem, als es zunächst scheint.

Zeitverschiebung kann für bestimmte Anwendungen schwerwiegende Probleme verursachen. Obwohl NTP installiert ist, kann dies aus folgenden (und vielen weiteren) Gründen fehlschlagen:

  • NTP wurde nicht richtig eingerichtet, um beim Neustart automatisch neu zu starten.
  • Die Einstellungen auf einem Server sind falsch, sodass der Zeitserver, auf den er verweist, nicht erreichbar oder ungenau ist.
  • Der Master-Zeitserver ist nicht erreichbar und alle Server, die mit ihm synchronisiert werden, synchronisieren jetzt mit einer unzuverlässigen Quelle.

Ich möchte eine Möglichkeit erkennen, ob alle einzelnen Server korrekt sind. Bedenken Sie, dass der Server mit dem Testskript / der Testanwendung möglicherweise nicht richtig ist.

Stuart Woodward
quelle
6
Ich denke, Ihre Gründe sind falsch, betriebliches NTP ist für die Farm von entscheidender Bedeutung. Stellen Sie sicher, dass NTP ordnungsgemäß funktioniert. Stellen Sie außerdem eine lokale Hauptuhr bereit.
user539484
NTP funktioniert auf vielen Linux-Distributionen sofort mit vernünftigen Standardeinstellungen. Es ist so ziemlich kein Thema mehr.
Matt

Antworten:

20

Dies ist leicht zu kontrollieren. Konfigurationsmanagement ist der Schlüssel ...

Stellen Sie sicher, dass der NTP-Dienst ausgeführt und konfiguriert wird ...

Monit beispielsweise zu verwenden , um sicherzustellen, dass es ausgeführt ntpdwird, und es neu zu starten, wenn es fehlschlägt, ist ein einfacher Ansatz. Es kann sinnvoll sein, dieser Art von Prüfung Cron und andere wichtige Dämonen hinzuzufügen.

Eine andere Möglichkeit ist die Verwendung eines Konfigurationsmanagement- Tools wie Puppet , um dieselbe ntpd.conf auf Ihren Servern zu erzwingen und sicherzustellen, dass ntpd installiert, konfiguriert und ausgeführt wird.

Es gibt genügend Redundanzen im NTP-Protokoll, um mit der Instanz eines Zeitservers fertig zu werden, der nicht erreichbar ist. Geben Sie mehrere Quellen an.

ewwhite
quelle
3
Ich muss dieses Gefühl wiederholen. Konfigurationsmanagement und mehrere NTP-Server sind ein ziemlich grundlegender Teil der Infrastruktur in allen Bereichen, die sich einem "Rechenzentrum" nähern. Ein mittleres oder größeres Rechenzentrum sollte über eine Hardware-Uhr verfügen. GPS-Zeitquellen können für ein paar Hundert gekauft werden, und wenn Sie einen Lötkolben <100 US-Dollar haben.
Chris S
diese lösung + nagios
von dort
4
Beachten Sie, dass es ziemlich wichtig ist , wie Sie ntpdden Status überprüfen . Du willst nicht einfach nur sagen "ntpd läuft. Alles ist großartig!". Sie müssen tatsächlich sicherstellen, dass Ihr System synchronisiert und über einen funktionsfähigen Peer verfügt oder dass der Zeitversatz zwischen dem Host und der Überwachungsbox minimal ist . Nagios hat check_ntp_peerund check_ntp_timewelche damit umgehen, wenn Sie Nagios nutzen wollen.
Voretaq7
ntpq, um den Status zu überprüfen
Kubanczyk
10

Es gibt eine Vielzahl von check_ntp-Plugins für Nagios .

Hier ist eins:

http://nagiosplugins.org/man/check_ntp

Fügen Sie diesen Scheck Ihrem Nagios-Host hinzu und Sie erhalten Benachrichtigungen, wenn etwas schief geht.

dmourati
quelle
Richten Sie einfach Ihr Überwachungssystem ein, um zu überprüfen, ob die Zeit gültig ist oder zumindest der Versatz zum Überwachungssystem minimal ist.
Zoredache