Idealerweise mit einer möglichst einfachen Installation und ohne Neustart der Server. Meistens, DL380 G5's
wenn es hilft.
hardware
storage
hp-proliant
hp-smart-array
alerts
DrZaiusApeLord
quelle
quelle
Antworten:
Dies hängt geringfügig von den Betriebssystemen ab, die Sie auf den Servern ausführen. Im Allgemeinen ist es jedoch möglich, Warnungen von HP ProLiant-Servern und Smart Array-RAID-Controllern abzurufen.
Die vollständige Liste der Treiber- und Softwareunterstützung für Ihre DL380 G5-Systeme finden Sie hier .
SNMP und eine Überwachungslösung sind der beste Ansatz ... Sie können dies jedoch mit einigen HP Tools erweitern. HP bietet den HP Systems Insight Manager an , der zum Download zur Verfügung steht und auch mit den Servern geliefert wird. Dies ist ideal für Serversammlungen. Wenn Sie nach einmaligen Warnungen suchen, ohne eine Verwaltungs- oder Überwachungsinfrastruktur aufzubauen, können Sie einfach die HP Management Agents (auch bekannt als ProLiant Support Pack ) installieren .
Bei eigenständigen Linux-Systemen lassen ich die Agenten Traps per E-Mail senden. Normalerweise konfiguriere ich das Support Pack mit Standardeinstellungen oder einem benutzerdefinierten Bundle , bearbeite
/opt/hp/hp-snmp-agents/cma.conf
und ändere dietrapemail
Zeile so, dass sie auf die Empfängeradresse verweist:Wenn Sie Linux ausführen und nicht die vollständige HP Management Suite installieren möchten, können Sie ein Skript um das Dienstprogramm cciss_vol_status entwickeln, um den Controller- / Festplattenstatus abzufragen. Siehe auch: Installieren von HP Agents auf OpenFiler
quelle
ProLiant DL360 G7
Server und HP SIM für die Überwachung eingerichtet.Testen Sie HP Insight Manager
https://www.hpe.com/us/en/product-catalog/detail/pip.489496.html#
Ich glaube, es sollte mit Ihren Servern funktionieren.
quelle
Ich habe das leichte Programm verwendet, das @ewwite in seiner Antwort erwähnt hat: cciss_vol_status
Wenn Sie den beiliegenden INSTALL-Anweisungen folgen, wird das Skript eingefügt
/usr/local/bin/cciss_vol_status
.Hier ist ein Wrapper-Skript, mit dem ich die Ausgabe von cciss_vol_status überprüfe und eine E-Mail sende, wenn ein Array den Status FAILED hat.
Rufen Sie das obige Skript in cron auf. Ich führe den Check alle zwei Minuten durch:
Wir verwenden HP System Insight Manager , um zu überprüfen, ob unsere HP betriebsbereit sind, aber nichts weiter. Ich fand, dass der Linux-Agent für uns übertrieben ist, da wir andere Überwachungslösungen haben, sodass dieses obige Skript seinen spezifischen Zweck gut erfüllt.
AKTUALISIEREN
Nur ein Tipp zur Fehlerbehebung, falls Sie darauf stoßen. Dieses Skript hat sich heute Morgen als hilfreich erwiesen, als ich eine E-Mail über ein fehlgeschlagenes Array erhielt mit:
Das Gerät war schreibgeschützt und in nicht sichtbar
/proc/partitions
. Ich habe den Server neu gestartet und beim Booten folgende Meldungen gesehen:Ich habe F2 ausgewählt und das RAID war in Ordnung und wurde beim Booten gemountet.
quelle
Installieren Sie Smartmontools. Mailen Sie, BEVOR ein Laufwerk ausfällt.
quelle