Automatisches Einschalten nach ordnungsgemäßem Herunterfahren der USV

7

Dies ist meine Grundeinstellung:

  • Ich verwende einen Server (DL380 G7; Linux 3.13-Kernel), auf dem ~ 10 virtuelle Maschinen gehostet werden
  • Es ist auf automatisches Einschalten eingestellt
  • Ich benutze NUT für die USV-Verwaltung
  • Die ordnungsgemäße Abschaltdauer des Hosts (einschließlich des ersten Herunterfahrens des VMS) beträgt ~ 8-10 Minuten
  • Die Gesamtlaufzeit der USV (ich habe 2, die jeweils ein Netzteil im Server und ein Netzteil im angeschlossenen Speicher mit Strom versorgen) bei voll aufgeladenen Batterien beträgt ~ 75 Minuten.
  • Ich habe die Pegel von UPS / NUT so eingestellt, dass ich den kritischen Pegel (LOWBATT) habe, dh nach 15 Minuten das Herunterfahren einleiten (ich wage es nicht, tiefer zu gehen).

Das folgende Szenario ist mir in den letzten 12 Monaten bisher zweimal passiert:

  • Stromausfall, USV übernehmen ganz gut
  • Die Stromversorgung bleibt ca. 1 Stunde lang ausgeschaltet -> das Herunterfahren wird wie vorgesehen eingeleitet
  • Der Server stoppt die vms und beginnt mit dem Herunterfahren
  • -> Irgendwann kommt hier wieder Strom
  • Der Server wird heruntergefahren und ausgeschaltet
  • Der Server wird nicht wieder online geschaltet, da die USV (wieder) mit Strom versorgt wird und der Server tatsächlich nie Strom verloren hat (von der USV geliefert wird). Im Grunde sieht es für den Server so aus, als wäre es ein absichtliches, ordnungsgemäßes Herunterfahren gewesen.
  • Sobald ich merke, dass ich den Server über ILO aus der Ferne einschalte [das letzte Mal geschah dies heute um 03:46 Uhr :-), deshalb frage ich]

Wie ewwhite betont hat, wären die spezifischen USV-Modelle hilfreich:

  • Eaton 5PX 2200VA mit +1 EBM
  • Roline Prosecure II, 1500 VA RM2U, mit +1 EBM

Hat jemand von euch das gleiche Problem? Gibt es eine Out-of-the-Box-Lösung für einige USVs?

Bisher habe ich überlegt, ein Linux-Gerät mit geringem Stromverbrauch (Raspberry Pi?) Einzustellen, um die Überwachung zu übernehmen. Es würde die Ups-Einheiten auf ausreichende Ladung der Batterien und den Eingangsleistungsstatus prüfen und dann den Server über ILO / IPMI neu starten.

Ist eine automatische Lösung einfach zu störend (für meinen Fall und allgemein) und sollte ich einfach manuell eingreifen, wann und ob dies passiert?

Grüße

Martin

Martin
quelle
Hier sollten Sie die Marke / das Modell der USV angeben.
ewwhite
eine ausgezeichnete Idee
Martin
Ein billiges Gerät mit geringerem Stromverbrauch, um den Start der Server auszulösen, klingt nach einem vernünftigen Ansatz. Dieses Gerät mit geringem Stromverbrauch muss nicht einmal von einer USV mit Strom versorgt werden, da es nur dann etwas tun soll, wenn Strom zur Verfügung steht. Um Schleifen-Stromzyklen zu vermeiden, ist es wichtig, dass die Server erst gestartet werden, wenn die Batterieleistung ausreichend aufgeladen ist (wie Sie bereits bemerkt haben). Es kann auch eine gute Idee sein, zu verlangen, dass die Stromversorgung für einige Zeit stabil ist.
Kasperd
@kasperd: Ich habe auch in diese Richtung gedacht. Ich denke, wenn es einen Grund gibt, warum ich dem Rat von ewwhite nicht folgen und mich an eine USV halten möchte, werde ich es einfach mit einem Pi versuchen. Ich muss nur an einige Regelsätze / Kriterien denken, die tatsächlich "stabile Macht ist zurück", "noch nicht" usw. darstellen
Martin

Antworten:

1

Dies ist ein Fall, in dem Sie nicht zwei USV-Einheiten verwenden sollten , bei denen jede eine Stromversorgung speist. Dies kann ein großer Teil Ihres Problems sein, da eine einzelne USV nach einem Ausfall den vorherigen Stromstatus wiederherstellen kann (dies ist auch im HP ProLiant BIOS die Standardeinstellung). Zwei zu haben scheint diese Logik durcheinander zu bringen.

Sind Sie über ein serielles oder USB-Kabel mit der USV verbunden?

Weitere Informationen finden Sie unter :
So aktivieren Sie einen Server, nachdem die USV ihn heruntergefahren hat, wenn die Stromversorgung wiederhergestellt ist?

Dies sollte leicht zu testen sein, aber um ehrlich zu sein, verbringe ich sehr wenig Zeit damit, mich mit diesen Randfällen zu befassen. Die Stromversorgung des Serverraums ist eines der am einfachsten zu planenden Dinge, da Sie eine Betriebsdauer von x Stunden für den Akku festlegen und in der Lage sein können, solche Stromausfallszenarien zu durchlaufen.

Wenn die Ausfälle länger sind, stelle ich nur sicher, dass ich die Dinge manuell fernsteuern und handhaben kann.

ewwhite
quelle
Vielen Dank für Ihre Antwort. Ihr erster Link ist wirklich genau die Frage, die ich stellen wollte (aber ich habe sie bei der Suche nicht gefunden). Der zweite Thread zeigt mir, dass Ihre Setups eine ganz andere Liga sind als meine eigene, aber ich kann sehen, wo das Problem liegt. Meine USV sind übrigens beide über USB angeschlossen.
Martin
@martin Ich würde nur mit einer USV gehen. Standardmäßig sollte es so funktionieren, wie Sie es erwarten.
ewwhite
Ich spreche das noch einmal an :). Halten Sie es für sinnvoll, die zweite USV als "Dummy" zu betreiben? Damit die Ausgangsleistung so angeschlossen ist, wie sie jetzt ist, aber nicht die Datenleitung, sondern nur die größere der beiden (2200 VA) mit Intelligenz betrieben, dh konfiguriert und an die Mutter angeschlossen. Ich denke, das würde mir eine längere Betriebszeit geben, nicht wahr? Der Hauptgrund, warum ich sogar 2 USV-Einheiten habe, ist, dass zu der Zeit, als ich auf dem Markt für sie war, 2 kleinere USV billiger waren als eine einzelne größere ihrer kombinierten Kapazität; das könnte jetzt anders sein.
Martin
@martin Ich bin nicht sicher. USV-Geräte sollen bei Lücken in der Stromversorgung helfen. Wenn es so viele Probleme gibt, bei denen Sie eine längere Laufzeit benötigen, ist es sinnvoll, zu versuchen, die Stromversorgung in der Anlage oder beim Versorger zu stabilisieren?
ewwhite
Im Allgemeinen ist die Stabilität der Stromversorgung nicht so schlecht (nach meinem Verständnis), aber es ist ein zumindest an das ländliche Gebiet grenzendes Gebiet mit häufigen Gewittern im Sommer und Spätherbst. Winzige Lücken (<= 1s) sind also ziemlich häufig und waren eine große Quelle der Qual, bevor ich eine USV hatte. Leider scheint es in meiner Region auch einige allgemeine Schwächen im Stromnetz zu geben, da längere Ausfälle (> = 30 Minuten) besonders nach starken Regenfällen (Überschwemmungen) und Stürmen (normalerweise fallende Bäume, die von einer Leitung abhacken) auftreten können. Ich denke, nicht unbedingt die ideale Region für den Betrieb von Servern.
Martin
1

Eine alternative Lösung, die keine Hardwareänderung erfordert, besteht darin, den Herunterfahrvorgang so einzurichten, dass ein Neustart durchgeführt wird, wenn die USV nach dem Herunterfahren aller VMs mit Strom versorgt wird. Dazu müssen Sie herausfinden, wo Sie beim Herunterfahren Ihr Init-Skript ablegen können, und Sie müssen sicherstellen, dass die Mutter nicht im Voraus geschlossen wird, da Sie sie für die Kommunikation mit Ihrer USV benötigen.

Senden Sie am Ende des Herunterfahrens des Servers einen Befehl zum Herunterfahren an die USV? Wenn nicht, können Sie auch die Option in Betracht ziehen, dies zu tun, und dann können Sie die Verzögerung bis zum Herunterfahren so einstellen, dass Ihr Server das Herunterfahren wirklich beendet hat, und auch eine Zeitüberschreitung nach dem Ausfall der Ups und bis zum Einschalten des Servers nach dem erneuten Einschalten. Wenn die Stromversorgung vor dem Herunterfahren wieder hergestellt ist, wird Ihr Server durch den Befehl shutdown immer noch vollständig ausgeschaltet, aber nach einiger Zeit wird er wieder hochgefahren.

Überprüfen Sie die NUT upscmd shutdown.return und die zugehörigen Timeouts.

Baruch Even
quelle
1

Eine Ghettolösung, aber es funktioniert. Besorgen Sie sich einen kleinen Mikrotik-Router oder ein Linux-Board und aktivieren Sie das LAN. Platzieren Sie das Gerät ohne Ups-Backup und konfigurieren Sie es so, dass es jede Minute oder 30 Sekunden Wake im LAN sendet. Wenn es also Strom verliert, sendet es keine Befehle, aber wenn es Strom bekommt, sendet es WOL alle 1 m oder 30 s. Ihr Server wird also niemals heruntergefahren, wenn die Stromversorgung eingeschaltet ist.

Asadullah Sayyad
quelle