Warum beendet vCenter 5.1u1 Hosts aus dem Wartungsmodus?

14

Dieser vCenter-Server wurde gerade auf 5.1-Update 1 aktualisiert. Ich gehe durch die Hosts, aktualisiere die Firmware und aktualisiere sie dann von verschiedenen Versionen von 5.0 auf 5.1u1.

vCenter 5.1u1 scheint ein interessantes neues Verhalten zu haben: Es entfernt Hosts aus dem Wartungsmodus, wenn sie nach dem Trennen der Verbindung wieder verbunden werden - aber sehr uneinheitlich, ich habe es vielleicht 4 oder 5 Mal bei ~ 25-30 Host-Neustarts gesehen. Ich habe es nur auf 5.0-Hosts gesehen, die noch nicht auf 5.1 aktualisiert wurden.

Aufgaben

Im Image habe ich den Host in den Hauptmodus versetzt und ihn im automatischen Aktualisierungsmodus der HP SPP DVD neu gestartet. Nach dem üblichen 40-minütigen Aktualisierungsvorgang war der Host wieder online. 7 Sekunden bevor er überhaupt protokollierte, dass der Host erneut eine Verbindung hergestellt hatte, hatte vCenter dem Host eine Aufgabe gesendet, um den Wartungsmodus zu beenden.

Veranstaltungen

Meines Wissens sollte vCenter einen Host nur dann aus dem Wartungsmodus entfernen, wenn vCenter ihn selbst in den Wartungsmodus versetzt (z. B. eine VUM-Upgrade-Aufgabe).

Warum würde dieses vCenter einen Host einseitig aus dem vom Benutzer initiierten Wartungsmodus beenden?

Bearbeiten, zusätzliche Infos:

Ich habe die Firmware-Upgrades auf 5 weiteren Hosts gleichzeitig ausgeführt. Zwei von ihnen haben den Wartungsmodus nach dem erneuten Verbinden verlassen, drei nicht. Der gemeinsame Faktor beim Verlassen des Wartungsmodus scheint zu sein, wie lange sie offline waren . Die beiden, die ein paar Versuche brauchten, um auf den virtuellen Datenträger zu booten, wurden aus dem Wartungsmodus geworfen.

  • esx31 (Bild oben): 45 Minuten reagiert nicht
  • esx19 (Maint beendet): 87 Minuten reagiert nicht
  • esx24 (hat gewartet): 32 Minuten reagierte nicht
  • esx29 (hat gewartet): 39 Minuten reagierte nicht
  • esx32 (hat gewartet): 30 Minuten reagierte nicht
  • esx34 (Maint beendet): 70 Minuten reagiert nicht

Bearbeiten: Die Idee der Verbindungsunterbrechung scheint ein roter Hering gewesen zu sein, da dies nicht konsequent geschieht.

Zusätzlich , in der vpxd.logder Ausgang maint Modus Aufgabe Initiation scheint immer sofort diesen folgen vim.EnvironmentBrowser.queryProvisioningPolicySOAP - Aufruf. Hier sind die Linien, die der Klarheit halber leicht beschnitten sind:

15:27:49.535 [info 'vpxdvpxdVmomi'] [ClientAdapterBase::InvokeOnSoap] Invoke done (esx31, vim.EnvironmentBrowser.queryProvisioningPolicy)
15:27:49.560 [info 'commonvpxLro'] [VpxLRO] -- BEGIN task -- esx31 -- HostSystem.exitMaintenanceMode --

Beachten Sie, dass auf den Knoten, die die Exit-Task nicht erhalten, das vim.EnvironmentBrowser.queryProvisioningPolicyEreignis weiterhin auftritt. Ich sehe keine anderen Unterschiede in den Ereignissen davor oder danach im Wiederverbindungsprozess, abgesehen von den zusätzlichen Ereignissen, die durch das Beenden des Wartungsmodus verursacht wurden.

Angesichts der Erwähnung der Bereitstellungsrichtlinien im Protokoll werden bei der Suche nach Problemen im Zusammenhang mit dem Autodeploy-Wartungsmodus Beschwerden über ein ähnliches Verhalten angezeigt (obwohl ich Autodeploy überhaupt nicht verwende).

Shane Madden
quelle
Möglicherweise möchten Sie sich an den VMware-Kundensupport wenden ... oder in einer der VMware-Gruppen nachfragen. Dies könnte möglicherweise ein Fehler in der Programmierung sein.
mdpc
Welchen vCenter-Ansatz verwenden Sie? Gerät? Läuft es unter Windows?
ewwhite
@ewwhite Läuft unter Windows.
Shane Madden
Hmm ... Möglicherweise im Zusammenhang damit ? - Ich würde sagen, das sollte es definitiv nicht tun ...
voretaq7
Welche Hardware verwenden Sie für Ihre Hosts? Unser UCS verursachte insofern ein ähnliches Problem, als beim Neustart eines Hosts einige von ihnen zweimal neu gestartet wurden, während andere (gleicher Blade-Typ, gleiche Firmware, gleiche esx-Updates) nur einmal neu gestartet wurden. Als ich mit Cisco darüber sprach, sagten sie "es ist ein bekanntes Problem"
MoSiAc

Antworten:

2

Ich habe dies bei ESXi 4.1-Hosts beobachtet, nachdem ein Patch versehentlich den Ordner / tmp / scratch zerstört hat. Möglicherweise möchten Sie überprüfen, ob dieses Verzeichnis noch auf den Hosts vorhanden ist, die den Wartungsmodus automatisch beendet haben.

Wenn sie fehlen, solltest du mkdir verwenden, um sie zu erstellen. In diesem VMware-KB-Artikel möchten Sie außerdem überprüfen, ob der permanente Scratch auf jedem Host korrekt eingerichtet ist:

VMware KB: Erstellen eines beständigen Arbeitsverzeichnisses für ESXi 4.x und 5.x

flink
quelle