VMware - anhaltender Alarm "Hostspeicherstatus" in vSphere

7

Ich habe einen bestimmten VMWare ESX 4.1-Host mit einem sehr anhaltenden Alarm "Hostspeicherstatus".

Dies wird auf einem HP ProLiant DL360 G7-Server ausgeführt. Die HP ILO- und System Management-Agenten kennen keine Fehler. Wenn ich den Alarm im vSphere-Client lösche, wird er innerhalb eines Tages zurückgegeben. Ich habe versucht, DIMMs erneut einzusetzen. Der Fehler weist jedoch nicht auf ein Problem mit einem bestimmten Modul hin.

Es gibt einen anderen Host im Cluster mit identischer Konfiguration. Es zeigt keine Probleme.

Irgendwelche Gedanken?

Dies wird in anderen Foren (und hier ) ohne klare Lösung kurz angesprochen .

Geben Sie hier die Bildbeschreibung ein

ewwhite
quelle
Irgendwas in den IML-Protokollen? beide auf der gleichen Firmware? klingt für mich wie ein HW-Problem
Chopper3
IML ist sauber. SMH ist sauber. Keine LEDs / Anzeigen auf dem Frontdisplay.
ewwhite
1
In der Lage, beide herunterzufahren und ihre Festplatten auszutauschen? Sehen Sie, ob das Problem bei der Hardware oder dem Code geblieben ist? Andernfalls würde ich sagen, dass es sich um ein HW-Problem handelt, und HP bitten, es zu beheben.
Chopper3
Ich könnte DIMMs austauschen oder Ersatz für die Garantie bestellen. Aber da der Fehler keinen Slot
angibt

Antworten:

4

Wann haben Sie das HP ESXi-Material das letzte Mal aktualisiert? Möglicherweise liegt ein Fehler in ihrem HW-Paket vor, der behoben wurde, oder es werden weitere Informationen bereitgestellt.

Eric C. Singer
quelle
Aktualisiert auf das neueste ESX 4.1-Update am Mittwoch. Ich werde jetzt versuchen, die PSP zu aktualisieren.
ewwhite
Es war ein Tag und ich hatte seitdem keine Fehler mehr. Das Aktualisieren des HP ProLiant Support Pack scheint also geholfen zu haben.
ewwhite
2

Ich habe das gleiche Problem erlebt und dieser Artikel hat es gelöst. Am Ende musste ich alle 9 Schritte ausführen.

http://kb.vmware.com/selfservice/microsites/search.do?language=de_DE&cmd=displayKC&externalId=2011531

Um dieses Problem zu beheben, müssen Sie Warnungen und Fehler auf der Registerkarte Hardwarestatus in VMware vCenter Server löschen .

So löschen Sie Warnungen und Fehler auf der Registerkarte Hardwarestatus :

  1. Wechseln Sie zur Registerkarte Hardwarestatus .
  2. Klicken Sie auf die Ansicht Systemereignisprotokoll .
  3. Klicken Sie auf Ereignisprotokoll zurücksetzen .
  4. Klicken Sie auf Aktualisieren . Der Fehler wird behoben.
  5. Klicken Sie auf die Ansicht Warnungen und Warnungen .
  6. Klicken Sie auf Sensoren zurücksetzen .
  7. Klicken Sie auf Aktualisieren . Der Speicher wird gelöscht.

Hinweis : Wenn der Fehler nicht behoben wird, stellen Sie eine Verbindung her und stellen Sie über SSH eine Verbindung zum Host her. Weitere Informationen finden Sie unter Aktivieren der Root-SSH-Anmeldung auf einem ESX-Host (8375637) .

  1. Führen Sie diesen Befehl aus, um den sfcbd-Dienst neu zu starten:
    services.sh restart

    Führen Sie diesen Befehl aus, um den Dienst in ESX neu zu starten:
    /etc/init.d/sfcbd-watchdog restart

  2. Klicken Sie auf Aktualisieren . Der Fehler wird behoben.

Fro
quelle
1
Willkommen bei Server Fault! Während dies theoretisch die Frage beantworten kann, wäre es vorzuziehen , die wesentlichen Teile der Antwort hier aufzunehmen und den Link als Referenz bereitzustellen.
Slm
Das Zurücksetzen des Ereignisprotokolls hat den Trick für mich getan! Ich kratzte mir seit einem Tag am Kopf über diese Diskrepanz, aber schließlich löste es sich! Vielen Dank!
Stein
1

Ich hatte kürzlich das gleiche Problem mit meinem HP Proliant DL360 G9 und VCenter 5.5. Hier ist die magische Sequenz aus Warnungen und Fehler zum Hardwarestatus in VMware vCenter Server 4.x und 5.x kann nicht gelöscht werden , die geholfen haben:

So löschen Sie Warnungen und Fehler auf der Registerkarte Hardwarestatus :

  1. Klicken Sie auf die Registerkarte Hardwarestatus .
  2. Klicken Sie auf die Ansicht Systemereignisprotokoll .
  3. Klicken Sie auf Ereignisprotokoll zurücksetzen .
  4. Klicken Sie auf Aktualisieren , um den Fehler zu beheben.
  5. Klicken Sie auf die Ansicht Warnungen und Warnungen .
  6. Klicken Sie auf Sensoren zurücksetzen .
  7. Klicken Sie auf Aktualisieren , um den Speicher zu löschen.

Hinweis: Wenn der Fehler nicht behoben werden kann, stellen Sie über SSH eine Verbindung zum Host her

  1. Führen Sie diesen Befehl aus, um den sfcbdDienst neu zu starten :

    services.sh restart

    Führen Sie diesen Befehl aus, um servicein ESX neu zu starten :

    /etc/init.d/sfcbd-watchdog restart

  2. Klicken Sie auf Aktualisieren .

Weitere Informationen finden Sie unter Warnungen auf der Registerkarte Hardwarestatus des ESXi 5.x-Hosts .

Timur Bakeyev
quelle