VMWare ESX- und Gasteinstellungen für das Netapp-Cluster-Failover

7

Welche Schritte sollte ich ausführen, um sicherzustellen, dass die VMs einem Worst-Failover von Clusterknoten im schlimmsten Fall standhalten, wenn ich VMWare 5.x auf FC-LUNs [edit] ausführe, die von einer Netapp ausgeführt werden, auf der ontap 8.x im 7-Modus ausgeführt wird? HBA-Einstellungen? ESX-Einstellungen? Änderungen an den Einstellungen der VMs? Ich weiß, dass dies alles mit dem Host-Kit von Netapp erledigt wird, aber wir möchten wissen, was es tut und / oder es selbst tun.

Eine Übernahme von Netapp ist normalerweise recht schnell, kann aber in einigen Fällen bis zu 3 Minuten dauern.

Basilikum
quelle
1
Welche Multipath-Regeln haben Sie in VMware?
Zapto
1
TimeOutValue innerhalb von Fenstern kann erhöht werden, aber es gibt einige Kontroversen darüber. MS sagt, es nicht über 20 Sekunden zu erhöhen, aber ...
Tony Roth
Dies ist eine Neuinstallation. Ich kann beliebige Multipath-Regeln festlegen. Mein Ziel ist es, sicherzustellen, dass ein geplantes oder ungeplantes Clusterübernahmeereignis in Netapp keine VMs offline schaltet oder betäubt.
Basil
Sind Sie besorgt über Pfad-Failover?
ewwhite
Das Pfad-Failover ist nahtlos. Wenn Sie eine Fabric oder einen HBA entfernen, greift VMWare problemlos auf die LUN auf dem anderen Pfad zu. Ich mache mir mehr Sorgen über den langen CF-Übernahmevorgang, bei dem ein Netapp-Knoten die Identität des anderen annimmt. Normalerweise ist es schnell, kann aber bis zu 180 Sekunden dauern.
Basil

Antworten:

7

Hauptsächlich möchten Sie sicherstellen, dass Ihre VMs ohne Festplatten-E / A in Ordnung sind. Durch die Installation der VMware-Tools wird dies mit 4.x und höher erledigt. Sie möchten auch die richtigen Einstellungen für Timeouts auf Ihren ESX-Hosts vornehmen. Diese finden Sie auf der Netapp-Site in TR-3749

Es spielt wirklich keine Rolle, welches Protokoll Sie für Cluster-Failover verwenden, da die Gäste dasselbe sehen - ihre Festplatten sind für kurze Zeit offline / schreibgeschützt. Dieses Skript kann Ihnen dabei helfen, die von NetApp empfohlenen Einstellungen auf den VMs festzulegen, aber ich bin mir ziemlich sicher, dass die Installation der VMware-Tools dies für Sie erledigt.

Auf der ESX / ESXi-Seite hängt es davon ab, welche Versionen von ESX / OnTap Sie ausführen , aber Sie können diese nicht bearbeiten. Sie können MRU / RR usw. erzwingen, aber nur so werden die Pfade zu den LUNs ermittelt (es sei denn, Sie tun etwas Seltsames beim Umschalten, das so ziemlich festgelegt und vergessen werden sollte). Sie können das Failover selbst nicht beschleunigen. Dies hängt davon ab, wie lange es dauert, bis der Controller gestartet und synchronisiert und dann die Daten im NVRAM wiedergegeben wird. PSP / SATP von VMware & NetApp arbeiten zusammen , um dieses Zeug zu verwalten. Für weitere Informationen können Sie esxcli verwenden, um diese Einstellungen anzuzeigen (und eine begrenzte Anzahl davon zu bearbeiten). Versuchen Sie esxcli storage nmp und esxcli storage san fc Ich persönlich würde mich nicht mit diesem Zeug anlegen, es sei denn, ich hätte ein spezielles Bedürfnis, selbst wenn Sie es schaffen, einige Leistungsverbesserungen herauszuholen, kann dies dazu führen, dass die Kompatibilität mit zukünftigen Versionen usw. beeinträchtigt wird.

Bei den HBAs kommt es darauf an, dass die Warteschlangentiefe die Hauptsache ist. Dies hängt jedoch davon ab, wie Sie Ihre Workload konfiguriert haben. Auf der Filerseite sollten Sie die Warteschlangeneinstellungen nicht ändern müssen, sie sollten sich je nach Arbeitslast anpassen.

Wenn Sie FC verwenden, empfehle ich dringend, zumindest auch NFS auszuprobieren. Dies kann Ihr Leben so viel einfacher machen.

TheFiddlerWins
quelle
Da er auf der grünen Wiese anfängt und Netapps hat, ist NFS der richtige Weg.
Tony Roth
Ich werde die Frage klären. Ich werde die Datenspeicher auf FC-LUNs installieren, die von Netapp bereitgestellt werden.
Basil
Ich würde das wirklich nicht tun, wenn Sie nicht bereits über eine umfangreiche San-Infrastruktur verfügen. Wenn Sie dies tun, haben Sie wahrscheinlich bereits 8 g Glasfaser und möglicherweise noch keine 10ge, was offensichtlich die Dinge ändern würde.
Tony Roth
1
Wir verfügen über eine umfangreiche SAN-Infrastruktur und sind auf FC für VMWare standardisiert. Wir haben keine 10ge. Ich bin wirklich am meisten daran interessiert, was wir tun können, um sicherzustellen, dass ein Cluster-Failover auf FC VMs nicht betäubt.
Basil
1
Standardmäßig wird VMW_PSP_MRU verwendet, um zu entscheiden, welcher Pfad verwendet werden soll (MPIO auf der NetApp-Seite). Auf diese Weise wird festgelegt, welcher Pfad für den Zugriff auf die LUNs verwendet werden soll. Wenn der Controller jedoch ein Failover (oder ein Giveback) durchführt, wie Sie sagten, kann er für eine Weile offline sein. NetApp empfiehlt, den Wert für das Festplatten-Timeout in Windows zu erhöhen (ich glaube, die VMware-Tools erledigen dies bei der Installation für Sie). Dies beschleunigt das Failover nicht, sondern macht das Gastbetriebssystem nur geduldiger, bevor Sie ein BSOD erhalten.
TheFiddlerWins