EMC ScaleIO gegen Starwind Virtual SAN

7

Ich richte ein Testlabor ein, um die beste Lösung für die zukünftige Verwendung in der Produktion zu bewerten. Die Produktionsfarm ist für ein KMU vorgesehen, daher ist das Budget vorhanden, aber es ist auch begrenzt.

Produktionsziel : 3 hyperkonvergente Server mit Windows Server 2012 R2-Failover-Virtualisierungscluster und Software Defined Storage-Lösung als gemeinsam genutztem Speicher. Kurzfristig wird der Cluster auf insgesamt 5 Server erweitert. Das SAN-Netzwerk ist dediziert.

Ziel für das Testlabor : Finden Sie eine SDS-Lösung, die die folgenden Kriterien erfüllt:
1. Bietet gemeinsam genutzten Speicher für Hyper-V-Cluster.
2. Scale-Out: Kann Datenträger (und vorzugsweise auch Knoten) hinzufügen und entfernen, ohne den Cluster herunterzufahren.
3. Fehlertolerant. Verfügbar nach Verlust von 1 Knoten (wenn nach Verlust von 2 Knoten wiederherstellbar - es ist großartig!).
4. Geringer Netzwerk-Overhead / Latenz (wird auch für SQL Server verwendet).
5. Haben Sie angemessene Preise (Storage Spaces Direct ist aus diesem Grund nicht akzeptabel).

Nachdem ich einige Produkte gelesen und angesehen habe, ist meine Shortlist EMC ScaleIO und Starwind Virtual SAN.

Ich habe beide ausprobiert und festgestellt, dass Starwind VSAN nur eine begrenzte HA-Kapazität bietet: Nach meinem Verständnis spiegelt diese Lösung nur die virtuelle Festplatte (nämlich eine Datei) über Knoten hinweg und ermöglicht nur die Erweiterung der Kapazität innerhalb der Grenzen der Hosting-Festplatte. Im Gegensatz dazu verteilt ScaleIO Daten auf mehrere Knoten und ermöglicht das Hinzufügen neuer Speicher- und Neuausgleichsvolumes .

Meine Fragen sind also:

  • Sind meine Annahmen korrekt oder ermöglicht Starwind VSAN das Erstellen eines HA-Volumes auf mehreren Festplatten in jedem Knoten und das spätere Hinzufügen von Festplatten?
  • Welche Lösung ist Ihrer Meinung nach für meine Bewerbung besser (bitte erläutern)?
  • Was sind die Nachteile einer empfohlenen Lösung?

Vielen Dank im Voraus!

Eugene
quelle

Antworten:

8

Hier gibt es weder gut noch schlecht: Beide ref'd-Lösungen unterscheiden sich nur in der Art und Weise, wie sie skaliert werden, wie sie Daten auf Clusterknoten verteilen und wie sie mit Komponentenfehlern umgehen.

1) Breites Striping gegenüber Datenlokalität. SIO führt das sogenannte "Wide Striping" durch: Die Volumendaten auf allen Clusterknoten (wie bei VMware VSAN und HPE VSA) werden mehr oder weniger gleichmäßig gespeichert, während StarWind sich um die so genannte "Datenlokalität" kümmert (auf die gleiche Weise wie Nutanix NDFS und SimpliVity / HPE do) und speichert Daten über eine begrenzte Anzahl von "Partnern". Für beide Ansätze gibt es tatsächlich Vor- und Nachteile.

http://www.vmware.com/content/dam/digitalmarketing/vmware/en/pdf/products/vsan/vmware-virtual-san-data-locality.pdf

https://www.nutanix.com/2013/12/03/data-locality-sql-vdi-on-the-same-nutanix-cluster/

https://www.simplivity.com/blog/2016/05/importance-data-locality/

https://www.starwindsoftware.com/data-locality-page

2) Einzelner einheitlicher Adressraum gegenüber virtuellen Festplatten. SIO kann zwar einen einzigen einheitlichen Adressraum erstellen, aber in Wirklichkeit handelt es sich um eine nutzlose (zumindest! Schlechte Idee!) Funktion in Ihrer Umgebung: Microsoft / Hyper-V benötigt also mindestens eine CSV / virtuelle LUN pro Clusterknoten In Ihrem Fall ist die optimale Anzahl virtueller LUNs dieselbe und spielt keine Rolle, ob Sie SIO oder StarWind verwenden.

https://technet.microsoft.com/en-us/library/jj612868%28v=ws.11%29.aspx

https://www.petri.com/how-many-csvs-should-a-scale-out-file-server-have

https://blogs.msdn.microsoft.com/clustering/2013/12/02/cluster-shared-volume-csv-inside-out/

3) Anzahl der Knoten und Fehlertoleranz. SIO ist Ceph hier sehr ähnlich: Es benötigt ziemlich viele Knoten (8-10), um eine angemessene Leistung zu erzielen (dank "Wide Striping"). Stellen Sie außerdem sicher, dass Sie verstehen, dass SIO nur Replikation ist und die endgültige Kapazität (N-1) / 2 ist, sodass Sie mit fünf Knoten eine Kapazität von 2 Knoten erhalten, die mit einer 2-Wege-Replikation verwendet werden kann und nur einen Knoten verlieren kann (N + 1). StarWind verwendet eine Kombination aus einem Replikations- und einem lokalen Rekonstruktionscode (Löschcodierung), um dank der mehreren Fehlerdomänen mehrere Fehler gleichzeitig zu überstehen. Es gibt nicht nur einen knotenübergreifenden Replikationsschutz, sondern auch einen lokalen "RAID" -ähnlichen Schutz Art und Weise SimpliVity und ähnlich wie Microsoft in Azure / S2D.

https://www.emc.com/collateral/white-papers/h15148-emc-scaleio-deployment-guide.pdf

https://www.simplivity.com/blog/2016/10/data-storage-built-resiliency/

https://www.microsoft.com/en-us/research/publication/erasure-coding-in-windows-azure-storage/

https://www.starwindsoftware.com/grid-architecture-page

TL; DR: Im Allgemeinen würde ich vorschlagen, einen POC für die beiden Shortlist-Kandidaten zu erstellen und zu sehen, wie gut alles läuft.

BaronSamedi1958
quelle
1
Danke, Baron! Sie haben mir einige gute Punkte zum Nachdenken gegeben. Tolle Links auch! Ging lesen.
Eugene
1
Wenn ich Ihre Aussage unter 2) richtig verstehe, ist das Erstellen einer CSV pro Knoten dazu gedacht, die Weiterleitung des Datenverkehrs vom VM-Eigentümerknoten zum CSV-Eigentümerknoten zu verringern? Hab ich recht?
Eugene
2
Ja absolut. VMFS3 / 5 ist ein geeignetes Cluster-Dateisystem und NTFS / ReFS mit einem CSVFSv1 / v2-Bolt-On nicht. Während Datenübertragungen direkte Blockierungen sind (zumindest sollten es ...), werden Metadaten übertragen werden immer über SMB3 umgeleitet.
BaronSamedi1958
2
Führt diese Umleitung zu einer erheblichen Belastung des Netzwerks und der Knoten? Ist es am besten, es in einer Umgebung oder nur in einer Hochleistungsumgebung zu vermeiden?
Eugene
1
Es ist nicht so viel in Bezug auf die zugewiesene Bandbreite, aber es ist riesig, wenn Sie nach einer geringen NVMe-Latenz suchen: Dies sind zusätzliche Hops und Koordinationssperren / -sperren.
BaronSamedi1958
6

Die kurze Antwort lautet: Beide Lösungen erfüllen Ihre Anforderungen .

Wie bereits im vorherigen Poster erwähnt, funktionieren sie nur anders.

Wenn Sie mehr über die Vor- und Nachteile jeder Lösung erfahren möchten, wenden Sie sich einfach an beide Anbieter und fragen Sie deren Pre-Sales-Techniker nach allem, was Sie wissen möchten. Stellen Sie danach einen PoC bereit und überprüfen Sie, was Ihnen gesagt wurde.

Strepsils
quelle