Ist RAID 1 auf Amazon EBS-Laufwerken in Bezug auf Zuverlässigkeit übertrieben?

7

Ich denke dahinter, dass RAID 1 zwei oder mehr Kopien der Daten auf mehreren EBS-Laufwerken erstellt. Sind Amazon EBS-Festplatten nicht praktisch ausfallsicher, weil sie auf mehreren physischen Laufwerken gespeichert sind? In Bezug auf die Zuverlässigkeit gewinnen Sie also nicht viel, wenn Sie RAID 1 hinzufügen. Ist das richtig oder sind meine Fakten falsch? Mir ist klar, dass Sie mit RAID 1 wahrscheinlich immer noch Vorteile für die Leseleistung erzielen würden.

Sameer Parwani
quelle

Antworten:

4

Hinter der Abstraktion sind die Laufwerke bereits redundant. Es ist in Ordnung, sie aus Geschwindigkeitsgründen in RAID 0 auszuführen. Optimal ist die Verwendung der Snapshot-Funktionalität für Backups. Bei RAID kann dies erreicht werden, indem das RAID heruntergefahren oder die Volumes eingefroren, Snapshots erstellt und die Laufwerke wieder normal verwendet werden. Alternativ können Sie die Daten auf ein einzelnes EBS-Volume schreiben und Snapshots erstellen, die auch andere Probleme abdecken können, z. B. Instanzfehler, bei denen die RAID-Laufwerke möglicherweise in einem inkonsistenten Zustand bleiben, selbst wenn sie erneut angeschlossen werden.

TL: DR; Die Verwendung von RAID 1 ist übertrieben, um sich besser auf andere Fehler vorzubereiten, die mit robusten Backups auftreten können

Flash-Mann
quelle
2
Danke für die Antwort. Ich habe vergessen, dies mit den Ergebnissen meiner Forschung zu aktualisieren. Grundsätzlich habe ich gesucht, dass es tatsächlich eine jährliche Ausfallrate von 0,5-1% für diese EBS-Laufwerke gibt. Daher können Sie sich nicht auf die Redundanz verlassen, die Amazon bietet. Sie können sich jedoch auch nicht auf die Verwendung von RAID 1 verlassen, da der Ausfall von zwei EBS-Laufwerken viel weniger unabhängig voneinander ist als bei einem typischen dedizierten Server. Wie Sie bereits erwähnt haben, besteht die beste Lösung (neben regulären Backups) darin, häufige Schnappschüsse zu erstellen,
Sameer Parwani
18

Ja, EBS ist im Back-End fehlertolerant, aber EBS-Fehler treten auf unerwartete Weise auf. Was Sie nicht sehen, ist die Art von Fehler, an die die meisten von uns gewöhnt sind - das Laufwerk läuft schlecht und fällt einfach sofort aus. Der häufigste Fehler ist eine enorme und unvorhersehbare Erhöhung der Latenz, die dazu führen kann, dass Ihre Anwendung nicht mehr reagiert. Mit RAID1- oder RAID 10-Sets können Sie das problematische Laufwerk einfach aus dem Array entfernen und es ohne Ausfallzeit durch ein neues ersetzen.

Erinnern Sie sich an ec2pocolypse vor ein paar Monaten, als ein großer Prozentsatz der EBS-Volumes nicht mehr reagierte. Diejenigen von uns, die RAID10-Sets hatten, konnten sich leicht erholen, indem sie ein Laufwerk ausfielen oder erzwangen, es mit der API zu trennen. Diejenigen, die dies nicht taten (ich sehe dich an, reddit), mussten nur knapp eine Woche Ausfallzeit durchstehen.

Wenn Sie sich tatsächlich um Ihre Daten kümmern, sollten Sie sie unter keinen Umständen RAID0. Auf diese Weise erhöhen Sie Ihre Ausfallwahrscheinlichkeit und verringern gleichzeitig Ihre Fähigkeit, sich von diesem Fehler zu erholen. Snapshotting ist großartig, aber wenn Sie Ihre Binärprotokolle nicht (zum Beispiel) streamen, können Sie keine Wiederherstellung zu einem bestimmten Zeitpunkt durchführen. Wenn Sie im E-Commerce tätig sind, sind die Leute verärgert, wenn sie für etwas bezahlen, das nicht versendet wird, weil es keine Aufzeichnungen mehr in der Datenbank gibt.

Ich habe kürzlich über RAID10 EBS geschrieben, nachdem ich einen weiteren Erfolg von EBS RAID erlebt habe: http://blog.9minutesnooze.com/raid-10-ebs-data/

Die Frage ist ... wem vertrauen Sie Ihre Daten mehr an? Amazonas? oder du selbst?

Aaron Brown
quelle
Gibt die Spiegelung in RAID10 nicht die doppelte Leseleistung auf? Da die Lesevorgänge gleichmäßig auf die zugrunde liegenden EBS-Volumes verteilt werden?
Nic Cottrell
Ich frage mich, ob die enormen Latenzzeiten durch einen Festplattenfehler verursacht werden, bei dem ein Failover
rogerdpack
Wenn Sie dies nur klarstellen, würden Sie RAID 1 im Falle eines Laufwerks für hauptsächlich MySQL-Daten (oder bessere Optionen) empfehlen. (sowie Schnappschüsse usw.)
Ian