Was ist besser: RAID5 + 1 Hotspare / RAID6? [geschlossen]

45

Nur neugierig, ich habe 6 x 1 TB 7200 U / min Near Line SAS für meinen neuen Server. Ich kann es entweder als RAID5 + 1 Hot Spare oder RAID6 konfigurieren.

Was soll ich wählen?

Raubvogel
quelle
1
Ich spekuliere, dass in 5 Jahren viele Leute fragen werden, was RAID ist. Es wird sehr bald zur Tür hinausgehen, aber für heute immer noch relevant.
Matt
1
Also, weil viele Leute Meinungen anstelle von Tatsachen äußern, schließen wir das Thema und lassen nicht zu, dass die Tatsachen besprochen werden? Das scheint falsch zu sein. Es gibt eine harte Mathematik, die zeigt, warum RAID 6 für die Sicherheit, die Kapazität und die Beeinträchtigung der Geschwindigkeit besser ist. Keine Meinung dazu.
Scott Alan Miller

Antworten:

36

Sie haben bei jedem Ansatz Nachteile und Vorteile. Es hängt davon ab, warum Sie RAID verwenden. Die meisten Leute nutzen es für die Verfügbarkeit. Sie möchten nicht, dass ein Laufwerk ausfällt und das System oder der Server heruntergefahren werden muss. In diesem Fall verwenden Sie RAID 5 nicht. Ich habe es auf die harte Tour gelernt und bei jeder RAID-bezogenen Frage, mit der ich mich mit SF befasse, auf den Punkt gebracht.

Warum? Da die Laufwerke immer größer werden, besteht eine größere Toleranz für nicht behebbare Lesefehler. Wir hatten es geschafft und es ist nicht das, was Sie während eines Umbaus entdecken möchten. Szenario: RAID-System mit 3 Laufwerken. Wir haben einen Alarm auf unserem Dell mit einer Hardware-PERC-Karte erhalten, die Laufwerk C nicht mehr unterstützt. Neues Laufwerk bestellen, austauschen, kein Problem. In der Mitte des Wiederaufbaus starb es.

Laut Diagnose gab es auf Laufwerk B einen "Bad Spot". Das System hatte auf diesem Laufwerk wiederholt einen unbeaufsichtigten Fehler, und jetzt, da die Daten neu erstellt wurden, konnte es diesen Spot nicht lesen, egal wie oft Wir haben die Reparatur sogar direkt vom Controller aus ausgeführt und jedes Mal, wenn wir sagten, dass alles repariert war, wurde sie nicht wiederhergestellt. Wir haben also ein unbenutztes Laufwerk und ein Laufwerk, das nicht von einer Stelle gelesen werden konnte. Am Ende ersetzen wir zwei Laufwerke und stellen sie aus dem Backup wieder her.

Lektion: RAID ist kein Backup und RAID 5 ist keine Verfügbarkeitsoption mehr für größere Laufwerke.

Wenn Sie die Geschwindigkeit erhöhen oder die Speichergröße erhöhen möchten, können Sie dies in Ihre Entscheidung einfließen lassen. Sie müssen Ihre Anforderungen in Bezug auf Ihre Anforderungen und Ziele definieren und nicht in Bezug auf "Ich benötige RAID, welches verwende ich?".

Bart Silverstrim
quelle
1
Laufwerke, die für RAID-Vorgänge vorgesehen sind, können ihre Fehlerkorrektur in der Regel sehr schnell nicht durchführen und melden den Fehler an den Controller. Die Idee ist, Situationen wie oben beschrieben zu vermeiden - der fehlerhafte Block wird neu zugeordnet und die Daten werden aus der Parität wiederhergestellt, anstatt dass die Festplatte als fehlerhaft markiert wird, da sie 45 Sekunden lang "hängt" und versucht, diesen Block wiederherzustellen. Western Digital hat sogar ein Hilfsprogramm, mit dem das Fehlerbehebungsverhalten der Festplatten geändert werden kann, obwohl das Hilfsprogramm nicht "offiziell" veröffentlicht wurde.
Chris
7
Ich konnte dem Argument nicht folgen. Wollen Sie damit sagen, dass Sie RAID 6 oder RAID 5 verwenden?
Martin
@martin: Ich kommentiere die Besorgnis, dass bestimmte Arten von Festplattenfehlern je nach dem Zieldesign der Festplatte unterschiedlich behandelt werden. Martin beschrieb einen Multi-Disk-Fehler als Ergebnis einer "fehlerhaften Stelle" auf einer Festplatte, die unter bestimmten Umständen keinen vollständigen Array-Neuaufbau verursachen kann (und sollte). Bei der Wiederherstellung des Arrays ist ein anderer Datenträger ausgefallen, was zu einem schlechten Tag führte.
chris
@chris - Entschuldigung für die Verwirrung - Ich habe Ihren Kommentar nicht kommentiert. (Es war nicht da, als ich gepostet habe.) Meine Frage richtete sich an Bart: Ich konnte nicht herausfinden, ob RAID 5 ein Muss ist oder ob RAID 5 nicht ausreicht und nur RAID 6 dies tun würde.
Martin
2
@ Chris-ich weiß nicht mehr, wie die Differenzierung aussehen würde, aber PERCs basieren auf Hardware, integriertem Cache, integrierten Verwaltungstools, Hot-Swap usw., und während Dell nicht unbedingt zehn Riesen für die Server berechnet, sind sie fair beliebt im Unternehmensumfeld. Die Laufwerke sollen Fehler melden; So erhalten Sie Fehlermeldungen und Warnungen. Aber UREs passieren mit Laufwerken, und sie scheinen sich dessen erst bewusst zu sein, wenn sie so etwas wie ... oh ... das Wiederherstellen eines Arrays tun. Dann plötzlich "Hey! Es gibt auch hier ein Problem!"
Bart Silverstrim
16

Verwenden Sie RAID6. Lesen Sie "Warum RAID 6 2019 nicht mehr funktioniert" von Robin Harris auf ZDNet.

zerrissen
quelle
4
Und was ist nach 2019?
Mat
2
@Mat Hi aus dem Jahr, in dem RAID 6 nicht mehr funktioniert. ;-) Das hätte eigentlich in dem Artikel stehen sollen, aber Sie müssen sich mit Löschcodierung befassen , die normalerweise mit polynomialer Überabtastung über GF (256) implementiert wird . Dies bedeutet, dass (fast) beliebige Redundanzstufen verwendet werden können, z. B. 9 + 3 oder 12 + 4. Der Hauptnachteil ist, dass es viel rechenintensiver ist als die RAID 6- oder sogar RAID 5-Paritäten.
Arne Vogel
9

RAID 5 sollte niemals mit einem Hot-Spare (Warm-Spare) existieren. RAID 6 ist immer eine bessere Verwendung der gleichen Laufwerksanzahl.

http://www.smbitjournal.com/2012/07/hot-spare-or-a-hot-mess/

Die RAID 5-Lösung bietet keinen Platz- / Kapazitätsvorteil oder Kostenvorteil (aber einen kleinen Leistungsvorteil), aber sie verringert das URE-Risiko erheblich.

Scott Alan Miller
quelle
3
RAID-6 ist wesentlich langsamer als RAID-5 + ein Ersatzlaufwerk. RAID-6 ist nicht immer besser.
Stefan Lasiewski
2
RAID-5 (oder RAID-6) mit einem Ersatzlaufwerk kann aus Sicht der Laufwerkanzahl durchaus sinnvoll sein, wenn Sie mehr als einen Stripe haben, der ein einzelnes Ersatzlaufwerk gemeinsam nutzen kann. Das erlaubt Resilvering sofort beginnen , wenn ein Laufwerk ausfällt, und das ausgefallene Laufwerk ersetzt so schnell wie möglich , aber wenn bequem , statt Scrambling das ausgefallene Laufwerk zu ersetzen , bevor es einen weiteren Ausfall ist.
ein Lebenslauf vom
2
RAID 6 ist schneller beim Lesen und langsamer beim Schreiben. Aber nur wenn zufällig. Sequentiell ist es auf beiden schneller. Aber der Sicherheitsunterschied ist episch, ein Unterschied in der Größenordnung. Fügen Sie einen Schreibcache hinzu, wie es bei jedem Business-Class-Hardware-RAID der Fall ist, und die zufälligen Schreibvorgänge bei RAID 6 nehmen dramatisch ab. Es ist sehr selten, dass R6 langsamer als R5 ist, da es die zusätzliche Spindel hat.
Scott Alan Miller
Das sofortige Resilven ist tatsächlich die Gefahr, da es die Resilver-Operation ist, die das Array am meisten gefährdet. R6 mit einem Hot-Spare unterscheidet sich grundlegend von R5 mit einem Hot-Spare. R5 mit einem Ersatzlaufwerk sollte niemals existieren, da Sie dasselbe Laufwerk in R6 verwenden, aber die Geschwindigkeit und Zuverlässigkeit steigern. Resilver ist nicht erforderlich, der Schutz ist bereits vorhanden, ohne dass das URE-Risiko der Resilver-Operation besteht.
Scott Alan Miller
6

Das ist ganz einfach - möchten Sie mehr verfügbaren Speicherplatz oder die Fähigkeit, fehlerhafte Festplatten zu überleben? So einfach ist das.

Ich werde also einige wilde Annahmen machen - dass Sie sich nicht für die Leistung interessieren, da es sich um 7,2 handelt, und dass Sie sich für den verfügbaren Speicherplatz interessieren, da es sich um 1-TB-Festplatten handelt - Sie erwähnen nicht, welche Art von Daten Sie möchten zu speichern, aber ich gehe davon aus, es ist entweder nur Videodateien oder eine Kombination aus Video und Audio. Wenn ich Recht habe, würden Sie vermutlich Schwierigkeiten haben, die Daten zu ersetzen? In diesem Fall würde ich weder 5 noch 6 wählen, sondern R10 wählen. Ja, Sie verlieren 1 TB gegenüber R6 und 2 TB gegenüber R5, aber es ist schneller und überlebt drei Festplatten, die kaputt gehen. Wenn ich mich irre und Sie Ihre Daten schnell wiederherstellen können, können Sie auch R5 verwenden, um den bestmöglichen Speicherplatz zu erhalten.

Chopper3
quelle
1
"Ja, Sie verlieren 1 TB über R6 und 2 TB über R5, aber es wird schneller und kann drei Festplatten überleben, die platzen." - Das ist, wenn Sie Glück haben; Im schlimmsten Fall überleben Sie nicht mehr als einen Laufwerksausfall (wenn sich das zweite im selben RAID-1-Paar wie das erste befindet). Wenn ich mich bei 1, 2, 3 und 4 Laufwerksausfällen nicht irre, ist die 'naive' kumulative Wahrscheinlichkeit, auf ein Backup zurückgreifen zu müssen, 0, 1/5, 3/5, 1 (die Zahl Null) Begriffe sind die Anzahl von Laufwerksausfällen, die sicher toleriert werden können. Bei RAID 6 ist es 0, 0, 1, was etwas einfacher zu handhaben ist, und Sie verlieren nicht dieses zusätzliche Terabyte.
James Haigh
2
Du hast Recht, James, die Dinge haben sich in den letzten FÜNF JAHREN geändert (OMG, das ist lange her - wow!) Und jetzt empfehle ich nur noch R6 / 60 und R1 / 10.
Chopper3
4

Während Leistung ein Anliegen ist, ist es nicht so ein Anliegen, wie Sie denken. Neuere RAID-Hardware wird 2 Paritätsstreifen genauso schnell schreiben wie 1 Streifen.

Außerdem weisen SAS-Laufwerke normalerweise eine niedrigere Bitfehlerrate auf, was sich in einem niedrigeren URE (Unrecoverable Read Error) niederschlägt. In der Regel eine Größenordnung (10x). Wenn das SAS-Laufwerk dasselbe Modell wie ein SATA-Laufwerk ist, ist möglicherweise keine Verbesserung festzustellen.

Was schließlich die Frage nach RAID-5 und UREs betrifft und wie das Ihren Tag ruinieren kann, habe ich vor einiger Zeit einen Artikel darüber geschrieben: http://subnetmask255x4.wordpress.com/2008/10/28/sata- nicht behebbare-fehler-und-wie-das-wirkt-sich-auf-raid / aus, in dem ich einige dieser fragen behandle Grundsätzlich sollte RAID-6 auf guter Hardware (nicht Software-RAID) die gleiche Leistung wie RAID-5 aufweisen. Wenn Sie eine schlechte Hardware haben oder Software-RAID verwenden, wird die Leistung beeinträchtigt.

Backups sind wie immer Ihre Rettung. Vergessen Sie nicht, eine Sicherungsrichtlinie zu implementieren UND sicherzustellen, dass sie wiederhergestellt werden kann.


quelle
2
Wow, ich glaube, ich war überall mit diesem Ding beschäftigt. Was ich damit sagen wollte, ist, dass bei Ihren Laufwerken, wenn Sie einen guten Hardware-RAID-Controller haben, RAID 6 keine Nachteile gegenüber RAID 5 mit einem Ersatzlaufwerk (+1) hat. Wenn Sie jedoch keinen guten Hardware-RAID-Controller haben, sehen Sie langsamere Lese- und Schreibvorgänge, wobei die Schreibvorgänge etwas langsamer sind als die Lesevorgänge. Wenn Sie nur Software-RAID verwenden, sehen Sie einen langsameren Lesevorgang und deutlich langsamere Schreibvorgänge. Gute Hardware - RAID 6; Schlechte Hardware - RAID 6 mit Leistungseinbußen; Nur Software - RAID 5 (+1) und viel beten.
3

Viele gute Ratschläge, insbesondere von Bart und Chopper3.

Das Einzige, was ich hinzufügen möchte, ist , Ihre Workload unter einer Fehlerbedingung zu testen . Normalerweise richten Benutzer ein RAID-5 / RAID-6 ein, um Verfügbarkeit zu erwerben (dh der Server fällt aufgrund eines Festplattenausfalls nicht aus). Leider stellen Sie bei einigen Workloads - insbesondere bei schreibintensiven Workloads - möglicherweise fest, dass die Leistung so stark beeinträchtigt ist, dass Sie nicht viel kaufen.

Wenn Ihre Tests erfolgreich sind, vergessen Sie nicht, eine Sicherungsstrategie zu entwickeln und zu testen.

duffbeer703
quelle
2

Ich denke, RAID 5 vs. 6 (und vs. 10) hängt von der Leistung ab und davon, wie sehr Sie der (den) Marke (n) von Laufwerken vertrauen, die Sie verwenden. Wir verwenden hauptsächlich HP Server und HP Speicher und hatten nur sehr wenige Festplattenfehler. Daher bin ich mit RAID5 + Hotspare oder sogar RAID5 auf weniger kritischen Systemen zufrieden.

Theoretisch erspart Ihnen RAID6 einen zweiten Laufwerksausfall, während ein erstes ausgefallenes Laufwerk wiederhergestellt wird, aber Sie müssen dies gegen die erhöhten Berechnungen abwägen, die erforderlich sind, um zwei verschiedene Paritätsstreifen zu generieren. Wir haben 6 nicht verwendet, daher habe ich mir noch nie angesehen, wie schnell ein RAID6-Array im Vergleich zu RAID5 wiederhergestellt werden kann, aber ich gehe davon aus, dass 6 länger dauert, da 2 Paritätsberechnungen erforderlich sind, nicht nur eine.

Wenn ich mich von RAID5 entfernen würde, würde ich wahrscheinlich 10 (oder 01) wählen, um mich von den Paritätsberechnungen insgesamt zu lösen. Mit 6 Laufwerken könnten Sie das tun, obwohl Sie nur die Hälfte der Kapazität netto.

Wird
quelle
2

RAID6. Wenn auf diese Weise zwei Festplatten relativ schnell hintereinander ausfallen und die Wiederherstellung des Arrays nach dem ersten Ausfall noch nicht abgeschlossen ist (oder zwei Festplatten nach einem Stromausfall nicht hochgefahren werden), gehen nicht alle Daten verloren.

xenny
quelle
1

Raid6 hat mehr Overhead, sodass Raid5 als solches auf der gleichen Anzahl von Laufwerken schneller ist. Auf der anderen Seite können Sie den Vorteil verlieren, wenn eine Festplatte stirbt und das rai5 neu erstellt wird. Es besteht die Gefahr, dass Sie das Array verlieren, wenn ein anderes Laufwerk während der Wiederherstellung stirbt.

In Ihrem Fall führen Sie raid5 vs 6 mit einer anderen Anzahl von Spindeln aus, sodass raid6 aufgrund der zusätzlichen Spindel möglicherweise schneller ist.

dyasny
quelle
1

Gute Antworten, außer dass niemand die Schreibleistung erwähnt hat. Bei RAID 6 ist die Leistung beim Schreiben im Vergleich zu RAID 5 in der Regel leicht beeinträchtigt, da zwei Paritätsstreifen beibehalten werden müssen.

Für die meisten lohnt es sich jedoch, sich für RAID 6 zu entscheiden.

kmarsh
quelle