Soll ich "Raid 5 + Spare" oder "Raid 6" verwenden?

12

Was ist "Raid 5 + Spare" (Auszug aus dem Benutzerhandbuch, Abschn. 4.17.2, S.54 ):

RAID5 + Spare: RAID 5 + Spare ist ein RAID 5-Array, bei dem eine Festplatte als Ersatz verwendet wird, um das System neu zu erstellen, sobald eine Festplatte ausfällt (Abb. 79). Es sind mindestens vier Festplatten erforderlich. Wenn eine physische Festplatte ausfällt, bleiben die Daten verfügbar, da sie aus den Paritätsblöcken gelesen werden. Daten von einer ausgefallenen Festplatte werden auf der Hot-Spare-Festplatte neu erstellt. Wenn eine ausgefallene Festplatte ersetzt wird, wird der Ersatz zum neuen Ersatzlaufwerk. Bei einem Ausfall einer einzelnen Festplatte gehen keine Daten verloren. Wenn jedoch eine zweite Festplatte ausfällt, bevor das System Daten im Hotspare wiederherstellen kann, gehen alle Daten im Array verloren.


Was ist "Raid 6" (Auszug aus dem Benutzerhandbuch, Abschn. 4.17.2, S.54 ):

RAID6: In RAID 6 werden Daten über alle Festplatten verteilt (mindestens vier), und zwei Paritätsblöcke für jeden Datenblock (p und q in Abb. 80) werden auf denselben Streifen geschrieben. Wenn eine physische Festplatte ausfällt, können die Daten von der ausgefallenen Festplatte auf einer Ersatzfestplatte wiederhergestellt werden. Dieser RAID-Modus kann bis zu zwei Festplattenfehler ohne Datenverlust unterstützen. RAID 6 ermöglicht eine schnellere Wiederherstellung von Daten von einer ausgefallenen Festplatte.


Sowohl "Raid 5 + Spare" als auch "Raid 6" sind so ähnlich ... ich kann den Unterschied nicht erkennen.

Wann wäre "Raid 5 + Spare" optimal?

Und wann wäre "Raid 6" optimal "?

Das Handbuch zeigt die verschiedenen Raids mit 5 Sternen. "Raid 5 + Spare" erhält nur 4 Sterne, "Raid 6" 5 Sterne. Wenn ich dem Handbuch blind vertrauen würde, würde ich zu dem Schluss kommen, dass "Raid 6" immer besser ist. Ist "Raid 6" immer besser?

Trevor Boyd Smith
quelle
1
ServerFault hat eine gute Diskussion darüber.
Brian
1
Was auch immer Sie am Ende tun, raiden Sie nur mit einem Raid-Controller, nicht mit dem integrierten Soft-Controller, der mit Ihrem Mobo geliefert wird. Wenn dein Mobo ausgeht, fragst du nach Ärger.
Sound2man
Der Raid wird von einem Hardware-Controller heruntergefahren (lol ich habe zu viele Dinge gegen Software-Raid-Controller gehört).
Trevor Boyd Smith

Antworten:

17

Zusamenfassend:

  • Wenn Sicherheit Ihr Hauptanliegen ist, entscheiden Sie sich für RAID6, da es zwei Laufwerke überleben kann, die gleichzeitig ausfallen. Wenn ein Laufwerk in einer R5 + -Speicheranordnung ausfällt, sind Sie vor einem weiteren Ausfall nicht sicher, bis das Ersatzlaufwerk auf die Geschwindigkeit gebracht wurde, die bei großen Laufwerken einige Zeit in Anspruch nehmen kann (und dies ist bei einem heruntergefahrenen Laufwerk nicht ungewöhnlich für Ewigkeiten, wie zum Beispiel Ihr Ersatzteil, um sich nicht zu drehen, wenn Sie endlich dazu aufgefordert werden).

  • Wenn die Leistung entscheidend ist, wählen Sie 5 + Ersatz, da die Schreibleistung besser ist, wenn sich das Array nicht in einem verschlechterten Zustand befindet. Der Leistungsunterschied zwischen R5 und R6 ist jedoch erheblich geringer als der Unterschied zwischen R5 und anderen Lösungen, wenn Sie eine haben Gute Steuerung (dh einmal, wenn eine Teilblockschreiboperation "zwei / drei gleichzeitige Lesevorgänge, dann Paritätsberechnung, dann zwei / drei gleichzeitige Schreibvorgänge" die meiste Zeit statt "Lese-dann-Lesen (-dann-Lesen) -dann-Parität" ausführt -calc-then-write-then-write (-then-write) ", was einige sehr billige Controller und Software-RAIDs tun können.

Bearbeiten: Ich habe beim ersten Mal einen potenziell wichtigen Punkt verpasst:

  • Wenn der Stromverbrauch ein Problem darstellt, hat R5 + Ersatz einen zusätzlichen Vorteil, wenn Ihr Controller das Ersatzlaufwerk bis zur Verwendung ausgeschaltet hält.
David Spillett
quelle
Am besten geschrieben / prägnant. (Nennt die offensichtlichen Vor- / Nachteile in den ersten beiden Wörtern jedes Aufzählungspunkts ... sehr, sehr gut).
Trevor Boyd Smith
Ich wäre gespannt, wann, wenn überhaupt, der Stromverbrauch eines einzelnen zusätzlichen Laufwerks im Vergleich zu allem anderen im Rechenzentrum / Serverraum / usw. wirklich ein "Problem" sein wird
Warren
Ein einzelnes Laufwerk in einer einzelnen Maschine, wahrscheinlich nicht. Aber in Colo, wo Sie X-Ampere pro Rack bekommen und viel für einen Überschuss bezahlen (oder ein Überschuss ist einfach nicht erlaubt - manchmal, wenn Sie darüber hinweggehen, werden Sie dunkel), kann dies auffallen. Der "verbrauchte" Strom ist ebenfalls ein Doppelschlag: Er wird in Lärm und Wärme umgewandelt, und Sie benötigen am Ende mehr Strom, um die Wärme abzuleiten. Und für einen ganzen Käfig oder einen größeren Satz von Kits summiert sich die Gesamtentnahme eines zusätzlichen Laufwerks pro Recheneinheit bald zu etwas, das ein ausreichend wählerischer Buchhalter möglicherweise bemerkt.
David Spillett
7

RAID 5 + Hot Spare:

  • auf gleicher Controller-Hardware bessere Leistung als RAID 6
  • Sie können nicht 2 Festplatten gleichzeitig verlieren . Wenn Sie eine Festplatte verlieren, gibt es eine Wiederherstellungszeit (mit dem Ersatzlaufwerk), in der Sie keine Redundanz haben . Alles, was in dieser Zeit fehlschlägt, verursacht einen vollständigen Verlust (kurz bevor alles an eine gute Datenrettungsfirma gesendet wird und wirklich $$$$ bezahlt wird)

RAID 6:

  • schlechtere Leistung als RAID 5 (abhängig vom Controller kann es von sehr auffällig bis praktisch keinen Unterschied reichen)
  • Sie können 2 Festplatten gleichzeitig verlieren

Für jedes RAID 5 oder 6 müssen Sie vorsichtig sein, um Festplatten zu verwenden, die nicht aus demselben Produktionslauf stammen. Es kann vorkommen (ich habe es gesehen!), Dass nach einem einzelnen Fehler beim Wiederherstellen die nächste (n) Festplatte (n) aufgrund der erhöhten Belastung ausfällt. Festplatten aus demselben Lauf haben genau dieselbe Firmware und wahrscheinlich sehr ähnliche physikalische Eigenschaften.

Bearbeiten: Was zu wählen

(Dies hängt auch von den Leistungsanforderungen des Servers und dem tolerierbaren Risiko ab.)

Wenn die Serverumgebung für Hardware (Farbe, Klima usw.) sehr gut geeignet ist, ist RAID5 + Hotspare in Ordnung.

Wenn die Umgebung es wahrscheinlicher macht, dass mehr als eine Festplatte innerhalb kurzer Zeit ausfällt (Vibrationen, Feuchtigkeit, Schmutz), wählen Sie RAID 6.

Haben Sie immer auch eine angemessene Sicherung und Testwiederherstellung.

Bearbeiten 2: Anständige RAID-Controller verfügen über eine Bereinigung , die regelmäßig alle Sektoren überprüft.

stricken
quelle
+1 für "eine angemessene Sicherung und Testwiederherstellung". Das ist das ERSTE, was jeder haben sollte, bevor er sich Gedanken über RAID-Level macht.
Warren
3

RAID5 verwendet einen Paritätsstreifen. Es ist erforderlich, die Reed Solomon-Fehlerkorrektur zu berechnen und zwei Streifen für RAID6 gegenüber einem für RAID5 zu schreiben. RAID5 wird für intensive Datenbankanwendungen verwendet, bei denen der Speicher aufgrund der Kosten für RAID10 sehr groß ist. Die RAID5-Kosten variieren zwischen 67% und 94% der Festplattenverfügbarkeit, wobei RAID10 50% beträgt (viel höhere Speicherkosten). Während RAID6 aufgrund der Rotationslatenz eine sehr geringe Leselatenz aufweist, ist RAID6 beim Schreiben zwischen 25 und 31% langsamer die Berechnung der Fehlerkorrektur und das zusätzliche Schreiben des Paritätsbits.

Unter Verwendung der mittleren Zeit zwischen Ausfällen (MTBF) für die Laufwerke beträgt die Wahrscheinlichkeit, dass zwei Laufwerke direkt nacheinander oder gleichzeitig ausfallen, ungefähr (0.1% x 0.1%)*12oder 0.001 x 0.001 * 12; Wenn 1000 Laufwerke ausgeführt werden, verlieren Sie durchschnittlich ~ 1,2 Laufwerke pro Jahr. Etwa alle 8,3 Jahre fallen zwei Laufwerke direkt nacheinander aus. Da es sich bei dem Laufwerksausfall aufgrund der hohen Belastung des Laufwerks während der Wiederherstellung nicht um eine Poisson-Verteilung handelt, ist es wahrscheinlicher, dass in diesem Zeitraum ein Ausfall eines zweiten Laufwerks auftritt, und die Verteilung liegt näher an einer Gamma-Verteilung mit geringfügig höheren Werten nach a Fehler tritt auf.

Unter dem Strich ist die Leistung für RAID5 beim Schreiben und für DB-Anwendungen RAID6 überlegen - weitaus besser. Für eine meist gelesene Anwendung wie einen Webserver spielt dies keine Rolle und Sie sollten RAID6 verwenden. Die Kostenvorteile der Verwendung von RAID5 gegenüber RAID10 sind für großen Speicher enorm. Wenn Sie sich den Overhead leisten können, verwenden Sie RAID10 für Anwendungen mit hoher Festplattenintensität. RAID10 wird immer eine bessere Leistung erbringen.

Das größte Versäumnis ist, dass RAID KEIN Backup ist, sondern eine Möglichkeit, Ausfallzeiten durch Redundanz zu begrenzen. Wenn die Daten kritisch sind, sollten Sie sie sichern (und Ihren Wiederherstellungsprozess testen).

Wenn ein RAID-Array mit 10 2-TB-SAS-Laufwerken ausfällt, kostet die Wiederherstellung Tausende von Dollar und die Wiederherstellung dauert Wochen, wenn dies überhaupt möglich ist.

Alle RAID-Arrays fallen schließlich aus!

Dr. Bombilious
quelle
1

Aus Sicht der Datenintegrität streng genommen, ja. Sie können zwei Laufwerke sicher verlieren, obwohl es ein seltenes Ereignis zu verlieren zwei zusammen kurz von schwerem körperlichem Trauma auf das System.

Finanziell nicht ganz so viel. Das Ersatzlaufwerk kann bis zur Verwendung ausgeschaltet werden, was bedeutet, dass es keinen Strom verbraucht und keinen Verschleiß verursacht.

Und wie immer ist RAID kein Ersatz für einen ordnungsgemäßen externen Backup-Plan.

Ignacio Vazquez-Abrams
quelle
1

Hast du 10 in Betracht gezogen? Wenn Sie genug Festplatten für Raid 6 haben, haben Sie genug, um ein 10-Volume zu erstellen. In den meisten Fällen ist 10 sowohl schneller als auch redundanter (auf Kosten von Speicherplatz).

Joel Coehoorn
quelle
10 unterstützt nur 4 Festplatten. Raid 10 ist also keine Option IMO.
Trevor Boyd Smith
1
@ Trevor Raid 10 unterstützt eine gerade Anzahl von Festplatten> = 4. Wenn Sie Raid 6 ausführen können, können Sie Raid 10 ausführen.
Joel Coehoorn
1

Diese Antworten scheinen falsch zu sein, da sie NUR auf der theoretischen Laufwerksleistung basieren. Wenn Sie einen RAID-Controller mit 1 GB Cache haben, erfolgt der Schreibvorgang (normalerweise unter normaler Last - kein massives, nicht normales Hochlastszenario) aus Sicht des Benutzers oder der Anwendung unmittelbar - er ging in den Speicher und dann in den Speicher 'tatsächliches' Schreiben erfolgt bei der Leistung des Laufwerks.

Das Lesen kann jedoch nicht gefälscht (mit einem Cache beschleunigt) werden, es sei denn, dieselben Daten wurden kürzlich oder gewöhnlich bereits geladen. Raid 6 ist besser zum Lesen und toleranter (2 gegen ein Laufwerk). Raid 5 schreibt langsamer und beim Wiederherstellen sehr langsam.

Während RAID 5 beim eigentlichen Schreiben langsam ist, wird es mit einem guten RAID-Controller ausgeblendet - wobei das Schreiben aus Sicht des Benutzers / der Anwendung im Speicher erfolgt. Raid 5 liest jedoch langsamer als Raid 6, und dies wird mit einem Controller nur verbessert, wenn die Daten bereits geladen wurden oder ein Algorithmus wiederholte Lesevorgänge aufzeichnet. Im wirklichen Leben gewinnt der Raid 6.

Zusammenfassend ist das Schreiben von Raid 5 langsam, aber mit einem guten Controller verborgen, und das macht Raid 5 oder 6 im Grunde gleich mit der "wahrgenommenen" Leistung beim Schreiben (es gibt einige Ausnahmen). Raid 6 liest jedoch schneller und Controller helfen wahrscheinlich nicht bei einer realen Arbeitsbelastung, um die Leseleistung zu verbessern. Fügen Sie nun hinzu, dass Raid 6 zwei Fehler und Raid 5 + 1 nur einen aushalten kann. Es wird einfach, Raid 6 als bessere Option zu wählen: Vergessen Sie nicht, dass der Wiederaufbau von Raid 5 auch sehr langsam ist. Ich habe auch erfahren, dass Raid 6-Laufwerke verwendet werden (also richtig getestet) und fehlerhafte Laufwerke in der Regel sehr schnell ausfallen. Sobald ein Array länger als 30 Tage aktiv ist, hält es in der Regel jahrelang. Ein Hot Spare ist ungetestet und kann tatsächlich sofort ausfallen, wenn es benötigt wird.

Trevor
quelle
0

Dies sind die Fakten des Falles und sie sind unbestritten (von jedem, der weiß, wovon er spricht):

  1. RAID5 + Hotspare ist buchstäblich die schlechteste RAID-Wahl, die Sie treffen können.
  2. RAID10 sollte die Standardauswahl sein, wenn Sie sich um Ihre Daten kümmern (dh Sie sind beispielsweise darauf angewiesen, um Ihr Geschäft am Laufen zu halten).

Wenn Sie alle möglichen RAID-Optionen in Betracht ziehen, ist RAID5 + Hotspare in keinem Fall die beste Wahl, vor allem, wenn Sie über RAID5 + Hotspare verfügen, bedeutet dies, dass Sie über 4 Laufwerke verfügen und mit 4 Laufwerken RAID6 oder sogar RAID6 ausführen können Besser, Sie können RAID10 machen.

Mit 4 Laufwerken erhalten Sie aus allen Auswahlmöglichkeiten den gleichen nutzbaren Speicher (R5 + HS, R6, R10).

Wenn Ihr Ziel die Leistung ist, ist RAID10 RAID5 und RAID6 überlegen.

Wenn Ihr Ziel die Sicherheit ist, sind RAID6 oder RAID10 RAID5 mit oder ohne Hotspare überlegen. Es ist fraglich, welches sicherer ist (6 gegen 10). RAID6 kann 2 Laufwerksfehler erleiden, aber aufgrund nicht behebbarer Lesefehler (UREs) ist es auch möglich, dass ein einzelner Laufwerksfehler in einem RAID6 das gesamte Array zerstört.

RAID10 hat nicht das gleiche Problem mit UREs, da es nicht paritätsbasiert ist. Wenn ein Paritäts-RAID (R5 usw.) ein Laufwerk verliert und dann auf ein URE stößt, geht das gesamte Array verloren. Wenn bei RAID1 oder RAID10 ein Laufwerk verloren geht und dann ein URE auf der Spiegelplatte gefunden wird, geht nur der nicht lesbare Sektor verloren.

Sehen Sie hier für eine detaillierte Erklärung, warum RAID5 ist die schlechteste Wahl . Siehe auch hier für eine Liste der angemessenen RAID - Auswahl nach der Anzahl der Laufwerke . Beachten Sie, dass RAID5 in keinem Fall die beste Wahl ist (unabhängig von Hotspare).

user1594322
quelle
2
Ich stimme dir nicht zu. RAID5 hat seine Verwendung. (zB wenn ein Budget knapp ist und Sie wirklich Speicherplatz benötigen). Und da RAID kein Backup ersetzt, das einen Festplattenfehler überlebt, können Sie bis 17.00 Uhr warten. Dann verlassen die Mitarbeiter das Büro und führen Wartungsarbeiten durch.
Hennes
Es gibt einen Unterschied zwischen "der besten Wahl" und "der besten Wahl, die Sie sich leisten können". RAID5 ist niemals die beste Wahl. Die Leute kommen hierher, um die beste Antwort zu erhalten, und die Leute sollten hier abreisen und wissen, dass RAID5 immer weniger als das Beste ist. Es ist mathematisch nachweisbar, dass RAID0 in einigen Fällen zuverlässiger ist als RAID5. So beängstigend ist RAID5. In vielen Fällen schafft es das RAID5 möglicherweise nicht bis 17 Uhr. Bei RAID5 gibt es einen großen Unterschied zwischen Theorie und realer Welt. Siehe hier
user1594322
Mir ist überhaupt nicht klar, warum Sie sagen, dass ein RAID10 nicht das gleiche Problem mit UREs hat. Wenn Sie bei einem RAID10-Setup mit vier Laufwerken ein Laufwerk verlieren und ein URE auf dem entsprechenden Spiegel haben, sind Sie gleichermaßen abgespritzt.
ChrisInEdmonton
Wenn RAID10 ein ausgefallenes Laufwerk und dann ein URE auf dem überlebenden Laufwerk hat, verlieren Sie nur den unlesbaren Sektor, nicht das gesamte Array. Die Antwort wurde aktualisiert.
user1594322