Richtlinien für die maximale Anzahl von Festplatten in einem RAID-Set?

13

In allen RAID-Levels, die Striping verwenden, erhöht das Erhöhen der Anzahl der physischen Datenträger in der Regel die Leistung, erhöht jedoch auch die Wahrscheinlichkeit, dass eine der Datenträger im Satz ausfällt. Ich habe die Idee, dass ich nicht mehr als 6-8 Festplatten in einem bestimmten RAID-Set verwenden sollte, aber das ist mehr nur überliefertes Wissen und keine harte Tatsache aus Erfahrung. Kann mir jemand gute Regeln mit Gründen für die maximale Anzahl von Festplatten in einem Satz geben?

kbyrd
quelle

Antworten:

10

Die empfohlene maximale Anzahl von Festplatten in einem RAID-System ist sehr unterschiedlich. Es hängt von einer Vielzahl von Dingen ab:

  • Festplattentechnologie SATA toleriert kleinere Arrays als SAS / FC, dies ändert sich jedoch.
  • RAID-Controller-Grenzen Der RAID-Controller selbst kann grundlegende Maximalwerte aufweisen. Wenn es SCSI-basiert ist und jeder sichtbare Datenträger eine LUN ist, gilt die 7/14-Regel. Wenn es auf FibreChannel basiert, können bis zu 120 oder mehr sichtbare Datenträger vorhanden sein.
  • RAID-Controller-Prozessor Wenn Sie sich für Paritäts-RAID entscheiden, ist die CPU auf der RAID-Karte die Begrenzung dafür, wie schnell Sie Daten schreiben können. Es wird ein grundlegendes Maximum für die Karte geben. Sie sehen es, wenn ein Laufwerk in einer RAID5 / 6-LUN ausfällt, da der Leistungsabfall alle LUNs betrifft, die der RAID-Karte zugeordnet sind.
  • Die Busbandbreite von U320 SCSI hat ebenso wie FibreChannel eigene Grenzen. Wenn RAID-Mitglieder bei SCSI auf verschiedenen Kanälen bleiben, kann dies die Parallelität und die Leistung verbessern, sofern der Controller dies unterstützt.

Für SATA-basiertes RAID möchten Sie nicht mehr als 6,5 TB Raw-Festplatte haben, wenn Sie RAID5 verwenden. Vorbeigehen als und RAID6 ist eine viel bessere Idee. Dies liegt an der nicht behebbaren Lesefehlerrate. Wenn die Größe des Arrays zu groß ist, steigt die Wahrscheinlichkeit, dass während der Wiederherstellung des Arrays nach einem Verlust ein nicht behebbarer Lesefehler auftritt. Wenn das passiert, ist es sehr schlimm. RAID6 reduziert dieses Risiko erheblich. Da sich die Qualität von SATA-Laufwerken in letzter Zeit jedoch verbessert hat, wird dies möglicherweise nicht mehr lange so bleiben.

Die Anzahl der Spindeln in einem Array beunruhigt mich nicht sonderlich, da es ziemlich einfach ist, mit 500-GB-Laufwerken auf U320 auf 6,5 TB zu kommen. In diesem Fall ist es ratsam, die Hälfte der Laufwerke auf einen Kanal und die Hälfte auf den anderen Kanal zu legen, um die E / A-Konflikte auf der Busseite zu reduzieren. Bei SATA-2-Geschwindigkeiten können bereits zwei mit maximaler Geschwindigkeit übertragene Festplatten einen Bus / Kanal überlasten.

SAS-Festplatten haben eine niedrigere MTBF-Rate als SATA (dies beginnt sich wieder zu ändern), sodass die Regeln dort weniger streng sind.

Es gibt FC-Arrays, die intern SATA-Laufwerke verwenden. Die RAID-Controller dort sind sehr ausgereift, was die Faustregeln trübt. Beispielsweise gruppiert die HP EVA-Reihe von Arrays Festplatten in „Festplattengruppen“, auf denen LUNs angeordnet sind. Die Controller platzieren Blöcke für die LUNs absichtlich an nicht sequenziellen Orten und führen eine Lastnivellierung für die Blöcke hinter den Kulissen durch, um Hotspotting zu minimieren. Das heißt, dass sie einen Großteil der Last in Bezug auf Mehrkanal-E / A, an einer LUN beteiligte Spindeln und den Umgang mit Redundanz für Sie erledigen.

Zusammenfassend lässt sich sagen, dass die Ausfallraten für Festplatten nicht die Regeln für die Anzahl der Spindeln in einer RAID-Gruppe bestimmen, sondern die Leistung. Hauptsächlich.

sysadmin1138
quelle
3

Wenn Sie nach Leistung suchen, ist es wichtig, die Verbindung zu kennen, die Sie zum Anschließen der Laufwerke an das Array verwenden. Für SATA oder IDE wird jeweils 1 oder 2 pro Kanal angezeigt (vorausgesetzt, Sie verwenden einen Controller mit unabhängigen Kanälen). Bei SCSI hängt dies stark von der Bustopologie ab. Frühe SCSI-Versionen hatten ein Gerätelimit von 7 Geräte-IDs pro Kette (alias pro Controller), von denen eine der Controller selbst sein musste, sodass Sie 6 Geräte pro SCSI-Kette hatten. Neuere SCSI-Technologien ermöglichen eine nahezu Verdoppelung dieser Zahl, sodass Sie sich für 12+ entscheiden würden. Der Schlüssel hierbei ist, dass der kombinierte Durchsatz aller Laufwerke die Kapazität der Verbindung nicht überschreiten kann , da Ihre Laufwerke sonst "im Leerlauf" sind, wenn sie die maximale Leistung erbringen.

Denken Sie daran, dass die Laufwerke hier nicht das einzige schwache Glied sind. Jede Verbindung ohne Redundanz führt zu einem einzelnen Fehlerpunkt. Wenn Sie mir nicht glauben, richten Sie ein RAID 5-Array auf einem einreihigen SCSI-Controller ein und schließen Sie den Controller kurz. Können Sie noch auf Ihre Daten zugreifen? Ja das ist, was ich dachte.

Heute haben sich die Dinge ein bisschen verändert. Die Antriebe sind nicht so weit fortgeschritten viel in Bezug auf Leistung, aber der Fortschritt gesehen ist bezeichnend genug , dass Leistung nicht als ein Problem neigt dazu , es sei denn , Sie mit „Drive - Farmen“ arbeiten, in welchem Fall Sie sprechen eine ganz andere Infrastrukturund diese Antwort / Konversation ist umstritten. Worüber Sie sich wahrscheinlich mehr Gedanken machen werden, ist die Datenredundanz. RAID 5 war in seiner Blütezeit aufgrund mehrerer Faktoren gut, aber diese Faktoren haben sich geändert. Ich denke, Sie werden feststellen, dass RAID 10 mehr Ihren Wünschen entspricht, da es zusätzliche Redundanz gegen Laufwerksausfälle bietet und gleichzeitig die Leseleistung erhöht. Die Schreibleistung leidet leicht, dies kann jedoch durch eine Erhöhung der aktiven Kanäle gemindert werden. Ich würde jeden Tag ein RAID-10-Setup mit 4 Laufwerken anstelle eines RAID-5-Setups mit 5 Laufwerken verwenden, da das RAID-10-Setup einen (speziellen) Ausfall mit zwei Laufwerken überstehen kann, während das RAID-5-Array sich einfach überschlägt und abstirbt mit einem Ausfall von zwei Laufwerken. Zusätzlich zur leicht verbesserten Redundanz können Sie den "Controller als Single Point of Failure" abschwächen. Situation durch Aufteilen des Spiegels in zwei gleiche Teile, wobei jeder Controller nur den Streifen handhabt. Bei einem Controllerausfall geht Ihr Stripe nicht verloren, sondern nur der Spiegeleffekt.

Dies kann natürlich auch für Ihre Umstände völlig falsch sein. Sie müssen sich die Kompromisse zwischen Geschwindigkeit, Kapazität und Redundanz ansehen. Wie beim alten Konstruktionswitz "Besser, billiger, schneller, wählen Sie zwei" werden Sie feststellen, dass Sie mit einer Konfiguration leben können, die zu Ihnen passt, auch wenn sie nicht optimal ist.

Avery Payne
quelle
2

RAID 5 Ich würde sagen, 0 Laufwerke pro Array. Siehe http://baarf.com/ oder ähnliche Angebote von einer beliebigen Anzahl anderer Quellen.

RAID 6 Ich würde sagen, 5 Laufwerke + 1 für jedes Ersatzlaufwerk pro Array. Wenn weniger und Sie RAID 10 ausführen, erhöhen Sie das Risiko und sollten RAID 10 verwenden.

RAID 10 ist so hoch, wie Sie möchten.

pplrppl
quelle
1

Ich benutze 7 als "magische" Maximalzahl. Für mich ist dies ein guter Kompromiss zwischen Platzverlust durch Redundanz (in diesem Fall ~ 14%) und Zeit für die Neuerstellung (auch wenn die LUN während der Neuerstellung verfügbar ist) oder Erhöhung der Größe und MTBF.

Bei der Arbeit mit SAN-14-Festplattengehäusen hat sich das natürlich hervorragend bewährt. Zwei unserer Kunden hatten 10 Festplattengehäuse, und die magische Zahl 7 wurde auf 5 reduziert.

Alles in allem hat 5-7 für mich gearbeitet. Sorry, auch keine wissenschaftlichen Daten von mir, nur Erfahrung mit RAID-Systemen seit 2001.

ΤΖΩΤΖΙΟΥ
quelle
Sie könnten also mit Sicherheit sagen, dass Sie Ihr Gehäuse in zwei Hälften teilen, dann hört es sich so an. Ich habe ein Gehäuse mit 12 Festplatten, das 10 Festplatten eines RAID 10-Arrays mit 2 Ersatzlaufwerken enthält, musste es aber zum Glück noch nicht neu erstellen.
Matt Simmons
1

Das effektive Maximum ist die RAID-Controller-Bandbreite.

Nehmen wir an, die Festplatte liest maximal mit 70 MB / s. In Spitzenzeiten können Sie Daten nicht schnell genug schaufeln. Bei einem ausgelasteten Dateiserver (RAID 5) oder Datenbankserver (RAID 10) kann dies schnell passieren.

SATA-2 ist eine 300 MB / S-Schnittstellenspezifikation, SCSI Ultra 320 wäre konsistenter. Sie sprechen von 6 bis 10 Festplatten, weil Sie nicht allzu oft Spitzenwerte erreichen.

gbn
quelle
0

Die Anzahl der Festplatten in einem RAID wurde früher durch die Anzahl der Geräte an einem SCSI-BUS bestimmt. Bis zu 8 oder 16 Geräte können an einen einzelnen Bus angeschlossen werden, und der Controller wird als ein Gerät gezählt - es waren also 7 oder 15 Festplatten.

Viele RAIDs bestanden also aus 7 Festplatten (eine war ein Ersatzlaufwerk), sodass 6 Festplatten übrig blieben - oder 14 Festplatten mit 1 Ersatzlaufwerk.

Das Wichtigste an Festplatten in einer RAID-Gruppe ist wahrscheinlich, wie viele IOPS Sie benötigen.

Beispielsweise kann eine SCSI-Festplatte mit 10.000 U / min ungefähr 200 IOPS ausführen - wenn Sie 7 davon in einem RAID 5 hatten -, verlieren Sie 1 Festplatte für die Parität, haben dann aber 6 Festplatten für Lese- / Schreibvorgänge und ein theoretisches Maximum von 1200 IOPS - wenn Sie Benötigte mehr IOPS - Fügen Sie mehr Festplatten hinzu (200 IOPS pro Festplatte).

Und die schnelleren Festplatten mit 15.000 U / min SAS können bis zu 250 IOPS usw. erreichen.

Und dann gibt es immer eine SSD (30.000 IOPS pro Platte) und sie sind raidbar (wenn auch sehr teuer).

Und ich denke, SAS hat einen verrückten Maximalwert für die Anzahl der Geräte - wie 16.000 Laufwerke

Rob Bergin
quelle
0

Mit RAID6 und SATA habe ich mit 11 Festplatten gute Erfolge erzielt ... Und einem Ersatzlaufwerk (einige fehlerhafte Controller benötigen zwei Ersatzlaufwerke, um RAID6 neu zu erstellen). Dies ist praktisch, da viele JBOD in Gruppen von 12 Festplatten wie dem HP MSA60 erhältlich sind.

Alexandre Carmel-Veilleux
quelle
0

Bis Sie die maximale Geschwindigkeit des Busses an der engeren Stelle in der Kette erreichen (Schlachtzugskarte, Glieder), kann es also Sinn machen. Dasselbe macht keinen Sinn, wenn Sie Ihrem PCI-Bus viele 1-GbE-NICs hinzufügen.


quelle