So wählen Sie die beste Stripe-Größe bei der Konfiguration eines RAID-Arrays aus

7

Im Internet gibt es verschiedene "Referenzen", die sich mit der Frage befassen, welche Faktoren bei der Auswahl einer bestimmten RAID-Stripe-Größe (4 KB bis 128 KB oder mehr) für ein Array von Festplatten zu berücksichtigen sind. Keiner dieser Faktoren ist jedoch sehr maßgeblich oder konsistent wirklich miteinander.

Zum Beispiel:

Johns Handbuch zur RAID-Optimierung für
Streifenbreite und -größe von Bits

Insbesondere scheinen verschiedene Faktoren in Bezug auf die Angaben zum Dateisystemtyp (FAT, NTFS usw.), zur Größe des Dateisystemclusters, zur Caching-Strategie und zur Versandstrategie für Festplattentreiberbefehle, unabhängig davon, ob mehrere Befehle möglich sind oder nicht, eine Rolle zu spielen Warteschlange (getaggte Warteschlange) zu den betreffenden Laufwerken usw.

Was ich suche, ist eine maßgebliche, datengesteuerte und referenzierte Dissertation darüber, was genau alle zu berücksichtigenden Faktoren sind und wie man letztendlich einen analytischen Ansatz zur Auswahl der optimalen Streifengröße für eine bestimmte Anwendung verfolgt, ohne die Brute-Force-Übung von durchlaufen zu müssen Probieren Sie alle Kombinationen dieser Faktoren aus, um festzustellen, was zu der besten Leistung führt.

Großer Jeff
quelle

Antworten:

4

Leider ist eine solche Dissertation möglicherweise schwer zu finden, und selbst wenn Sie beim Durchsuchen relevanter akademischer Papiersammlungen auf eine solche gestoßen sind, besagt das Gesetz von sod, dass der eine Umstand, der nicht durch das Papier abgedeckt wird, dem erwarteten E / A-Muster am nächsten kommt.

Es ist tatsächlich ein komplexer Bereich - nicht kompliziert , da jeder Teil des Problems keine Raketenwissenschaft ist, sondern komplex, da die verschiedenen Faktoren auf ziemlich subtile Weise miteinander interagieren können. Aus diesem Grund finden Sie in einigen Empfehlungen erhebliche Inkonsistenzen ( Das Ergebnis der Tests, auf denen die Empfehlungen basieren, hängt stark von der genauen Art der Tests und dem E / A-Muster ab, das sie zu simulieren versuchen. Finden Sie daher ein Papier, das genau Ihre Anforderungen erfülltBedürfnisse wären ein ziemlicher Glücksfall, es sei denn, Ihre Bedürfnisse sind sehr grundlegend (in diesem Fall reichen allgemeinere Empfehlungen wie "Die Standardeinstellungen werden wahrscheinlich in Ordnung sein" tatsächlich aus). Jedes Papier, das versuchte, alles (oder sogar nur die meisten Dinge) abzudecken, würde so lange dauern, bis es irrelevant war, lange bevor es fertiggestellt war.

Der einzig wahre Weg, um sicher zu sein, besteht darin, ein paar Kombinationen auszuprobieren. Versuchen Sie, eine typische E / A-Last für Ihre Anwendung in mehreren Konfigurationen zu replizieren, und sehen Sie, wie sie bewertet wird. Ich hoffe, dass dies nicht wenig hilfreich ist, aber ich denke, es ist wirklich der einzige Weg, um sicher zu sein. Allerdings: Wenn Sie einige spezifischere Details der Umgebung angeben, für die Sie eine RAID-Konfiguration in Betracht ziehen, kann jemand Sie möglicherweise auf ein Papier oder eine andere Ressource verweisen, die stärker auf diese Art von Umgebung + Kit + Anwendung + Last ausgerichtet ist Kombination als die Quellen, die Sie bereits gefunden haben.

Als fast-on-Thema Beispiel habe ich ein paar RAID - Tests auf meinem Netbook letzte Woche (nach der internen SSD entscheiden , schreiben weit weit weit zu langsam) und fand einige Ergebnisse , die weit waren von dem, was ich erwartet habe , als ich anfing (obwohl Ein Teil davon ist darauf zurückzuführen, dass ich nicht genau weiß, wie schlecht die interne SSD durch einige Metriken war!). Ich werde Sie hier nicht mit den genauen Details langweilen, da die E / A-Muster, um die ich mich unter diesen Umständen gekümmert habe, ganze Welten von dem entfernt sein werden, was Sie sich vorstellen, aber ich werde wiederholen, dass ich denke, dass es wirklich keinen Ersatz gibt Für einige Benchmarking-Läufe, die auf Ihren Kenntnissen des Systems basieren, das Sie erstellen möchten, wenn Sie bestimmte Indikatoren / Empfehlungen wünschen.

David Spillett
quelle