Wie ist der aktuelle Status (2016) von SSDs in RAID?

51

Online sind zahlreiche Ressourcen verfügbar, in denen die Verwendung von SSD-Laufwerken in RAID-Konfigurationen erörtert wird - diese stammen jedoch zumeist aus einigen Jahren, und das SSD-Ökosystem entwickelt sich sehr schnell -, genau wie wir es später in diesem Jahr mit der "Optane" -Produktveröffentlichung von Intel erwarten das wird alles ändern ... wieder.

Ich gehe meiner Frage voran, indem ich bestätige, dass es einen qualitativen Unterschied zwischen SSDs der Consumer-Klasse (z. B. Intel 535) und SSDs der Rechenzentrumsklasse (z. B. Intel DC S3700) gibt.

Mein Hauptanliegen betrifft die TRIMUnterstützung in RAID-Szenarien. Meines Erachtens unterstützen moderne RAID-Controller die Ausgabe von TRIMBefehlen an angeschlossene SSDs - mit Ausnahme von Intels RAID-Controllern - trotz der Einführung von SSDs in Consumer-Computern vor über 6 Jahren und NVMe vor 4 Jahren nicht mehr im RAID-0-Modus.

Ich bin überrascht, dass TRIMim RAID-1-Modus keine Unterstützung vorhanden ist, da die Laufwerke sich gegenseitig spiegeln, scheint dies unkompliziert zu sein. Aber ich schweife ab.

Ich stelle fest, dass, wenn Sie Fehlertoleranz für Festplatten (HDD und SSD) wünschen, Sie diese in einer RAID-Konfiguration verwenden würden - aber da die SSDs ohne TRIM wären, würde dies bedeuten, dass sie eine Schreibverstärkung erleiden, die zu zusätzlichem Verschleiß führt SSDs würden vorzeitig ausfallen - dies ist eine bedauerliche Ironie: Ein System, das zum Schutz vor Laufwerksausfällen entwickelt wurde, könnte direkt dazu führen, dass SSDs ausfallen.

Damit:

  1. Ist TRIMUnterstützung für moderne SSDs (Ära 2015-2016) erforderlich?

    1.1. Gibt es einen Unterschied in der Notwendigkeit der TRIMUnterstützung zwischen SATA-, SATA-Express- und NVMe-basierten SSDs?

  2. Häufig wird für Laufwerke mit einer verbesserten integrierten Speicherbereinigung geworben. macht dies unnötig TRIM? Wie funktioniert der GC-Prozess in RAID-Umgebungen?

    1.1. Beispiel: In dieser Qualitätssicherung aus dem Jahr 2010 wird eine ziemlich schlechte Leistungsverschlechterung aufgrund von Nicht-Trimmen beschrieben ( https://superuser.com/questions/188985/how-badly-do-ssds-degrade-without-trim ) Artikel aus dem Jahr 2015 macht den Fall, dass die Verwendung von TRIM dringend empfohlen wird ( http://arstechnica.com/gadgets/2015/04/ask-ars-my-ssd-does-garbage-collection-so-i-dont-need-trim) -right / ). Was ist Ihre Antwort auf diese starken Argumente für die Notwendigkeit von TRIM?

  3. Viele Artikel und Diskussionen aus früheren Jahren befassen sich mit SLC und MLC-Flash, und SLC ist aufgrund seiner viel längeren Lebensdauer vorzuziehen - jedoch scheinen alle SSDs heutzutage (unabhängig davon, wo sie sich im Consumer-to-Enterprise-Spektrum befinden) MLC zu sein heutzutage - ist diese Unterscheidung noch relevant?

    1.1 Und was ist mit DC-Flash?

  4. Enterprise-SSDs weisen in der Regel eine viel höhere Lebensdauer / Schreibgrenze auf (häufig gemessen daran, wie oft Sie das Laufwerk an einem Tag über die erwartete Lebensdauer von 5 Jahren hinweg vollständig überschreiben können) - wenn die Grenze für den Schreibzyklus sehr hoch ist (z. B. 100 vollständige Schreibvorgänge pro Tag) bedeutet dies, dass sie überhaupt nicht benötigt werden, TRIMweil diese Grenzwerte so hoch sind, oder - im Gegenteil - sind diese Grenzwerte nur durch die Verwendung erreichbar TRIM?

Dai
quelle
6
Obwohl ich Ihre Frage nicht beantworten kann, sollte dies angesichts der Tatsache in Betracht gezogen werden, dass unsere Branche versucht, proprietäres RAID abzutöten. Alle öffentlichen Cloud-Anbieter verwenden SSDs jetzt für Rechen- und Speicherdienste, aber sie haben dies sicherlich gelöst Mit Software, Löschcodierung usw. haben Cloud-Computing-Innovationen Dinge wie Hardware-RAID, das Cisco IOS und proprietäre Speicherbereichsnetzwerke als sinnlose Güter entlarvt, die an der Spitze der Nahrungskette fermentieren und Innovationen tatsächlich behindern. Hardware-RAID kann nicht im Maßstab verkauft werden (an AWS, Azure, CERN), also ...
Sum1sAdmin
@ Sum1sAdmin Die öffentlichen Cloud-Anbieter nutzen alle SSDs jetzt für Computing- und Speicherdienste. Wollen Sie damit sagen, dass AWS oder BlackBlaze Daten nur auf SSDs speichern?
AL
@AL nun nein, ich weise nur darauf hin, dass das Angebot SSD für Block, Datei, Objekt und kurzlebige Speicherung
Sum1sAdmin
Ich bin völlig anderer Meinung als der "qualitative Unterschied" zwischen Handel und Verbraucher. Ich kann Ihnen versichern, dass es keinen Unterschied bei der Herstellung von NAND gibt. Es gibt sicherlich verschiedene Hersteller (Samsung vs Intel), aber keiner von beiden hat ein spezielles Herstellungsverfahren für Verbraucher. Es gibt sicherlich Funktionsunterschiede, aber keine Qualitätsunterschiede.
Jim B
Apropos Optane, wir sind fast in der Mitte des Jahres 2016 und es ist nirgends in Sicht ... Weiß jemand, was der Deal ist?
Jeff Meden

Antworten:

24

Versuchen wir, jeweils eine Frage zu beantworten:

  • Ist TRIM-Unterstützung für moderne SSDs (Ära 2015-2016) erforderlich?

Kurze Antwort: In den meisten Fällen nein. Lange Antwort: Wenn Sie genügend freien Speicherplatz reservieren (~ 20%), weisen selbst Laufwerke der Consumer-Klasse in der Regel recht gute Leistungskonsistenzwerte auf (Sie müssen jedoch Laufwerke vermeiden, die sich stattdessen auf dauerhafte Schreibvorgänge beschränken). Laufwerke der Enterprise-Klasse sind sogar noch besser, da sie standardmäßig über mehr freien Speicherplatz verfügen und die Kombination aus Controller und Firmware für die kontinuierliche Nutzung des Laufwerks optimiert ist. Sehen Sie sich zum Beispiel das S3700-Laufwerk an, auf das Sie verwiesen haben: Auch ohne Trimmen weist es eine sehr gute Schreibkonsistenz auf.

  • Häufig wird für Laufwerke mit einer verbesserten integrierten Speicherbereinigung geworben. Erledigt dies die Notwendigkeit von TRIM? Wie funktioniert der GC-Prozess in RAID-Umgebungen?

Der Drive Garbage Collector übt seine Magie in der Drive Sandbox aus - er weiß nichts über die äußere Umgebung. Dies bedeutet, dass es vom RAID-Level des Arrays (meistens) nicht betroffen ist. Das heißt, einige RAID-Level (im Grunde genommen das paritätsbasierte) können manchmal (und in einer bestimmten Implementierung) den Schreibverstärkungsfaktor erhöhen, was wiederum eine höhere Arbeit für die GC-Routinen bedeutet.

  • Viele Artikel und Diskussionen aus früheren Jahren befassen sich mit SLC und MLC-Flash, und SLC ist aufgrund seiner viel längeren Lebensdauer vorzuziehen. Es scheint jedoch, dass alle SSDs (unabhängig davon, wo sie sich im Consumer-to-Enterprise-Spektrum befinden) MLC-Tage sind - Ist diese Unterscheidung von Relevanz mehr

SLC-Laufwerke sind im Grunde aus dem Unternehmen verschwunden und werden hauptsächlich für militärische und einige industrielle Aufgaben eingesetzt. Das markierte Unternehmen ist nun in drei Klassen unterteilt:

  • HMLC / MLCe-Flash ist der mit den besser eingestuften MLC-Chips und für mindestens 25000/30000 Umschreibezyklen zertifiziert.
  • 3D-MLC-Chips sind für etwa 5000-10000 Umschreibezyklen ausgelegt.
  • Normale planare MLC- und 3D-TLC-Chips sind für etwa 3000 Umschreibezyklen ausgelegt.

In Wirklichkeit sollte jeder der oben genannten Flash-Typen eine ausreichende Gesamtschreibkapazität bieten, und tatsächlich finden Sie Enterprise-Laufwerke mit allen oben genannten Flash-Typen.

Die wirkliche Unterscheidung zwischen Unternehmens- und Verbraucherantrieben ist:

  • die Controller / Firmware-Kombination, bei der Enterprise-Laufwerke aufgrund eines unerwarteten Controller-Fehlers viel schwerer zu sterben sind;
  • Der stromgeschützte Schreibcache ist äußerst wichtig, um Beschädigungen des Flash Translation Layer (FTL) zu vermeiden, der im Flash selbst gespeichert ist.

Treiber für Unternehmen sind vor allem aufgrund ihrer Controller und Leistungskondensatoren besser als aufgrund eines besseren Blitzes.

  • Enterprise-SSDs haben in der Regel eine viel höhere Lebensdauer / Schreibgrenze (häufig gemessen daran, wie oft Sie das Laufwerk an einem Tag über die erwartete Lebensdauer von 5 Jahren hinweg vollständig überschreiben können) Läuft TRIM nicht?

Wie bereits erwähnt, verfügen Enterprise-Laufwerke über einen viel höheren Standard-Ersatzspeicher (~ 20%), wodurch sich der Bedarf an regulären TRIMs drastisch verringert

Nebenbei bemerkt, ziehen Sie bitte einige Software-RAIDs in Betracht, die TRIMs unterstützen (jemand sagte Linux MDRAID? )

Shodanshok
quelle
Nur 35000 Schreibzyklen ?! Das klingt nicht nach sehr vielen. Ich denke, es ist sinnvoll, wenn der vermehrte Austausch von Laufwerken billiger ist als der Kauf derselben Kapazität in SLC.
user253751
~ 30000 garantierte Mindestumschreibezyklen sind nichts Schlimmes: Mit der durch den Wechsel auf 2-Bit-pro-Zelle-NAND erhöhten Kapazität sind MLC-Laufwerke viel billiger als SLC-Laufwerke bei gleichbleibender Lebensdauer. Darüber hinaus sind die Tage, an denen SLC-Zellen der 50-nm-Klasse mit> 100000 Umschreibezyklen eingestuft wurden, wahrscheinlich vorbei: Sogar Enterprise-Laufwerke haben einen Flash der 34/25-nm-Klasse (oder kleiner) mit einer wesentlich geringeren Lebensdauer (die auch SLC-Laufwerke betreffen).
Shodanshok
@shodanshok Ihre Schlussfolgerung lautet "Verwenden Sie SAS-SSDs (Enterprise Grade), die an einen normalen RAID-Controller angeschlossen sind, und machen Sie sich keine Sorgen" - und dass in den 5 Jahren, für die eine Laufwerksgarantie gilt, keine Leistungseinbußen zu verzeichnen sind? Und dass die von anderen Benutzern dokumentierten Leistungsprobleme nur Laufwerke für Endverbraucher betreffen?
Dai
@Dai Für "Enterprise-Grade" -Laufwerke meine ich nicht nur SAS-SSDs, sondern auch ausgewählte SATA-SSDs können als "Enterprise-Grade" bezeichnet werden. Und ja, Enterprise-Laufwerke haben eine sehr gute Leistungskonsistenz, auch im eingeschwungenen Zustand (dh vollständig voll). Ein Beispiel für solche Laufwerke finden Sie hier . Selbst einige Consumer-Laufwerke können in Verbindung mit einer großzügigen Überversorgung durchaus konsistent sein. Sehen Sie hier ein Beispiel.
Shodanshok
1
Binning ist der Prozess, bei dem Siliziumchips auf ihre Qualität hin untersucht und gruppiert werden. MLC-NAND-Chips für Unternehmen sind also im Grunde genommen die besser hergestellten und besser getesteten Chips.
Shodanshok
9

TRIM ist nichts, worüber ich mir Sorgen machen muss, wenn ich SSDs auf modernen RAID-Controllern verwende. Die SSDs wurden verbessert, die Funktionen des Hardware-RAID-Controllers wurden für diese Workloads optimiert, und in der Regel werden Berichte zur Lebensdauer erstellt.

TRIM ist für SATA-Laufwerke der unteren Preisklasse. Für SAS-SSDs haben wir SCSI-Unmap, und vielleicht ist das der Grund, warum ich nicht auf TRIM-Anforderungen stoße ...

Aber der andere Kommentator ist richtig. Software-Defined Storage (SDS) verändert die Verwendung von SSDs. In SDS-Lösungen spielen RAID-Controller keine Rolle. Und Dinge wie TRIM sind in der Regel weniger wichtig, da SSDs bestimmte Rollen ausfüllen. Ich denke an Nimble Storage Read Cache oder ZFS L2ARC und ZIL ... Sie alle erfüllen spezifische Anforderungen und die Software nutzt die Ressourcen intelligenter.

ewwhite
quelle
3
UNMAP und TRIM machen genau dasselbe.
Michael Hampton
2
Das Zuschneiden / Entfernen der Zuordnung ist immer erforderlich - ohne sie müssten Sie sich vollständig auf die interne Speicherbereinigung verlassen
Jim B,
Die interne Garbage Collection ist kein Ersatz für TRIM. Es gibt keine Firmware-Funktion, die die Funktionen von TRIM ersetzen kann. Es ist ein wenig alarmierend, so viele Antworten hier verstehen nicht, was TRIM tatsächlich tut und warum es benötigt wird. Artikel wie diesen finden Sie unter arstechnica.com/gadgets/2015/04/…
Shiv
1

RAID-Level mit SSD Eine Antwort oben legt nahe, dass RAID-Level mit Parität wie RAID 5 die Schreibverstärkung erhöhen. Es gibt wirklich mehr als einen Weg, dies zu interpretieren: die Auswirkung auf ein Laufwerk oder die Auswirkung auf den Satz von Laufwerken.

Im Vergleich zu keiner Redundanz fügt RAID 5 Schreibvorgänge zum Satz hinzu, da die Prüfsummenparität hinzugefügt wird. Im Vergleich zu einem RAID 0-Array mit (n-1) Laufwerken hat das RAID 5-Array mit n Laufwerken keine Auswirkungen auf die einzelnen Laufwerke. Jedes der n Laufwerke erhält genauso viele Schreibvorgänge. RAID 5 fügt dem Satz 1 / (n-1) zusätzliche Schreibvorgänge hinzu. RAID 1 und RAID 10 fügen dem Satz jedoch 100% zusätzliche Schreibvorgänge hinzu, da alle auf eine SSD geschriebenen Vorgänge auf ihren Spiegel geschrieben werden.

In Bezug auf das Schreiben in ein RAID 5-Set im Vergleich zu einem RAID 10-Set mit der gleichen Anzahl von Laufwerken erhalten die SSDs im RAID 5-Set weniger Schreibvorgänge. Dies gilt auch dann, wenn Sie die Anzahl der SSDs im RAID 10-Satz erhöhen, um die nutzbare Kapazität auszugleichen.

Keith J
quelle
0

Shodanshok ging hier auf die wahre Antwort ein. Wenn Sie zusätzlichen Speicherplatz reservieren, wird die Konsistenz von SSD und Schreibleistung mit der Zeit verbessert, und der Mangel an TRIM-Unterstützung wird größtenteils irrelevant. Sie können diesen zusätzlichen Speicherplatz reservieren, indem Sie, beginnend mit einer neuen SSD, weniger als die volle Kapazität partitionieren. Die meisten Controller im Laufwerk behandeln nie belegten Speicherplatz genauso wie reservierten Speicherplatz und reduzieren dadurch die Schreibverstärkung erheblich. Für Boot und Betriebssystem sind wahrscheinlich 10% reservierter Speicherplatz ausreichend. Erhöhen Sie den Speicherplatz für Laufwerke, die häufig neu geschrieben werden.

Keith J
quelle