Wir (und damit meine ich Jeff) prüfen die Möglichkeit der Verwendung von Consumer-MLC-SSD-Festplatten in unserem Backup-Rechenzentrum.
Wir wollen versuchen, die Kosten niedrig zu halten und den nutzbaren Speicherplatz hoch zu halten - daher sind die Intel X25-E mit jeweils etwa 700 US-Dollar und 64 GB Kapazität fast ausverkauft.
Was wir überlegen, ist, einige der unteren End-SSDs zu kaufen, die mehr Kapazität zu einem niedrigeren Preis bieten. Mein Chef glaubt nicht, dass es sich lohnt, etwa 5.000 Euro für Festplatten auf Servern auszugeben, auf denen das Backup-Rechenzentrum leer ist.
Diese Laufwerke würden in einem RAID-Array mit 6 Laufwerken auf einem Lenovo RD120 verwendet. Der RAID-Controller ist ein Adaptec 8k (umbenannter Lenovo).
Wie gefährlich ist dieser Ansatz und wie können diese Gefahren gemindert werden?
Antworten:
Ein paar Gedanken;
Viel Glück - brate sie einfach nicht mit Schriften an :)
quelle
Ich habe diesen Link gefunden, der eine interessante und gründliche Analyse von MLC- und SLC-SSDs in Servern enthält
Beachten Sie, dass einige MLC-SSD-Anbieter behaupten, ihre Laufwerke seien "unternehmerisch" genug , um die Schreibvorgänge zu überstehen:
Diese Behauptungen werden bei AnandTech weiter analysiert .
Darüber hinaus hat Intel jetzt die Aufzeichnung aufgenommen, dass SLC in 90% der Fälle auf Servern überlastet sein könnte :
Selbst für ihre serverorientierten SSD-Laufwerke hat Intel mit der neuen Intel SSD 710-Serie von SLC zu MLC gewechselt, wobei der "Overprovisioning" -Raum sehr hoch ist . Diese Laufwerke reservieren intern bis zu 20% des gesamten Speichers für Redundanz:
quelle
Basieren Sie diese Art von Dingen immer auf Fakten und nicht auf Vermutungen. In diesem Fall ist das Sammeln von Fakten ganz einfach: Zeichnen Sie langfristige Lese- / Schreib-IOPS-Profile Ihrer Produktionssysteme auf und finden Sie heraus, womit Sie in einem Disaster Recovery-Szenario leben können. Sie sollten so etwas wie das 99. Perzentil als Maß verwenden. Sie nicht mittelt verwenden , wenn IOPS cpacity Messung - die Spitzen sind alles , was Sache! Dann müssen Sie die erforderliche Kapazität und IOPS kaufen, die für Ihren DR-Standort erforderlich sind. SSDs sind möglicherweise der beste Weg, dies zu tun, oder auch nicht.
Wenn Ihre Produktionsanwendungen beispielsweise 7500 IOPS bei der 99. Perzentile erfordern, können Sie möglicherweise entscheiden, mit 5000 IOPS in einer Katastrophe zu leben. Das sind jedoch mindestens 25 Festplatten mit einer Kapazität von 15 KB, die direkt an Ihrem DR-Standort erforderlich sind. Daher ist SSD möglicherweise die bessere Wahl, wenn Ihr Kapazitätsbedarf gering ist (wie es scheint). Wenn Sie jedoch nur 400 IOPS in der Produktion messen, kaufen Sie einfach 6 SATA-Laufwerke, sparen Sie sich etwas Geld und nutzen Sie den zusätzlichen Speicherplatz zum Speichern weiterer Backup-Snapshots am DR-Standort. Sie können Lese- und Schreibvorgänge in Ihrer Datensammlung auch trennen, um anhand ihrer Spezifikationen herauszufinden, wie lange Nicht-Enterprise-SSDs für Ihre Workload geeignet sind.
Denken Sie auch daran, dass DR-Systeme möglicherweise weniger Speicher als die Produktion haben, was bedeutet, dass mehr IOPS erforderlich sind (mehr Auslagerungen und weniger Dateisystem-Cache).
quelle
Selbst wenn die MLS-SSD nur ein Jahr hielt, wird der Austausch in einem Jahr viel billiger sein. Können Sie es also ertragen, die MLS-SSD zu ersetzen, wenn sie nicht mehr verfügbar ist?
quelle
Wenn wir das Problem mit der Schreibmenge beiseite lassen (oder nachweisen, dass SSDs auf Consumer-Ebene damit umgehen können), sind SSDs meiner Meinung nach eine gute Ergänzung für Umgebungen auf Enterprise-Ebene. Sie werden wahrscheinlich die SSDs in einem RAID-Array verwenden. RAID5 oder RAID6. Das Problem dabei ist, dass das Array nach einem Ausfall eines einzelnen Laufwerks immer anfälliger für Ausfälle wird. Die Zeit für die Neuerstellung hängt stark vom Volumen des Arrays ab. Es kann Tage dauern, bis ein Array mit mehreren TB wiederhergestellt ist, während ständig auf es zugegriffen wird. Bei SSDs werden die RAID-Arrays a) zwangsläufig kleiner, b) die Wiederherstellungszeit drastisch verkürzt.
quelle
In einem Whitepaper zu den Unterschieden zwischen SLC und MLC von SuperTalent wird die Lebensdauer von MLC und die Lebensdauer einer SLC-SSD auf ein Zehntel geschätzt. Es besteht jedoch die Möglichkeit, dass die MLS-SSDs die Hardware, in die Sie sie einsetzen, überleben. Ich bin mir nicht sicher, wie zuverlässig diese Statistiken / Fakten von SuperTalent sind.
Angenommen, Sie erhalten eine ähnliche Unterstützung vom Lieferanten der MLC-SSDs, dann ist der niedrigere Preis einen Versuch wert.
quelle
Sie sollten nur die Anzahl der täglichen Schreibvorgänge berechnen, die Sie mit Ihrer aktuellen Konfiguration haben, und vergleichen, was der Hersteller garantiert, dass seine SSD-Laufwerke aushalten können. Intel scheint diesbezüglich am aktuellsten zu sein - schauen Sie sich beispielsweise die Datenblätter der SSD-Mainstream-Laufwerke an: http://www.intel.com/design/flash/nand/mainstream/technicaldocuments.htm
In Abschnitt 3.5 (3.5.4) des Spezifikationsdokuments heißt es, dass Sie eine Laufwerkslaufzeit von mindestens 5 Jahren mit 20 GB Schreibzugriff pro Tag haben. Ich gehe davon aus, dass dies berechnet wird, wenn die gesamte Laufwerkskapazität genutzt wird und Sie keinen freien Speicherplatz für Schreibvorgänge bereitstellen.
Interessant ist auch das Datenblatt zum Einsatz von Mainstream-SSDs in einer Unternehmensumgebung.
quelle
Ich habe vor ein paar Jahren ein paar 32-GB-SLC-Laufwerke als Puffer für eine schrecklich schlecht gestaltete App bereitgestellt, die wir verwendet haben.
Die Anwendung bestand zu 90% aus kleinen Schreibvorgängen (<4 KB) und lief auf den SSD-Laufwerken konstant (rund um die Uhr) mit 14 KB / s. Sie waren RAID 1 konfiguriert, alles war rosig, die Latenz war gering!
Nach ungefähr einem Monat und der ersten Fahrt, buchstäblich innerhalb von drei Stunden, war auch die zweite Fahrt gestorben. RAID 1 ist doch kein so guter Plan :)
Ich würde mich mit den anderen Plakaten auf eine Art RAID 6 einigen, wenn nichts anderes diese Schreibzugriffe auf mehr Laufwerke verteilt.
Denken Sie jetzt daran, dass dies vor ein paar Jahren war und diese Dinge jetzt viel zuverlässiger sind und Sie möglicherweise kein ähnliches E / A-Profil haben.
Die App wurde überarbeitet, aber als eine Lücke, die Ihnen helfen kann oder auch nicht, haben wir eine große RAM-Disk erstellt, einige Skripte erstellt, um die RAM-Disk neu zu erstellen / zu sichern und den ungefähr einstündigen Datenverlust in Kauf zu nehmen /Wiederherstellungszeit.
Auch hier kann der Lebenszyklus Ihrer Daten unterschiedlich sein.
quelle