Verwendung von 2,5 "Laptop-Laufwerken in einem Server?

7

Wir erwerben mehrere 1U-Server mit (8) 2,5-Zoll-Laufwerkssteckplätzen. Obwohl wir entweder SATA oder SAS verwenden können, gibt es große Preisunterschiede, sobald Sie 16 oder 24 dieser Laufwerke bestellen. Wir sehen uns also die 2,5 an "Laufwerke mit SATA-Schnittstelle.

Ich weiß, dass Seagate und WD beide "Enterprise" 2.5 "-Laufwerke herstellen, die schnell sind (10.000 und 15.000 U / min), aber auch ziemlich teuer sind.

Welche Probleme würden wir bei der Verwendung von 2,5-Zoll-Nicht-Enterprise-Laufwerken mit 7200 U / min haben? Diese werden übrigens an einen RAID-Controller angeschlossen (obwohl sie möglicherweise nur als JBOD konfiguriert sind). Diese Laufwerke sind pro Preis um fast 100 US-Dollar niedriger Fahrt.

Anthony
quelle
9
Es ist wie der Unterschied zwischen dem Aufsetzen von Golfwagenreifen auf Ihr Auto. Sicher, sie werden funktionieren, aber ich würde nicht damit fahren wollen.
Joeqwerty
1
Alle westlichen digitalen 2,5-Zoll-Laufwerke haben die gleiche MTBF wie die 3,5-Zoll-Laufwerke. Ich habe 60 WD Black 750GB 2.5 "in einem Server-Chassis und sie sind seit mehr als 4 Jahren dort. Nur 2 sind bisher ausgefallen.
Kara Kim
@ Joeqwerty eher versuchen, "Le Mans 24 Stunden" Wettbewerb in einem Golfwagen
durchzuführen

Antworten:

15

Zusätzlich zu den oben genannten Problemen kann es aufgrund des Fehlens von TLER zu zusätzlichen Problemen beim Ausführen dieser Laufwerke in der RAID-Konfiguration kommen. (Wenn Sie ein Modell ohne in Betracht ziehen.) Dieses Zitat bezieht sich auf Desktops und RAID Edition-Laufwerke, aber ich stelle mir vor, dass dies auch für die 2,5-Zoll-Zeile gilt, wenn Sie gegebenenfalls "Notebook" und "Enterprise" oder "SAS" verwenden.

Western Digital stellt Desktop Edition-Festplatten und RAID Edition-Festplatten her. Jeder Festplattentyp ist speziell für die Verwendung in einer Desktop-Computerumgebung oder einer anspruchsvollen Unternehmensumgebung konzipiert.

Wenn Sie eine Desktop Edition-Festplatte installieren und verwenden, die an einen RAID-Controller angeschlossen ist, funktioniert das Laufwerk möglicherweise nur dann ordnungsgemäß, wenn es von einem Unternehmens-OEM gemeinsam qualifiziert wurde. Dies wird durch das normale Fehlerbehebungsverfahren verursacht, das eine Desktop Edition-Festplatte verwendet.

Wenn auf einer Desktop Edition-Festplatte ein Fehler gefunden wird, tritt das Laufwerk in einen umfassenden Wiederherstellungszyklus ein, um zu versuchen, den Fehler zu beheben, die Daten aus dem Problembereich wiederherzustellen und dann einen dedizierten Bereich neu zuzuweisen, um den Problembereich zu ersetzen. Dieser Vorgang kann je nach Schweregrad des Problems bis zu 2 Minuten dauern. Bei den meisten RAID-Controllern dauert es sehr kurz, bis eine Festplatte einen Fehler behoben hat. Wenn eine Festplatte zu lange braucht, um diesen Vorgang abzuschließen, wird die Festplatte aus dem RAID-Array entfernt. Die meisten RAID-Controller erlauben 7 bis 15 Sekunden für die Fehlerbehebung, bevor eine Festplatte aus einem Array entfernt wird. Western Digital empfiehlt nicht, Desktop Edition-Festplatten in einer Unternehmensumgebung (auf einem RAID-Controller) zu installieren.

Festplatten der Western Digital RAID Edition verfügen über eine Funktion namens TLER (Time Limited Error Recovery), die verhindert, dass die Festplatte in einen umfassenden Wiederherstellungszyklus eintritt. Die Festplatte benötigt nur 7 Sekunden, um eine Wiederherstellung zu versuchen. Dies bedeutet, dass die Festplatte nicht von einem RAID-Array gelöscht wird. Obwohl TLER für RAID-Umgebungen entwickelt wurde, ist es vollständig kompatibel und wird bei Verwendung in Nicht-RAID-Umgebungen nicht beeinträchtigt.

Aaron Copley
quelle
Sehr aufschlussreich !
Antoine Benkemoun
Dies sind die einzigen quantitativen Daten, die einen echten Unterschied zwischen Desktop- und Unternehmensmodellen zeigen (abgesehen von Garantiezeit und Preis)
Hubert Kario,
Das würde ich nicht unbedingt sagen. Es gibt einen großen Leistungsunterschied, der leicht messbar ist.
Aaron Copley
Mein Hauptanliegen war, dass es sich um einen begrenzten Befehlssatz in den Laufwerken handelte. Wenn wir Software-RAID durchführen, bin ich mir natürlich nicht sicher, wie wichtig das sein wird.
Anthony
Sie benötigen eine sehr spezifische Anwendung, damit der Befehlssatz der Laufwerke eine Rolle spielt. Solange es NCQ, SMART und DMA gibt, ist es ein Laufwerk, das für mich gut genug ist. Sie müssen immer noch Redundanz in das System einbauen und sich daran erinnern, dass auch Controller ausfallen (in den meisten Studien zumindest, wenn nicht mehr, so oft wie die Laufwerke selbst, angepasst an die Populationsgröße).
Hubert Kario
12

Der größte Unterschied? Fehlerrate.

Auf diese "Enterprise" -Laufwerke wird eine Garantie von 5 Jahren gewährt, während für die billigeren Laufwerke wahrscheinlich eine geringere Garantie gewährt wird. Schauen Sie sich auch die technischen Datenblätter an und sehen Sie sich ihre Arbeitszyklen an. Die Enterprise-Laufwerke sind für eine Laufzeit von 5 Jahren ausgelegt, während die Desktop-Laufwerke für eine Laufzeit von 5 Jahren von 8 Stunden pro Tag ausgelegt sind. Sehr unterschiedliche Anwendungsfälle, die sich auf die Ausfallraten Ihres Laufwerks auswirken.


Eine zweite zu betrachtende Sache ist eine Zeile in den technischen Datenblättern mit dem Namen "Nicht behebbare Lesefehlerrate", die ein Maß für die Häufigkeit von Bits ist, die im Wiederherstellungsfenster nicht gelesen werden können.

Ab diesem Zeitpunkt (16.08.2011) ist die Rate des Seagate Savvio 10K.5, eines Enterprise-2,5-Zoll-Laufwerks mit 10.000 U / min, mit 1 x 10 ^ 16 angegeben . Der Western Digital Scorpio Black, ein verbraucherorientierter 2,5-Zoll-Laufwerk mit 7,2.000 U / min. Laufwerk, dessen Rate als 1x10 ^ 14 Bit aufgeführt ist. Durch diese Maßnahme ist der Savvio-Antrieb zwei Größenordnungen zuverlässiger.

Diese Fehlerrate legt eine Obergrenze für die Größe eines RAID5-Satzes fest, den Sie mit solchen Laufwerken erstellen können. Wenn ein Laufwerk in einem RAID5-Array ausfällt, muss das Array das gesamte RAID-Volume lesen, um die Parität wiederherzustellen. Wenn ein nicht behebbarer Lesefehler auftritt, können Sie den gesamten RAID-Satz verlieren . Einige RAID-Karten können dies umgehen, andere nicht. Sie sind nicht alle gleich gebaut.

Die oben genannten Fehlerratenmaße sind ungefähre Angaben, aber sie sind der Punkt, an dem solche Fehler eher auftreten als nicht.

  • 10 ^ 14 Bit = 12,5 TB
  • 10 ^ 16 Bit = 1,25 PB

Nur möchten Sie keine so großen Arrays erstellen. Die größte Größe, die Sie erstellen möchten, liegt bei etwa 50% dieser Größe, um die Wahrscheinlichkeit zu minimieren, dass die Wiederherstellung fehlschlägt. Für diese wirklich billigen 1-TB-2,5-Zoll-Laufwerke können Sie nur 7 davon in ein R5-Array einbauen, während Sie mit den teureren 10K-U / min-Laufwerken 15 dieser 900-GB-Laufwerke in ein Array einbauen und sich sicher fühlen können Wiederherstellen ganz gut (aber es dauert lange), Ihre Paritätsverluste sind mit den billigeren Laufwerken schlimmer, was sich auf Ihre Gesamtkapazität auswirkt.

sysadmin1138
quelle
Es gab nur wenige Studien, die keinen Unterschied in der Zuverlässigkeit zwischen Unternehmens- und Benutzermodellen zeigten. Die Rate der nicht behebbaren Lesefehler ist unterschiedlich, hängt jedoch hauptsächlich vom Modell ab, nicht vom Unternehmen / Desktop. Was ist wichtig, die Zeit , ein Desktop - Laufwerk und Unternehmen einer nehmen gelesenen Daten von beschädigtem Sektor zu versuchen. Sie möchten nicht, dass Ihr RAID-Array für 4 oder 5 Sekunden blockiert, während eines der Laufwerke versucht, Daten zu lesen ...
Hubert Kario
@ Hubert Kario, wie wäre es mit einem Link zu diesen Studien?
Zoredache
Irgendwelche Links zu diesen Daten? Wir betreiben seit fast 4 Jahren drei Server in RAID-10 (jeweils 4 Laufwerke) mit Software-RAID und Consumer-Laufwerken - der einzige Fehler, den wir hatten, sind Seagate-Laufwerke. WD-Consumer-Laufwerke ticken weiter.
Anthony
cs.cmu.edu/~bianca/fast07.pdf "Festplattenfehler in der realen Welt: Was bedeutet eine MTTF von 1.000.000 Stunden für Sie?", heißt es in der Bibliographie der Google-Festplattenstudie "Fehlertrends in einem großen Laufwerk" Bevölkerung " labs.google.com/papers/disk_failures.pdf , auch eine gute Lektüre
Hubert Kario
Jede RAID-Karte MFG empfiehlt, mindestens wöchentliche Volumenprüfungen Ihrer Arrays durchzuführen. Einige empfehlen sogar tägliche Kontrollen. In beiden Fällen werden bei der Volumenprüfung alle Fehler gefunden und korrigiert, bevor Sie eine Neuerstellung durchführen müssen. Es ist also nicht so, dass die Laufwerke seit 4 Jahren ohne Wartung laufen, wie Sie es anscheinend anzeigen. Ich habe gesehen, dass Arrays mehr als einmal nicht neu erstellt werden können, und meistens liegt es daran, dass ein Techniker etwas Dummes getan hat, wie das Trennen eines Laufwerks oder eine schlechte Verkabelung. Wenn ein Umbau mehr als 2 Tage dauert, haben viele Leute Probleme, ihn laufen zu lassen. Ich empfehle nicht, R5 jemals auszuführen. Verwenden Sie R6
Brian D.
3

Anscheinend irren sich alle, die sagen, Unternehmenslaufwerke zu verwenden ... nur weil ... sich irren.

Es gibt mehrere Artikel von Unternehmen, die dies tatsächlich getan haben, anstatt sich nur etwas auszudenken.

Kurz gesagt: Ausfallrate von Unternehmenslaufwerken 4,6%, Ausfallrate von Consumer-Laufwerken 4,2%.

Ich hasse es wirklich, wenn ein gut durchdachtes, leidenschaftliches Argument von einer winzigen hässlichen kleinen Tatsache zerstört wird.

https://www.backblaze.com/blog/enterprise-drive-reliability/

user342213
quelle
Wenn es eine signifikante Anzahl getesteter Festplatten gibt, ist dies möglicherweise eine gute Antwort. In diesem Artikel werden 368 Enterprise-Laufwerke mit 14719 Consumer-Laufwerken verglichen, was einen so großen Unterschied darstellt, dass es sich nicht um FACT handelt, sondern nur um einen Gedanken.
Jakuje
Nur weil weniger Daten vorhanden sind als gewünscht, sind die Daten nicht irrelevant. Zum Beispiel sieht der ST4000DM000 ziemlich gut aus, zumal es sich um ein Desktop-Laufwerk handelt und über 20.000 davon verwendet werden.
Brian D.
2

Das ist eine wirklich schlechte Idee. Es gibt einen guten Grund, warum Laptop-Laufwerke so viel billiger sind als ihre Cousins ​​auf Server-Ebene. Schlicht und einfach - sie sind nicht dafür gebaut, rund um die Uhr verwendet zu werden. Sie werden unglaublich hohe Ausfallraten bei diesen Laufwerken feststellen, wenn sie in einer Serverkapazität verwendet werden.

EEAA
quelle
10k und 15k sind unterschiedlich, das ist sicher, der Unterschied zwischen 7,2k Enterprise- und Desktop-Modellen ist bestenfalls eine andere Firmware.
Hubert Kario
1

Ich habe (5) WD Black 2,5 "SATA-Festplatten in RAID-5 auf einem Server. Es läuft seit ungefähr 3 Jahren ohne Probleme. Der Unterschied zwischen einem SAS-Laufwerk mit 15.000 U / min und einem SATA-Laufwerk mit 7,2.000 U / min ist nicht erkennbar. Don Glauben Sie nicht alles, was Joe und Jane im Internet sagen. Probieren Sie es einfach selbst aus (aber stellen Sie sicher, dass Sie für alle Fälle einen guten Backup-Plan haben ...)

Stanav
quelle
0

Eine Sache, die in Bezug auf die Ausfallrate von Laufwerken, die für RAID entwickelt wurden, im Vergleich zu Einzelantriebssystemen berücksichtigt werden muss, ist der Vibrationsfaktor. Raid-Laufwerke sind so konzipiert, dass sie die zusätzlichen Vibrationen bewältigen, die durch einen Käfig voller Laufwerke verursacht werden, während dies bei Laufwerken der Consumer-Klasse nicht der Fall ist.

ErnieTheGeek
quelle
0

Es hängt ganz davon ab, was Sie mit dem Server machen wollen.

Wenn es sich um einen einzelnen Knoten in einem großen ausfallsicheren Cluster handelt (z. B. Hadoop oder einen ähnlichen), ist dies in Ordnung.

Wenn die Laufwerke nur zum Booten und Austauschen vorgesehen sind und sich alle realen Daten auf einem netten, zuverlässigen SAN- oder Enterprise-NAS-System befinden, sollte dies wieder in Ordnung sein (in diesem Fall benötigen Sie jedoch nur zwei oder drei Laufwerke. Warum sollten Sie sich also die Mühe machen, zu sparen? ?)

Wenn Sie nur versuchen, billig zu sein, weil Ihr Budget knapp ist, stellen Sie sicher, dass Sie ein Ersatzlaufwerk (oder drei) im Raid-Array haben, und wissen Sie, dass dies bedeuten kann, dass ein hektisches 2-Uhr-Laufwerk funktioniert, wenn zwei Laufwerke zwei gleichzeitig ausfallen .

Die Unternehmenslaufwerke sind aus einem bestimmten Grund vorzuziehen, aber wenn Sie ehrlich zu sich selbst sind, warum Sie sie nicht verwenden, und PLAN für die viel wahrscheinlichere Ausfallrate, fahren Sie fort.

Kyle__
quelle
0

IOPS - wie viele brauchen Sie? Durchsatz - wie viel brauchen Sie?

Wenn Sie eine Aktualisierung durchführen und derzeit ATA-Laufwerke in Ihren vorhandenen Boxen verwenden, ist Ihr Speicher ein einschränkender Leistungsfaktor? Wenn nicht, könnten Sie wahrscheinlich bei den ATA-Laufwerken bleiben, obwohl, wie andere betonen, möglicherweise eine etwas höhere Ausfallrate auftritt.

Wenn Sie sich bei Leistungsproblemen nicht sicher sind, schauen Sie sich perfmon an, ob es sich um einen physischen Windows-Server handelt oder was auch immer das Äquivalent für Linux wäre. Virtuelle Serverprodukte verfügen über eigene Dienstprogramme, um die Festplattenleistung zu überprüfen. Sie können nach den Metriken suchen, die Sie untersuchen möchten.

SAS bietet bessere IOPS und einen besseren Durchsatz, was auf schnellere Such- und Spindeldrehzahlen zurückzuführen ist. Außerdem verfügen "Enterprise" -Produkte wahrscheinlich über bessere Algorithmen für den Umgang mit dem Cache (wann Sie fortfahren und schreiben müssen, wann Sie Schreibvorgänge vor dem Festschreiben sammeln müssen usw.).

Aber auch hier gilt: Wenn die Speicherleistung keine Rolle spielt, geben Sie kein Geld für die Aktualisierung aus. Oder selbst wenn dies der Fall ist, können Sie das bekommen, was Sie brauchen, indem Sie einfach langsamere billige Spindeln verwenden als weniger schnellere, aber teurere Spindeln. Finden Sie heraus, was Ihre Leistungsengpässe sind, und geben Sie dort Geld aus.

sjw
quelle