Ich möchte einen Speicherserver aufbauen und habe gekauft 10 x 2TB WD RED's
. Der ist HDD's
gerade angekommen.
Gibt es ein Tool, mit dem Sie nach defekten Laufwerken suchen oder die Kindersterblichkeit am besten bekämpfen können, bevor Sie echte Daten auf Ihre Datenträger kopieren?
Ist es besser, jedes einzelne zu überprüfen HDD
oder das Array ( ZFS raid-z2
) zu testen, indem viele Daten darauf kopiert werden?
Antworten:
Ich hatte vor 2 Monaten die gleiche Frage. Nach dem Senden einer ausgefallenen Festplatte ist die Ersatzfestplatte in meinem NAS nach 3 Tagen ausgefallen. Deshalb habe ich beschlossen, den neuen Ersatz jetzt zu testen, bevor er in Produktion geht. Ich teste nicht jede neue Festplatte, die ich kaufe, sondern nur 'überholte' Festplatten, denen ich nicht ganz vertraue.
Wenn Sie diese Festplatten testen möchten, würde ich empfehlen, einen Badblockscan und einen erweiterten SMART-Test auf der brandneuen Festplatte durchzuführen.
Auf einer 2-TB-Festplatte dauert dies bis zu 48 Stunden. Der Befehl badblock schreibt die Festplatte mit einem Muster voll und liest dann die Blöcke erneut, um festzustellen, ob das Muster tatsächlich vorhanden ist, und wiederholt dies mit 4 verschiedenen Mustern.
Dieser Befehl wird wahrscheinlich keine fehlerhaften Blöcke auf einer neuen Festplatte anzeigen, da Festplatten in diesen Tagen fehlerhafte Blöcke neu zuweisen.
Vorher und nachher führte ich einen intelligenten Test durch und überprüfte die neu zugewiesene und aktuelle Anzahl der ausstehenden Sektoren. Wenn einer dieser Fehler aufgetreten ist, weist Ihre Festplatte bereits einige fehlerhafte Blöcke auf und ist möglicherweise nicht vertrauenswürdig.
Danach führe ich erneut einen erweiterten SMART-Test durch.
Möglicherweise möchten Sie zuerst smartctl oder smartmontools installieren.
Achtung , das Flag badblocks -w überschreibt alle Daten auf Ihrer Festplatte. Wenn Sie nur eine Lesekontrolle durchführen möchten, ohne die Festplatte zu überschreiben, verwenden Sie
badblocks -vs /dev/sdX
Wenn danach Ihre Smart-Werte in Ordnung zu sein scheinen, würde ich der Festplatte vertrauen.
Um zu wissen, was jeder Smart Value bedeutet, können Sie hier nachschauen
http://en.wikipedia.org/wiki/Self-Monitoring,_Analysis,_and_Reporting_Technology
quelle
Dies sind neue Festplatten. Entweder werden sie scheitern oder nicht. Mit dem ZFS-Dateisystem sind Sie bereits einen großen Schritt voraus. So erhalten Sie einen umfassenden Einblick in den Zustand Ihres Schlachtzugs und Ihres Dateisystems.
Ich würde nichts anderes tun, als nur das Array aufzubauen. Das ist der Punkt der Redundanz. Mit den anderen aufgeführten Methoden können Sie keinen Laufwerksfehler auslösen.
quelle
Sie können Bonnie ++ zum Testen verwenden. Es kann das Verhaltensmuster eines Dateiservers perfekt emulieren.
Beispielsweise:
Der Test wird als Benutzer "nobody" ausgeführt und erstellt / überschreibt / löscht 100 * 1024 Dateien mit einer Größe von 200 bis 150000 Bytes pro Datei in 100 automatisch erstellten Verzeichnissen unterhalb von / home / tmp. Und Anzahl der Tests = 300. Sie können die Anzahl / Größe der Dateien und die Anzahl der Testwiederholungen herumspielen.
quelle
Normalerweise führe ich nur eine vollständige RAID-Init-Operation durch und beginne dabei, das Dateisystem zu füllen, wobei ich ständig weiß, dass möglicherweise ein Problem aufgrund von Laufwerksausfällen vorliegt. Auf diese Weise verschwende ich keine Zeit für Tests, die sowieso ziemlich unzuverlässig sind, und würde die wirklich schwachen Laufwerke sofort erkennen. Danach besteht möglicherweise immer noch eine erhöhte Wahrscheinlichkeit für Laufwerksausfälle aufgrund der "Kindersterblichkeit", aber es gibt keinen praktischen Weg, dies zu beseitigen.
In der Praxis gab es während des ersten Betriebsjahres bei keiner der letzten hundert Festplatten, die ich in einem RAID verwendet habe, Probleme.
quelle
Ich arbeite für ein Unternehmen, das solche Tests tagtäglich durchführt. Und ja, wir testen jede einzelne Festplatte, die wir kaufen. Unser Prozess beginnt mit dem Ausführen der Laufwerke über ein kostenloses DOS-basiertes Programm namens HDAT2. Es kann kostenlos heruntergeladen werden. Es kann auf SMART und einige andere Funktionen des Laufwerks zugreifen, auf die in einer Windows-Umgebung nicht zugegriffen werden kann. Abhängig von den Ergebnissen werden wir sie durch eine von mehreren verschiedenen Linien spezialisierter Hardware führen, aber im Kern führen sie meist nur einen kurzen SMART-Selbsttest, einen langen Test, ein sicheres Löschen und einen All Read durch, um die Sektoren zu überprüfen. Mein Vorschlag wäre, ein sicheres Löschen der gesamten Festplatte durchzuführen, dann einen vollständigen Lesevorgang und dann einen kurzen SMART-Selbsttest. Diese Reihenfolge ist wichtig, da ein kurzer Selbsttest möglicherweise nichts findet, wenn er zu Beginn des Tests ausgeführt wird. Nach einem vollständigen Beschreiben und Lesen der Disc kann sich jedoch ein Problem ergeben. Hoffe das hilft.
quelle
Sie können die Testsuite des Herstellers oder so etwas wie SpinRite verwenden , um die gesamte Festplatte zu durchsuchen . Es wäre auch eine gute Idee, sich die SMART- Werte anzusehen und nach schlechten Sektoren und anderen Alters- / Versagenszeichen Ausschau zu halten.
quelle
Wenn Sie wirklich testen möchten, verwenden Sie den Schreibtest
badblocks
. Es schreibt Datenmuster auf die Festplatte und liest sie dann zur Überprüfung. Währenddessen wird Ihre Festplatte ein wenig belastet. Meiner Meinung nach können Sie der Festplatte vertrauen, wenn sie erfolgreich ausgeführt wird.Aber ich denke, ZFS und gutes Backup ist genug.
quelle