Was ist die durchschnittliche Lebensdauer einer SATA-Festplatte?
Fast alle Daten, die ich finden kann, geben Fehlerraten für die ersten 0-5 Jahre an, aber keine scheint tatsächlich das Ende der Lebensdauer der Laufwerke zu finden.
Die Berichte, Diagramme und Studien von Google, Backblaze und ähnlichen Anbietern erzählen nur einen Teil der Geschichte, da sie sich auf die ersten fünf Jahre +/- konzentrieren.
Die Hypothese, dass 50% der Laufwerke innerhalb von 8 Jahren sterben, lässt nicht darauf schließen, dass die anderen 50% innerhalb von 16 Jahren sterben. Gibt es ein Diagramm, das 100% einer Reihe von Laufwerken bis zum Tod zeigt und die Ergebnisse liefert? Oder etwas, das gleichwertige Informationen liefern würde?
Unter der Annahme einer hohen Arbeitsbelastung der Verbraucher für Verbraucherlaufwerke in einem typischen klimatisierten Heim / Büro, wie hoch ist der weltweite Durchschnitt der Lebensdauer von Festplattenlaufwerken? Wiederum nicht Ausfallraten bei einer (kurzen) festgelegten Lebensdauer.
Die tatsächlichen Ergebnisse für uns sind, dass wir in 10 Jahren weniger als 10% Laufwerksausfälle hatten und nie eng beieinander liegen. Daher bin ich mit der Verwendung veralteter Laufwerke ziemlich vertraut, möchte jedoch informiert werden, wo immer dies möglich ist. Unser aktueller Satz von Laufwerken reicht von 0 bis 8 (in Betrieb) Jahren im Durchschnitt von ungefähr 3 bis 4 Jahren, der letzte Ausfall war ein 5-jähriger in Betrieb. Weiterhin haben wir ein 40 GB und 80 GB Laufwerk, die jeweils weit über 10 Jahre (Herstellungsdatum) alt sind und hier und da immer noch zuverlässig eingesetzt werden. Genügend Daten, um zu sagen, dass SATA-Festplatten zuverlässig länger als 5 Jahre halten, aber nicht genug, um einen Trend darüber aufzuzeigen, wie lange sie dauern.
Hintergrund:
Wir sind auf ein OBR10-Setup für ein kleines Unternehmen mit gealterten SATA-Laufwerken von 4 bis 6 Jahren umgezogen und ich versuche herauszufinden, wie umsichtig es wäre, auf ein MD RAID 10 mit 3 Kopien im Vergleich zu 2 Kopien umzusteigen.
Mit täglichen Datenspiegeln und vollständigen Sicherungen wäre es nicht nachteilig, einen vollständigen Verlust des primären Arrays zu haben und ein Backup erneut erstellen und wiederherstellen zu müssen, aber ich würde gerne ein solches Szenario vermeiden. Allerdings kann ich nicht scheinen , Daten zu finden , die weit über das Alter unserer aktuellen Laufwerke aussehen . und es gibt keine Anzeichen dafür, dass sie in Scharen an der 5 +/- Jahresmarke versagen, an der die Daten zu stoppen scheinen.
quelle
Antworten:
TLDR: Es ist unmöglich, eine Zahl für die durchschnittliche Lebensdauer der Festplatte anzugeben, da diese zu komplex ist.
Es gibt kein reales Maß für die durchschnittliche Lebensdauer, da es stark von einer ganzen Reihe verschiedener Faktoren abhängt. Es ist ein bisschen wie zu fragen, wie lang ein Stück Schnur ist . Für ein bestimmtes Laufwerk enthält ein Datenblatt möglicherweise einige relevante Informationen, obwohl dies immer noch ein grober Hinweis ist, der möglicherweise mit einer Prise Salz und Teeblättern interpretiert werden muss.
Zunächst einmal ist ein Ausfall eines einzelnen Laufwerks, wenn Sie ein Laufwerk haben, eine Tragödie, da ein Laufwerk eines überfallenen Arrays, das Teil eines Array-Clusters ist, eine Statistik ist. Man kann sich ein bestimmtes Laufwerk nicht ansehen und sagen, dass dies mit Sicherheit ein Jahrzehnt dauern wird ". Man kann sagen "Dieses Laufwerk sollte 5 Jahre dauern" und planen, es in geplanter Weise zu ersetzen.
Ich möchte auch darauf hinweisen, dass Backblaze und Google sowie die meisten Branchenunternehmen mit durchschnittlichen Ausfallraten und Zuverlässigkeit über die Lebensdauer eines Laufwerks unter bestimmten Bedingungen befasst sind . Sie möchten eine Lastwagenladung von Laufwerken kaufen, sie so billig und effizient wie möglich betreiben und sich erst dann wirklich Sorgen um sie machen, wenn der Austausch geplant ist. Es ist sogar besser zu wissen, dass "dies die Anzeichen sind, die ein Laufwerk zum Erliegen bringen wird", als dass sie zum Erlöschen gebracht werden. Außerdem ist es besser, die Kosten für die Kühlung eines Standorts mit den Hardwarekosten für das Braten von gerösteten Festplatten abzugleichen.
In der Praxis handelt es sich bei Festplatten um Standardgeräte - und in der Regel behalten die meisten Orte die Zuverlässigkeit nicht im Auge. Erst vor kurzem (relativ!) Haben große Unternehmen damit begonnen, gigantische Flotten dieser Laufwerke bereitzustellen und ihre Zuverlässigkeitsinformationen auszutauschen.
Es gibt einen guten Grund, warum der Schwerpunkt auf prädiktiver Fehleranalyse und Auswahlmodellen für Zuverlässigkeit und Langzeitzuverlässigkeit liegt . Einfach alle Hardware-Ausfälle und es ist „billiger“ in Bezug auf Arbeitsleistung, Ausfallzeiten und in einigen Fällen sogar das Ersetzen von Laufwerken, bevor sie dazu neigen, an einem mechanischen Ausfall zu sterben.
Spezifische Laufwerke können Probleme haben - die seagate 7200.11 für zufällig sterben wegen schlechten Firmware beispielsweise bekannt und wurde später festgelegt. Andere Laufwerksmarken und -modelle weisen möglicherweise ein lächerliches Maß an Zuverlässigkeit auf. Ich hatte buchstäblich noch nie einen Ausfall eines HGST-Desktop-Laufwerks.
Sie könnten die mittlere Ausfallzeit für das Modell nachschlagen - was mit der durchschnittlichen Lebensdauer der Festplatte korrelieren sollte, aber die moderne Literatur scheint es als eine Last von Pferdehockey zu betrachten. Seagate hat sowieso auf AFR umgestellt .
Als ich das nachgeschlagen habe, bin ich auf diese großartigen Folien von jemandem von WD gestoßen. Ich bin nicht sicher, ob die zugehörige Vorlesung online ist.
Es gibt ein hervorragendes Anzeichen dafür, welche Zuverlässigkeit / Lebensdauer von einem großen Festplattenhersteller mindestens erwartet wird.
Die typische Garantie für ein Enterprise-Gerät und ältere Consumer-Festplatten beträgt 5 Jahre. Für neuere Laufwerke sind es 3 Jahre. Ihr Festplattenhersteller geht also davon aus, dass seine Festplatten erst nach 5 Jahren ausfallen werden, da dies Geld kostet. Als solches gehen sie davon aus, dass Sie das Risiko entweder übernehmen oder es nach Ablauf der Zeit ersetzen würden.
Der Rest der Präsentation ist eine gute Lektüre, aber der größte Teil der Physik wird übersprungen.
Dies ist eine einfache kleine Grafik, die alle Elemente zeigt, die für die Zuverlässigkeit der Festplatte von Bedeutung sind
Und während die klassische Wannenrundung das ist, worüber die Leute mit Zuverlässigkeit des Laufwerks sprechen , spielen neben all diesen Design- und Umgebungsfaktoren auch Dinge wie der tatsächliche Arbeitszyklus, wenn Schreibvorgänge auf ein Laufwerk erfolgen, und die Temperatur eine Rolle . Es ist einfach zu komplex, um es zu erraten.
quelle