Ich habe mich gefragt, ob es eine gute Idee ist, eine Festplatte in einem (ziemlich) systemkritischen Datenbankserver nach einer bestimmten Anzahl von Nutzungsjahren zu ersetzen, bevor sie abstirbt.
Zum Beispiel dachte ich daran, eine Festplatte nach 3 Jahren Gebrauch auszutauschen. Da ich über mehrere Festplatten auf Servern verfüge, könnte ich stufenweise festlegen, welche Festplatten ersetzt werden.
Ist das eine gute Idee oder warten die Leute nur auf das Scheitern?
quelle
Nein.
Eines der größten Probleme beim Ersetzen einer Festplatte auf einem aktiven Produktionsserver ist, dass dadurch eine Neuerstellung ausgelöst wird. Insbesondere, wenn Sie RAID5 verwenden und insbesondere, wenn Sie große Laufwerke verwenden, führt das Erzwingen einer Neuerstellung zu einem erheblichen Risiko eines nicht behebbaren Fehlers. Das Risiko, das Array während einer Wiederherstellung zu verlieren, ist weitaus größer als das Risiko, ein 3 Jahre altes Laufwerk an Ort und Stelle zu lassen.
Ein extremes Beispiel: Wenn Sie nacheinander jede Festplatte in einem RAID5-Array mit 6 Festplatten und 2 TB ersetzen, liegt das theoretische Risiko eines nicht behebbaren Lesefehlers bei einer der Neuerstellungen bei 58% (nach meiner Serviettenberechnung; Bitte machen Sie Ihre eigenen und vergleichen Sie Notizen). Mit anderen Worten: Ihr "vorbeugender" Plattenwechsel ist praktisch nichts anderes als ein Sabotageakt.
Das einzige Mal, wenn ich in Betracht ziehen würde, Laufwerke in einem alten Server zu aktualisieren, wäre das "Auffrischen", z. B. nachdem ich von einer Aufgabe getrennt wurde und bevor ich sie mit einer neuen Rolle wieder in Betrieb nehme. Auch zu diesem Zeitpunkt wären Kapazitäts- und Leistungsanforderungen weitaus wichtiger als das Alter der Laufwerke.
quelle
Ich habe es nicht gesehen Wir behalten die Garantie für Server, bis diese aus der Produktion genommen werden - 5 Jahre. Mit Standard-RAID 5 können Sie einen Festplattenausfall überstehen, sodass wir nur ein paar Laufwerke zur Hand haben, um sofort mit der Wiederherstellung zu beginnen. Auf kritischen Servern wird ein Hotspare oder RAID 10 verwendet.
Wenn Sie feststellen, dass mehrere Laufwerke ausfallen In letzter Zeit ist auf einem Server möglicherweise ein Backplane-Problem aufgetreten. Es kann sich auch um neue Vibrationen oder Staub von nahegelegenen Bauteilen handeln.
quelle