Hintergrund
In meinem privaten Desktop-System sind 5 SATA-Laufwerke installiert. Kürzlich fing mein System an, auf seltsame Weise wie zufällige Kernel-Panics zu versagen, und ich habe es schließlich auf zufällige Verschlechterungen des RAID-Arrays zurückgeführt. Manchmal konnte ich booten, manchmal nicht und so weiter. Nachdem ich eine Weile nach Software-Problemen gesucht hatte, zog ich endlich die Laufwerke heraus und stellte fest, warum sie versagten: Sie waren heißer als ein Grillabend am 4. Juli! Der vordere Gehäuselüfter hatte sich festgefahren, und der PS-Lüfter hatte einen losen Netzstecker im Rost, sodass das Innere des Gehäuses gekocht hatte.
Als Zwischenstopp fand ich einen Hausventilator und ließ den Sauger abkühlen. Es lief großartig mit allem, was schön und kalt war. Ungefähr zu dieser Zeit lernte ich, wie man von SMART Laufwerkstemperaturwerte abruft
for i in a b c d e; do
sudo smartctl --all /dev/sd$i | grep Temperature_Celsius
done
Jetzt weiß ich, dass bei geöffnetem Koffer ein Hausventilator die Spinnweben permanent ausräumt und die Laufwerke bei 31-32 ° laufen. Ein schneller Test ohne Belüftung, um den ausgefallenen Zustand zu reproduzieren, zeigt, dass die Laufwerke ziemlich schnell auf die hohen 40er gelaufen sind. Ich weiß nicht, wie schlimm es während des tatsächlichen Ausfalls war oder wie lange es so war.
In diesem Sinne habe ich die ausfallenden Lüfter ausgetauscht, ein paar mehr hinzugefügt, den vorderen Lüfter, der über die Laufwerke bläst, von 80 mm auf 120 mm verbessert und ihn wieder geschlossen. Wenn es wieder aufrecht steht, liegt der Temperaturbereich jetzt im Allgemeinen bei 32 ° unten und 37 ° oben.
Die Frage
Was ist ein allgemeiner sicherer Betriebstemperaturbereich für SATA-Laufwerke? Sollte 37 ° ein Problem sein oder ist ein Laufwerksschaden erst nach einem bestimmten Zeitpunkt ein Problem?
Obwohl sich die Laufwerke jetzt anscheinend gut testen lassen, wie wahrscheinlich ist es, dass sie in der Vergangenheit durch Hitzeeinwirkung zu Ausfällen neigen?
Antworten:
37 Grad sollten überhaupt kein Problem sein. Natürlich unterscheiden sich Festplatten in ihren Spezifikationen, einige können heißer als die anderen sein. Sie sollten die veröffentlichten Spezifikationen der Laufwerke überprüfen, über die Sie verfügen. Beispielsweise beträgt die Betriebstemperatur von WD Caviar Black 1 TB -0 ° C bis 60 ° C. Sie möchten natürlich nicht, dass Ihr Laufwerk 60 ° C heiß ist, da dies die Lebensdauer verringern könnte.
Google hat eine sehr interessante Studie (PDF) über den Zustand und die Lebensdauer von Festplatten veröffentlicht, die auf Daten basiert, die von ihren Systemen (viele Tausend Festplatten) gesammelt wurden. Diese Studie besagt, dass:
Die Grafik zeigt, dass die Fehlerrate erst dann steigt, wenn die Laufwerkstemperatur über 45 Grad liegt.
quelle
Dies ist nur meine begrenzte persönliche Erfahrung, aber ich habe ein paar Laufwerke bei 40 ° C ohne Probleme über 2-3 Jahre betrieben, da ich ein leises Gehäuse (gekühlt durch einen kleinen Lüfter, um ein Erreichen von 50 ° C zu vermeiden) verwendet habe. Bei diesen Temperaturen würde ich eher von einer kürzeren Lebensdauer und einem schnellen Tod ausgehen als von einer zufälligen Datenbeschädigung, aber ich könnte mich irren. In jedem Fall ist alles unter 40C-42C in Ordnung.
Unterschätzen Sie jedoch nicht andere Faktoren, die bei der Beschädigung von Daten eine Rolle spielen können:
1) Die South Bridge, auf der sich der IDE / RAID-Controller-Chipsatz befindet, wird häufig nur von einem kleinen Kühlkörper gekühlt. Sie neigen dazu, unter normalen Bedingungen heiß zu werden. Daher kann ein Anstieg der Umgebungstemperatur aufgrund eines mangelnden Luftstroms im Gehäuse und vieler Festplatten plausibel zu einer Beschädigung der Daten führen.
2) RAM- oder CPU-Überhitzung ist eine häufige Ursache von CRC-Speicherfehlern, die zu Datenkorruption führen. Das Überwachen der CPU-Temperatur und das Durchführen von Speichertests sind von entscheidender Bedeutung, wenn Daten beschädigt werden sollen.
Wenn Ihre aktuellen SMART-Indikatoren in Ordnung sind und keine nicht korrigierbaren Sektorzahlen anzeigen, würde ich die Laufwerke als sicher für die Verwendung betrachten.
quelle
Der erste Post gab an, dass der Benutzer nicht wusste, wie heiß seine Laufwerke waren - einige Discs zeichnen diesen Parameter auf und er ist über die SMART-Informationen zugänglich. Hard Disc Sentinal ist ein Teil der Sicherheit, das dies als maximale Temperatur während der gesamten Lebensdauer meldet.
Ich habe Ergebnisse für Maxstor-, WD- und Seagate-Laufwerke gesehen
Einige meiner externen USB-Laufwerke, die ich für die Datensicherung verwende, weisen maximale Temperaturen von 63 bzw. 64 ° C auf! Ich habe jetzt einen Kühler für das externe Laufwerk gebaut
quelle
Ich habe den oben genannten Bericht gelesen und die Betriebstemperaturbereiche für Samsung-, WD- und Hitachi-Festplatten überprüft. Aufgrund von Untersuchungen bin ich zu dem Schluss gekommen, dass Laufwerke im Bereich von 30 bis 45 Grad die geringste Wahrscheinlichkeit eines Ausfalls aufweisen. Eine SMART-Hochtemperatur von bis zu 55 Grad ist kein Grund zur Sorge. und dass Peek-Temperaturen über 60 Grad eine verringerte Lebensdauer des Laufwerks anzeigen würden.
Meine eigenen Tests haben ergeben, dass bei starkem Zugang mit einem Anstieg von bis zu 10 Grad zu rechnen ist.
Bei der Arbeit scheint es einen unbekannten Faktor zu geben, der abnormale Fehlerraten bei externen Laufwerken verursacht. Obwohl Wärme ein Teil des Problems zu sein scheint, ist dies nicht die vollständige Antwort. Ich empfehle allen Benutzern externer Laufwerke, die Temperaturen genau zu überwachen, wenn sich die Art der Laufwerksnutzung oder -umgebung ändert. Dies scheint ein "unbekanntes" (nicht das übliche) Problem zu sein, das zu einem unerwarteten Überhitzen dieser Laufwerke führt.
Ich lehne derzeit die Erklärung von Computerviren, Unwissenheit der Benutzer, schlechten USB-Protokollen und der Platzierung der Laufwerke an einem falschen Ort ab.
quelle