Ist die Verwendung von SMART smart?

16

Vor ein paar Jahren wurde mir gesagt, ich solle SMART wie die Pest meiden. Die Überlegung war, dass die Belastung, die das Laufwerk durch das Testen erfährt, tatsächlich zum Ausfall des Laufwerks führt.

Ist das noch der Fall? Wenn nicht, wie oft sollten Tests durchgeführt werden? Wenn ich es dennoch vermeiden sollte, wie kann ich den Zustand meiner Festplatten besser überwachen?

Bob
quelle

Antworten:

30

Obwohl SMART mit Sicherheit nicht alle Fehler vorhersagt, habe ich mehrere Jahre in einer Computerreparaturwerkstatt gearbeitet, und viele Male war eine SMART-Fehlermeldung der erste Hinweis auf einen bevorstehenden Fehler, sodass ich die Kundendaten vor dem Laufwerk speichern konnte ist gestorben.

Die Technologie selbst belastet das Laufwerk nicht, sondern erfasst lediglich eine Reihe von Indikatoren (vollständige Liste hier: http://en.wikipedia.org/wiki/SMART .), Die möglicherweise zu einem Laufwerksausfall führen können, z.

  • Fehlerrate lesen
  • Neu zugewiesene Sektoren zählen
  • Anzahl der Wiederholungsversuche
  • Nicht korrigierbare Sektoranzahl
  • Betriebsstunden

Die Leistungseinbußen für SMART sind vernachlässigbar, belasten die Laufwerke nicht (die Überwachung ist passiv) und können Sie möglicherweise warnen, dass Sie im Begriff sind, alle Bilder Ihrer Kinder (oder Ihrer MP3-Sammlung oder was auch immer auf Ihrer Festplatte wichtig ist) zu verlieren ).

Kurz gesagt, lass es an.

Sean Earp
quelle
Ich denke, das Originalplakat wurde über die Gefahr von aktiven Oberflächentests informiert, die von SMART durchgeführt werden können (manuelle Durchführung von "langen" Tests). Wie Sie sagen, ist SMART standardmäßig passiv und sollte immer aktiviert sein. Persönlich führe ich auch einmal im Monat aktive Tests auf meinen Laufwerken durch.
Colas Nahaboo
3

Neben der passiven Protokollierung von Leistungsindikatoren und Ereignissen bietet SMART eine Schnittstelle, über die verschiedene vom Laufwerk durchgeführte Selbsttests initiiert und deren Ergebnisse später abgerufen werden können.

Einige dieser Tests umfassen das Scannen der gesamten Plattentelleroberfläche, während Sie online bleiben und auf Host-Anforderungen reagieren.

Ich vermute, das letztere ist die Quelle des schwerwiegenden Missverständnisses, das Ihnen mitgeteilt wurde. SMART ist nett.

NekojiruSou
quelle
-6

Vor einiger Zeit hat Google eine Studie (PDF) " Fehlertrends bei einer großen Festplattenpopulation " durchgeführt. Sie haben Tonnen von Laufwerken, die verwendet werden und die Studie zeigte:

Unsere Analyse identifiziert mehrere Parameter aus der SMART-Funktion (Self Monitoring Facility) des Frequenzumrichters, die in hohem Maße mit Fehlern korrelieren. Trotz dieser hohen Korrelation ist es unwahrscheinlich, dass Modelle, die nur auf SMART-Parametern basieren, für die Vorhersage einzelner Laufwerksausfälle nützlich sind. Überraschenderweise stellten wir fest, dass Temperatur- und Aktivitätsniveaus weniger mit Laufwerksausfällen korrelierten als zuvor berichtet.

Die Temperatur ist also ein viel größerer Faktor als die Belastung des Laufwerks. Mit all den Fehlerkorrekturen, die bei diesen neuen Laufwerken ständig auftreten, kommt so viel mehr Stress hinzu, über den Sie keine Kontrolle haben. Wenn Sie ein Tool zur Wartung (oder Wiederherstellung) Ihrer Laufwerke suchen, würde ich SpinRite empfehlen . Sein durch Steve Gibson und sein ein erstaunliches Produkt.

Bernie Perez
quelle
3
Bedeutet Ihre Referenz nicht, dass die Temperatur nicht mit dem Ausfall des Laufwerks korreliert? ... aber Sie betrachten sie als "viel größeren Faktor"? Bitte klären Sie, was Sie meinen
Michael Haren
Lese ich das falsch Es heißt, dass die Temperatur nicht stark mit dem Ausfall des Laufwerks korreliert, oder? Weder ist Aktivität nach diesem Papier.
MrChrister
1
"Die Temperatur ist also ein viel größerer Faktor als die Belastung des Laufwerks." - Woraus schließen Sie das? Der von Ihnen angegebene Absatz besagte Temperatur korrelierte nicht so stark.
Joe Phillips
3
-1 für das Versäumnis, nicht nur die Zusammenfassung des Papiers richtig zu lesen, sondern auch die Zeit zu verlieren, um das Ganze zu lesen. Ein Laufwerksausfall ist im Allgemeinen entweder auf einen Herstellungsfehler zurückzuführen (wie in Abb. 3 dargestellt: Eine hohe Auslastung in den ersten 3 Monaten beseitigt Komponentenfehler - danach beginnt ein Ausfall aufgrund der Auslastung zu konvergieren) oder auf eine Verschlechterung im Laufe der Zeit. Eine Verschlechterung im Laufe der Zeit wird SMART feststellen. Abb. 5 zeigt, dass die Temperatur überhaupt kein wichtiger Faktor ist. In der Tat geht der Bericht davon aus, dass kühlere Laufwerke eher eine Fehleränderung aufweisen als solche, die heiß laufen, sicherlich innerhalb der ersten drei Jahre.
Ian