So setzen Sie SMART-Ergebnisse zurück

16

Wie kann ich die SMART-Ergebnisse zurücksetzen, damit frühere Ergebnisse nicht registriert werden? Mein Grund ist, dass ich die Festplatten zusammen in einem geschlossenen Gehäuse getestet habe. Dadurch konnte eine der Festplatten die Luftstromtemperatur nicht messen.

Nach dem Öffnen des Gehäuses (wodurch die Temperatur aller Laufwerke in 5 Minuten um 10 Grad Celsius gesenkt wurde) und dem anschließenden Trennen der Laufwerke um etwas mehr (3 Grad weniger) waren alle Ergebnisse gut zeigt sich als gescheitert.

Wie kann ich die Messwerte für SMART zurücksetzen?

Bildbeschreibung hier eingeben

Luis Alvarado
quelle
1
Ich denke, Sie können Mhdd verwenden, um Smart auszuschalten. Es ist mit den Floppy-Tools auf sysresccd.org/System-tools nicht die beste Idee ... aber es könnte sich lohnen, sie sich anzusehen .
Mateo
2
Warum möchten Sie es zurücksetzen?
Angelo
Nun, es war im Grunde genommen vor drei Jahren, aber ich glaube, es war, weil sich die Festplatte zu diesem Zeitpunkt an einem Ort befand, an dem es sehr heiß war. Nachdem es in einen Raum mit eher kaltem Klima gebracht wurde, blieb das Problem bestehen, obwohl die Temperatur von 68 auf 37 Grad stieg. Es handelte sich also um einen externen Temperaturanstieg, der das Problem am Anfang verursachte, aber nach dem Verschieben an einen anderen Ort immer noch auftrat.
Luis Alvarado

Antworten:

0

Festplatten haben aus Wiederherstellungsgründen freien Speicherplatz. Die Wiederherstellung erfolgt automatisch. Wiederherstellungstools ordnen nur physisch fehlerhafte Sektoren diesem freien Speicherplatz zu. Sobald eine Neuzuordnung vorgenommen wurde und ein Lese- oder Schreibzugriff auf einen fehlerhaften Sektor erfolgt, schaltet das Laufwerk den Zugriff auf den freien Speicherplatz frei und blendet den Fehler aus.

Um ehrlich zu sein, kenne ich keine Möglichkeit, SMART-Daten zurückzusetzen. Es ist etwas, das die Festplatte intern unterhält, und auf jeden Fall wäre es eine schlechte Sache.

SMART meldet, dass Ihre Festplatte ausfällt! Das Zurücksetzen der Zähler ändert nichts an der Tatsache, dass ein Fehlerschwellenwert für das Laufwerk überschritten wurde.

NEIN, Sie können den SMART-Verlauf nicht zurücksetzen. Es wird im Werk installiert, um bei einem Ausfall eine Laufwerksbewertung durchzuführen. SMART kann nur deaktiviert oder aktiviert werden.

Ich hoffe das beantwortet deine Frage.

Mitch
quelle
Hallo Mitch, gut wie in der Frage erklärt, ist der Fehler nicht real. Das lag daran, dass alle Festplatten in einem schlecht belüfteten Raum sehr dicht zusammen standen. Nachdem das geändert und erneut getestet wurde, funktionierte es einwandfrei, außer dass es immer noch den vergangenen Fehler erwähnte. Im Moment habe ich das folgende sudo smartctl -l sataphy, reset / dev / sdd ausgeführt, wodurch das Problem der Gesamtbewertung unter Berücksichtigung des vorherigen Fehlers behoben wurde, der jetzt normal erscheint, der Fehler jedoch für das bestimmte Attribut weiterhin angezeigt wird. Auch hier fällt die Festplatte nicht aus, der vorherige Fehler wird jedoch weiterhin angezeigt.
Luis Alvarado
Ich verstehe, aber es mag normal erscheinen, es ist nur versteckt. Sie haben gefragt, ob dies zurückgesetzt werden kann, und die Antwort lautet NEIN. Auch wenn Sie den Fehler verbergen konnten, kann der Hersteller, sobald das Laufwerk aus irgendeinem Grund an den Hersteller geht, feststellen, was mit dem Laufwerk im Laufe der Zeit tatsächlich schief gelaufen ist. Alles, was ich sage, ist, dass der vorherige Fehler weiterhin angezeigt wird, und es sei denn, Sie können die Werkzeuge des Herstellers in die Hand nehmen, um den SMART-Status des Laufwerks wiederherzustellen.
Mitch
26

Eigentlich gibt es eine Möglichkeit, SMART-Daten zurückzusetzen. Sie benötigen nur einen einfachen RS232-zu-USB-Konverter (UART zu TTL) und ein paar Kabel, die an die Festplatten-Diagnoseschnittstellen angeschlossen sind. (Es befindet sich auf der rechten Seite des SATA-Ports, 5 oder 4-polig.) Sie müssen RX-TX- und GND-Kabel (und natürlich das Stromkabel: D) anschließen, dann die Festplatte einschalten und mit Putty oder Hyperterminal daran anschließen (Linux kann eine Verbindung herstellen) eigenes Terminal, denke ich) zum Beispiel für Seagate-Laufwerke: für 7200.10 und ältere beträgt die Baudrate 9600 für 7200.11 und neuere 38400

Befehle nach dem Verbindungsaufbau drücken Sie STRG + Z und geben Sie "/ 1" ein. Drücken Sie dann die Eingabetaste. Geben Sie "N1" ein, wenn alle Kabel entfernt sind. Schalten Sie die Festplatte wie gewohnt ein, um die Änderungen zu sehen. :)

für andere hdd info benutze google :)

HERR X
quelle
5
Dies scheint nur für Seagate-Laufwerke zu gelten, aber Sie haben Recht. In diesem Video wird der Vorgang erläutert.
Adrian Frühwirth
5
Einer meiner Kollegen hat Seagate kontaktiert und uns mitgeteilt, dass diese Funktion seitdem gesperrt ist, sodass ohne ein proprietäres Tool nicht darauf zugegriffen werden kann. Ich bin nicht sicher, zu welchem ​​Zeitpunkt sie das getan haben.
JFA
4

SMART-Daten sind bei den Herstellern keine Standarddaten, aber der Festplattentemperaturtest sollte anzeigen, ob die Festplattentemperatur in der Vergangenheit einen Schwellenwert überschritten hat: http://en.wikipedia.org/wiki/SMART#Known_ATA_S.MART_attributes

Der Gedanke ist, dass eine Überhitzung die Wahrscheinlichkeit eines Ausfalls erhöht. SMART sagt nicht, dass Ihr Laufwerk defekt ist, aber die Wahrscheinlichkeit eines zukünftigen Ausfalls steigt.

SMART ist als Überwachung des Laufwerkverlaufs gedacht und wird vom Laufwerk selbst verwaltet, sodass Sie SMART-Werte nicht zurücksetzen oder löschen können.

Leicht kubanisch
quelle
3

Der Punkt der aktuellen / schlechtesten Eigenschaften wie der Temperatur ist genau dieser: um Ihnen mitzuteilen, ob der Antrieb jemals seine maximale Betriebstemperatur überschritten hat und somit bleibende Schäden erlitten haben könnte.

Deshalb heißt es "in der Vergangenheit fehlgeschlagen", nicht "jetzt fehlgeschlagen": Sie haben die Höchsttemperatur-Schwelle nur knapp berührt. Beachten Sie, dass in der Attributanzeige "normalisiert: 50, Schwelle: 45, schlechteste: 45" angezeigt wird. (Dies sind 0..200 normalisierte Werte wie für jedes andere Attribut, nicht rohe Celsius-Temperaturen.)

Sie haben auch einige fehlerhafte Sektoren (nicht korrigierbare Sektorenfehler). Es ist also wahrscheinlich an der Zeit, dieses Laufwerk außer Betrieb zu setzen, unabhängig davon, ob die kurze, hohe Temperatur dies verursacht hat oder nicht.

Eine bessere Benutzeroberfläche für die SMART-Software zeigt Ihnen die aktuelle und höchste Temperatur . zB
smartctl -a /dev/sdaoder smartctl -x /dev/sda( -xdruckt alle verfügbaren SMART- und Nicht-SMART-Daten, die vom Laufwerk abgerufen werden können, einschließlich eines Temperaturverlaufsprotokolls (falls vorhanden), mit einem ASCII-Balkendiagramm.)

smartctl -x enthält dies für eine alte WD Green 1 TB (WD10EADS) -Festplatte:

Current Temperature:                    36 Celsius
Power Cycle Min/Max Temperature:     25/42 Celsius
Lifetime    Min/Max Temperature:     35/46 Celsius

Die Software, die Sie verwenden, scheint nur die aktuelle Temperatur anzuzeigen, die etwas unter dem Schwellenwert liegt, aber es wird nicht die Tatsache verbergen, dass das Laufwerk zu einem bestimmten Zeitpunkt in der Vergangenheit nicht den Spezifikationen entsprach.


Sie könnten es durchaus rechtfertigen, diese momentane Hochtemperatur zu ignorieren, wenn Sie sie wirklich innerhalb von Minuten korrigieren würden. Aber Sie werden (oder sollten) niemals in der Lage sein, das Laufwerk selbst zum Lügen zu bringen, weil es für einige Zeit über der angegebenen Maximaltemperatur lag und das Attribut in der Vergangenheit fehlgeschlagen ist.

Sie können so konfigurieren smartd, dass ein bestimmtes Attribut ignoriert wird, sodass Sie weiterhin eine nützliche Benachrichtigung erhalten, wenn etwas anderes einen Schwellenwert in ein Gebiet überschreitet, das offiziell nicht funktioniert. : smartd.conf(5)sagt:

-i ID [ATA only]Ignorieren Sie die ID der Geräteattributnummer, wenn Sie prüfen, ob die Verwendungsattribute fehlerhaft sind. ID muss eine Dezimalzahl im Bereich von 1 bis 255 sein. Diese Direktive ändert das Verhalten der '-f'-Direktive und hat ohne sie keine Auswirkung.

Dies ist beispielsweise dann nützlich, wenn Sie eine sehr alte Festplatte haben und nicht ständig Nachrichten über das Fehlschlagen des Attributs "Stunden auf Lebenszeit" (normalerweise Attribut 9) erhalten möchten. Diese Direktive kann für ein einzelnes Gerät mehrmals vorkommen, wenn Sie mehrere Attribute ignorieren möchten.


Erweiterte Temperaturverlaufsattribute

Ich habe gerade einen neuen 6-TB-Seagate-Barracuda (ST6000DM003-2CY186-Firmware 0001, ein Laufwerk mit 5425 U / min ) erhalten, der einige interessante Statistiken enthält, einschließlich der Zeit, die für das Überschreiten von Min / Max-Betriebspunkten und des Hochs / Tiefs von Kurzzeit- und Log-Temps aufgewendet wurde .

SCT Status Version:                  3
SCT Version (vendor specific):       522 (0x020a)
Device State:                        Active (0)
Current Temperature:                    33 Celsius
Power Cycle Min/Max Temperature:     27/33 Celsius
Lifetime    Min/Max Temperature:     27/33 Celsius
Under/Over Temperature Limit Count:   0/0

SCT Temperature History Version:     2
Temperature Sampling Period:         3 minutes
Temperature Logging Interval:        59 minutes
Min/Max recommended Temperature:     14/55 Celsius
Min/Max Temperature Limit:           10/60 Celsius
Temperature History Size (Index):    128 (2)

Und im ausführlichen Abschnitt:

0x05  =====  =               =  ===  == Temperature Statistics (rev 1) ==
0x05  0x008  1              33  ---  Current Temperature
0x05  0x010  1               -  ---  Average Short Term Temperature
0x05  0x018  1               -  ---  Average Long Term Temperature
0x05  0x020  1              33  ---  Highest Temperature
0x05  0x028  1              30  ---  Lowest Temperature
0x05  0x030  1               -  ---  Highest Average Short Term Temperature
0x05  0x038  1               -  ---  Lowest Average Short Term Temperature
0x05  0x040  1               -  ---  Highest Average Long Term Temperature
0x05  0x048  1               -  ---  Lowest Average Long Term Temperature
0x05  0x050  4               0  ---  Time in Over-Temperature
0x05  0x058  1              55  ---  Specified Maximum Operating Temperature
0x05  0x060  4               0  ---  Time in Under-Temperature
0x05  0x068  1              13  ---  Specified Minimum Operating Temperature

(Das Laufwerk ist erst seit ein paar Minuten eingeschaltet. Vermutlich gibt es deshalb -in einigen Feldern ein for no data.)

Wenn Sie mit diesen erweiterten Attributen fahren, können Sie jemandem zeigen, dass die Zeit, die Sie außerhalb der zulässigen Zeit verbracht haben, sehr kurz war (falls dies der Fall ist). Wenn Sie wahrscheinlich die SMART-Daten ändern würden, hätten Sie dies einfach getan und jede Erwähnung entfernt, dass sie sich jemals außerhalb der Reichweite befänden, aber offensichtlich können Sie keinen Daten von einem Zweithand-Laufwerk, das diese Daten enthält, 100% vertrauen jemand versucht dich zu verkaufen.

Unter /superuser/1389522/what-does-it-mean-when-my-new-hdd-reports-errors-at-a-time-that-shouldnt-exist- für weitere Informationen zu verwendeten Laufwerken mit Beispiel: "Rollback des Kilometerzählers" für das Attribut "Power_On_Hours".

Peter Cordes
quelle
Vielen Dank Peter für die gründliche Analyse hier. Sehr geschätzt.
Luis Alvarado
0

Meines Wissens besteht die einzige Möglichkeit, dies zu stoppen, darin, SMART im BIOS zu deaktivieren. Dies stoppt jedoch nur die HARDWARE.

Ihr Betriebssystem fragt das Laufwerk weiterhin nach seinen SMART-Informationen ab und teilt Ihnen mit, dass ein Fehler vorliegt.

Jesseryte
quelle