Schnelle Methode zur Feststellung des SSD-Zustands?

13

Ich habe ein Intel X-25M-Laufwerk, das in einem ZFS-Speicherarray zweimal als "Fehlgeschlagen" markiert wurde, wie hier angegeben . Nach dem Entfernen des Laufwerks scheint es jedoch auf anderen Computern (Mac, PC, USB-Gehäuse usw.) aktiviert, gelesen und beschrieben zu werden.

Gibt es eine gute Möglichkeit, den aktuellen Zustand des Laufwerks zu bestimmen? Ich bin der Meinung, dass der vorherige Fehler in der ZFS-Lösung die Konvergenz von Fehlern, Berichten über schlechte Fehler und Hardware war. Es scheint jedoch, dass dieses Laufwerk etwas Leben in sich birgt.

ewwhite
quelle
ist es ein g1 oder ein g2?
Jim B
Dies ist ein G2 120 GB X25-M-Laufwerk.
ewwhite

Antworten:

12

Eine gute, aber nicht unfehlbare Möglichkeit, den Zustand eines Laufwerks zu überprüfen, besteht darin, die SMART-Attribute zu überprüfen.

Unten ist das SMART-Attribut für eine Intel X25-M G2 160-GB-Festplatte aufgeführt, die mit smartctl v5.41 erstellt wurde. (Die Version ist wichtig, frühere Versionen von smartctl hatten unterschiedliche Zuordnungen von Attributnamen und verstanden die spezifische Tabelle für dieses Laufwerk nicht richtig.)

# ./smartctl -data -A /dev/sda
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-2.6.18-194.32.1.el5] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 5
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED     RAW_VALUE
  3 Spin_Up_Time            0x0020   100   100   000    Old_age   Offline      -       0
  4 Start_Stop_Count        0x0030   100   100   000    Old_age   Offline      -       0
  5 Reallocated_Sector_Ct   0x0032   100   100   000    Old_age   Always       -       1
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       4076
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       67
192 Unsafe_Shutdown_Count   0x0032   100   100   000    Old_age   Always       -       30
225 Host_Writes_32MiB       0x0030   200   200   000    Old_age   Offline      -       148418
226 Workld_Media_Wear_Indic 0x0032   100   100   000    Old_age   Always       -       755
227 Workld_Host_Reads_Perc  0x0032   100   100   000    Old_age   Always       -       49
228 Workload_Minutes        0x0032   100   100   000    Old_age   Always       -       16956537
232 Available_Reservd_Space 0x0033   099   099   010    Pre-fail  Always       -       0
233 Media_Wearout_Indicator 0x0032   098   098   000    Old_age   Always       -       0
184 End-to-End_Error        0x0033   100   100   099    Pre-fail  Always       -       0

Dies zeigt, dass dem Laufwerk 1 Sektor neu zugewiesen wurde, 1% seines verfügbaren reservierten Speicherplatzes (Attribut 232) und 2% seiner geplanten Programmier- / Löschzyklen (Attribut 233) verwendet wurden. Es wurden 148418 * 32MiB (Attribut 225) darauf geschrieben.

Wenn auf dem Laufwerk eine erhebliche Anzahl von neu zugewiesenen Sektoren angezeigt wird, kann dies Anlass zur Sorge geben, da dies wahrscheinlich auf einen fehlerhaften Flash-Chip hinweist (genauso wie eine erhebliche Anzahl von neu zugewiesenen Sektoren auf einer sich drehenden Festplatte im Allgemeinen auf Oberflächenfehler hinweist ). End-to-End-Fehler sind ebenfalls schlecht - ich habe einige X25-M G2 160-GB-Datenträger mit großen (> 1000) End-to-End-Fehlern ausfallen lassen. Es gibt jedoch nur zwei nützliche Fehlerbedingungsattribute für diese Festplatten, da die meisten nützlichen SMART-Attribute für normale Festplatten nicht für SSDs gelten.

SMART wird jedoch im Allgemeinen nicht als 100% zuverlässig angesehen. Googles Studie zu Festplattenfehlern ergab, dass die verschiedenen SMART-Frühwarnindikatoren zwar gut mit dem Ausfall eines Laufwerks korrelierten, dass sie jedoch kein nützliches Tool für die Vorhersage des Ausfalls eines einzelnen Laufwerks waren. Aus diesem Grund verwende ich SMART im Allgemeinen, um zu beweisen, dass ein Laufwerk schlecht ist (wenn Fehler angezeigt werden, wird es wahrscheinlich bald scheitern), anstatt zu beweisen, dass ein Laufwerk immer noch gut ist.

Daniel Lawson
quelle
1
Beachten Sie, dass sich Googles Studie auf Vor-Ausfall-Indikationen von SMART konzentrierte, die sich als weniger zuverlässig herausstellten. Das Melden von Fehlerzuständen ist etwas genauer.
Chris S
2

Obwohl das Dienstprogramm "Badblocks" für "traditionelle" Festplatten hergestellt wurde, kann es von Vorteil sein, da es alle zuordnungsfähigen Sektoren auf dem Laufwerk ausüben soll. Mit der SSD-Fragmentierungsverhinderung und internen Neuzuordnungen können Sie nicht sicher sein, ob das Laufwerk in Ordnung ist. Wenn sich jedoch herausstellt, dass das Laufwerk defekt ist, werde ich das Laufwerk mit Sicherheit als tot ausgeben.

bot403
quelle
1

HD Tune (und HD Tune Pro ) sind großartige Tools zum Messen des Zustands und der Leistung Ihres SSD-Laufwerks. Die kostenlose Version (HD Tune) verfügt nur über eine sehr eingeschränkte Funktionspalette, aber die Zustandsanalyse fällt darunter, sodass Sie das Glück hatten. Die Pro-Version hat eine 15-tägige Testversion, die ich unbedingt empfehlen sollte. Sie bietet Ihnen eine umfassende Analyse der Leistung Ihrer SSD.

András Szepesházi
quelle