Wie überprüfe ich den Zustand einer SSD?

81

Wir alle wissen, dass SSDs eine begrenzte vorgegebene Lebensdauer haben. Die Frage für mich ist also, wie ich unter (Ubuntu) Linux den aktuellen Status meiner SSD überprüfe. Und vielleicht eine Schätzung, wie lange es dauern wird?

Das grafische Werkzeug wird bevorzugt, aber das Befehlszeilenwerkzeug wäre auch in Ordnung.

Ich benutze Xubuntu 12.04 LTS

keiki
quelle
1
Können Sie die Ausgabe von smartctl -i /dev/sdazu Ihrer Frage hinzufügen ?
Mitch
1
@ dschinn1001 Nicht genau, das gilt nur für aktuelle SSDs. Es ist bekannt, dass SSDs der ersten und zweiten Generation eine begrenzte Lebensdauer haben, die von der Anzahl der Schreibvorgänge auf die Festplatte abhängt.
João André
1
Ich stammte von alten, sich drehenden Laufwerken und verwendete Tools zum Testen von HD, die die gesamte Festplatte einige Male beschrieben und gelesen haben, was einige Stunden in Anspruch nahm. Es scheint, dass keines der genannten Tools einen solchen Ansatz verwendet? Ist ein solcher Ansatz für SSD nicht sinnvoll? Nun, dann scheint es, dass die SSD ihre eigenen Erfahrungen protokolliert und dann erkennt, ob sie krank ist. Habe ich das richtig verstanden?
Mads Skjern
@MadsSkjern Es ist durchaus möglich, ein Tool wie Badblocks zu verwenden, um den Status einer SSD zu überprüfen. Es gibt jedoch sehr gute Gründe, dies NICHT zu tun. Nach meiner Erfahrung versagen SSDs in der Regel nach Überschreiten einer bestimmten Schreibschwelle, sodass ein zerstörerischer Lese- und Schreibtest, wie er durchgeführt werden badblockskann, die Lebensdauer des Laufwerks verkürzen kann.
Elder Geek

Antworten:

35

Installieren Sie das Gnome-Festplatten-Dienstprogramm und überprüfen Sie SMART-Daten und -Tests auf Verschleißwerte oder ähnliches. Je höher diese Zahl (%, von 1 bis 100) ist, desto mehr ist Ihre SSD "verbraucht", was bedeutet, dass Sie mit größerer Wahrscheinlichkeit Probleme haben. Wenn Sie jedoch eine neuere SSD haben, brauchen Sie sich darüber keine Sorgen zu machen.

Installiert über

 sudo apt-get install gnome-disk-utility

starte es über

entweder Menü-> Einstellungen-> Festplatten-Dienstprogramm

oder über die Kommandozeile

sudo gnome-disks
João André
quelle
2
Ja, ich war mir über den Namen nicht sicher, da er in 12.10 geändert wurde
João André
8
palimpsest wird von Ubuntu 14.04 nicht erkannt, obwohl gnome-disk-utility installiert ist. Ich sehe auch kein Festplatten-Dienstprogramm in den Einstellungen (Zahnradsymbol). palimpsestist ein schrecklicher Name, variiert der Name mit der Benutzersprache (z. B. Englisch gegen etwas anderes).
Paul
10
als Hinweis für die Leser; palimpset wird in gnome-disks umbenannt (wie erwähnt unter askubuntu.com/a/623306/4580 ).
Immeëmosol
2
Warum sagen Sie "Wenn Sie eine aktuelle SSD haben, brauchen Sie sich darüber keine Sorgen zu machen"?
JFA
2
Du hast das falsch verstanden. Die Verschleißnummer beginnt bei 100 und nimmt mit Nutzung, so je höher die Zahl, die verwendet LESS ist die SSD finden Sie hier: superuser.com/questions/1037644/...
Logix
48

um den Zustand einer SSD zu überprüfen

Für Ubuntu-, Mint- oder Debian-basierte Distributionen

# apt-get install smartmontools

Der Media_Wearout_Indicator ist das, wonach Sie suchen. Für 100 bedeutet, dass Ihre SSD 100% Leben hat, die niedrigere Zahl bedeutet, dass weniger Leben übrig ist.

# smartctl -a /dev/sda | grep Media_Wearout_Indicator

Zum Anzeigen Ihrer SDD-Informationen

# smartctl -a /dev/sda

Den vollständigen Artikel finden Sie im Nam Huy Linux Blog - So überprüfen Sie das Leben von SSDs unter Linux

Blanca Higgins
quelle
1
Also, wenn mein Wert 199 - 199 hat, ist es glaubwürdig?
m4tm4t
7
Diese Eigenschaft wird in meiner SSD nicht angezeigt. Vielleicht sollte ich stattdessen auf Wear_Leveling_Count schauen? wie in: sudo smartctl -a / dev / sda | grep Wear_Leveling_Count BEARBEITEN: Bestätigt durch die Antwort unten: askubuntu.com/a/381779/221115
Jose Gómez
Auf Kingston hast duWear_Range_Delta
phreakbox
In KINGSTON SV300S37A240G sollten Sie nachSSD_Life_Left
Herlon Aguiar
Blanca Higgins, namhuy.net/1024/how-to-check-ssd-life-left.html ist tot.
mr.zog
35

Wenn Sie keine Intel-SSD haben: LESEN SIE DIESES.

Achtung !! - Ich wurde von "smartmontools" leichtfertig in die Irre geführt. Ich besitze eine Samsung- SSD, und der SmartMonitor / das Tool 'smartctl' meldete erfreulicherweise, dass das Attribut '233' (hex 'E9') 'Media_Wearout_Indicator' lautete. in der Tat - nein, für Samsung (und andere Hersteller) ist es ganz anders. Dieses und andere Forumsbeiträge, Stapelaustauschfragen / -antworten und Power-User-Blogs, die ich gefunden habe, scheinen auf Intel ausgerichtet zu sein, mit nur vagen Hinweisen, dass sie variieren können. (Im Gegensatz zu allen Vorschlägen, die Sie für eine falsche und fehlerhafte Kennzeichnung des Attributs durch smartmontools beachten müssen).

Als ich mich darauf vorbereitete, meine SSD auf eine neue Festplatte zu kopieren, die ich gekauft hatte (aufgrund der Angaben von smartmontools), startete ich unter Windows (ich habe ein Dual-Boot-System), um etwas über SSDs zu lernen, die nur unter Windows verfügbar waren Das Samsung-Tool 'Samsung_Magician_v43.exe' musste mir von meinem Laufwerk berichten - es war schockierend wenig aussagekräftig.

Nach stundenlangem Graben konnte ich endlich die Windows-Tools ausführen: hddgaurdian - 'code.google.com/p/hddguardian' und dann auch CrystalDiskInfo: Surprise! Beide Tools teilen mir unabhängig voneinander mit, dass meine Samsung-SSD „in Ordnung“ ist (Festplattenwächter sagt „5 Sterne“ und Crystal Disk „98% OK“). Im Gegensatz dazu hat das smartctl-Tool das Attribut explizit mit 'dezimal-233 /' hex-E9 'als "Media Wearout Indicator" gekennzeichnet - und mir mitgeteilt, dass sein Wert "1" oder 1% ist - ein Indikator für (das Risiko von) bevorstehender Fehler. Um so sicher wie möglich zu sein, habe ich mich umgegraben und konnte endlich etwas von einem Samsung-Mitarbeiter finden: " http://www.samsung.com/global/business/semiconductor/minisite/SSD/us/download/ 07_Kommunikation_mit_Ihrem_SSD.pdf"Das Dokument impliziert in der Tat, dass das Attribut 'hex E9' / 'decimal' 233 'von Samsung nicht auf die gleiche Weise verwendet wird. (Samsung: Ich bin sehr enttäuscht, bitte reparieren Sie entweder Ihr offizielles Software-Tool oder machen Sie es zumindest klar, dass Sie keine Angaben zur Verschleißanzeige machen!)

Wenn Sie weder eine Intel-SSD noch eine Samsung-SSD haben, werden Sie gewarnt, dass diese Informationen von Hersteller zu Hersteller variieren. (In der Attributetikettentabelle unter "code.google.com/p/hddguardian/wiki/about_reliability" finden Sie beispielsweise den einzigen nützlichen Hinweis auf den Variabilitätsgrad, den ich gefunden habe.)

Das A und O: Wenn Sie keine Intel-SSD haben, lassen Sie sich nicht von den falschen Attributnamenbezeichnungen irreführen, die von smartmonitor bereitgestellt werden. Vielleicht wird es sich in Zukunft verbessern, aber die standardmäßig für Ubuntu 12.04 LTS (April 2014) installierte Version war total ausgefallen. Anstatt Ihnen zu sagen, dass es nicht weiß, hat smartctl das Attribut falsch benannt. Ich habe kein anderes Tool für Linux gefunden, das die 'richtigen' Informationen transparent oder klar macht.

Matt S.
quelle
1
Requisiten für die Aufnahme des Links zur Samsungs-Dokumentation ihrer SMART-Attribute. Ich habe keine Ahnung, welche anderen Anwendungen Sie erwähnt haben oder wie nützlich sie sind, aber ich würde Ihnen dringend empfehlen, einfach das Attribut Nr. 5 "Anzahl neu zugewiesener Sektoren" im Auge zu behalten, da dies ein guter Indikator dafür ist, wie eng Ihre SSD ist Zum Scheitern: Sobald die freien Sektoren erschöpft sind, müssen diese ersetzt werden. Dann nähern Sie sich EOL auf Ihrer SSD
Maks
10

Für Kingston-Laufwerke auf Debian-basierten Computern

Ähnlich wie diese Antwort ausführen

# apt-get install smartmontools

Wenn ich jedoch den Befehl zum Anzeigen der Laufwerksinformationen ausführe, sieht es so aus, als wäre SMART deaktiviert:

# smartctl -a /dev/sda 
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-45-generic] (local build)
[ ... ]
SMART support is: Available - device has SMART capability.
SMART support is: Disabled

Sie müssen dies aktivieren, indem Sie Folgendes als root ausführen:

# smartctl -s on -a /dev/sda

Sie können dann einen Selbsttest durchführen, indem Sie entweder einen kurzen Test durchführen (der ca. 1 Minute dauerte):

# smartctl -t short -a /dev/sda

oder ein gründlicherer Test (der ungefähr 1,5 Stunden dauerte):

# smartctl -t long -a /dev/sda

Beachten Sie, dass Sie in den meisten Fällen das Laufwerk nicht aushängen müssen, um diese Tests auszuführen. Wenn Sie das tun, sehen Sie man smartctl.

Jetzt, wenn Sie ausführen smartctl -a /dev/sda, sollten Sie ein Selbsteinschätzungstestergebnis sehen. Dies ist wahrscheinlich alles, womit Sie sich wirklich befassen müssen:

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

Wenn Sie Details mögen, sehen Sie auch eine Tabelle wie diese:

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x0032   095   095   050    Old_age   Always       -       0/178007034
  5 Retired_Block_Count     0x0033   100   100   003    Pre-fail  Always       -       0
  9 Power_On_Hours_and_Msec 0x0032   092   092   000    Old_age   Always       -       7626h+46m+45.580s
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       8
171 Program_Fail_Count      0x000a   100   100   000    Old_age   Always       -       0
172 Erase_Fail_Count        0x0032   100   100   000    Old_age   Always       -       0
174 Unexpect_Power_Loss_Ct  0x0030   000   000   000    Old_age   Offline      -       4
177 Wear_Range_Delta        0x0000   000   000   000    Old_age   Offline      -       1
181 Program_Fail_Count      0x000a   100   100   000    Old_age   Always       -       0
182 Erase_Fail_Count        0x0032   100   100   000    Old_age   Always       -       0
187 Reported_Uncorrect      0x0012   100   100   000    Old_age   Always       -       0
189 Airflow_Temperature_Cel 0x0000   030   035   000    Old_age   Offline      -       30 (Min/Max 24/35)
194 Temperature_Celsius     0x0022   030   035   000    Old_age   Always       -       30 (Min/Max 24/35)
195 ECC_Uncorr_Error_Count  0x001c   120   120   000    Old_age   Offline      -       0/178007034
196 Reallocated_Event_Count 0x0033   100   100   003    Pre-fail  Always       -       0
201 Unc_Soft_Read_Err_Rate  0x001c   120   120   000    Old_age   Offline      -       0/178007034
204 Soft_ECC_Correct_Rate   0x001c   120   120   000    Old_age   Offline      -       0/178007034
230 Life_Curve_Status       0x0013   100   100   000    Pre-fail  Always       -       100
231 SSD_Life_Left           0x0013   100   100   010    Pre-fail  Always       -       0
233 SandForce_Internal      0x0032   000   000   000    Old_age   Always       -       3498
234 SandForce_Internal      0x0032   000   000   000    Old_age   Always       -       2885
241 Lifetime_Writes_GiB     0x0032   000   000   000    Old_age   Always       -       2885
242 Lifetime_Reads_GiB      0x0032   000   000   000    Old_age   Always       -       868

Wenn Sie wissen möchten, was all diese Werte bedeuten, lesen Sie die Kingston-Dokumentation .

Mike
quelle
Wenn du abstimmen willst, hinterlasse wenigstens einen Kommentar ...
Mike
1
Nicht alle SSDs von Kingston unterstützen sie alle. Einige, die (wie mein UV400 ) keine Zufallszahlen in den Feldern anzeigen, die sie nicht unterstützen.
Otus
Der Antwort fehlen einige nützliche Hinweise zu den intelligenten Details. Nur um sicherzustellen, dass der Leser die resultierende Wertetabelle richtig liest. Kurz gesagt scheint mir der SSD_Life_Left-Wert der einfachste Indikator zu sein. Wenn 100, nagelneues ssd, wenn 1, ein gehender toter ssd.
mh-cbon
@ mh-cbon Da die Antwort bereits relativ wortreich ist, habe ich einfach auf die Kingston-Dokumentation verwiesen, da es dort VIELE Details gibt. Wenn Sie jedoch der Meinung sind, dass Sie die Antwort verbessern können, können Sie sie jederzeit bearbeiten.
Mike
5

Wear_Leveling_Count ist das richtige Attribut zum Verfolgen. Wie bei den anderen Attributen ist jedoch 100 der BESTE Wert und 0 der SCHLECHTESTE. Betrachten Sie es als "Prozent Leben".

Jim Van Zandt
quelle
3
Es kann von Hersteller zu Hersteller unterschiedlich sein, aber dies ist höchstwahrscheinlich sehr falsch. Auf dieser Seite wird der Mikrometer-Code (auch bekannt als "kritischer m4-Code" usw.) erläutert. Der Code lautet "Durchschnittliche Löschanzahl aller guten Blöcke". Das ist eine Zahl, die mit der Nutzung zunimmt. Wenn Sie etwas über den Verschleißausgleich lesen , werden Sie feststellen, dass dieser mindestens bis zu Zehntausenden reichen sollte, bevor das Laufwerk defekt ist (dh, Sie werden ihn wahrscheinlich nicht mehr so ​​sterben sehen).
Goldlöckchen
2
Meins sagt 1461.
CMCDragonkai
4

Der beste Weg, um den Zustand einer SSD zu überprüfen, besteht darin, die Empfehlungen des Herstellers zu befolgen. Da diese von Hersteller zu Hersteller unterschiedlich sind und sich im Laufe der Zeit ändern können, sollten Sie sich bei Ihrem Festplattenhersteller erkundigen, wenn Sie Bedenken haben. Basierend auf MTBF-Ratings (der JEDEC JESD218A-Standard definiert die Methode), die von den meisten Herstellern bereitgestellt werden, sollte eine SSD problemlos über eine Million Stunden halten.

Ich habe mehrere davon, die mehrere Hersteller abdecken. Ich kann garantieren, dass die SMART-Attribute zwischen den Herstellern variieren. Zu Vergleichszwecken finden Sie hier ein Beispiel aus OCZ und Smart-Daten von einem Corsair F40-Gerät sowie eine Diskussion darüber, wie unzuverlässig diese Daten sind.

Obwohl SMART-Daten durchaus einen Wert haben können, ist es wichtig, dass Sie Ihre Daten regelmäßig sichern, da alle Geräte irgendwann ausfallen. Dies gibt Ihnen die Gewissheit, dass Ihre Daten sicher sind, während Sie (wahrscheinlich mehrere Jahre lang) darauf warten, dass Ihre SSD ausfällt. Wenn die Kosten sinken und die Kapazitäten steigen, ist es wahrscheinlicher, dass Sie eine SSD aufgrund von Platzmangel ersetzen als aufgrund eines Ausfalls. (Nach meiner Erfahrung 10x wahrscheinlicher). Ich würde einfach regelmäßig sichern und mich nicht darum kümmern.

Quellen:

Experience, http://www.hardcoreware.net/mtbf-ssd-what-does-it-mean-for-you/

Elder Geek
quelle
0

Für (zumindest einige) NVMe-Laufwerke können Sie dies tun

smartctl -a /dev/nvme0

Sie können dann nach einer Zeile suchen wie:

Percentage Used:                    5%

Hier sind niedrigere Zahlen besser und 100%bedeuten, dass das Laufwerk "abgenutzt" ist. Laut Herstellerdokumentation ist es möglich, Zahlen über 100% zu erhalten, wenn Sie das Laufwerk über diesen Punkt hinaus weiter verwenden ( Beispiel von Seagate, siehe Seite 12 ).

Beachten Sie, dass, wenn Sie den Namespace oder die Partitionsgeräte wie /dev/nvme0n1oder verwenden /dev/nvme0n1p1, dies nicht funktioniert und stattdessen eine Meldung wie folgt angezeigt wird Read NVMe SMART/Health Information failed: NVMe Status 0x4002.

Nate Eldredge
quelle