Warum steigt die Anzahl meiner Festplattenzyklen so schnell an?

1

Ich möchte verstehen, warum SMART den Rohwert für die Lastzykluszählung meiner HGST-Festplatte als steigend meldet, und wenn ich etwas tun sollte, um dies zu minimieren, um die Lebensdauer meiner Festplatte zu verlängern.

Ich verwende Debian Jessie auf meinem Laptop und bin seit einigen Stunden an die Klimaanlage angeschlossen. Ich habe smartctl installiert:

# apt-get install smartmontools

Meine Festplatte ist ein HGST Travelstar:

$ sudo smartctl -a /dev/sda
...
Model Family:     HGST Travelstar 7K1000
Device Model:     HGST HTS721010A9E630
...

Ich habe ein Skript, das regelmäßig einige interessante Statistiken aufzeichnet:

  9 Power_On_Hours          0x0012   089   089   000    Old_age   Always       -       5236
 12 Power_Cycle_Count       0x0032   099   099   000    Old_age   Always       -       1598
193 Load_Cycle_Count        0x0012   070   070   000    Old_age   Always       -       305107

Mein Skript greift nach diesen Werten und speichert sie in einer Datei, damit ich sie mit gnuplot über die Zeit zeichnen kann:

Timestamp,PowerOnHoursValue,PowerOnHoursRawValue,PowerOnHoursWorst,PowerOnHoursThreshold,PowerCycleCountValue,PowerCycleCountRawValue,PowerCycleCountWorst,PowerCycleCountThreshold,LoadCycleCountValue,LoadCycleCountRawValue,LoadCycleCountWorst,LoadCycleCountThreshold
2017-06-10T11:02:18,089,5235,089,000,099,1598,099,000,070,304747,070,000
2017-06-10T11:17:01,089,5235,089,000,099,1598,099,000,070,304795,070,000
2017-06-10T12:17:01,089,5236,089,000,099,1598,099,000,070,305195,070,000
2017-06-10T12:27:03,089,5236,089,000,099,1598,099,000,070,305304,070,000

Ich habe cmd_linein meiner /etc/hdparm.confDatei keine Option festgelegt, mit der die hdparmAuslaufzeit konfiguriert werden kann. Ich habe auch keine -e apmOption in meiner /etc/smartd.confDatei festgelegt.

Ich führe MATE aus, bin mir aber nicht sicher, ob für die Auslaufzeit andere Konfigurationsoptionen als das Kontrollkästchen " Festplatten auslaufen lassen" unter " System"> "Einstellungen"> "Energieverwaltung" festgelegt wurden . (Im Übrigen ist diese Option derzeit im Netzbetrieb deaktiviert und im Akkubetrieb aktiviert .)

Von ca. 11:05 Uhr bis ca. 12:00 Uhr habe ich meinen Laptop alleine gelassen, ihn aber nicht in den Standby- oder Schlafmodus versetzt. Es war immer noch eingeschaltet, der Bildschirm war gesperrt.

Um 12:00 Uhr begann ich wieder damit und war bis 12:27 Uhr an der Tastatur

Hier sind meine aktuellen APM-Einstellungen:

$ sudo smartctl --get=apm /dev/sda
...
APM level is:     128 (minimum power consumption without standby)

$ sudo hdparm -I /dev/sda | grep level
    Advanced power management level: 128

$ sudo hdparm -B /dev/sda

/dev/sda:
 APM_level  = 128

Gemäß der Beschreibung der -SOption bis hdparmbedeutet 128, dass das Standby-Zeitlimit (Spindown-Zeitlimit) für das Laufwerk 128 * 5 = 640 Sekunden oder etwas mehr als 10 Minuten beträgt, wenn ich das richtig verstanden habe.

Update: Ich habe APM auf dem Laufwerk deaktiviert, indem ich my bearbeitet /etc/smartd.confund -e apm,241zu -e apm,offgeändert und dann smartmontools neu gestartet habe.

Dies scheint geholfen zu haben, den Anstieg zu stoppen:

Timestamp,PowerOnHoursValue,PowerOnHoursRawValue,PowerOnHoursWorst,PowerOnHoursThreshold,PowerCycleCountValue,PowerCycleCountRawValue,PowerCycleCountWorst,PowerCycleCountThreshold,LoadCycleCountValue,LoadCycleCountRawValue,LoadCycleCountWorst,LoadCycleCountThreshold
2017-06-10T11:02:18,089,5235,089,000,099,1598,099,000,070,304747,070,000
2017-06-10T11:17:01,089,5235,089,000,099,1598,099,000,070,304795,070,000
2017-06-10T12:17:01,089,5236,089,000,099,1598,099,000,070,305195,070,000
2017-06-10T12:27:03,089,5236,089,000,099,1598,099,000,070,305304,070,000
2017-06-10T13:17:01,089,5237,089,000,099,1598,099,000,070,305585,070,000
2017-06-10T14:17:01,089,5238,089,000,099,1599,099,000,070,305864,070,000
2017-06-10T14:59:17,089,5238,089,000,099,1600,099,000,070,305868,070,000
2017-06-10T14:59:24,089,5238,089,000,099,1600,099,000,070,305868,070,000
2017-06-10T15:00:05,089,5238,089,000,099,1600,099,000,070,305868,070,000
2017-06-10T15:01:06,089,5238,089,000,099,1600,099,000,070,305868,070,000
2017-06-10T15:02:08,089,5238,089,000,099,1600,099,000,070,305868,070,000
2017-06-10T15:03:09,089,5238,089,000,099,1600,099,000,070,305868,070,000
2017-06-10T15:04:10,089,5238,089,000,099,1600,099,000,070,305868,070,000
2017-06-10T15:05:11,089,5238,089,000,099,1600,099,000,070,305868,070,000
2017-06-10T15:05:26,089,5238,089,000,099,1600,099,000,070,305868,070,000
2017-06-10T15:15:27,089,5238,089,000,099,1600,099,000,070,305868,070,000
2017-06-10T15:17:01,089,5238,089,000,099,1600,099,000,070,305868,070,000

Wenn niemand bessere Ideen hat, kann ich als Nächstes versuchen, mit dem Wert 241 herumzuspielen, um zu sehen, wie sich das auswirkt. Nach der hdparmManpage:

  • 0 : Timeouts sind deaktiviert
  • 1..240 : Vielfache von 5 Sekunden, was zu Zeitüberschreitungen von 5 Sekunden bis 20 Minuten führt
  • 241..251 : 1..11 Einheiten von 30 Minuten, was zu Timeouts von 30m..5.5h führt
  • 252 : Zeitüberschreitung von 21 Minuten
  • 253 : Vom Anbieter definierte Zeitüberschreitungsperiode 8h..12h
  • 254 : reserviert
  • 255 : 21 Minuten plus 15 Sekunden

Ich wollte 241 für meinen Laptop, speziell für ein 30-minütiges Timeout, also würde ich erwarten, dass die Anzahl der Ladezyklen alle 30 Minuten um 1 erhöht wird. Es sieht jedoch so aus, als ob die Anzahl 300- bis 400-mal pro Stunde gestiegen ist, bevor ich APM deaktiviert habe, was im Durchschnitt 5- bis 7-mal pro Minute oder alle 8 bis 12 Sekunden passiert.

Bitte korrigieren Sie mich, wenn ich diese falsch interpretiere.

Update: Ich habe gerade den Laptop abgeholt und aus dem Suspend genommen. Im letzten Update habe ich die APM-Stufe nach dem Neustart nie überprüft smartmontools. Das mache ich diesmal.

Seit ich aus Suspend herausgekommen bin, habe ich bemerkt, dass sich meine Zykluszahl dieses Mal nur um 1 erhöht hat, seit mein Laptop in Suspend gegangen ist und nun aus Suspend herausgekommen ist:

...
2017-06-10T15:17:01,089,5238,089,000,099,1600,099,000,070,305868,070,000
2017-06-10T15:25:28,089,5238,089,000,099,1600,099,000,070,305868,070,000
2017-06-10T15:35:29,089,5239,089,000,099,1600,099,000,070,305868,070,000
2017-06-11T00:56:09,089,5239,089,000,099,1601,099,000,070,305869,070,000
2017-06-11T01:04:24,089,5239,089,000,099,1601,099,000,070,305869,070,000
...

Was lustig ist, ist, dass es jetzt wieder zunimmt:

...
2017-06-11T01:04:24,089,5239,089,000,099,1601,099,000,070,305869,070,000
2017-06-11T01:14:25,089,5239,089,000,099,1601,099,000,070,305918,070,000
2017-06-11T01:17:01,089,5239,089,000,099,1601,099,000,070,305918,070,000
2017-06-11T01:21:35,089,5239,089,000,099,1601,099,000,070,305918,070,000
2017-06-11T01:24:26,089,5239,089,000,099,1601,099,000,070,305918,070,000
2017-06-11T01:33:48,089,5239,089,000,099,1601,099,000,070,305963,070,000

Ich habe den APM-Level überprüft und es ist wieder 128:

$ sudo hdparm -I /dev/sda | grep level
    Advanced power management level: 128
$ sudo smartctl --get=apm /dev/sda
...
APM level is:     128 (minimum power consumption without standby)
$ sudo hdparm -B /dev/sda

/dev/sda:
 APM_level  = 128

Meine /etc/smartd.confEinstellungen wurden weiterhin angegeben, -e apm,offsodass ich einfach neu gestartet smartmontoolsund dann die APM-Stufe erneut überprüft habe:

$ sudo service smartmontools restart
$ sudo smartctl --get=apm /dev/sda
...
APM feature is:   Disabled
$ sudo hdparm -I /dev/sda | grep level
    Advanced power management level: disabled
$ sudo hdparm -B /dev/sda

/dev/sda:
 APM_level  = off

Ich habe den Laptop absichtlich wieder in den Suspend-Modus versetzt und ihn wieder herausgenommen. Ich habe den APM-Level überprüft und es war wieder 128, genau wie oben; Als ich neu gestartet habe smartmontools, war die APM-Ebene wieder wie oben deaktiviert.

Nach dem Deaktivieren von APM hält meine Zykluszahl wieder an:

...
2017-06-11T01:33:48,089,5239,089,000,099,1601,099,000,070,305963,070,000
2017-06-11T01:34:27,089,5239,089,000,099,1601,099,000,070,305971,070,000
2017-06-11T01:42:06,089,5239,089,000,099,1601,099,000,070,306048,070,000
2017-06-11T01:42:58,089,5239,089,000,099,1602,099,000,070,306050,070,000
2017-06-11T01:43:24,089,5239,089,000,099,1602,099,000,070,306050,070,000
2017-06-11T01:44:32,089,5239,089,000,099,1602,099,000,070,306050,070,000
2017-06-11T01:45:00,089,5239,089,000,099,1602,099,000,070,306050,070,000

Nach den Informationen in Fehler # 1248012 habe ich versucht, die APM-Optionen zu aktivieren in /etc/hdparm.conf:

...
# -B apm setting
#apm = 255
apm = 255
# -B apm setting when on battery
#apm_battery = 127
apm_battery = 255
...

Ich habe neu gestartet hdparm:

$ sudo /etc/init.d/hdparm restart

Nachdem ich die Festplatte in den Suspend-Modus versetzt und wieder herausgenommen hatte, stellte ich fest, dass der APM-Wert wieder 128 beträgt.

Ich habe dazu die Frage # 1218107 geöffnet .

jia103
quelle

Antworten:

1

Diese Werte, die Sie von erhalten haben, man hdparmgelten für die -SOption - Drehen nach unten, wodurch die Plattendrehung stoppt.

Meine schnelle Recherche hat ergeben, dass Load_Cycle_Counteine Verbindung zu Parkköpfen besteht und die -BOption (Advanced Power Management, APM) die richtige ist. Die Beschreibung in der Manpage ist mir nicht ganz klar, aber Ihr Wert von 128ist der aggressivste , der kein Herunterfahren zulässt. Ich vermute, es parkt die Köpfe am häufigsten.

Sie berechnen eine Auslaufzeit aus diesem Wert der 128Verwendung der Beschreibung von -Sund ich denke, es ist falsch. Diese Berechnung verwirrt -Bund -S. Dieselbe Verwirrung tritt auf, wenn Sie APM auf einstellen 241.

Ich habe Behauptungen gesehen , die hdparm -B 255 /dev/sdXhelfen. Es deaktiviert jedoch Advanced Power Management. Meine Festplatte ist auf eingestellt 254und hat, wie ich finde, einen moderaten Wert in Load_Cycle_CountBezug auf Power_On_Hours: 200k bzw. 20k. Das Verhältnis ist also viel besser als bei Ihnen.

Mein Rat ist, eine der folgenden zu verwenden:

hdparm -B 127 /dev/sdX
hdparm -B 254 /dev/sdX
hdparm -B 255 /dev/sdX

Ich denke, wenn Sie -Beinen Wert einstellen , der ein Herunterfahren erlaubt (dh 127oder weniger), sollten Sie auch die -SOption anpassen , um eine nicht zu kurze Herunterfahrzeit zu erhalten. Dies liegt daran, dass bei jedem Herunterdrehen die Köpfe geparkt werden müssen.

Während man hdparmwarnt vor verschiedenen gefährlichen Optionen, -Bist nicht unter ihnen. Auch wenn ich völlig falsch liege, sollte es sicher sein, zu experimentieren.

Kamil Maciorowski
quelle
Ich habe sowohl 127 als auch 255 manuell versucht, wie oben für die Option -B angegeben. beide halten die Lastzykluszahl konstant. Das einzige verbleibende Problem ist, warum es immer wieder zurückgesetzt wird, für das ich eine separate Frage geöffnet habe, wie oben in meiner Bearbeitung beschrieben.
Jia103