Warum verbraucht ein nicht partitioniertes Hitachi HDS5C3020-Laufwerk 15 Minuten nach dem Start 50% mehr Strom?

19

In einem Debian 6.0.6-System gibt es 74 Stück 2 TB Toshiba DT01ABA200-Laufwerke. Diese Laufwerke werden als Hitachi HDS5C3020BLE630-Laufwerke mit Firmware-Revision MZ4OAAB0 bezeichnet. 64 Laufwerke, die über HP SAS-Erweiterungskarten an einen LSI 2008 SAS-Controller angeschlossen sind, weitere 5 Laufwerke sind direkt an das Mainboard angeschlossen, 4 Laufwerke sind an einen Sil-basierten PCI-Controller angeschlossen und das letzte Laufwerk wird nur mit Strom versorgt und es ist kein Datenkabel angeschlossen. Das Onboard-BIOS des Controller-LSI und der Sil-Karte ist deaktiviert, und die Module mpt2sas und sata_sil werden vom Linux-Kernel debian 2.6.32-5-amd64 # 1 SMP entfernt. Sun Sep 23 10:07:46 UTC 2012 x86_64 GNU / Linux. Das mpt2sas-Modul wird nach dem Booten mit einem modprobe-Befehl in /etc/rc.local geladen. Diese 74 Laufwerke sind weder partitioniert, noch formatiert und auch nicht gemountet.

Das System verbraucht:

  • bei 0 Laufwerken : 70,6 - 70,9 Watt (auch 15 Minuten nach dem Booten);
  • bei 74 Laufwerken : 330 - 360 Watt direkt nach dem Start (entspricht 3,5 - 3,9 W pro Laufwerk im Leerlauf);
  • Bei 74 Laufwerken : 420 - 466 Watt, jeweils in der 15. Minute der Betriebszeit (entspricht 4,7 - 5,3 W pro Laufwerk im Leerlauf).

In der Laufwerksspezifikation sind 4,7 W als Lese- / Schreibleistung und 3,3 W als Leerlaufleistungsaufnahme aufgeführt.

Der erhöhte Stromverbrauch ist am wahrscheinlichsten auf der 5-V-Leitung, da nach ungefähr 1 Minute ein "Überstromschutz" (OCP) des Netzteils (PSU) den Strom abschaltet. Das verwendete Netzteil ist ein Einzelschienenmodell mit einem OCP von> 122A auf der 12-V-Leitung und> 55A auf der 5-V-Leitung.

Regression:

  • Es spielt keine Rolle, ob der APM-Wert des Laufwerks deaktiviert ist oder 1 (maximale Energieeinsparung).
  • Das Betriebssystem zeichnet keine Lese- / Schreibaktivität in auf /proc/diskstats. Die Werte dort sind identisch (28 Lese-, 0 Schreiboperationen) wie unmittelbar nach der Modprobe-Operation.
  • Ich kann nicht testen, was passiert, wenn das BIOS des Mainboards gebootet wird - um Betriebssystemeingriffe auszuschließen -, da das Super Micro X8SI6-F-Mainboard mit der Firmware 27.06.12 einen Fehler aufweist, bei dem die Temperatur eines +74,0 C-CPU-Sensors fälschlicherweise als " Hoch "im BIOS - Modus und schaltet die Stromversorgung nach 1 Minute ab.

Was kann die Lese- / Schreibaktivität des Laufwerks auf allen Laufwerken in der 15. Minute nach dem Start verursachen und wie kann dies verhindert werden?

Pro Backup
quelle
Nur neugierig ... Was für ein System ist das? Backup System? Alle Software-RAID?
Ewwhite
Derzeit nur zum Testen, für Backup-Speicher ohne RAID gedacht. Die Redundanz wird von optionalen sekundären und tertiären Servern bereitgestellt.
Pro Backup
@ewwhite erinnert mich an Backblaze Pods. Jemand musste diesen Namen erwähnen.
Dmitri Chubarov
@Dmitri Chubarov Es ist wie ein Backblaze-Speicher-Pod, aber ohne SATA-Port-Multiplikatoren, 5U-Höhe, kein RAID, 74 statt 45 Laufwerke, ein einziges Netzteil, nur 2,0 Watt Stromverbrauch für die Kühlung und wenn alle Laufwerke im Leerlauf laufen, mit a Temperaturunterschied von 6 Grad zwischen dem kühlsten und dem wärmsten Laufwerk.
Pro Backup

Antworten:

20

Klingt sehr nach SMART-Scrubbing (automatischer Offline-Test) auf den Laufwerken.

smartctl -a /dev/hdx

sollte die Konfiguration mit bestätigen:

Auto Offline Data Collection: Enabled.

Deaktivieren mit:

smartctl --offlineauto=off /dev/hdx

Es könnte auch etwas anderes sein ...

Chris S
quelle
smartctl --offlineauto=offhat den Trick gemacht. Zumindest für 32 Minuten gibt es keine größeren Stromverbrauchserhöhungen mehr, die zum Herunterfahren des Netzteil-OCP führen. Als Bonus setzt hdparm -SX nun die Laufwerke von "Aktiv / Leerlauf" auf "Standby". Die an den sata_sil-Controller angeschlossenen Laufwerke konnten jedoch keine Controller sein. Das vorübergehende Anschließen dieser Laufwerke an einen anderen Controller ist die Problemumgehung. Die Einstellung für die Offline-Datenerfassung übersteht Neustarts und Aus- und Einschalten.
Pro Backup