HP SmartArray P400: Wie kann ein ausgefallenes logisches Laufwerk repariert werden?

8

Ich habe einen HP Server mit SmartArray P400-Controller (inkl. 256 MB Cache / Batterie-Backup) mit einem logischen Laufwerk mit ersetztem fehlgeschlagenem physischen Laufwerk, das nicht neu erstellt wird.

So sah es aus, als ich den Fehler entdeckte:

~ # / usr / sbin / hpacucli ctrl slot = 0 show config
Smart Array P400 in Steckplatz 0 (eingebettet) (sn: XXXX)

  Array A (SATA, nicht verwendeter Speicherplatz: 0 MB)
    Logisches Laufwerk 1 (698,6 GB, RAID 1, OK)
      physischer Antrieb 1I: 1: 1 (Port 1I: Box 1: Schacht 1, SATA, 750 GB, OK)
      physischer Antrieb 1I: 1: 2 (Port 1I: Box 1: Schacht 2, SATA, 750 GB, OK)

  Array B (SATA, nicht verwendeter Speicherplatz: 0 MB)
    Logisches Laufwerk 2 (2,7 TB, RAID 5, fehlgeschlagen)
      physisches Laufwerk 1I: 1: 3 (Port 1I: Box 1: Schacht 3, SATA, 750 GB, OK)
      physischer Antrieb 1I: 1: 4 (Port 1I: Box 1: Schacht 4, SATA, 750 GB, OK)
      physischer Antrieb 2I: 1: 5 (Port 2I: Box 1: Schacht 5, SATA, 750 GB, OK)
      physisches Laufwerk 2I: 1: 6 (Port 2I: Box 1: Schacht 6, SATA, 750 GB, fehlgeschlagen)
      physischer Antrieb 2I: 1: 7 (Port 2I: Box 1: Schacht 7, SATA, 750 GB, OK)

  nicht zugewiesen
      physischer Antrieb 2I: 1: 8 (Port 2I: Box 1: Schacht 8, SATA, 750 GB, OK)
~ # 

Ich dachte, ich hätte Laufwerk 2I: 1: 8 als Ersatz für Array A und Array B konfiguriert, aber anscheinend war dies nicht der Fall :-(. Ich habe das Problem aufgrund von E / A-Fehlern auf dem Host bemerkt, auch wenn Nur 1 physisches Laufwerk des RAID5 ist ausgefallen.

Weiß jemand, warum das passieren könnte? Das logische Laufwerk sollte in den "Degraded" -Modus wechseln, aber vom Host-Betriebssystem aus weiterhin vollständig zugänglich sein!?

Ich habe zuerst versucht, das nicht zugewiesene Laufwerk 2I: 1: 8 als Ersatz für logisches Laufwerk 2 hinzuzufügen, aber dies war nicht möglich:

~ # / usr / sbin / hpacucli ctrl slot = 0 Array B Ersatzteile hinzufügen = 2I: 1: 8
    Fehler: Dieser Vorgang wird mit der aktuellen Konfiguration nicht unterstützt.
    Verwenden Sie den Befehl "show" auf Geräten, um zusätzliche Details anzuzeigen 
    über die Konfiguration.
~ #  

Interessanterweise ist es möglich, das nicht zugewiesene Laufwerk problemlos zum ersten Array hinzuzufügen. Ich dachte, vielleicht hat der Controller das Array aufgrund des fehlenden Ersatzes in den Status "ausgefallen" versetzt und ausgefallene Arrays vor Änderungen geschützt. Also habe ich versucht, das logische Laufwerk wieder zu aktivieren (um das Ersatzlaufwerk danach hinzuzufügen):

~ # / usr / sbin / hpacucli ctrl slot = 0 ld 2 wieder aktivierbar ändern
    Warnung: Alle zuvor auf dem logischen Laufwerk vorhandenen Daten sind möglicherweise nicht vorhanden 
    gültig oder wiederherstellbar sein. Fortsetzen? (j / n) y

    Fehler: Dieser Vorgang wird mit der aktuellen Konfiguration nicht unterstützt.
    Verwenden Sie den Befehl "show" auf Geräten, um zusätzliche Details anzuzeigen
    über die Konfiguration.
~ # 

Wie Sie jedoch sehen können, war es nicht möglich, das logische Laufwerk erneut zu aktivieren.

Jetzt habe ich das ausgefallene Laufwerk durch Hotswapping durch das nicht zugewiesene Laufwerk ersetzt. Der Status sieht jetzt so aus:

~ # / usr / sbin / hpacucli ctrl slot = 0 show config
Smart Array P400 in Steckplatz 0 (eingebettet) (sn: XXXX)

  Array A (SATA, nicht verwendeter Speicherplatz: 0 MB)
    Logisches Laufwerk 1 (698,6 GB, RAID 1, OK)
      physischer Antrieb 1I: 1: 1 (Port 1I: Box 1: Schacht 1, SATA, 750 GB, OK)
      physischer Antrieb 1I: 1: 2 (Port 1I: Box 1: Schacht 2, SATA, 750 GB, OK)

  Array B (SATA, nicht verwendeter Speicherplatz: 0 MB)
    Logisches Laufwerk 2 (2,7 TB, RAID 5, fehlgeschlagen)
      physisches Laufwerk 1I: 1: 3 (Port 1I: Box 1: Schacht 3, SATA, 750 GB, OK)
      physischer Antrieb 1I: 1: 4 (Port 1I: Box 1: Schacht 4, SATA, 750 GB, OK)
      physischer Antrieb 2I: 1: 5 (Port 2I: Box 1: Schacht 5, SATA, 750 GB, OK)
      physischer Antrieb 2I: 1: 6 (Port 2I: Box 1: Schacht 6, SATA, 750 GB, OK)
      physischer Antrieb 2I: 1: 7 (Port 2I: Box 1: Schacht 7, SATA, 750 GB, OK)
~ # 

Auf das logische Laufwerk ist immer noch nicht zugegriffen. Warum wird es nicht wieder aufgebaut?

Was kann ich machen?

Zu Ihrer Information, dies ist die Konfiguration meines Controllers:

~ # / usr / sbin / hpacucli ctrl slot = 0 show
 Smart Array P400 in Steckplatz 0 (eingebettet)
  Busschnittstelle: PCI
  Slot: 0
  Seriennummer: XXXX
  Cache-Seriennummer: XXXX
  RAID 6 (ADG) -Status: Aktiviert
  Controller-Status: OK
  Chassis-Steckplatz:
  Hardware-Revision: Rev E.
  Firmware-Version: 5.22
  Wiederherstellungspriorität: Mittel
  Priorität erweitern: Mittel
  Oberflächen-Scan-Verzögerung: 15 Sek
  Benachrichtigung über Inkonsistenzen bei der Oberflächenanalyse: Deaktiviert
  Raid1-Schreibpufferung: Deaktiviert
  Zeitlimit nach Eingabeaufforderung: 0 Sek
  Cache Board vorhanden: Richtig
  Cache-Status: OK
  Beschleunigungsverhältnis: 25% Lesen / 75% Schreiben
  Laufwerksschreibcache: Deaktiviert
  Gesamtgröße des Caches: 256 MB
  Schreibcache ohne Batterie: Deaktiviert
  Cache Backup-Stromquelle: Batterien
  Anzahl der Batterien / Kondensatoren: 1
  Batterie- / Kondensatorstatus: OK
  SATA NCQ unterstützt: True
~ # 

Vielen Dank für Ihre Hilfe im Voraus.

TegtmeierDE
quelle

Antworten:

5

Die Antwort ist nicht angenehm. Es besteht eine hohe Wahrscheinlichkeit, dass sich Ihr Array im Status "Warten auf Wiederherstellung" befindet, in dem eine weitere fehlerhafte Festplatte im RAID5-Array-Set vorhanden ist, die den Abschluss der Wiederherstellung verhindert. Aus diesem Grund sollten Sie heutzutage RAID5 vermeiden . Es hilft nicht, dass dies SATA-Laufwerke sind ... Die Wahrscheinlichkeit von Problemen ist noch höher. Schalten Sie das System aus (lassen Sie die Laufwerke herunterfahren) und schalten Sie es wieder ein. Befolgen Sie die Anweisungen auf dem BIOS-Array-Bildschirm und wählen Sie die F2Option "Alle logischen Laufwerke wieder aktivieren". Dies kann den Wiederherstellungsprozess ankurbeln.

Andernfalls handelt es sich um eine Wiederherstellung / Wiederherstellung mit neuen Festplatten.

ewwhite
quelle
0

Sie sollten ACU starten und sehen, was genau los ist. Wenn auf das gesamte logische Laufwerk nicht zugegriffen werden kann, können Sie es dort wieder aktivieren.

Kly
quelle