Intel RAID-Controller kann fehlerhafte Festplatte nicht diagnostizieren

1

Auf meinem System (unter Windows 7 x 64) habe ich ein Asus Z87 Deluxe-Motherboard mit einem integrierten Intel RAID-Controller. Meine Konfiguration enthält eine Kingston 240 GB SSD-Festplatte für das Betriebssystem und zwei Western Digital 4 TB-Festplatten für Daten. Ich habe absichtlich zwei Datenträger gekauft, um sie zu spiegeln, weil ich das Risiko eines Datenverlusts auf diesem System minimieren möchte. Alle Festplatten sind 6,0 ​​Gbit / s SATA.

Ich habe die beiden Festplatten mit dem integrierten Intel-Controller als RAID 1-Array konfiguriert, und das System wird seit einiger Zeit mit dieser Konfiguration ausgeführt. Es war jedoch immer furchtbar langsam, und ich hatte fast ein Jahr lang damit zu kämpfen, bevor ich schließlich das RAID auflöste und den Controller für den Standardfestplattenzugriff neu konfigurierte, um diese unglaubliche Langsamkeit zu beheben (das WD-Diagnosetool ist nicht in der Lage) Für die Kommunikation mit RAID-Festplatten ist ein direkter Zugriff auf die physischen Festplatten erforderlich.

Sobald ich das RAID durchbrochen hatte, tauchten viele Festplattenfehler im Systemereignisprotokoll auf, und das WD-Diagnosetool stellte sofort fest, dass eine der Festplatten fehlerhaft war. Da die Garantie noch besteht, habe ich WD angerufen, um Ersatz zu erhalten, der derzeit ausgeliefert wird. Die andere Festplatte ist in Ordnung, daher ist kein Datenverlust aufgetreten.

Hier besteht jedoch ein großes Problem: Das System läuft seit fast einem Jahr mit einer fehlerhaften Festplatte, und dies konnte nicht nur der Intel RAID-Controller nicht vollständig diagnostizieren , sondern es verschlechterte auch die Situation, indem die Festplattenfehler vor dem Betriebssystem verborgen wurden , die keine Möglichkeit hatte, eine Festplatte zu erkennen, fiel aus.

Im Laufe dieses schwierigen Jahres habe ich alle veröffentlichten Versionen der Intel RAID-Software ( Rapid Storage Technology) ausprobiert . Keiner von ihnen änderte dieses Verhalten oder brachte eine Leistungsverbesserung (von der ich annahm, dass sie durch die RAID-Konfiguration oder den RAID-Controller verursacht wurde und nicht durch eine fehlerhafte Festplatte, von der ich überhaupt nichts wusste).

Warum hat der Controller eine fehlerhafte Festplatte nicht diagnostiziert?
Und wie kann ich sicherstellen, dass ich tatsächlich gewarnt werde, wenn eine Festplatte ausfällt, wenn ich sie erneut für den RAID-Modus konfiguriere?

Massimo
quelle
Ohne weitere Informationen über den bestimmten Fehler des Laufwerks sehe ich nicht, wie dies erklärt werden kann.
Ramhound
Windows wirft Fehler in seinem Systemereignisprotokoll nach links und rechts aus. Dinge wie Atapi-Ereignis 11 und 52, Disk-Ereignis 11, 15 und 51 und sogar DiskDiagnostic-Ereignis 1 ("SMART sagt, dass die Festplatte ausfällt, ersetzen Sie sie so schnell wie möglich"). Außerdem warnt das BIOS bei jedem Start vor dem schlechten SMART-Status der Festplatte, und das WD-Diagnosetool meldet, dass dieses Laufwerk so kaputt ist, dass ich nicht einmal meine Tests durchführen kann.
Massimo
Aber das alles nur nach dem Deaktivieren von RAID im Controller; Während sich diese Festplatte in einem RAID-Array befand, war dies alles vor dem Betriebssystem verborgen , und die RAID-Software hat sich nie darum gekümmert, dieses Durcheinander zu diagnostizieren oder eine Warnung zu geben, was passierte.
Massimo
Es steht mehr als "Das Laufwerk fällt aus". Welche Attribute fallen genau aus?
Ramhound
1 Attribut, Raw Read Error Rate.
Massimo

Antworten:

0

Wenn es immer sehr langsam war, war wahrscheinlich eines der ursprünglichen Laufwerke von Anfang an defekt. Das heißt, Sie haben einen Spiegel in einem herabgesetzten Zustand ausgeführt. Dies hätte gemeldet werden sollen, aber die Treiber (IRST ist Software-RAID, das vom Betriebssystem und den Treibern gehandhabt wird; nicht in Hardware).

Ich habe jedoch nie IRST verwendet, da es das Schlimmste beider Welten ist, kein Leistungsvorteil oder zusätzliche Ports, die durch HW-RAID gewonnen wurden, noch die volle Flexibilität von Software-RAID. Ich habe also keine Ahnung, wie laut Windows klagen wird, wenn das Array Fehler gibt.

Da der Controller von der normalen AHCI-Einstellung abweicht, müssen Sie auch Einstellungen vornehmen, um die HDD SMART-Parameter zu lesen. Welchen Teil des Treiber- und Softwarepakets kenne ich leider (oder nicht?) Nicht.

Unabhängig davon: Die beste Wette ist ein fehlerhaftes Laufwerk seit Tag 1, und seitdem Sie in einem Spiegel ausgeführt haben, wurde das Array erfolgreich für diesen Zweck abgedeckt. Auf Kosten zusätzlicher Verzögerungen.

Nun von einigen Annahmen und Hintergründen zu Ihren eigentlichen Fragen:

Warum hat der Controller eine fehlerhafte Festplatte nicht diagnostiziert?

Leider weiß ich es nicht. Ich würde davon ausgehen, dass iRST ein Element der Systemsteuerung oder ein Statusprogramm installiert. Sofern Sie es nicht ausgeblendet oder deaktiviert haben, sollte eine Nachricht verfügbar sein.

Und wie kann ich sicherstellen, dass ich tatsächlich gewarnt werde, wenn eine Festplatte ausfällt, wenn ich sie erneut für den RAID-Modus konfiguriere?

Dieser ist jetzt viel einfacher. Stellen Sie den SATA-Controller auf den normalen AHCI-Modus ein. Installieren Sie das Betriebssystem auf der SSD. Fügen Sie dann beide Festplatten hinzu und verwenden Sie Windows-Software-RAID, das nicht mit irst identisch ist, um beide Laufwerke zu einem Spiegel zu kombinieren.

Dies hat den Vorteil, dass es portabler ist (lesen Sie: leichter wiederherzustellen, wenn ein Fehler auftritt) und Ihre SATA-Controller im normalen Modus belässt. Alle SMART-Tools sollten mit der Festplatte kommunizieren können.

Hennes
quelle
Intel RST installierte eine Verwaltungsanwendung, sagte jedoch immer, dass alles in Ordnung sei. Dies ist genau das, worüber ich mich beschwert habe: Ich habe vermutet, dass eine Festplatte fehlerhaft ist, aber die RAID-Software konnte dies nicht diagnostizieren. Ich entdeckte erst, was tatsächlich vor sich ging, als ich das RAID durchbrach und Windows endlich direkt auf die Festplatten zugreifen konnte.
Massimo
Und ja, ich habe RST über Bord geworfen, den Controller für den AHCI-Modus konfiguriert und auf Windows-Software-RAID umgestellt. nach dem austauschen der defekten festplatte natürlich. Seitdem läuft alles gut.
Massimo
Bah. Ich wusste, dass dies ein alter Beitrag war und ich weiß, dass mein Mangel an ersten Kenntnissen ein Hindernis ist. Ich hatte gehofft, einen Teil der Überlegungen aufzuzeigen und herauszufinden, wie man es besser machen kann. Anscheinend haben Sie diesen Teil bereits erreicht. Ich bin nicht versucht, zuerst auf meinem Prüfstand zu installieren, nur um herauszufinden, wie ich diesen Teil richtig diagnostizieren kann. :(
Hennes
-1

Unter Windows können Sie SmartMontools verwenden, die jahrelang Smart-Attribute anzeigen und Tests auf einzelnen Laufwerken ausführen, auch wenn sie Mitglieder von Intel Fake-Raid sind.
Das einfachste Installationsprogramm finden Sie unter http://www.netpower.fr/smartmontools-win, mit dem Sie E-Mail-Warnungen, Popups usw. einrichten können.

Vanille
quelle
Ein kostenloser GUI-Wrapper für smartctl ist gsmartcontrol, der unter folgenden Windows-Betriebssystemen ausgeführt wird: gsmartcontrol.sourceforge.net/home/index.php/Downloads (In den Einstellungen weisen Sie gsmartcontrol an, die neuere Datei smartctl-nc.exe von smartmoxntools zu verwenden.) Bei people.chem.duke.edu/~staff/smart/… ist ein Screenshot zu sehen! [Gsmartcontrol-intel-fake-raid.png] ( people.chem.duke.edu/~staff/smart/… ) Sowohl die Intel Raid Arrays als auch die einzelnen Festplatten stehen als / dev / cdsmiN, M
vanilla am