mdadm raid5 Lesefehler nicht korrigierbar

1

Ich habe ein Software-RAID5-Setup bestehend aus 4 Festplatten. SDA, SDB, SDC, SDD Da alles in Betrieb war, wollte ich das Array testen. Dazu habe ich den Stecker auf eine der Festplatten gezogen (sdd). Alles lief gut, also habe ich versucht, die Festplatte mit erneut hinzuzufügen mdadm --add /dev/md0 /dev/sdd, mdadm baute das Array gerade neu auf. Nach ein paar Stunden überprüfte ich, ob etwas schief gelaufen ist, und sdc schlug fehl.

Kurz gesagt: sdc hat einige fehlerhafte Sektoren, wenn mdadm aus diesen Sektoren liest, schlägt dies fehl.

In / var / log / messages sehe ich:

lesefehler nicht korrigierbar (sektor 753682864 auf sdc).

Ich kann das Array nicht zusammenbauen, da es sdc und sdd als fehlerhaft ansieht.

Kann ich aber mdadm /dev/md0 --create --assume-clean -l5 -n4 /dev/sd[abc] missing. Danach habe ich versucht, ssd hinzuzufügen, aber ohne Erfolg.

Wenn mdadm fehlschlägt und den Sektor in / var / log / messages meldet, kann ich dies durch Ausführen überprüfen hdparm --read-sector [sector] /dev/sdc. Wenn ich den Sektor mit überschreibe hdparm --write-sector es wird ersetzt und funktioniert dann wieder. Dies ist jedoch ein sehr zeitaufwendiger Prozess.

Gibt es irgendwelche Möglichkeiten, wie ich mich von diesem Durcheinander erholen kann? Würde es helfen, sdc in ssd (mit dd) zu spiegeln und dann ssd als fehlendes Laufwerk hinzuzufügen?

siebz0r
quelle
Wie viele schlechte Sektoren gibt es? Wenn es nur wenige gibt, korrigieren Sie sie mit hdparm. Wenn es viele gibt, werfen Sie das Laufwerk aus und stellen Sie es aus dem Backup wieder her.
psusi
Wie jeder gute Administrator habe ich kein Backup. Ich ging davon aus, dass RAID 5 genügend Redundanz bieten würde. Ich weiß nicht, wie viele fehlerhafte Sektoren es gibt, aber es sieht so aus, als wäre es ziemlich zufällig. Ich werde zuerst das SATA-Kabel austauschen und es dann erneut versuchen.
siebz0r
3
RAID5 ist kein Ersatz für Backup, sie dienen vollständig verschiedene Zwecke. Wenn Sie versehentlich eine Datei löschen oder ein Softwarefehler einen Befehl zum Löschen oder Löschen von Dateien ausgibt, werden die Daten auf allen Laufwerken vom RAID 5-Array pflichtgemäß zerstört.
David Schwartz
Ich weiß, aber RAID 5 entspricht meinen Bedürfnissen
siebz0r
1
Betreff: "RAID ist kein Backup, da es Ihnen mit rm -rf nicht weiterhilft". Dies ist kein unüberwindbares Problem: Erstellen Sie mit LVM einen Snapshot neben dem Live-Volume auf demselben MD-Array. Wenn Sie das falsche Objekt oder alles löschen oder das Dateisystem irgendwie beschädigt wird, stellen Sie einfach den Snapshot wieder her. Natürlich kann auch dort etwas schief gehen, aber es ist viel unwahrscheinlicher und es besteht das Risiko eines Ausfalls bei JEDER Backup- oder Redundanzstrategie. Es dreht sich alles um das Risikomanagement.
Chris Smith