Feststellen einer fehlerhaften Festplatte / Verknüpfen einer dmesg-Nachricht mit der richtigen Festplatte in Debian GNU / Linux

0

dmesg meldet folgendes

[78909.100057] ata5.00: failed command: WRITE DMA
[78909.100063] ata5.00: cmd ca/00:08:80:08:00/00:00:00:00:00/e0 tag 11 dma 4096 out
                        res 51/04:00:88:08:00/00:00:00:00:00/e0 Emask 0x1 (device error)
[78909.100067] ata5.00: status: { DRDY ERR }
[78909.100069] ata5.00: error: { ABRT }

lsscsi berichtet

....
[4:0:0:0]    disk    ATA      Maxtor 6H500F0   1DD0  /dev/sdc
[5:0:0:0]    disk    ATA      Maxtor 6H500F0   1DD0  /dev/sdd
[6:0:0:0]    disk    ATA      Maxtor 6H500F0   1DD0  /dev/sde 
....

und ls / dev / disk / by-path / reports

....
lrwxrwxrwx 1 root root   9 Oct  7 18:22 pci-0000:00:1f.2-ata-4 -> ../../sdd
lrwxrwxrwx 1 root root  10 Oct  7 18:22 pci-0000:00:1f.2-ata-4-part1 -> ../../sdd1
lrwxrwxrwx 1 root root   9 Oct  7 18:22 pci-0000:00:1f.2-ata-5 -> ../../sde
lrwxrwxrwx 1 root root  10 Oct  7 18:22 pci-0000:00:1f.2-ata-5-part1 -> ../../sde1
lrwxrwxrwx 1 root root   9 Oct  7 18:22 pci-0000:00:1f.2-ata-6 -> ../../sdf
lrwxrwxrwx 1 root root  10 Oct  7 18:22 pci-0000:00:1f.2-ata-6-part1 -> ../../sdf1
....

Die ausgefallene Festplatte ist entweder / dev / sdd oder / dev / sde, aber da beide Festplatten hier dieselbe Marke und dasselbe Modell aufweisen, kann ich nur schwer feststellen, welche Seriennummer unter / dev / disk / by-id die richtige ist Löschen.

Nun lautet die Frage: dmesg bezieht sich auf ata5.00, welches ist richtig? lsscsi oder / dev / disk-by / path / oder (wahrscheinlicher) sind beide korrekt. Wie kann man feststellen, welche Festplatte tatsächlich ausfällt?

EDIT: Bei dieser Frage geht es darum herauszufinden, was ataX.XX in dmesg auf was / dev / sdX verweist

Wachskopf
quelle
Das sieht unvollständig aus. Welche anderen Symptome des "Scheiterns" gibt es neben den Syslog-Zeilen? Sind Sie sicher, dass Sie alle wichtigen Zeilen aus dem Syslog (dmesg-Ausgabe) melden? Siehe superuser.com/questions/641219/…. Haben Sie sich SMART-Tests angesehen oder durchgeführt?
Sägemehl
@sawdust: Ja, das ist unvollständig. Die Frage bezieht sich auf die Identifizierung des Laufwerks und nicht auf den Festplattenfehler. dmesg zeigt ataX.XX und lsscsi und / dev / disk / by-path zeigt verschiedene ata-Nummern an. Wenn ich die Seriennummer der Festplatte in / dev / disk / by-path / suchen muss, muss ich die richtige Festplatte finden.
Waxhead
1
Mit smartctlfrom können Sie smartmontoolsden SMART- Status Ihrer Festplatten abrufen.
Xenoid
Ich bin bei @xenoid. Das erste, was Sie tun müssen, ist, smartctl --all /dev/sdXalle Laufwerke zu durchsuchen und die mit Fehlern verbundenen Variablen ("offline nicht korrigierbar", "anstehend" usw.) sowie das Fehlerprotokoll des Laufwerks zu überprüfen. Der zweite Schritt ist die Ausführung smartctl -t offline /dev/sdXfür jedes Laufwerk und die erneute Überprüfung der Fehlerwerte und Protokolle. Beachten Sie, dass die normale Leistung des Laufwerks, das Selbsttests durchführt, beeinträchtigt ist.
Kostix
Für die Zukunft ist es am besten, smartmontoolsregelmäßige Disc-Überprüfungen einzurichten. Auf allen meinen Computern sind kurze Selbsttests nachts und lange Selbsttests am Wochenende nachts aktiviert. Dabei hat jedes Laufwerk einen eigenen Zeitschlitz, sodass keine zwei Laufwerke gleichzeitig einen langen Selbsttest durchführen Zeit. Das Tool kann Ihnen E-Mails senden, wenn einer der kritischen Parameter bemerkt wird, dass er seinen Wert erhöht (z. B. die Anzahl der nicht korrigierbaren Offline-Sektoren).
Kostix