Ursachen für plötzliche massive Schäden am Dateisystem? ("Root Inode ist kein Verzeichnis") [geschlossen]

8

Ich habe einen Laptop mit Maverick (sehr glücklich bis gestern) mit einer Patriot Torx SSD; LUKS-Verschlüsselung der gesamten Partition; ein lvm physisches Volumen darüber; dann home und root in ext4 logischen Volumes.

Als ich gestern versuchte, es zu booten, beschwerte es sich, dass es das Root-Dateisystem nicht mounten konnte. Wenn fsck ausgeführt wird, scheint im Grunde jede Inode falsch zu sein. Sowohl Home- als auch Root-Dateisysteme weisen ähnliche Probleme auf. Das Überprüfen eines Backup-Superblocks hilft nicht.

e2fsck 1.41.12 (17-May-2010)
lithe_root was not cleanly unmounted, check forced.
Resize inode not valid.  Recreate? no

Pass 1: Checking inodes, blocks, and sizes
Root inode is not a directory.  Clear? no   
Root inode has dtime set (probably due to old mke2fs).  Fix? no
Inode 2 is in use, but has dtime set.  Fix? no
Inode 2 has a extra size (4730) which is invalid
Fix? no
Inode 2 has compression flag set on filesystem without compression support.  Clear? no
Inode 2 has INDEX_FL flag set but is not a directory.
Clear HTree index? no
HTREE directory inode 2 has an invalid root node.
Clear HTree index? no
Inode 2, i_size is 9581392125871137995, should be 0.  Fix? no
Inode 2, i_blocks is 40456527802719, should be 0.  Fix? no
Reserved inode 3 (<The ACL index inode>) has invalid mode.  Clear? no
Inode 3 has compression flag set on filesystem without compression support.  Clear? no
Inode 3 has INDEX_FL flag set but is not a directory.
Clear HTree index? no
....

Laufen stringsüber die Dateisysteme, kann ich sehen , dass es , was es aussieht wie Dateinamen und Benutzerdaten. Ich habe ausreichend gute Backups (Touch Wood), so dass es sich nicht lohnt, einzelne Dateien abzurufen, obwohl ich möglicherweise ein Image der unverschlüsselten Festplatte speichern kann, bevor ich sie neu erstelle, nur für den Fall.

smartctlzeigt keine Fehler an und das Kernel-Protokoll auch nicht. Das Ausführen eines Schreibmodus badblocksüber den Swap lv führt ebenfalls zu keinen Problemen. Die Festplatte kann also ausfallen, aber nicht auf offensichtliche Weise.

An diesem Punkt bin ich im Grunde genommen, wie sie sagen, gefickt? Zurück zur Neuinstallation, möglicherweise Badblocks über die Festplatte ausführen und dann aus dem Backup wiederherstellen? Es scheint nicht einmal genug Daten zu geben, um einen bedeutungsvollen Fehler zu melden ...

Ich erinnere mich nicht, dass diese Maschine das letzte Mal abgestürzt ist, als ich sie benutzt habe.

An diesem Punkt vermute ich, dass ein Fehler oder eine Speicherbeschädigung dazu geführt hat, dass beim letzten Ausführen Müll auf die Festplatten geschrieben wurde, oder dass ein subtiler Fehlermodus für die SSD aufgetreten ist.

Was hätte das wohl verursacht? Gibt es noch etwas, das du versuchen würdest?

Poolie
quelle

Antworten:

4

Es scheint, dass Ihr erster Superblock beschädigt ist. Es gibt viele Kopien des Superblocks, da es das kritischste Teil des Dateisystems ist. Sie können e2fsckmit der -bOption versuchen, zu überprüfen, ob eine andere Kopie des Superblocks die richtigen Informationen enthält. Überprüfen Sie e2fsck (8) auf weitere Informationen zur -bOption und zum Ermitteln der Position der zusätzlichen Superblöcke.

IIRC, es gibt nur eine Kopie des Stammverzeichnisses. Wenn es also beschädigt wurde, muss es neu erstellt werden, leer. Die Verzeichnisse, die ursprünglich unter dem Stammverzeichnis lagen, werden in / lost + found angezeigt, und Sie müssen sie von dort aus verschieben.

Inode-Tabellen werden über die Partition verteilt. Es ist unwahrscheinlich, dass Sie alle verlieren würden. Diejenigen, die wiederhergestellt werden können, wenn ihre Dateien nicht in ihre ursprünglichen Verzeichnisse verschoben werden können, enden auch in / lost + found.

Juliano
quelle
Oh, Sie denken also, weil der Superblock beschädigt war, zeigten die Zeiger auf die Inode-Regionen überhaupt nicht auf Inodes, also sahen sie alle korrupt aus? Das macht Sinn.
Poolie
Das Überprüfen mit anderen Superblöcken hat nicht geholfen.
Poolie
2

Ich habe das schon mal gesehen. Es hat etwas mit Ubuntu 10.10 zu tun. Ich würde mich auf dem Bug-Tracker umsehen, da er einige Male gepostet wurde. Um sicherzugehen, machen Sie einen Schnappschuss von der Festplatte, löschen Sie ihn und legen Sie ihn in einem sekundären System ab, um festzustellen, ob sich der Fehler wiederholt (um die Festplatte auszuschließen - unwahrscheinlicher Schuldiger).

Öffentliches Zertifikat
quelle
Ich habe es zweimal mit dieser SSD gesehen und überhaupt nicht auf demselben System mit Magnetplatten oder auf einem anderen System mit einer anderen SSD. Ich vermute also die SSD an dieser Stelle.
Poolie
1

Update: Irgendwann war ich überzeugt, dass das Problem ein komplizierter SSD-Fehler war, oder ich nehme an, dass möglicherweise eine Interaktion zwischen dem Kernel und der SSD vorliegt. Ich habe es durch eine Magnetplatte ersetzt und hatte keine Probleme mehr.

Poolie
quelle