Wie werden diese Fehler aus dem Syslog interpretiert?

12

Mein Ubuntu hat sich in letzter Zeit komisch verhalten. Gestern würde es nicht normal booten, also musste ich einen 'Wiederherstellungsmodus'-Boot durchführen. Es hieß, ich müsse fsckmanuell eine machen, was ich mit einer Live-CD gemacht habe. Danach konnte ich bereits auf dem Desktop booten, aber alles ist so träge. Apps würden für Sekunden grau werden. Manchmal starten andere Apps überhaupt nicht. In anderen Fällen wird angegeben, dass sich das Dateisystem im schreibgeschützten Modus befindet.

Dies ist ein Teil dessen, was ich bekommen habe:

Oct 26 21:23:56  kernel: [ 1900.960506] sd 0:0:0:0: [sda] Add. Sense: Unrecovered read error - auto reallocate failed
Oct 26 21:23:56  kernel: [ 1900.960533] end_request: I/O error, dev sda, sector 63206544
Oct 26 21:23:56  kernel: [ 1900.960541] Buffer I/O error on device sda1, logical block 7900562
Oct 26 21:24:00  kernel: [ 1904.146683]          res 51/40:00:90:74:c4/00:00:00:00:00/03 Emask 0x9 (media error)
Oct 26 21:24:00  kernel: [ 1904.146692] ata1.00: error: { UNC }
Oct 26 21:24:03  kernel: [ 1907.351844]          res 51/40:00:90:74:c4/00:00:00:00:00/03 Emask 0x9 (media error)
Oct 26 21:24:03  kernel: [ 1907.351853] ata1.00: error: { UNC }
Oct 26 21:24:06  kernel: [ 1910.482152]          res 51/40:00:90:74:c4/00:00:00:00:00/03 Emask 0x9 (media error)
Oct 26 21:24:06  kernel: [ 1910.482161] ata1.00: error: { UNC }
Oct 26 21:24:09  kernel: [ 1913.604742]          res 51/40:00:90:74:c4/00:00:00:00:00/03 Emask 0x9 (media error)
Oct 26 21:24:09  kernel: [ 1913.604751] ata1.00: error: { UNC }
Oct 26 21:24:12  kernel: [ 1916.792646]          res 51/40:00:90:74:c4/00:00:00:00:00/03 Emask 0x9 (media error)
Oct 26 21:24:12  kernel: [ 1916.792656] ata1.00: error: { UNC }
Oct 26 21:24:15  kernel: [ 1919.922855]          res 51/40:00:90:74:c4/00:00:00:00:00/03 Emask 0x9 (media error)
Oct 26 21:24:15  kernel: [ 1919.922864] ata1.00: error: { UNC }
Oct 26 21:24:16  kernel: [ 1920.056506] sd 0:0:0:0: [sda] Add. Sense: Unrecovered read error - auto reallocate failed
Oct 26 21:24:16  kernel: [ 1920.056533] end_request: I/O error, dev sda, sector 63206544
Oct 26 21:24:16  kernel: [ 1920.056540] Buffer I/O error on device sda1, logical block 7900562
Oct 26 21:24:55  kernel: [ 1959.134566]          res 51/40:00:e0:28:44/00:00:00:00:00/04 Emask 0x9 (media error)
Oct 26 21:24:55  kernel: [ 1959.134575] ata1.00: error: { UNC }
Oct 26 21:25:05  kernel: [ 1969.674292]          res 51/40:00:b2:4c:44/00:00:00:00:00/04 Emask 0x9 (media error)
Oct 26 21:25:05  kernel: [ 1969.674301] ata1.00: error: { UNC }
Oct 26 21:25:08  kernel: [ 1972.887782]          res 51/40:00:b2:4c:44/00:00:00:00:00/04 Emask 0x9 (media error)
Oct 26 21:25:08  kernel: [ 1972.887791] ata1.00: error: { UNC }
Oct 26 21:25:12  kernel: [ 1976.059674]          res 51/40:00:b2:4c:44/00:00:00:00:00/04 Emask 0x9 (media error)
Oct 26 21:25:12  kernel: [ 1976.059683] ata1.00: error: { UNC }
Oct 26 21:25:15  kernel: [ 1979.206592]          res 51/40:00:b2:4c:44/00:00:00:00:00/04 Emask 0x9 (media error)
Oct 26 21:25:15  kernel: [ 1979.206601] ata1.00: error: { UNC }
Marky
quelle

Antworten:

11

Ihre erste Festplatte (SDA) ist im Begriff, einen aggressiven Fehler zu verursachen.

Schalten Sie es sofort aus, holen Sie sich ein neues Boot-Laufwerk und installieren Sie ein neues Betriebssystem auf dem neuen Boot-Laufwerk. Sobald dies funktioniert, schließen Sie das fehlerhafte Laufwerk an, hängen Sie es "schreibgeschützt" ein, und Sie können möglicherweise Daten daraus extrahieren.

Natürlich haben Sie, wie die meisten Menschen, vollständige und aktuelle Backups, oder? ;)

als Antwort auf Kommentar hinzugefügt

"Säuglingsversagen" sind im Hardware-Engineering so verbreitet, dass es einen Begriff für sie gibt. Im Allgemeinen fällt ein Gerät sehr früh aus oder läuft eine Weile. Wenn Sie wiederholt Fehler haben, sind Sie entweder:

  1. Billigdisketten kaufen (Ich hatte persönlich mehr Probleme mit Brand Foo-Laufwerken als ich zählen kann (aber meine persönliche Erfahrung kann nicht dazu verwendet werden, eine allgemeine Aussage über einen Hersteller zu treffen, weshalb ich "Maxtor" nicht geschrieben habe)) .
  2. etwas wirklich Pech haben. Das gleiche könnte mit Glühbirnen passieren: Es wird einen Typen geben, der die nächsten zwei Glühbirnen hat, die er in einer Woche nicht kaufen kann. Die Statistiken für Sie und Sie könnten nur "der Typ" mit den Laufwerken sein.
  3. Sie haben tatsächlich einen fehlerhaften Antriebsregler, der die Antriebselektronik in Brand setzt. Zum Beispiel kann ein nicht spezifikationsgemäßer Widerstand in einer Laufwerkssteuerleitung vorhanden sein, der jedes Laufwerk brät, das Sie daran anschließen.

Ich denke, diese drei Möglichkeiten sind weitaus wahrscheinlicher, als dass Sie einen schwerwiegenden Fehler in EXT4 aufdecken. es ist einfach zu hart geschlagen worden. Andererseits könnte dämonischer Besitz im Spiel sein, den Klerus Ihrer Wahl konsultieren und viel Glück.

msw
quelle
Geben Sie niemals zu viele Kommentare ab, wenn Sie auf die Wichtigkeit von Backups hinweisen.
Takkat
Technisch könnte es sich um ein loses Kabel (oder sogar einen losen Jumper) handeln. Überprüfen Sie dies, wenn Sie Ihren Computer kürzlich aufgerüttelt haben. In jedem Fall handelt es sich jedoch um einen Hardwarefehler, und die Festplatte ist der wahrscheinlichste Schuldige.
Gilles 'SO- hör auf böse zu sein'
Oh nein! :( Dies ist so ziemlich eine neue Festplatte. Sie ist noch nicht einmal 3 Monate alt. Wie konnte das passieren? Während mein anderes SATA-Laufwerk über 2 Jahre alt ist und von meinen Windows XP - NTFS-Partitionen verwendet wird und es sehr gesund ist. Ich schwöre etwas ist falsch mit EXT4 FS. Ich hatte 2 IDE-Laufwerke vor diesem einen Absturz auch.
Marky
@ Markey: siehe "hinzugefügt" oben
msw
Seitdem bin ich ein großer Fan von SeaGate. Mein NTFS-Laufwerk ist ein 2 Jahre alter Barracuda und es ist genauso gesund, seit ich es gekauft habe. Dieses neuere Laufwerk ist auch ein SeaGate. (1) Irgendwelche Vorschläge für eine bessere Fahrt? WD ist keine Option. Ich glaube nicht, dass es in meiner Region verfügbar ist. (2) Es kann kein schlechter Controller sein, mein NTFS-Laufwerk wäre auch gebraten worden. (3) Für was es wert ist, werde ich Pech haben. LOL! :)
Marky
1

Sie können den Zustand Ihrer Festplatte mit dem Festplatten-Dienstprogramm überprüfen. Klicken Sie auf System / Administration / Disk Utility, suchen Sie Ihre Festplatte im linken Fenster und klicken Sie darauf, klicken Sie rechts auf die Schaltfläche "SMART Data". Sehen Sie sich die Bewertung für jeden Artikel sowie die Gesamtbewertung oben an. Wenn es nicht grün ist, ist Ihre Festplatte definitiv fehlerhaft.

mdeslaur
quelle
1
Dies ist unnötig, da das Protokoll bereits zeigt, dass es fehlschlägt. Wenn Sie das Laufwerk länger als unbedingt erforderlich eingeschaltet lassen, erhöht sich das Risiko eines zusätzlichen Verlusts.
msw
1
Noch riskanter als nur das Einschalten ist die Kopfbewegung bei der Überprüfung der Festplattenintegrität. Dies sind alles Dinge, mit denen nach der Datenwiederherstellung gespielt werden kann, was jetzt Priorität 1 hat.
Takkat
Normalerweise hätte Marky diesbezüglich bereits Warnungen erhalten müssen, wenn eine Desktop-Installation mit installiertem Festplatten-Dienstprogramm verwendet wurde, oder?
26.
Nein, dies geschah plötzlich ohne klare Warnungen. Da die Festplatte relativ neu ist, habe ich das natürlich nicht erwartet. Der SMART-Test hat bestanden, stellt jedoch fest, dass es einige fehlerhafte Sektoren gibt. Die Farbe ist übrigens noch grün. Wie lange sollte die Festplatte noch verwendbar sein?
Marky