EXT4-fs-Fehler nach Ubuntu 17.04-Upgrade

17

Ich habe ein Dell XPS 15 9550 . Ich habe Ubuntu 16.10 für vier Monate ohne Dramen ausgeführt.

Vor zwei Tagen habe ich ein Upgrade auf Ubuntu 17.04 durchgeführt . Ungefähr eine Stunde nach dem Upgrade wurde meine Festplatte wieder in den schreibgeschützten Modus versetzt. Als ich zu einem tty-Bildschirm sprang, sah es so aus:

[ 746.341551] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #525023: comm NetworkManager: reading directory iblock 0
[ 746.343318] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #524289: comm pool: reading directory iblock 0
[ 746.356125] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #11272213: comm systemd-udevd: reading directory iblock 0
[ 746.356139] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #11272210: comm systemd-udevd: reading directory iblock 0
[ 746.356332] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #11272193: comm systemd-udevd: reading directory iblock 0
[ 746.356338] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #11272825: comm systemd-udevd: reading directory iblock 0
[ 746.356400] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #11272210: comm systemd-udevd: reading directory iblock 0
[ 746.474632] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #524539: comm unity-settings-: reading directory iblock 0
[ 746.992814] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #5506108: comm BrowserBlocking: reading directory iblock 0
[ 746.304451] EXT4-fs error (device nvme0n1p7): ext4_find_entry:1463: inode #5506117: comm BrowserBlocking: reading directory iblock 0

Folgendes fdisk -lzeigt:

Disk /dev/nvme0n1: 477 GiB, 512110190592 bytes, 1000215216 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disklabel type: gpt
Disk identifier: 3CD27380-DAC8-48DC-910A-D084CE857DA3

Device             Start        End   Sectors   Size Type
/dev/nvme0n1p1      2048    1026047   1024000   500M EFI System
/dev/nvme0n1p2   1026048    1288191    262144   128M Microsoft reserved
/dev/nvme0n1p3   1288192  487948287 486660096 232.1G Microsoft basic data
/dev/nvme0n1p4 972302336  973223935    921600   450M Windows recovery environmen
/dev/nvme0n1p5 973223936  998094847  24870912  11.9G Windows recovery environmen
/dev/nvme0n1p6 998094848 1000204287   2109440     1G Windows recovery environmen
/dev/nvme0n1p7 487948288  939046911 451098624 215.1G Linux filesystem
/dev/nvme0n1p8 939046912  972302335  33255424  15.9G Linux swap

Partition table entries are not in disk order.

Ich startete neu und fuhr fort, den Fehler ungefähr einmal pro Stunde zu erhalten. Also habe ich Ubuntu 17.04 von Grund auf neu installiert . Ich bekomme jedoch immer noch das gleiche Problem.

Ich habe versucht, fsck durch Erstellen einer / forcefsck-Datei auszuführen (ich habe ein Wrapper-Shell-Skript erstellt, das das -vFlag hinzufügt und stdout in eine Datei ausgibt). Hier ist das Ergebnis:

fsck.fat 4.0 (2016-05-06)                               
Checking we can access the last sector of the filesystem
Boot sector contents:                                   
System ID "MSDOS5.0"                                    
Media byte 0xf8 (hard disk)                             
       512 bytes per logical sector                     
      4096 bytes per cluster                            
      6206 reserved sectors                             
First FAT starts at byte 3177472 (sector 6206)          
         2 FATs, 32 bit entries                         
    508416 bytes per FAT (= 993 sectors)                
Root directory start at cluster 2 (arbitrary size)      
Data area starts at byte 4194304 (sector 8192)          
    126976 data clusters (520093696 bytes)              
63 sectors/track, 255 heads                             
      2048 hidden sectors                               
   1024000 sectors total                                
Reclaiming unconnected clusters.                        
Checking free cluster summary.                          
/dev/nvme0n1p1: 212 files, 15526/126976 clusters    

Ich habe versucht, von einem Live-USB-Gerät zu booten und e2fsck -p /dev/nvme0n1p7wie hier vorgeschlagen auszuführen ( /ubuntu//a/768813/679041 ). Es gab keine Fehler.

Ich habe auch versucht, auszuführen, smartctl -t long /dev/nvme0n1p7aber die Ergebnisse scheinen darauf hinzudeuten, dass das Tool mit meiner speziellen SSD nicht funktioniert:

smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.10.0-19-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Number:                       PM951 NVMe SAMSUNG 512GB
Serial Number:                      S29PNX0H611013
Firmware Version:                   BXV77D0Q
PCI Vendor/Subsystem ID:            0x144d
IEEE OUI Identifier:                0x002538
Controller ID:                      1
Number of Namespaces:               1
Namespace 1 Size/Capacity:          512,110,190,592 [512 GB]
Namespace 1 Utilization:            254,982,533,120 [254 GB]
Namespace 1 Formatted LBA Size:     512
Local Time is:                      Mon Apr 17 17:45:48 2017 AEST
Firmware Updates (0x06):            3 Slots
Optional Admin Commands (0x0017):   Security Format Frmw_DL *Other*
Optional NVM Commands (0x001f):     Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat
Maximum Data Transfer Size:         32 Pages

Supported Power States
St Op     Max   Active     Idle   RL RT WL WT  Ent_Lat  Ex_Lat
 0 +     6.00W       -        -    0  0  0  0        5       5
 1 +     4.20W       -        -    1  1  1  1       30      30
 2 +     3.10W       -        -    2  2  2  2      100     100
 3 -   0.0700W       -        -    3  3  3  3      500    5000
 4 -   0.0050W       -        -    4  4  4  4     2000   22000

Supported LBA Sizes (NSID 0x1)
Id Fmt  Data  Metadt  Rel_Perf
 0 +     512       0         0

=== START OF SMART DATA SECTION ===
Read NVMe SMART/Health Information failed: NVMe Status 0x2002

Gibt es eine Idee, warum dieses Problem auftreten könnte und wie ich es lösen könnte? Vielen Dank! :)

Ben B
quelle
1
Willkommen bei AskUbuntu! Es sieht so aus, als ob Sie von diesem Fehler betroffen sein könnten. Ich empfehle Ihnen, die Entwickler darüber zu informieren, dass dieser Fehler auch Sie betrifft, und den Fehler zu abonnieren, damit Sie über den Fortschritt / die Lösung informiert werden.
Elder Geek
Ich habe genau das gleiche Problem auf einem Lenovo Thinkpad X270 mit einer Toshiba-SSD "THNSF5256GPUK TOSHIBA". Ich denke, es ist gut zu wissen, dass ich nicht der einzige bin.
Maeher
@ElderGeek Beim Lesen des verknüpften Fehlerberichts scheint es so, als ob bis zur Behebung des Problems eine vorübergehende Lösung darin besteht, APST zu deaktivieren. Aufgrund der dortigen Diskussion ist mir jedoch nicht klar, wie ich das tun soll. Es scheint, als wäre ein Weg, dies zu tun, eine gültige Antwort auf diese Frage.
Maeher
Danke für eure Kommentare, Leute :) Ungeduldig, ich habe gestern Abend erneut neu installiert, diesmal habe ich jedoch explizit / dev / nvme0n1p7 formatiert und / dev / nvme0n1p8 zuvor gelöscht (ich dachte vielleicht, eine Neuinstallation mit allen Standardoptionen könnte nicht wirklich formatieren, und stattdessen Löschen Sie nur alte Dateien, bevor Sie neue installieren. Bin nach 4 Stunden ununterbrochener Nutzung noch auf das Problem gestoßen aber erst die Zeit wird es zeigen. Sie werden mein Schluchzen über den Pazifik hören, wenn ich :)
Ben B
OK, das kann ich bestätigen. Ich habe das Problem gerade erneut erhalten, obwohl die Partition vollständig formatiert wurde. Fügt einen Kommentar zum oben verlinkten Bug hinzu
Ben B

Antworten:

18

Wie in einem Kommentar von Elder Geek ausgeführt , liegt dies an einem bekannten Fehler .

Aus dem Fehlerbericht:

Der APST-Support ist gerade im neuesten Zesty-Kernel (4.10.0-14.16) als Teil von https://bugs.launchpad.net/ubuntu/+source/linux/+bug/1664602 gelandet . Dieser Patch hat eine Besonderheit für bestimmte 256 GB Samsung-Laufwerke in Dell-Laptops, die sich bei aktiviertem APST nicht gut verhalten. Ich habe die gleichen Symptome mit dem gleichen Laptop-Modell, außer mit einem 512 GB Samsung. Vor dem manuellen Deaktivieren von APST würde das Laufwerk ausfallen und das System innerhalb von 20 bis 40 Minuten nach dem Start mit E / A-Fehlern in Flammen ausfallen.

Bis eine ordnungsgemäße Korrektur implementiert ist, wird eine Problemumgehung vorgeschlagen, bei der ein Kernelparameter hinzugefügt wird :

Bitte versuchen Sie es nvme_core.default_ps_max_latency_us=5500, wenn das Problem weiterhin besteht. Bitte versuchen Sie es nvme_core.default_ps_max_latency_us=200.

Um einen Kernel-Boot-Parameter hinzuzufügen, bearbeiten Sie die Konfigurationsdatei für GRUB:

sudo nano /etc/default/grub

Suchen Sie den Zeilenanfang GRUB_CMDLINE_LINUX_DEFAULTund fügen Sie den Boot-Parameter zu den anderen hinzu, die sich bereits zwischen den Anführungszeichen befinden. Zum Beispiel werden Sie in diesem Fall wahrscheinlich mit enden

GRUB_CMDLINE_LINUX_DEFAULT="quiet splash nvme_core.default_ps_max_latency_us=5500"

Speichern Sie die Datei, und beenden Sie sie. Führen Sie dann den Befehl aus, um die Änderung wirksam zu machen

sudo update-grub 
Ben B
quelle
1
Funktioniert dieses Update für Sie? Übrigens ein Link zum Festlegen von
justmyfault
1
Ich verwende Ubuntu 16.04 und aktualisiere Pakete stückweise auf zesty, etwas, das ich niemandem empfehlen würde, außer aus Gründen der Notwendigkeit. Das letzte Paket war libc, etwas, das so wichtig für das System ist, dass ein Fehler beim Upgrade von libc auftreten kann. Beim Neustart wurden alle in der obigen Frage genannten EXT4-Fehler angezeigt. Durch Hinzufügen des Kernel-Parameters konnte ich jedoch in Ruhe neu starten und fortfahren. Vielen Dank.
Lukecampbell
Irgendwelche Updates dazu? Ich leide unter diesem Problem auf meinem Razer Blade Stealth mit einem Samsung 512 GB SSD
Lucas Zanella
Die obige Problemumgehung hat bei mir funktioniert, aber der Fehler wurde in Paket Linux - 4.10.0-22.24 behoben. Wenn Sie immer noch Probleme haben, sollten Sie einen neuen Fehlerbericht auf dem Launchpad öffnen.
Ben B
Ich habe beide Werte ausprobiert, aber es ist trotzdem abgestürzt. nvme_core.default_ps_max_latency_us = 0 hat für mich gearbeitet. Kernel 4.15.0-36-generisches Ubuntu 16.04
Mike Schroll
0

Zuerst würde ich die Samsung-Support-Website besuchen und sicherstellen, dass Sie die neueste Firmware für Ihr SSD-Modell installiert haben.

Dann hat dein fsck nicht viel Sinn ergeben, also mach es so ...

So überprüfen Sie das Dateisystem auf Ihrer Ubuntu-Partition ...

  • Starten Sie das GRUB-Menü
  • Wählen Sie Erweiterte Optionen
  • Wählen Sie den Wiederherstellungsmodus
  • Wählen Sie Root-Zugriff
  • Geben Sie an der Eingabeaufforderung # Folgendes ein sudo fsck -f /
  • Wiederholen Sie den Befehl fsck, wenn Fehler aufgetreten sind
  • Art reboot
Heynnema
quelle
1
Vielen Dank für Ihre Antwort! Ich habe neu installiert, aber dieses Mal habe ich zuerst die Problempartition explizit formatiert (für den Fall, dass der Standard-Neuinstallationsprozess nicht wirklich formatiert wurde). Hoffentlich ist es jetzt in Ordnung, aber wenn das Problem weiterhin besteht, starte ich eine fsck und poste die Ergebnisse (obwohl ich sagen würde, wenn das Problem auf einer frisch formatierten Partition bestehen bleibt, könnte es über die Möglichkeiten von fsck hinausgehen)
Ben B
Das Problem trat erneut auf, aber wie Elder Geek in den Kommentaren unter meiner Frage hervorhob , scheint es auf einen bekannten Fehler zurückzuführen zu sein ( bugs.launchpad.net/ubuntu/+source/linux/+bug/1678184 ).
Ben B
@BenB Hast du jemals die Firmware deiner Samsung SSD überprüft, wie ich es vorher vorgeschlagen hatte? Je nach Modell mussten einige Updates durchgeführt werden, damit das Laufwerk ordnungsgemäß funktioniert.
Heynnema
Ich bin mir nicht 100% sicher, wie das geht. Ich habe hier einige Firmware gefunden, bin mir jedoch nicht 100% sicher, ob diese für meine spezielle SSD zutreffen. Der Fehlerbericht zeigt sowieso keine Firmware-bezogenen Probleme an, daher warte ich an dieser Stelle lieber auf weitere Informationen von den Entwicklern, um den Fehler zu beheben, bevor ich versuche, die Firmware zu aktualisieren (ich kenne mich aus, ich würde es falsch machen und verliere alle meine Sachen: P).
Ben B
1
fsck zeigt keine fehler an. Das Problem ist nicht irgendein Firmware-Problem oder eine SSD-Beschädigung. Es liegt an APST, das am 17.04 aktiviert wurde. Das Setzen des Kernel-Parameters 'nvme_core.default_ps_max_latency_us = 5500' hat das Problem für mich behoben, und andere haben berichtet, dass das Deaktivieren von APST das Problem insgesamt für sie behebt.
Ben B
0

Eine mögliche Problemumgehung für den bekannten Fehler, den ich erwähnte und den ich nicht testen kann, da ich nicht über die betreffende NVMe-Hardware verfüge, ist der Versuch, das aktuelle tägliche Kernel-Hauptpaket für Ihre hier verfügbare Archetektur zu booten .

Warten! Bevor Sie dies versuchen, muss ich betonen, dass ein Backup dringend empfohlen wird , es sei denn, Sie sind sich sicher, dass Sie genau wissen , was Sie tun und wie Sie sich von unbeabsichtigten Konsequenzen erholen können .

Wenn Sie nicht wissen, was Sie tun und über ein aktuelles Backup verfügen, finden Sie hier weitere Informationen zum Erstellen Ihres Kernels .

Hinweis: Falls Sie den ersten Satz überflogen haben, basiert diese Antwort auf Recherchen und nicht auf Tests. Wenn es kaputt geht, stellen Sie Ihr Backup wieder her.

Elder Geek
quelle