Sind diese SATA-Fehler gefährlich?

36

Ich bekomme diese Fehler nur selten und weiß nicht, ob es normal ist oder nicht.

[39441.061856] ata3.00: failed to read SCR 1 (Emask=0x40)
[39441.061866] ata3.01: failed to read SCR 1 (Emask=0x40)
[39441.061892] ata3.15: exception Emask 0x10 SAct 0x0 SErr 0x280100 action 0x6 frozen
[39441.061897] ata3.15: irq_stat 0x08000000, interface fatal error
[39441.061904] ata3.15: SError: { UnrecovData 10B8B BadCRC }
[39441.061910] ata3.00: exception Emask 0x100 SAct 0x0 SErr 0x0 action 0x6 frozen
[39441.061917] ata3.01: exception Emask 0x100 SAct 0xe SErr 0x0 action 0x6 frozen
[39441.061923] ata3.01: failed command: READ FPDMA QUEUED
[39441.061933] ata3.01: cmd 60/a8:08:b0:48:62/00:00:00:00:00/40 tag 1 ncq 86016 in
[39441.061940] ata3.01: status: { DRDY }
[39441.061944] ata3.01: failed command: READ FPDMA QUEUED
[39441.061953] ata3.01: cmd 60/a8:10:b0:49:62/00:00:00:00:00/40 tag 2 ncq 86016 in
[39441.061959] ata3.01: status: { DRDY }
[39441.061963] ata3.01: failed command: READ FPDMA QUEUED
[39441.061972] ata3.01: cmd 60/58:18:58:4a:62/00:00:00:00:00/40 tag 3 ncq 45056 in
[39441.061978] ata3.01: status: { DRDY }
[39441.061987] ata3.15: hard resetting link
[39441.608302] ata3.15: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[39441.609090] ata3.00: hard resetting link
[39441.929246] ata3.00: SATA link up 3.0 Gbps (SStatus 123 SControl 320)
[39441.929333] ata3.01: hard resetting link
[39442.249184] ata3.01: SATA link up 3.0 Gbps (SStatus 123 SControl 320)
[39442.263242] ata3.00: configured for UDMA/133
[39442.277570] ata3.01: configured for UDMA/133
[39442.277725] ata3: EH complete

Ich klebe auch smartctl -afür sda , sdb und sdc .

Vielen Dank im Voraus für Ihre Hilfe.

Marcos Junior
quelle

Antworten:

16

Obwohl ich der Antwort von Geppettvs D'Constanzo im Wesentlichen zustimme , würde ich vorschlagen, dass einige der ersten Dinge, die Sie auch versuchen könnten, sind

  1. Überprüfen Sie, ob das SATA-Kabel fest angeschlossen und in die Buchsen auf der Hauptplatine und der Festplatte eingesteckt ist.

  2. Ersetzen Sie Ihr SATA-Kabel. SATA-Kabel sind (relativ) billig und manchmal gibt es ein " schlechtes ". Oft ist ein einfacher Austausch des Kabels der einfachste Weg, um ein solches Problem zu diagnostizieren und zu lösen.

(Obwohl es etwas unerwartet ist, dass zwei Kabel gleichzeitig defekt sind. Trotzdem ist es meiner Meinung nach eine einfache Sache, dies zu überprüfen, die es wahrscheinlich wert ist, getan zu werden.)

Ich habe gerade gesehen, dass Sie Pastbins mit den SMART-Daten für Ihre Laufwerke haben. Beachten Sie die unerwartet große Anzahl von CRC-Fehlern für Laufwerke sdbund sdc. Ich schlage vor, Sie überprüfen zunächst die Kabel und Anschlüsse für diese Laufwerke.

junior@mediacenter:/$ sudo  smartctl -a /dev/sda
...
Model Family:     SAMSUNG SpinPoint M7E (AFT)
Device Model:     SAMSUNG HM321HI
...
199 UDMA_CRC_Error_Count    0x0036   200   200   000   Old_age  Always -    0

junior@mediacenter:/$ sudo  smartctl -a /dev/sdb
...
Model Family:     SAMSUNG SpinPoint F4 EG (AFT)
Device Model:     SAMSUNG HD204UI
...
199 UDMA_CRC_Error_Count    0x0036   100   100   000   Old_age  Always  -  57

junior@mediacenter:/$ sudo  smartctl -a /dev/sdc
...
Model Family:     SAMSUNG SpinPoint F4 EG (AFT)
Device Model:     SAMSUNG HD204UI
...
199 UDMA_CRC_Error_Count    0x0036   100   100   000   Old_age  Always  - 398

OKAY. Also kein Latpop. ;-)
Wenn dies auf einem Laptop passiert, gilt natürlich keines der oben genannten und ich bin mir nicht sicher, welchen Rat ich anbieten soll. Vielleicht die Festplatte entfernen und neu installieren? Vielleicht muss es nur wieder in die Steckdose gesteckt werden, um die Verbindung zu verbessern?


sbdund sdcwerden über dasselbe externe E-SATA-Kabel (Thermaltake Duo HDD Dock) angeschlossen. Ich werde mein E-SATA-Kabel ersetzen.

Dies kann an einem fehlerhaften oder minderwertigen Kabel liegen. Es kann auch sein, dass das Kabel während der Verwendung des Laufwerks bewegt, gestoßen oder anderweitig gestoßen wird.

irrational John
quelle
1
sbdund sdcbeide an dasselbe externe E-SATA-Kabel angeschlossen sind (Thermaltake Duo HDD Dock). Ich werde mein E-SATA-Kabel ersetzen.
Marcos Junior
9

Es sieht so aus, als hätten Sie ein schlechtes / beschädigtes SATA-Strom- / Datenkabel. Das kann zu schlechten CRCs führen. Sie sind überhaupt nicht schädlich und Sie können mit ihnen leben, aber Sie werden bald viele Daten verlieren.

Der SMART-Bericht Ihrer Festplatten sieht vernünftig aus, sodass ich Probleme mit der Stromversorgung habe, basierend auf meiner Erfahrung beim Einstellen von 5 Festplatten in der gleichen Hülle / Stromquelle. Ich beendete die Verwendung einer externen Stromquelle (475 W) für 2 Laufwerke und der 600 W des Gehäuses für den gesamten Fall, einschließlich GPU-, optischer und Festplattenlaufwerke.

Auf jeden Fall empfehle ich Ihnen, eine vollständige Sicherung durchzuführen, bevor Sie etwas anderes tun. Wenn möglich, klonen Sie Ihr Festplattenlaufwerk. Anschließend sollten Sie Ihre Kabel und die Spannung der Stromquelle überprüfen.

Geppettvs D'Constanzo
quelle
War diese GPU aus Neugier eine große, leistungshungrige GPU?
irrational John
1
nVidia Quadro 4000, in der Tat nicht so hungrig.
Geppettvs D'Constanzo
1
Interessant. Ich habe ein 400-W-Antec-Netzteil (Neo-Eco), 5 Festplatten, 2 optische Laufwerke und eine NVIDIA GeForce 9500 GT, und ich glaube nicht, dass ich Probleme mit der Stromversorgung hatte. Ich habe Laufwerk-CRC-Fehler , aber ich denke, dass sie von dummen Benutzerfehlern herrühren, die ich vor einiger Zeit gemacht habe. Ich habe keine Warnprotokolle in meinen Kernelmeldungen bemerkt . Ich denke, ich sollte trotzdem genauer hinschauen, um sicher zu gehen.
irrational John
1
Optische Laufwerke für 1xIDE DVD-RW, 1xSATA DVD-RW und 1xSATA Blu-Ray ROM auf dieser Seite. 4 SATA- und 1 IDE-Festplatte, die GPU verbraucht 142 Watt. Ich kann nicht sagen, dass ich absolut sicher bin, dass es um Probleme mit der Stromquelle ging, aber als ich die neue Stromquelle hinzufügte, waren die Probleme weg. Übrigens, meine Laufwerke scheinen gesund zu sein. Aber danke, dass ich das sehe. Ihre Meinung wird auf dieser Seite sehr geschätzt. Danke!
Geppettvs D'Constanzo
1
Äh, 142 Watt für eine GPU sind ... etwas. Mein gesamtes System verbraucht (normalerweise) weniger. Während ich das tippe, zieht meine Desktop-Box ~ 117 Watt. (Laut dem Kill-A-Watt hatte ich vergessen, dass ich es noch eingesteckt habe. ;-)
irrational John
4

Es scheint ein Problem zwischen einigen Kernel-Versionen und einigen SATA-Controllern zu geben.

Ich habe vor kurzem begonnen, ein sehr ähnliches Problem (nicht sicher, ob es dasselbe ist) auf einem Webserver mit Scientific Linux zu haben.

Die genaueste und vollständigste Information, die ich über ein solches Problem gefunden habe, ist dieser Launchpad- Fehler .

Kurz gesagt: Das Deaktivieren von NCQ scheint die beste Lösung für Benutzer mit diesem Problem zu sein.

jap1968
quelle
3
Das Deaktivieren von NCQ ist eine häufige Problemumgehung für fehlerhafte Hardware. Es scheint keinen Kernel-Fehler zu geben.
Psusi
Heilige $ #! + Das hat funktioniert! Alle meine Fehlermeldungen verschwanden und mein System stürzte ab! Ich bin völlig anderer Meinung als ein Kernel-Fehler, da ich eine ältere Kernel-Version (bis zu mindestens 2.6) ohne Abstürze verwenden kann. Ich kann nicht glauben, dass ich das nicht früher gefunden habe!
Reukiodo
1

Dies ist fast immer ein fehlerhaftes Laufwerk. Ich verwende Tausende von Laufwerken. Obwohl diese Fehler niemals zum Ausfall des Laufwerks führen, hat dies zu einer Beschädigung des Dateisystems geführt. Ich denke, es hat wirklich mit einem Problem mit der Controller-Karte auf dem Laufwerk zu tun.

Ich habe alles versucht, um dieses Problem zu lösen. Die Lösung besteht darin, das Laufwerk auszutauschen, und es funktioniert mit denselben Kabeln und Controllern.

Viel Glück

user209235
quelle
Nach über 30 Jahren, in denen ich diesen Dingen mein Leben lang nachgegangen bin, kann ich Ihnen versichern, dass dies meiner Erfahrung nach fast immer ein düsteres Kabel ist. Und da sie billig sind, versuchen Sie das zuerst.
Elder Geek
0

Ich weiß, dass dieser Thread alt ist, aber ich bin vor kurzem auf das gleiche Problem bei einem neu gekauften Computer mit 6 SATA-Slots gestoßen. Ich habe die CD-ROM und die Festplatte in 2 SATA-Steckplätzen nebeneinander installiert und dann Ubuntu ohne Fehler installiert, bis ich einen Neustart durchführte und dann den Fehler "ata8: hard reset link" sah. Die Maschine bleibt bis zu diesem Zeitpunkt stehen und hat sich nie erholt. Ich habe ein paar Mal versucht, einen Neustart durchzuführen, aber es hat nicht funktioniert. Und dann habe ich versucht, die Festplatte in einem der 4 verfügbaren Steckplätze zu ersetzen, und es hat einwandfrei funktioniert.

ultrajohn
quelle
Sie meinen, Sie haben den SATA-Anschluss geändert, an den die Festplatte angeschlossen war, oder? Oder meinst du damit, die gesamte Festplatte durch eine andere zu ersetzen? Ich denke, es ist das erstere, aber nur eine doppelte Überprüfung
Xen2050
Es ist das erstere.
Ultrajohn
0

Hatte das gleiche Problem - in meinem Fall war dies darauf zurückzuführen, dass das 4-polige SATA-Netzteil nicht richtig eingesteckt war.

Andrei Pokrovsky
quelle
0

Ich hatte das gleiche problem Ich hatte alles ausprobiert, aber nur auf dem jicron port meines asus p5k hatte ich keine fehler.

Aber als ich das Laufwerk an ein anderes Netzteil anschloss, funktionierte es und die Fehler waren verschwunden. Dann habe ich das Laufwerk wieder auf die ursprüngliche Stromversorgung zurückgesetzt, aber einen neuen Stromanschluss und das hat auch funktioniert.

Martin Van Der Meulen
quelle
0

Ich weiß, dass dieser Thread alt ist, aber nur auf das gleiche Problem gestoßen ist, kam hier von Google.

  • bekommen ata3.01: failed command: READ FPDMA QUEUEDauf den KUbuntu 16.04 LiveCD bootet.
  • WINDOWS 7 verhält sich unregelmäßig, funktioniert eine Weile in Ordnung, friert jedoch nach dem Ansehen von YouTube ein.

Das Ändern des SATA-Kabels hat nichts gebracht.
Ersetzte das Netzteil und das Problem ging weg.

marco_roboto
quelle
0

Es ist unwahrscheinlich, dass dieser Fehler Ihre Festplatte beschädigt, es ist jedoch sehr wahrscheinlich, dass Ihre Dateisysteme beschädigt werden. Stellen Sie zunächst fest, auf welchem ​​Laufwerk die Fehler ausgelöst werden. Dies kann normalerweise leicht durch eine Reihe von Ansätzen bestimmt werden, wie z.

1) Geben Sie den Befehl ein dmesg | grep ata3und suchen Sie nach der Marke und dem Modell der Festplatte. (Da ata3 der Port ist, der den Fehler in Ihrer Situation auslöst. Passen Sie ihn entsprechend an.) Dies liefert eine Ausgabe ähnlich der folgenden:

dmesg | grep ata3
[    4.756081] ata3: SATA max UDMA/133 abar m2048@0xf7f26000 port 0xf7f26200 irq 135
[    5.071981] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[    5.077850] ata3.00: HPA detected: current 1953523055, native 1953525168
[    5.077959] ata3.00: ATA-8: SAMSUNG HD103SJ, 1AJ10001, max UDMA/133
[    5.077960] ata3.00: 1953523055 sectors, multi 16: LBA48 NCQ (depth 32), AA
[    5.084057] ata3.00: configured for UDMA/133

Ein kurzer Blick zeigt, dass das an ata3 angeschlossene Laufwerk der SAMSUNG HD103SJ ist

2) Geben Sie den folgenden Befehl ein:

find -L /sys/bus/pci/devices/*/ata*/host*/target* -maxdepth 3 -name "sd*" 2>/dev/null | egrep block |egrep --colour '(ata[0-9]*)|(sd.*)'

Daraufhin werden sowohl die Ports als auch die Gerätenamen angezeigt, die in derselben Zeile hervorgehoben sind (siehe unten):

Ausgabe

Es ist leicht zu erkennen, dass dem mit ata3 verbundenen Gerät der Gerätename sdb zugewiesen wurde

3) installiere lsscsi mit sudo apt install lsscsiund gib den Befehl auslsscsi

$ lsscsi
[0:0:0:0]    cd/dvd  ATAPI    iHAS124   F      CL9M  /dev/sr0 
[1:0:0:0]    disk    ATA      WDC WD2003FZEX-0 1A01  /dev/sda 
[2:0:0:0]    disk    ATA      SAMSUNG HD103SJ  0001  /dev/sdb 
[3:0:0:0]    disk    ATA      ST6000VN0033-2EE SC60  /dev/sdc 

Beachten Sie, dass der erste Eintrag in jeder Zeile oben scsi_host, channel, target_number und LUN ist. Es ist in Klammern gesetzt und jedes Element ist durch Doppelpunkte getrennt. Wenn mehrere SCSI-Geräte vorhanden sind, werden deren Einträge in aufsteigender Reihenfolge sortiert.

Durch einfaches Hinzufügen von 1 zu der ersten Zahl in jeder Ausgabezeile erhalten Sie den ATA-Port. Weitere Details finden Sie lsscsi hier und hier.

Da in Ihrem Fall sowohl bei 3.00 als auch bei 3.01 Fehler auftreten, ist mehr als ein Laufwerk an denselben ATA-Port angeschlossen. Sie möchten die Konnektivität sowohl zu ata3.00 als auch zu ata3.01 sorgfältig prüfen. Dies kann ein Laufwerkgehäuse mit mehreren Einschüben sein, das an dasselbe Kabel angeschlossen ist. Da beide Laufwerke Fehler auslösen, sollte das Ersetzen des Kabels an der oben genannten Position für mehrere Laufwerke das Problem für beide Laufwerke beseitigen. Diese Geräte verfügen normalerweise über eine externe Stromquelle, die ebenfalls der Schuldige sein könnte und ausgetauscht werden muss, aber das Kabel (das schwächste Glied) ist bei weitem die wahrscheinlichste Ursache für das Problem.

Quellen:

Erfahrung

https://linux.die.net/man/8/lsscsi

http://sg.danny.cz/scsi/lsscsi.html

https://serverfault.com/questions/244944/linux-ata-errors-translating-to-a-device-name/868943#868943

Elder Geek
quelle