ReFS / Speicherplatz-Laufwerk wird unter starker Last gelöscht

8

Ich habe eine Windows 10-Workstation in meinem Unternehmen, die beispielsweise für die Bildverarbeitung (Photoshop) und die Softwareentwicklung (Eclipse) verwendet wird. Es ist ein i7-2600K-basierter Computer, ein Gigabyte GA-B75M-D3H B75-Motherboard mit 16 GB RAM. Das Betriebssystem ist auf der Samsung 850 Pro SSD, es gibt eine weitere 850 Pro für Daten, WD Black für Daten sowie zwei 4 GB HGST-Laufwerke an SATA 3-Ports, formatiert mit ReFS, in einem Speicherbereichsspiegel. Das Array hat 1,63 GB verwendet, 1,99 GB frei.

Vor kurzem sind die ReFS-Laufwerke im Speicherbereichsspiegel gesunken - bisher dreimal im Monat. Dies tritt normalerweise unter mäßiger bis schwerer Last nach einem längeren Zeitraum auf. Soweit ich das beurteilen kann, fällt keine der anderen Festplatten unter Last. Ich gehe daher davon aus, dass es sich um ReFS, Speicherbereiche oder ein Problem mit einer zugrunde liegenden Festplatte handelt. Ein Neustart bringt die Festplatte online.

Ich kann Fehler in der Ereignisanzeige sehen, wie die folgenden. Diese befinden sich nicht alle an einem Ort, und obwohl es unter "Anwendungs- und Dienstprotokoll -> Microsoft -> Windows" Protokollbereiche für NTFS und Speicherbereiche gibt, scheint es keinen für ReFS zu geben.

Ich würde mich über Hilfe freuen, um herauszufinden, was diese Probleme verursacht, und um sie zu beheben, damit mein System in Betrieb bleibt.

16:27.05 (under event viewer -> application and services log -> microsoft -> windows -> storagespaces-driver-operationsl
Virtual disk {26bf58b3-1cb9-4b93-a945-1b89331bb565} requires a data integrity scan.                                    
Data on the disk is out-of-sync and a data integrity scan is required.                  To start the scan, run the following command:                  

Get-ScheduledTask -TaskName "Data Integrity Scan for Crash Recovery" | Start-ScheduledTask                  

Once you have resolved the condition listed above, you can online the disk by using the following commands in PowerShell:                  

Get-VirtualDisk | ?{ $_.ObjectId -Match "{26bf58b3-1cb9-4b93-a945-1b89331bb565}" } | Get-Disk | Set-Disk -IsReadOnly $false                  
Get-VirtualDisk | ?{ $_.ObjectId -Match "{26bf58b3-1cb9-4b93-a945-1b89331bb565}" } | Get-Disk | Set-Disk -IsOffline  $false

16:27.05 (windows system event log): The file system was unable to write metadata to the media backing volume R:. A write failed with status "A device which does not exist was specified." ReFS will take the volume offline. It may be mounted again automatically.
16:27.06 (windows system event log): The file system detected a checksum error and was not able to correct it. The name of the file or folder is "<unable to determine file name>".
18:35.50 (windows system event log): Failed to connect to the driver: (-2147024894) The system cannot find the file specified. 
18:35.50 (Kernel PNP) The driver \Driver\WudfRd failed to load for the device SWD\WPDBUSENUM\_??_USBSTOR#Disk&Ven_Generic&Prod_STORAGE_DEVICE&Rev_9451#7&2a9fd895&0#{53f56307-b6bf-11d0-94f2-00a0c91efb8b}.

18:35.58: Virtual disk {26bf58b3-1cb9-4b93-a945-1b89331bb565} could not be repaired because there is not enough free space in the storage pool.                  
Replace any failed or disconnected physical disks. The virtual disk will then be repaired automatically or you can repair it by running this command in PowerShell:                  
Get-VirtualDisk | ?{ $_.ObjectId -Match "{26bf58b3-1cb9-4b93-a945-1b89331bb565}" } | Repair-VirtualDisk

UPDATE, wie Yagmoth hervorhebt, beinhaltet dieser Fehler etwas über USB. Die Szenarien, in denen ich mich an diesen Fehler erinnere, sind: a) Beim Sichern auf einem externen USB-Laufwerk b) Beim Ausführen von CrashPlan-Sicherungen auf einem anderen internen SATA-Laufwerk

Tim
quelle
1
Antivirus entfernt, falls es sich um ein Windows 10-Kompatibilitätsproblem handelt? als ob mcafee Probleme mit dem
Jubiläums-
@ yagmoth555 Ich könnte es versuchen, denke ich, aber es scheint mir nicht sehr wahrscheinlich. Ich bin ziemlich daran interessiert, wie das Problem selbst behoben werden kann, anstatt zu raten und zu überprüfen.
Tim
Leider ohne weiteres Protokoll vermute ich ein darunter liegendes Hardwareproblem. Da die AV-Idee der einfache Test war, als ob Ihr Spiegel nicht mit E / A umgehen kann, hilft der AV-Treiber beim Zugriff / beim Schreiben nicht (da er Ihre E / A verlangsamt, indem er einen Treiber dazwischen installiert). Wenn Sie ohne Test / Fehler nachforschen möchten könnte zuerst einen Prozessmonitor versuchen, um alles zu protokollieren. Wenn alle fehlschlagen, würde ich versuchen, die Spiegelung zu entfernen, um sie anschließend erneut zu testen (aber dieser Test ist leider immer noch ein Test / Fehlertest). Halten Sie uns bitte mit dem Überwachungsprotokoll auf dem
Laufenden
Kann ich fragen, ob Ihr Spiegel mit USB-Festplatte fertig ist? als
Kernelfehler
Beide Festplatten sind mit SATA 3 Gbit / s ausgestattet. Gute Erkennung des USB-Fehlers. Frage aktualisiert. Ich bin seit ungefähr einer Woche nicht am Computer, aber ich werde versuchen, es erneut auszulösen und festzustellen, ob die Protokolle unterschiedlich sind. ProcessMonitor sieht so aus, als würde es eine Menge Protokolle erzeugen, aber ich werde es irgendwann versuchen, danke.
Tim

Antworten:

2

Speicherplätze scheinen sehr empfindlich auf Schreiblatenz zu reagieren: Wenn zu viele Spitzen vorhanden sind, kann das Volume gelöscht werden.

Dies scheint ein bekanntes Problem bei der Verwendung von Consumer-SSDs zu sein, wie Sie hier finden

Shodanshok
quelle
Danke für diese Information. Meine ReFS / Storage Space-Festplatten sind 4-TB-HGST-Festplatten, keine SSDs. Auf meinen SSDs wird NTFS ausgeführt. Die Sache mit der Schreiblatenz ist jedoch interessant.
Tim
1

Zuerst sollten Sie wirklich die HCL überprüfen. Ich wette, ein ziemlich schönes Abendessen, nichts, was Sie erwähnt haben, steht auf Storage Spaces HCL. Windows und Storage Spaces haben wie vSAN völlig unterschiedliche HCLs. Ich kann sagen, ohne Ihre Laufwerke nachzuschlagen, dass keines von ihnen in der HCL enthalten sein wird, da es sich bei keinem von ihnen um Laufwerke für Unternehmen handelt.

Wenn Sie eine stabile Lösung wünschen, besorgen Sie sich eine LSI-SAS-Karte (ohne RAID), Unternehmens-SATA-Festplatten und eine Intel-SSD der DC-Serie. Ist es teuer? Ja. Wird es zuverlässig sein? So viel wie Windows sein kann, wenn es um Speicher geht (was nicht großartig ist).

Ich habe Speicherplätze abgeladen und bin zu einer LSI-RAID-Karte zurückgekehrt. Ging jede Woche von Datenkorruption, um über zwei Jahre lang auf derselben Hardware einen soliden Speicher zu schaffen. Und ich hatte ALLE Enterprise-Kits, die auf der HCL waren.

Die Hardwarekompatibilitätsliste (HCL) finden Sie hier https://www.windowsservercatalog.com/results.aspx?&chtext=&cstext=&csttext=&chbtext=&bCatID=1642&cpID=0&avc=10&ava=0&avq=0&OR=1&PGS=25&ready0

Eric C. Singer
quelle
1
Danke für deine Gedanken, Eric. Vielleicht könnten Sie Ihren Beitrag bearbeiten, um "HCL" zu erweitern, da ich nicht weiß, was es bedeutet, und andere werden diesen Beitrag auch nicht lesen. Ich dachte, der Sinn von Software-RAID wie Speicherplätzen besteht darin, die Notwendigkeit teurer Lösungen für Unternehmen zu vermeiden. Ich bin mir nicht sicher, ob Ihre Antwort "wegwerfen und etwas anderes kaufen" meine Frage wirklich beantwortet.
Tim
Siehe meine Kommentare, HCL = Hardware, die für Laien zertifiziert ist. SW-RAID ist nicht gleichbedeutend mit oder bedeutet, dass Sie auf HW für Unternehmen verzichten können. Dies bedeutet, dass Sie die Flexibilität einer SW-basierten Lösung haben.
Eric C. Singer
... und beenden Sie die Verwendung von ReFS, wechseln Sie zurück zu NTFS. Es ist wie unendlich reifer als ReFS. ReFS ist vielversprechend, hat aber auch eine Menge zu reifen.
Eric C. Singer
Ich habe einen ganzen Blog-Beitrag über Storage Spaces BTW geschrieben, eine Serie gestartet, aber aufgegeben, weil IMO, es ist ein POS. Wie die meisten MS-Lösungen ist es halbgebacken. ericcsinger.com/backup-storage-part-5-realization-of-a-failure Wir sind wieder auf RAID-Karten umgestiegen und hatten seitdem kein Problem mehr. Da Sie die Spiegelung verwenden, ist es fast besser, ein Robocopy-Skript einzurichten, um Daten von einer Festplatte auf eine andere zu kopieren. Die Fehlerbehebung ist einfacher und wahrscheinlich zuverlässiger, und Sie können Ihre Consumer-Festplatten behalten.
Eric C. Singer
1
Dies vorausgeschickt , da Sie Ihre Festplatten spiegeln, Sie könnten eine Platte vertreiben, formatieren Sie es mit NTFS und kopieren Sie Ihre Daten hinüber. Ich würde dringend von Speicherplätzen abraten, da das Problem, das Sie sehen, nicht so sehr ein ReFS-Problem ist, sondern ein Speicherbereich. Alles, was damit zu tun hat, dass Datenträger entfernt werden oder als fehlerhaft angezeigt werden, hängt mit Speicherplätzen zusammen. Wenn Sie nur versuchen, Ihre Datenträger synchron zu halten, damit Sie ein lokales Replikat haben, ist Robocopy der einfachste Weg, dies zu tun Nicht Echtzeit ist alles.
Eric C. Singer