Ich habe den Status meiner RAID-Arrays eher zufällig überprüft cat/proc/mdstatund festgestellt, dass eines meiner Arrays neu zu synchronisieren scheint:
Warum ist das so und was bedeutet es? Ich kann anscheinend mit r/wBerechtigungen problemlos auf den Mount-Punkt zugreifen .
EDIT 1 (als Antwort auf die Antwort von SLM )
Ich kann nichts wirklich sehen, wenn ich grepdurch bin dmesgund der --detailSchalter mir auch nicht viel sagt, dh er zeigt an, dass die Neusynchronisierung ausgeführt wird ... aber kein Hinweis auf den Grund oder warum es möglicherweise nicht mehr synchron ist. - Ich denke, ich muss es vielleicht nur im Auge behalten, bevor ich anfange, meine Hardware auszutauschen.
Dies scheint darauf hinzudeuten, dass die Synchronisierung zwischen den beiden RAID-Mitgliedern nicht synchron bleibt.
1. Untersuchen Sie die Protokolle
Ich würde Ihre dmesgProtokolle untersuchen und feststellen, ob Meldungen vorliegen, dass eine der physischen Festplatten, aus denen dieses Array besteht, Hardwarefehler aufweist.
2. Überprüfen Sie mdadm
Sie können auch mdadmden --detailSchalter verwenden, um weitere Informationen zum Resync zu erhalten:
$ sudo mdadm --detail /dev/md0
/dev/md0:
Version : 00.90.03
Creation Time : Sat Jan 26 09:14:11 2008
Raid Level : raid1
Array Size : 976759936 (931.51 GiB 1000.20 GB)
Used Dev Size : 976759936 (931.51 GiB 1000.20 GB)
Raid Devices : 2
Total Devices : 2
Preferred Minor : 0
Persistence : Superblock is persistent
Update Time : Fri Jan 1 01:29:16 2010
State : clean, resyncing
Active Devices : 2
Working Devices : 2
Failed Devices : 0
Spare Devices : 0
Rebuild Status : 50% complete
UUID : 37a3bfcb:41393031:23c133e6:3b879f08
Events : 0.2178969
Number Major Minor RaidDevice State
0 8 1 0 active sync /dev/sda1
1 8 17 1 active sync /dev/sdb1
Wenn beide Geräte in Ordnung zu sein scheinen und Sie nicht genau feststellen können, bei welchem Gerät ein Problem auftritt, möchten Sie möglicherweise vorübergehend ein Diagnosetool wie HDAT2 oder SpinRite für jede Festplatte ausführen, um deren Zustand zu bestätigen.
3. Verkabelung
Wenn die Festplatten auschecken, würde ich anfangen, die Verkabelung zu überprüfen. Normalerweise tausche ich diese aus.
4. Controller
Als nächstes würde ich den Controller selbst überprüfen, indem ich entweder die Laufwerke aus dem betroffenen System herausnehme und sie in einem sekundären System diagnostiziere oder dem betroffenen System eine Controller-Karte eines Drittanbieters hinzufüge, um das Problem weiter zu diagnostizieren.
5. Stromversorgung
Ob Sie es glauben oder nicht, ich hatte in der Vergangenheit Probleme mit Festplatten und RAIDs, bei denen das Austauschen einer fehlerhaften oder kurz vor dem Ausfall der Stromversorgung meine RAID-Gesundheitsprobleme behoben hat.
@cerr - Ja, wenn die Resyncs nur in scheinbar zufälligen Intervallen stattfinden, ist wahrscheinlich eine der Festplatten auf dem Weg nach draußen oder 3,4 oder 5. Die Manifestation, die Sie beschreiben, ist passiert Einige Male waren es diese Situationen, die diese Fehler für mich in der Vergangenheit behoben haben.
slm
8
Überprüfen Sie Ihre Cron-Dateien. Viele Distributionen führen einmal pro Woche eine geplante erneute Synchronisierung / Überprüfung durch.
Unter CentOS 7.1 befindet es sich in /etc/cron.d/raid-check
# Run system wide raid-check once a week on Sunday at 1am by default
0 1 * * Sun root /usr/sbin/raid-check
Um das Verhalten zu konfigurieren, bearbeiten Sie / etc / sysconfig / raid-check
Obwohl es normalerweise nur ein Scheck ist, kein Resync ...
Frostschutz
2
@frostschutz ... es sei denn, es ist der erste Sonntag im Monat: serverfault.com/a/255549/299551 In diesem Fall wird eine erneute Synchronisierung erzwungen.
Überprüfen Sie Ihre Cron-Dateien. Viele Distributionen führen einmal pro Woche eine geplante erneute Synchronisierung / Überprüfung durch.
Unter CentOS 7.1 befindet es sich in /etc/cron.d/raid-check
Um das Verhalten zu konfigurieren, bearbeiten Sie / etc / sysconfig / raid-check
quelle
Auf Debian wird es gemacht von:
Etwas deaktivieren:
Siehe auch.
quelle