RAID-Resynchronisierung automatisch?

11

Ich habe den Status meiner RAID-Arrays eher zufällig überprüft cat/proc/mdstatund festgestellt, dass eines meiner Arrays neu zu synchronisieren scheint:

md1 : active raid1 sdb7[1] sdc7[0]
      238340224 blocks [2/2] [UU]
      [==========>..........]  resync = 52.2% (124602368/238340224) finish=75.0min speed=25258K/sec

Warum ist das so und was bedeutet es? Ich kann anscheinend mit r/wBerechtigungen problemlos auf den Mount-Punkt zugreifen .

EDIT 1 (als Antwort auf die Antwort von SLM )

Ich kann nichts wirklich sehen, wenn ich grepdurch bin dmesgund der --detailSchalter mir auch nicht viel sagt, dh er zeigt an, dass die Neusynchronisierung ausgeführt wird ... aber kein Hinweis auf den Grund oder warum es möglicherweise nicht mehr synchron ist. - Ich denke, ich muss es vielleicht nur im Auge behalten, bevor ich anfange, meine Hardware auszutauschen.

mdadm synchronization stdcerr
quelle

10

Dies scheint darauf hinzudeuten, dass die Synchronisierung zwischen den beiden RAID-Mitgliedern nicht synchron bleibt.

1. Untersuchen Sie die Protokolle

Ich würde Ihre dmesgProtokolle untersuchen und feststellen, ob Meldungen vorliegen, dass eine der physischen Festplatten, aus denen dieses Array besteht, Hardwarefehler aufweist.

2. Überprüfen Sie mdadm

Sie können auch mdadmden --detailSchalter verwenden, um weitere Informationen zum Resync zu erhalten:

$ sudo mdadm --detail /dev/md0
/dev/md0:
        Version : 00.90.03
  Creation Time : Sat Jan 26 09:14:11 2008
     Raid Level : raid1
     Array Size : 976759936 (931.51 GiB 1000.20 GB)
  Used Dev Size : 976759936 (931.51 GiB 1000.20 GB)
   Raid Devices : 2
  Total Devices : 2
Preferred Minor : 0
    Persistence : Superblock is persistent

    Update Time : Fri Jan  1 01:29:16 2010
          State : clean, resyncing
 Active Devices : 2
Working Devices : 2
 Failed Devices : 0
  Spare Devices : 0

 Rebuild Status : 50% complete

           UUID : 37a3bfcb:41393031:23c133e6:3b879f08
         Events : 0.2178969

    Number   Major   Minor   RaidDevice State
       0       8        1        0      active sync   /dev/sda1
       1       8       17        1      active sync   /dev/sdb1

Wenn beide Geräte in Ordnung zu sein scheinen und Sie nicht genau feststellen können, bei welchem Gerät ein Problem auftritt, möchten Sie möglicherweise vorübergehend ein Diagnosetool wie HDAT2 oder SpinRite für jede Festplatte ausführen, um deren Zustand zu bestätigen.

3. Verkabelung

Wenn die Festplatten auschecken, würde ich anfangen, die Verkabelung zu überprüfen. Normalerweise tausche ich diese aus.

4. Controller

Als nächstes würde ich den Controller selbst überprüfen, indem ich entweder die Laufwerke aus dem betroffenen System herausnehme und sie in einem sekundären System diagnostiziere oder dem betroffenen System eine Controller-Karte eines Drittanbieters hinzufüge, um das Problem weiter zu diagnostizieren.

5. Stromversorgung

Ob Sie es glauben oder nicht, ich hatte in der Vergangenheit Probleme mit Festplatten und RAIDs, bei denen das Austauschen einer fehlerhaften oder kurz vor dem Ausfall der Stromversorgung meine RAID-Gesundheitsprobleme behoben hat.

slm
quelle

@cerr - Ja, wenn die Resyncs nur in scheinbar zufälligen Intervallen stattfinden, ist wahrscheinlich eine der Festplatten auf dem Weg nach draußen oder 3,4 oder 5. Die Manifestation, die Sie beschreiben, ist passiert Einige Male waren es diese Situationen, die diese Fehler für mich in der Vergangenheit behoben haben.

slm

8

Überprüfen Sie Ihre Cron-Dateien. Viele Distributionen führen einmal pro Woche eine geplante erneute Synchronisierung / Überprüfung durch.

Unter CentOS 7.1 befindet es sich in /etc/cron.d/raid-check

# Run system wide raid-check once a week on Sunday at 1am by default
0 1 * * Sun root /usr/sbin/raid-check

Um das Verhalten zu konfigurieren, bearbeiten Sie / etc / sysconfig / raid-check

Sergio
quelle

Obwohl es normalerweise nur ein Scheck ist, kein Resync ...

Frostschutz

2

@frostschutz ... es sei denn, es ist der erste Sonntag im Monat: serverfault.com/a/255549/299551 In diesem Fall wird eine erneute Synchronisierung erzwungen.

Dan

2

Auf Debian wird es gemacht von:

/etc/cron.d/mdadm

Etwas deaktivieren:

chmod -x /usr/share/mdadm/checkarray

Siehe auch.

Sanmai
quelle