Ich habe die Geschichte über den Manager gelesen, der eine Festplatte aus einem RAID 5-Array herausnimmt, und dann eine zweite, aber ich möchte nur selbst ausprobieren, was passiert, wenn ich einfach eine Festplatte von einem Live-System trenne. Da es sich um einen Server der HP ProLiant DL585 G7-Serie handelt , muss er im laufenden Betrieb austauschbar sein.
Aber bevor ich mich darauf einlasse, dachte ich, es wäre vielleicht besser, etwas Input von erfahreneren Leuten zu bekommen, bevor ich etwas wirklich, wirklich Dummes tue.
raid
hp-proliant
hp-smart-array
hotswap
Berzemus
quelle
quelle
Antworten:
Das hängt von Ihrem Controller ab.
Wenn es Hot-Swap unterstützt, dann ja. Wenn nicht, können Sie den Controller sprengen und das gesamte Array beenden.
Wenn Sie ein Laufwerk aus dem Array nehmen (entweder während des Betriebs oder beim Ausschalten), müssen Sie nach dem Zurücksetzen eine vollständige Neuerstellung durchführen. Dies dauert eine Weile und beeinträchtigt die Leistung, während dies geschieht.
Das Testen Ihres RAID-Setups auf diese Weise ist keine schlechte Idee. Stellen Sie einfach sicher, dass Ihre Backups korrekt und aktuell sind, falls etwas schief geht und das Array den Test nicht überlebt.
quelle
Laut einer einfachen Suche sollte dieser Server über "Hot-Plug 2.5" SAS-Laufwerke verfügen. Wenn dies der Fall ist, sollten Sie in der Lage sein, Laufwerke herauszuziehen und Laufwerke einzulegen, während der Computer in Betrieb ist um Ihr aktuelles Setup zu überprüfen.
Dies sollten Sie nicht nur tun, um Ihren Chef zu beeindrucken, sondern vor allem, um sich selbst zu demonstrieren, wie es funktioniert. Sie sollten ein Laufwerk ziehen, um sicherzustellen, dass das System am Leben bleibt, und um sicherzustellen, dass Ihr heißes Ersatzteil sofort aktiviert wird. Es ist auch eine gute Idee, den Wiederherstellungsprozess zu beobachten und festzustellen, wie lange es dauert. Ersetzen Sie das "fehlende" Laufwerk durch ein anderes Laufwerk und prüfen Sie, ob Sie es als Ersatzlaufwerk erstellen und zuweisen können. Ziehen Sie dann das andere Laufwerk, das Teil des ursprünglichen Arrays war, und prüfen Sie, ob die Maschine am Leben bleibt und das neue Ersatzlaufwerk aktiviert wird.
Ein weiterer unterhaltsamer Test besteht darin, die Laufwerke bei ausgeschaltetem Gerät zu entfernen und in einer anderen Reihenfolge wieder einzulegen. Starten Sie dann die Maschine und sehen Sie, was der Controller sagt.
Es ist wichtig, diese Dinge zu tun, bevor die Maschine in Produktion ist, damit Sie a) wissen, dass sie tatsächlich funktioniert, und b) eine Prozedur schreiben können. Sie werden überrascht sein, wie oft ein bestimmtes RAID-Setup nicht wie erwartet funktioniert.
Da Sie neu in diesem Bereich sind, sehen Sie möglicherweise auch, wie ein gezogenes Laufwerk aussieht, wenn Sie es an einen anderen Computer anschließen und versuchen, auf die Daten zuzugreifen. Sie können auch mit Laufwerken unterschiedlicher Größe experimentieren, um zu erfahren, wie das System mit ihnen umgeht.
Nennen Sie mich paranoid, aber im Idealfall können Sie auch ein paar zusätzliche Replikate der Laufwerke kaufen, die Sie verwenden möchten, und jedes einzelne testen, bevor das System in Produktion ist. Ich hatte viele dumme Probleme mit geringfügigen Unterschieden in der Laufwerksgröße zwischen Herstellern, defekten Laufwerken, die beim Einsetzen ganze SCSI-Kanäle herausgenommen haben usw. Das Leben ist gut, wenn Sie ein paar Ersatzlaufwerke haben, die mit den Laufwerken identisch sind, die Sie sind mit.
quelle
Ja, wenn sie Hot-Swap-fähig sind, können Sie einfach eine der Festplatten ziehen, und die Dinge sollten weiter funktionieren. So würden Sie eine ausgefallene Festplatte ersetzen.
quelle
Abhängig von der Steuerung und / oder Software sollte es funktionieren, und in vielen Fällen wird die Redundanz einige Momente nach dem Einlegen der Festplatte wiederhergestellt.
Ich würde es niemals auf einem Produktionssystem tun, da die Festplatten stark belastet sind. Es kann Stunden dauern, bis die Festplatten wieder gespiegelt sind (während dieser Zeit haben Sie keine Redundanz) und und und, aber theoretisch sollte es funktionieren.
In Testsystemen mache ich das immer, bevor ich live gehe, und es wurde immer wiederhergestellt ...
quelle
Wir haben ein paar alte Dell-Server von der Räumung eines erworbenen Rechenzentrums bekommen. Einer von ihnen hat zufällig einen Raid5 eingerichtet, als wir diesen noch nicht in unserem Büro hatten. Also habe ich das einzig logische gemacht. Ich habe es hochgefahren, ein paar Prozesse gestartet und angefangen, Festplatten für die Wissenschaft herauszuholen. 1 war in Ordnung, 2 war in Ordnung, 3 nicht so sehr. Die kurze Antwort lautet also ja. Es ist befreiend!
quelle
Ich habe einmal ein Laufwerk aus einem RAID5-Array als Live-Proof-of-Concept / Hardwaretest gezogen, während ich tatsächlich in der Einrichtung war, in der die Maschine installiert wurde. Ich hatte das schon mehrmals im Büro gemacht, was immer in Ordnung gewesen war, also nahm ich an, dass es diesmal auch so sein würde. Es ging wieder rein, aber es dauerte zwei Wochen, bis ich daran herumfummelte, um wieder erkannt zu werden. Wenn Sie also denken, "es wird gut!", Sollte es ja sein. Aber hören Sie sich alle warnenden Geschichten an.
quelle
Ja, ich habe es geschafft (rein zufällig, ich beeile mich hinzuzufügen).
quelle