Dell PowerEdge Server abgestürzt, wie zu reparieren? Was ist passiert? Informationen im Inneren

8

Ich bin zurzeit in der High School und betreibe die Website unserer Schule. In diesem Sommer wurde bei unserem SysAdmin Krebs diagnostiziert, und er ging zur Behandlung, sodass ich in eine interessante Situation geraten bin.

Ich bin mir wirklich nicht sicher, was mit diesem Webserver nicht stimmt, aber ich würde mich über Ihre Ideen / Lehren / Beiträge freuen, da ich versuche, schnell zu lernen, damit ich helfen kann.

Auf dem Server wurde FreeBSD ausgeführt, was möglicherweise nichts bedeutet, da dies ein Hardwareproblem ist. Ich weiß, dass der Server zu einem bestimmten Zeitpunkt fünf identische Laufwerke enthielt (bedeutet das Raid-5?), Aber zum Zeitpunkt des Absturzes befanden sich drei funktionierende Laufwerke ("läuft im herabgesetzten Modus?").

Vor ungefähr einer Woche wurde der Server nicht gestartet, da nur 1 logisches Laufwerk gefunden wurde. Ich habe das Konfigurationsdienstprogramm ausgeführt und Folgendes gesehen:http://i.stack.imgur.com/IL6ut.jpg

Ich gehe davon aus, dass auf diesem einen lebenden Laufwerk noch einige Daten übrig sind, oder? (Ich habe Backups der Web-Fies, nur nicht das eigentliche Betriebssystem- und Webserver-Setup).

Wenn ich Informationen hinzufügen muss, damit Sie besser erklären können, was mit mir passiert ist, bin ich mehr als bereit, dies zu tun. Ich möchte nur verstehen, was passiert ist, was dies an einem Punkt war und wie ich Maßnahmen ergreifen kann, um dies zu beheben.

Ich danke dir sehr.

ankurkdotcom
quelle
2
So traurig :( mein Beileid ... Überprüfen Sie die Daten und Stromkabel aller Laufwerke, der Rückwandplatine und des Controllers, legen Sie die Festplatten wieder ein. Wenn möglich, schließen Sie diese Laufwerke an einen anderen Computer an (NICHT FORMATIEREN) und prüfen Sie, ob sie erkannt werden.
GioMac
Oh, es ist SCSI, nicht so einfach, eine Verbindung zu einem anderen System herzustellen :( Wahrscheinlich sind die Laufwerke zu alt und tot.
GioMac
Wenn das alles nicht hilft und es sich lohnt, können Sie versuchen, sich an das Unternehmen zu wenden, das HDD-Wiederherstellungsdienste anbietet.
GioMac
2
Ihre Route in Sysadmin ist meiner sehr ähnlich. Viel Glück für die Zukunft, es wird besser. Leider werden Ihre ersten Tage ziemlich unangenehm sein, da Sie alle Laufwerke auf diesem Server austauschen müssen (ein weiteres als Ersatzlaufwerk hinzufügen) und aus dem Backup wiederherstellen müssen.
Tom O'Connor

Antworten:

12

Zunächst mein Beileid zum Krankenhausaufenthalt Ihres Mentors und Ihrer Feuertaufe in die Systemadministration.

Zweitens mein Beileid zu Ihrem Datenverlust. Ich hoffe aufrichtig, dass Sie Backups haben.


Um Ihre Situation zusammenzufassen:

Sie haben ein RAID-Array mit drei Laufwerken (vermutlich ein RAID-5 ).
Dies ist ein "logisches Laufwerk" (die 3 Festplatten werden vom RAID-Controller verwaltet und dem Rest des Systems so präsentiert, als wären sie ein Laufwerk).

Sie haben zwei der drei Laufwerke im Array verloren, und RAID-5 kann es einfach nicht tolerieren, dass zwei Laufwerke ausfallen. ( Weitere Informationen finden Sie in dem Beitrag, auf den ich zuvor verlinkt habe .)

In jeder Hinsicht können Ihre Daten nicht wiederhergestellt werden. Die einzige Möglichkeit, Daten von diesem System wiederherzustellen, besteht darin, alle drei Laufwerke an ein Datenwiederherstellungsunternehmen zu senden (eine kostspielige Aussicht).

Wenn Sie Backups haben, können Sie mit dem Wiederherstellen des Systems auf neuen Festplatten beginnen.
Gute Backups sollten den Wiederherstellungsprozess relativ schmerzlos machen (obwohl dies je nach System und anderen Aktivitäten - E-Mail, DNS usw. - möglicherweise immer noch ein Projekt ist).

Wenn Sie keine Backups haben, haben Sie hoffentlich mindestens eine Kopie der Website (auf der Workstation, auf der Sie entwickeln?) Und können eine neue Serverumgebung einrichten und Ihre Website dort hochladen oder alternativ einen gemeinsam genutzten Hosting-Webspace an at mieten Am wenigsten können Sie die Webpräsenz Ihrer Schule wieder in Betrieb nehmen.

Wenn Sie nur über begrenzte Erfahrung in der Systemadministration verfügen und niemand mit Ihnen daran arbeiten kann, würde ich die gemeinsame Hosting-Route empfehlen.

voretaq7
quelle
Mike, weißt du, welcher Controller das ist? ist es wiederherstellbar / kompatibel mit dmraid?
GioMac
6
Das heißt nicht, dass es hier funktionieren wird, aber wenn Sie wissen, welches Laufwerk zuletzt ausgefallen ist , können Sie das Konfigurationsdienstprogramm möglicherweise zwingen, es auf "Online" zu setzen, um ein gutes Backup zu erstellen. Manchmal werden Laufwerke von einem Controller als "Fehlgeschlagen" markiert, sind aber noch nicht vollständig Fubar'd.
TheCleaner
1
@TheCleaner hat einen Punkt - Dell PERC-Controller sind dafür besonders berüchtigt - sie fahren ständig offline, um Fehler zu beheben. Der Schlüssel ist die erneute Aktivierung
desjenigen, der LETZT