Muss ich Fusion-io-Karten RAID?

27

Kann ich mit einer in einem Server installierten Fusion-io- Karte zuverlässig arbeiten oder muss ich zwei Karten in einem Software-RAID-Setup bereitstellen ?

Fusion-io ist nicht sehr klar (fast irreführend) in Bezug auf das Thema, wenn es um die Überprüfung ihrer Marketingmaterialien geht. Angesichts der Kosten der Karten bin ich gespannt, wie andere Ingenieure sie in realen Szenarien einsetzen.

Ich plane die Verwendung der Fusion-io ioDrive2 1.2TB-Karte der Marke HP für eine proprietäre Standalone-Datenbanklösung, die unter Linux ausgeführt wird. Dies ist eine Einzelserverkonfiguration ohne echte Hochverfügbarkeitsoption. Es gibt eine asynchrone Replikation mit einem 10-minütigen RPO , bei der Transaktionsprotokolle auf einem zweiten physischen Server gespiegelt werden.

Normalerweise würde ich für diese Anwendung einen High-End- HP ProLiant- Server mit der höchsten CPU-Auslastung angeben . Ich muss auf SSD umsteigen und kann Fusion-io für die erforderliche Kapazität zu einem niedrigeren Preis erwerben als Enterprise-SAS-SSD.

  • Muss ich zwei ioDrive2-Karten ausführen und sie mit Software-RAID (md oder ZFS) verbinden, oder ist das nicht erforderlich?
  • Sollte ich mir mehr Gedanken über einen Fusion-io-Fehler machen als über einen RAID-Controller-Fehler oder einen Motherboard-Fehler?
  • Systemadministratoren mögen RAID. Erfordert dies eine andere Denkweise angesichts der unterschiedlichen Benutzeroberfläche und der in diesem Formfaktor verfügbaren Abnutzungskorrektur / Fehlerkorrektur auf der Karte?
  • Was IST die Ausfallrate dieser Geräte?

Bearbeiten: Ich habe gerade ein Whitepaper zur Zuverlässigkeit von Fusion-io von Dell gelesen und es scheint zu lauten: "Bei Fusion-io-Karten gibt es viele interne Redundanzen. Machen Sie sich keine Sorgen um RAID !!" .

ewwhite
quelle
Schaffen es Software Raid und / oder der PCIe-Bus überhaupt noch, Schritt zu halten, wenn Sie das IOPS-Limit überschreiten? Ich habe ehrlich gesagt keine Ahnung, aber es lohnt sich herauszufinden.
Pause
1
Der PCIe-Bus wird mithalten. Das Software-RAID (falls erforderlich ) wird ZFS-basiert sein, ist also in der Lage. Ich habe vorerst zwei Karten bestellt, aber in der Fusion-io-Literatur scheint zu stehen: "Eine Karte ist gut genug".
Ewwhite
Sogar ZFS muss CPU-Zyklen zum Spiegeln von Daten verwenden, um Komplexität und Latenz zu erhöhen. Wie stark sich dies jedoch auf Ihre spezifische Anwendung auswirken würde, lässt sich nicht sagen. Fusion scheint sehr stolz auf ihre niedrigen CPU-Kosten für die interne Spiegelung / Sicherung zu sein.
Pause

Antworten:

16

Letztendlich kommt es auf Ihr Versagensmodell an. Was ist die Auswirkung eines Ausfalls?

In der Vergangenheit haben wir immer alles geklaut, da die Kosten dafür vernachlässigbar waren. Weitere 500 Dollar für eine Festplatte zum Spiegeln? Total die Kosten wert, ohne es zu berücksichtigen.

Wenn Sie über weitere $ 10K + sprechen, um die Spiegelung zu aktivieren, muss dies etwas mehr berücksichtigt werden.


Nein, Sie müssen nicht spiegeln

Die Fusion-io- Karten haben eine recht gute interne Redundanz. Dies ist nicht die Art von Hardware, bei der Ihre Festplatte ein einzelner Chip ist. In den meisten Situationen, in denen ich einen Fehler beobachtet habe, handelte es sich um ein Firmware-Problem, das beide Mitglieder eines Spiegels betraf, sodass RAID keine Rolle gespielt hätte.

Stellen Sie sich eine Fusion-io-Karte als RAID-Controller mit Festplatten dahinter vor. Sind Sie in Ordnung mit einem Single-Controller-Setup? Wahrscheinlich. Behandle es so.

In vielen Setups, in denen Sie Fusion-io-Laufwerke bereitstellen würden, sind andere Sicherheitsvorkehrungen integriert (Redundanz auf Knotenebene), sodass dies weniger sinnvoll ist.


Ja, du musst spiegeln

RAID erhöht Ihre Verfügbarkeit . Benötigen Sie trotz der Kosten eine absolute maximale Verfügbarkeit? Sind die Kosten für einen Ausfall und mögliche Ausfallzeiten hoch? Fahren Sie fort und spiegeln Sie die Laufwerke. Bei einer statistisch großen Konfiguration treten trotz der internen Sicherheitsvorkehrungen Laufwerksausfälle auf.

MikeyB
quelle
Update: Ich habe die Fusion-io-Karten in den Installationen gespiegelt, in denen der Kunde mit den zusätzlichen Ausgaben einverstanden war (und um mir die Bereitstellung des Produkts zu erleichtern). Ich habe eine Reihe von Einzelkarteninstallationen in anderen Situationen bereitgestellt. Bisher war alles in Ordnung ...
ewwhite
18

Die auf dem Gerät vorhandene Redundanz sollte für Ausfälle der Flash-Chips in Ordnung sein - analog zu RAID bei allen Komponenten, die die eigentliche Datenspeicherung durchführen.

Sollte ich mir mehr Gedanken über einen Fusion-io-Fehler machen als über einen RAID-Controller-Fehler oder einen Motherboard-Fehler?

Ein Ausfall des gesamten Geräts wäre so ziemlich analog zum Ausfall eines RAID-Controllers oder eines Motherboards. Die Fusion-io-Karte bereitet mir ungefähr die gleichen Sorgen wie diese anderen Komponenten, bei denen nur ein einziger Fehler auftritt. Ich habe keine Erfahrung mit den Geräten im großen Maßstab, um die Ausfallraten mit harten Daten vergleichen zu können.

Muss ich zwei ioDrive2-Karten ausführen und sie mit Software-RAID (md oder ZFS) verbinden, oder ist das nicht erforderlich?

Das Hinzufügen von Redundanz zusätzlich zu dem, was das Gerät bereits hat (z. B. Software-RAID zwischen mehreren Fusion-io-Karten), ähnelt dem Ausführen von Software-RAID zwischen zwei Hardware-RAID-Gruppen auf zwei verschiedenen RAID-Controllern. Dies kann sich für Systeme lohnen, die eine extreme Redundanz gewährleisten, um einen zusätzlichen Single-Point-of-Failure-Punkt zu beseitigen, jedoch nicht für allgemeine Bereitstellungen (eine 10-minütige RPO auf einem Spiegel sollte für die meisten Anwendungen ausreichen).

Sysadmins mögen RAID. Erfordert dies eine andere Denkweise angesichts der unterschiedlichen Benutzeroberfläche und der in diesem Formfaktor verfügbaren Abnutzungskorrektur / Fehlerkorrektur auf der Karte?

Ja ich glaube schon. Grundsätzlich erhalten Sie ein Gerät, das einem RAID-Controller ähnelt, und eine Reihe von Speichergeräten in einem Paket. Es ist definitiv verlockend, sich Sorgen darüber zu machen, dass Ihre sensiblen Daten auf ein einzelnes Gerät übertragen werden, aber man muss ein gewisses Maß an Vertrauen in die interne Redundanz des Geräts haben ... Dies sollte mit einem gesunden Verständnis des Begriffs "RAID ist kein RAID" in Einklang gebracht werden backup "-Konzept: Seien Sie immer darauf vorbereitet, dass eine redundante Komponente ausfällt oder dass ein Benutzer die darauf befindlichen Daten mit guten Sicherungen löscht.

Shane Madden
quelle
13

Wie Sie wissen, haben wir ihr Kit für eine Weile sowohl in RAID- als auch in Nicht-RAID-Setups verwendet. Ich wünschte, ich hätte einige Fehlererfahrungen, die ich Ihnen geben könnte, aber ich habe keine. Wir hatten keine Ausfälle, bei denen RAID geholfen hätte, und die integrierten Ausfallsicherheitsfunktionen werden immer besser. Außerdem ist die Hauptfunktion, für die wir sie verwenden, jetzt horizontal skaliert / gruppiert, sodass wir noch weniger Gründe haben, sie zu RAIDen. Tolle Karten, kann ich nur empfehlen.

Chopper3
quelle
Ein guter Datenpunkt. Ich kann jedoch nur nicht sagen, ob das Hinzufügen einer RAID-Ebene übertrieben ist oder nicht.
Ewwhite
1
Ich sehe die Technologie hier nicht als den entscheidenden Punkt an - entweder müssen Ihre Daten den Verlust einer einzelnen FusionIO-Karte unterstützen oder nicht - betrachten Sie sie einfach als schnelle, kostenintensive Festplatten - das ändert nichts daran, ob Sie dies tun oder nicht kann ohne RAID leben oder nicht?
Chopper3
Ein wenig ... Ein traditioneller Ansatz wäre die Verwendung von SAS-SSDs für Unternehmen in einem RAID 1 + 0. Dies entspricht dem Standard für das Drehen von Festplatten auf SSDs. Das setzt aber auch Hot-Swap-Fähigkeit voraus. Dies gilt nicht für eine PCIe-basierte Karte, insbesondere wenn ich dazu gezwungen wäre, Software-RAID zu verwenden. Da Fusion-io auch den Vorteil eines besseren Abnutzungsniveaus und einer besseren Überwachung bietet, versuche ich, die realistischen Fehlermodi zu verstehen, um die es hier geht. Behandle ich den Fusion-io wie eine Festplatte oder einen Controller? Sie würden nicht zwei Smart Array-Karten in einen ProLiant stecken, um interne Festplatten zu bedienen, oder?
Ewwhite
2
@ewwhite Möglicherweise verfügen Sie über zwei RAID-Controller mit unterschiedlichen Datenträgern und RAID1 zwischen den Datenträgern des Controllers, wenn Sie in der Lage sein müssen, den Ausfall eines RAID-Controllers zu behandeln. Ich würde sagen, dass Sie die Fusion-io-Karte im Sinne Ihrer Redundanzplanung wie einen RAID-Controller behandeln.
Shane Madden
@ewwhite Wenn Sie sich die Formulierung ansehen, die ich verwendet habe, können Sie zwischen den Zeilen lesen, dass wir auf einem einzelnen mit FusionIO ausgestatteten Server einen Ausfall hatten - wir hatten einen Mobo-Go-Pop - einen DL580 G6 (wir haben nur sehr wenige) und etwas ist einer ganzen Bank des Gedächtnisses zugestoßen, und es hat das who-Brett herausgenommen. In diesem Szenario war es RAID 1'ed, aber das war offensichtlich egal. Natürlich bedenken Sie , dass PCIe kann Hot-Swap, kann es eine massive faff sein , aber es kann gut funktionieren.
Chopper3
9

Ich bin nicht direkt mit Fusion vertraut, habe aber einige Erfahrungen mit PCIe-SSDs.

Diejenigen, mit denen ich arbeite, präsentieren dem Betriebssystem vier verschiedene LUNs und behandeln die PCIe-Karte wie einen HBA. Wenn ich RAID möchte, würde ich zwei LUNs unter Verwendung des Betriebssystems zusammen spiegeln. Dies ermöglicht mir eine Ein-Karten-Lösung für Redundanz. Obwohl, wenn die Karte komplett ausfällt, bin ich immer noch einen Bach hoch. Ich weiß nicht, ob ioDrive dasselbe tut.

sysadmin1138
quelle
Diese spezielle Einheit präsentiert ein Blockgerät.
Ewwhite
1
ioDrives präsentieren ein oder zwei unabhängige Geräte. Wenn zwei Geräte vorhanden sind, handelt es sich physisch um zwei separate Geräte auf einer Karte mit jeweils eigenem internen Schutz. Vergleichen Sie beispielsweise den Intel 910 mit vier Geräten, die als SSD behandelt werden sollten.
MikeyB
5

Ich habe in den letzten Monaten 6 der 1,2-TB-Karten gekauft. Einer von ihnen ist bereits gescheitert. Also würde ich sie absolut überfallen. Ich habe Windows Active Disk Mirror verwendet. Das Laufwerk ist mit der Meldung "fehlende LEB-Karte" ausgefallen. Mir wurde gesagt, es müsste ausgetauscht werden. Aber um die RMA-Genehmigung zu erhalten, müsste ich Bilder auf beiden Seiten der ausgefallenen Karte aufnehmen (zum Herausnehmen der Karte ist ein Produktionsausfall erforderlich). Und dann sagten sie mir, dass die Ersatzkarte ohne eta vergriffen sei. Sie sollten sich also überlegen, bevor Sie sie kaufen.

user229000
quelle
Vielen Dank für Ihre Erfahrung. Ich habe diese 1,2-TB-Karten in gespiegelten Paaren bereitgestellt. Ich verwende HP SKUs, daher habe ich meinen HP Supportvertrag für RMA / Ersatz.
Ewwhite