Was ist ein Storage Area Network und welche Vorteile hat es gegenüber verschiedenen Speicherlösungen?

35

Ich schlage vor, dass dies eine kanonische Frage zu Storage Area Networks auf Unternehmensebene ist.

Was ist ein Storage Area Network (SAN) und wie funktioniert es?
Wie unterscheidet es sich von einem Network Attached Storage (NAS)?
Was sind die Anwendungsfälle im Vergleich zu Direct-Attached Storage (DAS)?
Inwiefern ist es besser oder schlechter?
Warum ist es so teuer?
Soll ich (oder meine Firma) eine verwenden?

Massimo
quelle
@Basil: Meinst du, die Frage sollte sich auch mit NAS befassen? Sie unterscheiden sich grundlegend von SAN (und es gibt bereits eine Frage, die sie miteinander vergleicht: serverfault.com/questions/81723/… ). Ich wollte, dass es in diesem speziell um SANs geht. Ich entferne Ihre Bearbeitung nicht, aber ich würde mich über ein Feedback der Community zu diesem Thema freuen.
Massimo
I do-file-Serving ist normalerweise eine Funktion der meisten Speichergeräte auf dem Markt, die heute von den meisten als "SAN" bezeichnet werden.
Basil
Ich denke, die Frage, die ich verknüpft habe, deckt dies ziemlich gut ab, und NAS sind konzeptionell viel einfacher (sie sind im Grunde genommen Dateiserver). Ein SAN ist komplexer, modularer und teurer. Eine Ausweitung des Geltungsbereichs dieser Frage auf alle Arten der Speicherung würde sie einfach zu weit führen. Das ist natürlich meine Meinung.
Massimo
Mein Punkt ist, dass jede Speicherlösung, die Sie jetzt erhalten können, eine integrierte Dateibereitstellung hat. EMC, HDS, IBM, HP, Netapp (offensichtlich), Dell. Sie können nicht über ein "SAN" (wieder eine falsche Bezeichnung, da Sie dies eigentlich als Konnektivitätsschicht bezeichnen) sprechen, ohne über das Serving von Dateien zu sprechen. Könnten Sie in den Kommunikationsraum springen?
Basil
1
Ich mag die Art und Weise, wie sich das herausgestellt hat. Ich denke, es ist besser, sich bei dieser Frage darauf zu konzentrieren, was ein SAN ist, und NAS nur nebenbei zu erwähnen. Diese ältere Frage zu "Was ist der Unterschied zwischen SAN, NAS, DAS?" könnte ein bisschen aktualisiert und in eine kanonische Q & A für sich gemacht werden.
Ward - Reinstate Monica

Antworten:

45

Vor allem für einen (breit) Vergleich von DEM, NAS und SAN - Speicher zu sehen hier .


Es gibt einige verbreitete Missverständnisse über den Begriff " SAN ", der " Storage Area Network " bedeutet und sich streng genommen nur auf die Kommunikationsinfrastruktur bezieht, die Speichergeräte (Festplatten-Arrays, Bandbibliotheken usw.) und Speicherbenutzer (Server) verbindet ). In der allgemeinen Praxis wird der Begriff "SAN" jedoch verwendet, um sich auf zwei Dinge zu beziehen:

  1. Eine vollständige Speicherinfrastruktur, einschließlich der gesamten Hardware und Software für den gemeinsamen Zugriff auf zentrale Speichergeräte von mehreren Servern aus. Obwohl diese Verwendung nicht unbedingt korrekt ist, wird sie allgemein akzeptiert, und worauf sich die meisten Leute beziehen, wenn sie über ein "SAN" sprechen. Der Rest dieser Antwort konzentriert sich darauf und beschreibt somit jede Komponente einer Speicherinfrastruktur auf Unternehmensebene.
  2. Ein einzelnes Speicherarray (siehe später); Wie in "Wir haben ein Brand X SAN mit 20 TB Speicher". Diese Verwendung ist grundsätzlich falsch, da sie nicht einmal die wahre Bedeutung von "SAN" berücksichtigt und lediglich davon ausgeht, dass es sich um eine Art Speichergerät handelt.

Ein SAN kann aus sehr unterschiedlicher Hardware bestehen, kann jedoch normalerweise in verschiedene Komponenten unterteilt werden:

  • Speicher-Arrays : Hier werden Daten tatsächlich gespeichert (und was fälschlicherweise häufig als "SAN" bezeichnet wird). Sie setzen sich zusammen aus:
    • Physische Festplatten: Sie archivieren natürlich die Daten. Datenträger auf Unternehmensebene werden verwendet, was bedeutet, dass sie normalerweise eine geringere Datenträgerkapazität, jedoch eine viel höhere Leistung und Zuverlässigkeit aufweisen. Außerdem sind sie viel teurer als Festplatten der Consumer-Klasse. Die Festplatten können je nach SAN-Implementierung eine Vielzahl von Verbindungen und Protokollen ( SATA , SAS , FC usw.) sowie verschiedene Speichermedien ( Solid-State-Festplatten werden immer häufiger verwendet) verwenden.
    • Festplattengehäuse: Hier werden die Festplatten platziert. Sie stellen Strom- und Datenverbindungen zu ihnen her.
    • Speicher-Controller / -Prozessoren: Diese verwalten Festplatten-E / A, RAID und Caching (der Begriff "Controller" oder "Prozessor" variiert zwischen SAN-Anbietern). Auch hier werden Controller auf Unternehmensebene verwendet, sodass sie eine viel bessere Leistung und Zuverlässigkeit aufweisen als Hardware der Consumer-Klasse. Sie können und werden normalerweise paarweise für Redundanz konfiguriert.
    • Speicherpools : Ein Speicherpool ist eine Menge Speicherplatz, der aus einigen (häufig vielen) Festplatten in einer RAID-Konfiguration besteht. Es wird als "Pool" bezeichnet, da Teile davon bei Bedarf zugewiesen, in der Größe geändert und freigegeben werden können, wodurch LUNs erstellt werden.
    • Logical Unit Numbers (LUNs): Eine LUN besteht aus einem Speicherbereich, der einem oder mehreren Servern zur Verfügung gestellt wird. Dies wird von den Servern als Speichervolume angesehen und kann von ihnen mit jedem beliebigen Dateisystem formatiert werden.
  • Bandbibliotheken: Sie können mit einem SAN verbunden werden und dieselbe Kommunikationstechnologie sowohl für die Verbindung zu Servern als auch für die direkte Sicherung von Speichern auf Band verwenden.
  • Kommunikationsnetzwerk ( das eigentliche "SAN" ): Hiermit können die Speicherbenutzer (Server) auf die Speichergeräte (Speicherarrays, Bandbibliotheken usw.) zugreifen. Genau genommen ist dies die eigentliche Bedeutung des Begriffs "Storage Area Network" und der einzige Teil einer Speicherinfrastruktur, der als solcher definiert werden sollte . Es gibt wirklich viele Lösungen, um Server mit gemeinsam genutzten Speichergeräten zu verbinden, aber die häufigsten sind:
    • Fibre Channel : Eine Technologie, die Glasfaser für Hochgeschwindigkeitsverbindungen zum gemeinsam genutzten Speicher verwendet. Es umfasst Host-Bus-Adapter , Glasfaserkabel und FC-Switches und kann Übertragungsgeschwindigkeiten von 1 Gbit bis 20 Gbit erreichen. Auch Multipath - I / O kann zuGruppe zusammen mehr physikalischen Verbindungen verwendet werden, so dass fürhöhere Bandbreite und Fehlertoleranz.
    • iSCSI : Eine Implementierung des SCSI- Protokolls über IP-Transport. Es wird mit Standard- Ethernet- Hardware betrieben, was bedeutet, dass Übertragungsgeschwindigkeiten von 100 MBit (im Allgemeinen nicht für SANs verwendet) bis 100 GBit erreicht werden können. Multipath-E / A können ebenfalls verwendet werden (obwohl die zugrunde liegende Netzwerkschicht einige zusätzliche Komplexitäten mit sich bringt).
    • Fibre Channel over Ethernet (FCoE) : Eine Technologie zwischen vollständiger FC und iSCSI, die Ethernet als physische Schicht und FC als Transportprotokoll verwendet, sodass keine IP-Schicht in der Mitte erforderlich ist.
    • InfiniBand : eine sehr leistungsstarke Verbindungstechnologie, die weniger verwendet und ziemlich teuer ist, aber eine beeindruckende Bandbreiteerreichen kann.
  • Host-Bus-Adapter (HBAs): Die Adapterkarten, die von den Servern für den Zugriff auf die Konnektivitätsschicht verwendet werden. Dies können dedizierte Adapter (wie in FC-SANs) oder Standard-Ethernet-Karten sein. Es gibt auch iSCSI-HBAs, die über eine Standard-Ethernet-Verbindung verfügen, jedoch das iSCSI-Protokoll in der Hardware verarbeiten können, wodurch der Server von zusätzlicher Last entlastet wird.

Ein SAN bietet viele zusätzliche Funktionen über direkt angeschlossenen (oder physisch gemeinsam genutzten) Speicher:

  • Fehlertoleranz: Hochverfügbarkeit ist in jedem SAN auf Unternehmensebene integriert und wird auf allen Ebenen verarbeitet, von Netzteilen in Speicherarrays bis hin zu Serververbindungen. Festplatten sind zuverlässiger, RAID wird verwendet, um Ausfällen einzelner Festplatten (oder mehrerer Festplatten) standzuhalten, redundante Controller werden eingesetzt, und Multipfad-E / A ermöglichen einen unterbrechungsfreien Speicherzugriff, selbst bei einem Verbindungsfehler.
  • Höhere Speicherkapazität: SANs können viele große Speichergeräte enthalten, sodass viel mehr Speicherplatz zur Verfügung steht, als ein einzelner Server leisten kann.
  • Dynamische Speicherverwaltung: Speichervolumes (LUNs) können bei Bedarf erstellt, in der Größe geändert und gelöscht werden. Sie können von einem Server auf einen anderen verschoben werden. Das Zuweisen von zusätzlichem Speicher zu einem Server erfordert nur einige Konfigurationen, im Gegensatz zum Kaufen und Installieren von Datenträgern.
  • Leistung: Ein ordnungsgemäß konfiguriertes SAN, das neuere (wenn auch teure) Technologien verwendet, kann eine beeindruckende Leistung erzielen und wurde von Grund auf für die Bewältigung hoher gleichzeitiger Lasten von mehreren Servern entwickelt.
  • Replikation auf Speicherebene: Zwei (oder mehr) Speicher-Arrays können für die synchrone Replikation konfiguriert werden, sodass die Server-E / A in Fehler- oder Katastrophenszenarien vollständig von einem zum anderen umgeleitet werden können.
  • Snapshots auf Speicherebene : Die meisten Speicher-Arrays ermöglichen das Erstellen von Snapshots einzelner Volumes und / oder ganzer Speicherpools. Diese Schnappschüsse können dann bei Bedarf wiederhergestellt werden.
  • Backups auf Speicherebene: Die meisten SANs ermöglichen auch das Ausführen von Backups direkt von Speicherarrays auf SAN-verbundene Bandbibliotheken, wobei die Server, die die Daten tatsächlich verwenden, vollständig umgangen werden. Zur Gewährleistung der Datenintegrität und -konsistenz werden verschiedene Techniken eingesetzt.

Auf der Grundlage der obigen Ausführungen liegen die Vorteile der Verwendung von SANs auf der Hand. Aber was ist mit den Kosten für den Kauf und der Komplexität der Verwaltung?

SANs sind Hardware der Enterprise-Klasse (obwohl es auch für kleine und mittlere Unternehmen ein Geschäftsmodell für kleine SANs geben kann). Sie sind natürlich hochgradig anpassbar und können von "ein paar TBs mit 1-Gbit-iSCSI und etwas hoher Zuverlässigkeit" bis zu "mehreren hundert TBs mit erstaunlicher Geschwindigkeit, Leistung und Zuverlässigkeit und vollständiger synchroner Replikation in ein DR-Rechenzentrum" reichen. Die Kosten variieren dementsprechend, sind jedoch im Allgemeinen höher (wie in "Gesamtkosten" sowie in "Kosten pro Gigabyte Speicherplatz") als bei anderen Lösungen. Es gibt keinen Preisstandard, aber es ist nicht ungewöhnlich, dass auch kleine SANs Preisschilder im Bereich von Zehntausenden (und sogar Hunderttausenden) Dollar haben.

Das Entwerfen und Implementieren eines SAN (insbesondere für ein High-End-SAN) erfordert spezielle Fähigkeiten, und diese Art von Arbeit wird in der Regel von hochspezialisierten Mitarbeitern ausgeführt. Alltägliche Vorgänge wie das Verwalten von LUNs sind erheblich einfacher, aber in vielen Unternehmen wird die Speicherverwaltung ohnehin von einer bestimmten Person oder einem bestimmten Team durchgeführt.

Unabhängig von den obigen Überlegungen sind SANs die Speicherlösung der Wahl, wenn hohe Kapazität, Zuverlässigkeit und Leistung erforderlich sind.

Massimo
quelle
3
Vote ++ für eine so ausführliche Antwort.
Simon Catlin
3

Benötigen Sie einen? Hängt davon ab. £ oder $ pro TB ist erheblich höher als DAS. Außerdem übertrifft die Leistung von DAS leider FC / AL und iSCSI SAN (zumindest in meinen Tests mit Oracle- und SQL Server-DBs). Mit DAS erhalten Sie jedoch nicht die Vorteile, Speicher gemeinsam zu nutzen (gut für Clustering und VMWare).

Eine Reihe von Speicheranbietern migrieren weg von Fibre Channel für die Host-zu-Speicher-Controller-Verbindungen zugunsten von iSCSI, das über Ethernet ausgeführt wird. Es ist die alte Token-Ring-gegen-Ethernet-Saga. Bei so vielen branchenweiten Forschungen und Investitionen in Ethernet kann FC einfach nicht mithalten. Ein 10-Gbit / s-Ethernet-Switch ist weitaus billiger als ein 8-Gbit / s-FC-Switch. Außerdem kann er vLAN- oder anderweitig segmentiert werden, um Speicher- und Nichtspeicherdaten bereitzustellen.

Es gibt jedoch einige große Vorteile von SANs:

  • SAN-Snapshots (Zeitpunkt der Wiederherstellung eines Servers oder mehrerer Server)
  • Replikation auf Blockebene vor Ort und außerhalb des Standorts (ohne Beteiligung des Hostservers, daher keine softwarebasierte Replikation erforderlich)
  • Direkte SAN-Sicherungen - wenn sich Ihr Sicherungssystem in Ihr SAN einbinden und damit arbeiten kann

Wenn Sie erwägen, Ihren Zeh in das Wasser eines gemeinsam genutzten Speichers zu tauchen, schauen Sie sich Produkte wie das HP P4000 Kit an.

Simon Catlin
quelle