Was unterscheidet Cloud Storage (Amazon AWS, Microsoft Azure, Google Apps) von herkömmlichen Speichernetzwerken für Rechenzentren (SAN und NAS)?

8

Einige Verwirrung wegen meiner Frage, um es einfach zu machen:

"Welche Art von Speicher verwenden große Cloud-Anbieter und warum?"

Soweit ich weiß, kann ich jedoch keine offiziellen Unterschiede im Speichernetzwerk zwischen typischen Rechenzentren und Clouds feststellen. Alle Cloud-Anbieter verwenden DAS, das sich von den typischen Rechenzentren unterscheidet.

Selbst DAS hat viele Nachteile als SAN oder NAS. Ich möchte die Details erfahren, warum Clouds DAS entweder für Speicher- oder Anwendungszwecke verwenden.

Jede Ressource oder Beschreibung wird geschätzt, um mich klar zu machen.

EDIT: Während sie den Artikel "Netzwerkherausforderungen und resultierende Ansätze für die Cloud-Konstruktion in großem Maßstab, David Bernstein und Erik Ludvigson (Cisco)" lesen, erwähnen sie Folgendes:

Seltsamerweise sehen wir keine Clouds von den großen Anbietern, die NAS oder SAN verwenden. Die typische Cloud-Architektur verwendet DAS, was für Datacenter-Speicheransätze nicht typisch ist.

Aber hier gibt es einen Konflikt: Meiner Meinung nach und auch später in diesem Artikel angegeben, sollten Clouds SAN oder NAS verwenden, da DAS nicht geeignet ist, wenn eine VM auf einen anderen Server verschoben wird und dennoch vom ursprünglichen Server auf Speicher zugreifen muss.

Was sind andere Gründe, warum Clouds DAS, NAS oder SAN bevorzugen? Welche Art von Speicher verwenden große Cloud-Anbieter und warum?

Berkay
quelle
2
Fragen Sie sich "Was ist für mich der Unterschied zwischen dem Speichern meiner Daten in der Cloud und dem Speichern mit meinem eigenen SAN oder NAS" oder "Welche Art von Speicher verwenden große Cloud-Anbieter und warum"?
Randy Orrison

Antworten:

4

Diese Antwort wurde bearbeitet, nachdem die Frage geklärt wurde.

Was sind andere Gründe, warum Wolken DAS bevorzugen?

Wobei "DAS" Direct Attached Storage bedeutet, dh SATA- oder SAS-Festplattenlaufwerke.

Alle Cloud-Anbieter verwenden DAS, da es Preis- / Leistungsverbesserungen um Größenordnungen bietet. Es handelt sich um eine horizontale Skalierung .

Kurz gesagt, SATA-Festplatten und SATA-Controller sind billige Waren. Sie sind Massenprodukte und sehr preisgünstig. Durch den Aufbau eines großen Clusters billiger PCs mit billigen SATA-Laufwerken erhalten Google, Amazon und andere eine enorme Kapazität zu einem sehr niedrigen Preis. Anschließend fügen sie ihre eigene Softwareschicht hinzu. Ihre Software führt eine Multi-Server-Replikation aus, um Leistung und Zuverlässigkeit zu gewährleisten, die Replikation nach einem Hardwarefehler zu überwachen, auszugleichen und andere Dinge.

Sie können sich MogileFS als einfacheren Vertreter der Art von Software ansehen , die Google, Amazon und andere für die Speicherung verwenden. Es ist natürlich eine andere Implementierung, aber es teilt viele der gleichen Entwurfsziele und -lösungen wie die großen Systeme. Wenn Sie möchten, finden Sie hier einen Ausgangspunkt, um mehr über GoogleFS zu erfahren .

Wie weiter unten in diesem Dokument erwähnt, sollten Clouds SAN oder NAS verwenden, da DAS nicht geeignet ist, wenn eine VM auf einen anderen Server verschoben wird

Es gibt zwei Gründe, warum SANs nicht verwendet werden.

1) Preis. SANs sind im großen Maßstab enorm teuer. Obwohl sie die technisch "beste" Lösung sein mögen, werden sie aufgrund der Kosten normalerweise nicht in sehr großen Installationen verwendet.

2) Das CAP-Theorem Das CAP-Theorem von Eric Brewer zeigt, dass Sie in sehr großem Maßstab keine starke Konsistenz aufrechterhalten können, während akzeptable Zuverlässigkeit, Fehlertoleranz und Leistung erhalten bleiben. SANs sind ein Versuch, eine starke Konsistenz der Hardware zu erreichen. Das mag für eine Installation mit 5.000 Servern gut funktionieren, aber es wurde nie nachgewiesen, dass es für die über 250.000 Server von Google funktioniert.

Ergebnis: Bisher haben die Cloud-Computing-Anbieter beschlossen, die Komplexität der Aufrechterhaltung des Serverstatus auf den Anwendungsentwickler zu übertragen. Aktuelle Cloud-Angebote bieten nicht für jede virtuelle Maschine einen konsistenten Status. Anwendungsserver (virtuelle Maschinen) können abstürzen und ihre lokalen Daten können jederzeit verloren gehen.

Jeder Anbieter verfügt dann über eine eigene Implementierung von persistentem Speicher, den Sie für wichtige Daten verwenden sollen. Die Angebote von Amazon sind schöne Beispiele. MySQL , SimpleDB und Simple Storage Service . Diese Angebote selbst spiegeln den CAP-Satz wider - die MySQL-Instanz weist eine starke Konsistenz, aber eine begrenzte Skalierbarkeit auf. SimpleDB und S3 skalieren fantastisch, sind aber erst irgendwann konsistent.

Jesper M.
quelle
Jetzt ist die Frage klar. Danke für die Links, ich werde sie überprüfen.
Berkay
Ich habe alle Links überprüft, danke für die Antworten. Im Allgemeinen können wir sagen, dass DAS für die Cloud-Anbieter bevorzugt wird. Für einige Anwendungen kann jedoch auch SAN oder NAS verwendet werden.
Berkay
1

Wenn Sie DAS verwenden, ist die Verfügbarkeit Ihr Problem

Wenn sie DAS verwenden, ist die Verfügbarkeit ihr Problem. Und wenn sie gut sind, verwenden sie mehrere Abstraktionsebenen, um sicherzustellen, dass ihr Problem nicht zu Ihrem Problem wird. Anstatt sich zu entscheiden, wie sie ihre Festplatten in ihrem Rechenzentrum einbinden möchten, ist die Frage, ob die Verfügbarkeit, die sie in ihrem SLA garantieren, für Ihre Anforderungen angemessen ist oder nicht. Oh, und der echte Elefant im Raum, was machen Sie, wenn sie nicht mehr im Geschäft sind (wahrscheinlich nicht für einige Anbieter, aber Sie sollten es trotzdem in Betracht ziehen) und was tun Sie, wenn Sie diese Daten lokal verwenden und Ihre Internetverbindung besteht nicht verfügbar - Letzteres ist wesentlich wahrscheinlicher als die Wahl des DAS, die direkt zu einem Ausfall führt.

Rob Moir
quelle
0

Obwohl ich die Antwort auf DAS vs SAN / NAS nicht habe ... Bei der Suche nach Speicherlösungen sind viele Dinge zu beachten.

Die Datenmenge? Wenn wir uns mit GB beschäftigen, könnte ein NAS mit einem Backup die Aufgabe übernehmen. Wenn es Terrabyte an Daten gibt, steigt der Preis sehr schnell.

Ich denke, der Preis ist der Hauptfaktor ... Wenn Sie ein SAN haben, brauchen Sie:

  • Administratoren zum Konfigurieren / Verwalten.
  • Serverraum (Strom, Bandbreite, Sicherheitsmaßnahmen in diesem Raum, ...)

Und trotzdem haben Sie überhaupt keine Redundanz. Wenn Sie Zugriff auf ein Rechenzentrum haben, können die Dinge anders sein.

Eine andere zu berücksichtigende Sache ist die Zugänglichkeit. Archivieren Sie? Wenn dies nicht der Fall ist, archivieren Sie einige Male pro Tag / Woche / Monat Ihre Speicherlösung.

Wenn Sie andererseits über Daten verfügen, auf die ständig zugegriffen werden muss, stellen Sie schnell einen Engpass in Bezug auf Bandbreite und Hardwarebeschränkung (z. B. E / A) fest. Wenn Sie jedoch viel Daten übertragen, besteht eine gute Chance, dass eine Online-Speicherlösung Sie viel kostet.

Der ROI (Return on Investment) ist das, wofür alle Anbieter von Online-Speicherlösungen werben, und sie sind natürlich oft richtig, abhängig von der Nutzung.

Viel Glück.

Embreau
quelle
0

(Nur Meinung und stark verallgemeinernd.)

Der Unterschied ist die Abstraktionsebene, die Sie (allgemein) betrachten.

SAN / NAS stellt Ihnen normalerweise ein Volume zur Verfügung, auf dem Sie ein Dateisystem installieren können. Der Wert dieses Ansatzes für das Endsystem besteht darin, dass Sie die Details der physischen Hardware ausgelagert haben (z. B. RAID-Level, physischer Standort usw.).

Im Gegensatz dazu bietet Ihnen der Cloud-Speicher normalerweise eine Schnittstelle zu einem Dateisystem. Der Vorteil hierbei ist, dass Sie häufig kostenlos Funktionen höherer Ordnung kostenlos erhalten können (z. B. führt Dropbox die automatische Versionierung jeder Datei transparent durch).

Caelyx
quelle