Einige Verwirrung wegen meiner Frage, um es einfach zu machen:
"Welche Art von Speicher verwenden große Cloud-Anbieter und warum?"
Soweit ich weiß, kann ich jedoch keine offiziellen Unterschiede im Speichernetzwerk zwischen typischen Rechenzentren und Clouds feststellen. Alle Cloud-Anbieter verwenden DAS, das sich von den typischen Rechenzentren unterscheidet.
Selbst DAS hat viele Nachteile als SAN oder NAS. Ich möchte die Details erfahren, warum Clouds DAS entweder für Speicher- oder Anwendungszwecke verwenden.
Jede Ressource oder Beschreibung wird geschätzt, um mich klar zu machen.
EDIT: Während sie den Artikel "Netzwerkherausforderungen und resultierende Ansätze für die Cloud-Konstruktion in großem Maßstab, David Bernstein und Erik Ludvigson (Cisco)" lesen, erwähnen sie Folgendes:
Seltsamerweise sehen wir keine Clouds von den großen Anbietern, die NAS oder SAN verwenden. Die typische Cloud-Architektur verwendet DAS, was für Datacenter-Speicheransätze nicht typisch ist.
Aber hier gibt es einen Konflikt: Meiner Meinung nach und auch später in diesem Artikel angegeben, sollten Clouds SAN oder NAS verwenden, da DAS nicht geeignet ist, wenn eine VM auf einen anderen Server verschoben wird und dennoch vom ursprünglichen Server auf Speicher zugreifen muss.
Was sind andere Gründe, warum Clouds DAS, NAS oder SAN bevorzugen? Welche Art von Speicher verwenden große Cloud-Anbieter und warum?
quelle
Antworten:
Diese Antwort wurde bearbeitet, nachdem die Frage geklärt wurde.
Wobei "DAS" Direct Attached Storage bedeutet, dh SATA- oder SAS-Festplattenlaufwerke.
Alle Cloud-Anbieter verwenden DAS, da es Preis- / Leistungsverbesserungen um Größenordnungen bietet. Es handelt sich um eine horizontale Skalierung .
Kurz gesagt, SATA-Festplatten und SATA-Controller sind billige Waren. Sie sind Massenprodukte und sehr preisgünstig. Durch den Aufbau eines großen Clusters billiger PCs mit billigen SATA-Laufwerken erhalten Google, Amazon und andere eine enorme Kapazität zu einem sehr niedrigen Preis. Anschließend fügen sie ihre eigene Softwareschicht hinzu. Ihre Software führt eine Multi-Server-Replikation aus, um Leistung und Zuverlässigkeit zu gewährleisten, die Replikation nach einem Hardwarefehler zu überwachen, auszugleichen und andere Dinge.
Sie können sich MogileFS als einfacheren Vertreter der Art von Software ansehen , die Google, Amazon und andere für die Speicherung verwenden. Es ist natürlich eine andere Implementierung, aber es teilt viele der gleichen Entwurfsziele und -lösungen wie die großen Systeme. Wenn Sie möchten, finden Sie hier einen Ausgangspunkt, um mehr über GoogleFS zu erfahren .
Es gibt zwei Gründe, warum SANs nicht verwendet werden.
1) Preis. SANs sind im großen Maßstab enorm teuer. Obwohl sie die technisch "beste" Lösung sein mögen, werden sie aufgrund der Kosten normalerweise nicht in sehr großen Installationen verwendet.
2) Das CAP-Theorem Das CAP-Theorem von Eric Brewer zeigt, dass Sie in sehr großem Maßstab keine starke Konsistenz aufrechterhalten können, während akzeptable Zuverlässigkeit, Fehlertoleranz und Leistung erhalten bleiben. SANs sind ein Versuch, eine starke Konsistenz der Hardware zu erreichen. Das mag für eine Installation mit 5.000 Servern gut funktionieren, aber es wurde nie nachgewiesen, dass es für die über 250.000 Server von Google funktioniert.
Ergebnis: Bisher haben die Cloud-Computing-Anbieter beschlossen, die Komplexität der Aufrechterhaltung des Serverstatus auf den Anwendungsentwickler zu übertragen. Aktuelle Cloud-Angebote bieten nicht für jede virtuelle Maschine einen konsistenten Status. Anwendungsserver (virtuelle Maschinen) können abstürzen und ihre lokalen Daten können jederzeit verloren gehen.
Jeder Anbieter verfügt dann über eine eigene Implementierung von persistentem Speicher, den Sie für wichtige Daten verwenden sollen. Die Angebote von Amazon sind schöne Beispiele. MySQL , SimpleDB und Simple Storage Service . Diese Angebote selbst spiegeln den CAP-Satz wider - die MySQL-Instanz weist eine starke Konsistenz, aber eine begrenzte Skalierbarkeit auf. SimpleDB und S3 skalieren fantastisch, sind aber erst irgendwann konsistent.
quelle
Wenn Sie DAS verwenden, ist die Verfügbarkeit Ihr Problem
Wenn sie DAS verwenden, ist die Verfügbarkeit ihr Problem. Und wenn sie gut sind, verwenden sie mehrere Abstraktionsebenen, um sicherzustellen, dass ihr Problem nicht zu Ihrem Problem wird. Anstatt sich zu entscheiden, wie sie ihre Festplatten in ihrem Rechenzentrum einbinden möchten, ist die Frage, ob die Verfügbarkeit, die sie in ihrem SLA garantieren, für Ihre Anforderungen angemessen ist oder nicht. Oh, und der echte Elefant im Raum, was machen Sie, wenn sie nicht mehr im Geschäft sind (wahrscheinlich nicht für einige Anbieter, aber Sie sollten es trotzdem in Betracht ziehen) und was tun Sie, wenn Sie diese Daten lokal verwenden und Ihre Internetverbindung besteht nicht verfügbar - Letzteres ist wesentlich wahrscheinlicher als die Wahl des DAS, die direkt zu einem Ausfall führt.
quelle
Obwohl ich die Antwort auf DAS vs SAN / NAS nicht habe ... Bei der Suche nach Speicherlösungen sind viele Dinge zu beachten.
Die Datenmenge? Wenn wir uns mit GB beschäftigen, könnte ein NAS mit einem Backup die Aufgabe übernehmen. Wenn es Terrabyte an Daten gibt, steigt der Preis sehr schnell.
Ich denke, der Preis ist der Hauptfaktor ... Wenn Sie ein SAN haben, brauchen Sie:
Und trotzdem haben Sie überhaupt keine Redundanz. Wenn Sie Zugriff auf ein Rechenzentrum haben, können die Dinge anders sein.
Eine andere zu berücksichtigende Sache ist die Zugänglichkeit. Archivieren Sie? Wenn dies nicht der Fall ist, archivieren Sie einige Male pro Tag / Woche / Monat Ihre Speicherlösung.
Wenn Sie andererseits über Daten verfügen, auf die ständig zugegriffen werden muss, stellen Sie schnell einen Engpass in Bezug auf Bandbreite und Hardwarebeschränkung (z. B. E / A) fest. Wenn Sie jedoch viel Daten übertragen, besteht eine gute Chance, dass eine Online-Speicherlösung Sie viel kostet.
Der ROI (Return on Investment) ist das, wofür alle Anbieter von Online-Speicherlösungen werben, und sie sind natürlich oft richtig, abhängig von der Nutzung.
Viel Glück.
quelle
(Nur Meinung und stark verallgemeinernd.)
Der Unterschied ist die Abstraktionsebene, die Sie (allgemein) betrachten.
SAN / NAS stellt Ihnen normalerweise ein Volume zur Verfügung, auf dem Sie ein Dateisystem installieren können. Der Wert dieses Ansatzes für das Endsystem besteht darin, dass Sie die Details der physischen Hardware ausgelagert haben (z. B. RAID-Level, physischer Standort usw.).
Im Gegensatz dazu bietet Ihnen der Cloud-Speicher normalerweise eine Schnittstelle zu einem Dateisystem. Der Vorteil hierbei ist, dass Sie häufig kostenlos Funktionen höherer Ordnung kostenlos erhalten können (z. B. führt Dropbox die automatische Versionierung jeder Datei transparent durch).
quelle