Was ist Deduplizierung?

8

Ich meine, ich kann die Wörterbuchdefinition nachschlagen, aber warum reden plötzlich alle darüber in Bezug auf virtuelle Bandbibliotheken? Was ist hier "neu", so dass es in letzter Zeit so viel in den Nachrichten gibt?

Lavinio
quelle

Antworten:

14

Bei der Deduplizierung sehen Sie sich den Inhalt eines Datensatzes an, notieren sich alle vorhandenen doppelten Bits und speichern die Daten nur einmal, wobei Sie alle ansonsten Kopien der Daten durch einen Zeiger zurück auf die eine Kopie ersetzen. Dies ist besonders bei Sicherungen hilfreich, da beim Sichern von Servern so viele Daten gleich sind. Stellen Sie sich zum Beispiel vor, Sie sichern 1.000 Windows-Server - ein Großteil des Inhalts dieser Boxen ist identisch.

Die Deduplizierung ist heute aus drei Gründen so beliebt:

  1. In letzter Zeit ist jeder davon besessen, Disaster Recovery-Lösungen zu entwickeln, die externe Server verwenden. Dazu müssen Sie viele Produktionsdaten auf den Remote-Standort replizieren, und die Bandbreite ist ein großes Problem. Jede Reduzierung der Datenmenge, die Sie replizieren müssen, hilft sehr.

  2. Die Menge an Daten, die Unternehmen aufbewahren, explodiert - dank billigerer Speicherung und branchenübergreifender Anforderungen für die Aufbewahrung von Aufzeichnungen.

  3. Die Technologie hat vor relativ kurzer Zeit den Sweet Spot erreicht. Wir hatten lange Zeit Dinge wie Deduplizierung (Einzelinstanzspeicher usw.), die geholfen haben, aber erst im letzten Jahr oder so haben wir eine echte Deduplizierung gesehen, die die Menge an Speicher, die den Mainstream erreicht, erheblich reduzieren kann.

icky3000
quelle
2
Ich möchte auch hinzufügen, dass die Kosten für De-Dup-Lösungen sinken, damit Anbieter ihre Vorteile leichter verkaufen können - und wenn es einfacher zu verkaufen ist, werden Anbieter mehr darüber sprechen ... Ich habe keine Diskussion bemerkt, die sich speziell mit virtuellem Band befasst Bibliotheken gegenüber anderen Sicherungsmethoden, aber ich denke, es ist eine Gelegenheit, die Vorteile beider gemeinsam zu vermarkten.
William
1
@William: Ja, genau, ich wollte mich irgendwie auf den Kostenteil beziehen, als ich "Sweet Spot" sagte, aber das nicht klar gemacht habe, also danke, dass du darauf hingewiesen hast. Sicherlich sind die Kosten so niedrig geworden, dass viele von uns eine Deduplizierungslösung finden können, die wir uns tatsächlich leisten können.
icky3000
0

In meinem Unternehmen haben wir bei der Arbeit mit Netapp festgestellt, dass die Deduplizierung in einer VM-Umgebung nur dann wirklich gut funktioniert, wenn Ihre Laufwerke ausgerichtet sind. Dies ist ein Problem für uns, da wir viele Windows Server 2003-Computer haben und keines der Laufwerke ausgerichtet ist. Dies bedeutet, dass Sie bei korrekter Ausrichtung der Laufwerke kaum ein Viertel des möglichen Speicherplatzes wiederherstellen können.

Es wird uns jedoch mitgeteilt, dass wir, sobald die Laufwerke richtig ausgerichtet sind, 40-60% unseres Speicherplatzes mit Dedup wiederherstellen können sollten.

Webs
quelle
Dies ist ein Problem der konkreten NetApp-Implementierung, die (aus anderen völlig verständlichen Gründen) statische Blockgrößen von 4 KB verwendet. Die Alternative wären inhaltsdefinierte Blöcke mit variabler Größe, die keine gute Ausrichtung erfordern.
Meister