Muss ich eine Überprüfung für LTO-Bandsicherungen durchführen, obwohl die Laufwerke selbst beim Schreiben eine Überprüfung durchführen?

8

Wir haben ein LTO-3-Bandlaufwerk in einer Dell-Medienbibliothek, das wir für unsere Bandsicherungen verwenden. Der Artikel über LTO auf Wikipedia besagt:

LTO verwendet eine automatische Verify-After-Write-Technologie, um die Daten beim Schreiben sofort zu überprüfen. Einige Sicherungssysteme führen jedoch explizit einen vollständig separaten Bandlesevorgang durch, um zu überprüfen, ob das Band korrekt geschrieben wurde. Diese separate Überprüfungsoperation verdoppelt die Anzahl der End-to-End-Durchgänge für jede geplante Sicherung und reduziert die Bandlebensdauer um die Hälfte.

Ich möchte wissen, ob ich meine Sicherungssoftware (in diesem Fall Backup Exec) benötige, um eine Überprüfung dieser Bänder durchzuführen, oder ob die in LTO-Laufwerken enthaltene Überprüfung nach dem Schreiben ausreichend ist.

Ich wäre auch neugierig, wenn Backup Exec die Verify-After-Write-Technologie so gut versteht, dass ich benachrichtigt werde, wenn diese Technologie die Daten nicht sehr verbessern kann, oder wenn sie einfach ignoriert wird, sodass sie ohnehin unbrauchbar werden, selbst wenn das Laufwerk ein Problem erkennt, das ich niemals erkennen würde davon wissen.

Chris Magnuson
quelle

Antworten:

10

Gute Frage!

Während ich das ja sagen würden Sie sie testen sollte, würde ich sagen , dass die Bänder / Laufwerke in sich selbst zu testen wichtig ist , was viel mehr von entscheidender Bedeutung ist testet das Ende zu Ende Restaurationsprozess .

Ich kann nicht genug regelmäßige vollständige Systemwiederherstellungen und Servicetests empfehlen. Nur so können Sie sicher sein, dass das gesamte System das tut, wofür Sie es gekauft haben. Sie müssen auf dieser Website nicht weit suchen, um Leute zu sehen, die Schwierigkeiten haben, ihren Service wiederherzustellen, obwohl sie dachten, sie hätten alle Schritte einzeln behandelt.

Hoffe das hilft.

Chopper3
quelle
1
+1 für die Wiederherstellung. An diesem Punkt stimme ich mit "virtuellen Maschinen!" - Das Wiederherstellen auf einer virtuellen Maschine kann ein guter unterbrechungsfreier Indikator dafür sein, dass Ihr Backup nützlich ist
Sirex
1
Was Sie sagen, ist definitiv eine gute Idee, und wir sollten damit beginnen, aber ich bin mir immer noch nicht sicher, ob die Verify-on-Write-Technologie in LTO 3-Laufwerken dazu führt, dass meine Sicherung fehlschlägt, wenn die Daten aus irgendeinem Grund nicht wie gewünscht überprüft werden können tritt auf, wenn meine Sicherungssoftware eine Überprüfung der Daten ausgeführt hat. Ich mag die Idee, etwas mehr zu tun, aber ich muss noch wissen, ob ich gerade etwas Redundantes mache, das nicht notwendig ist. Vielen Dank
Chris Magnuson
1
Stellen Sie außerdem sicher, dass Sie eine Wiederherstellung mit einem anderen Bandlaufwerk durchführen als mit dem Backup, da einige Bänder nur auf dem Laufwerk gelesen werden können, auf dem sie erstellt wurden (oder zumindest in der Vergangenheit möglich war).
James
@ChrisMagnuson Haben Sie jemals herausgefunden, was passiert, wenn das Laufwerk einen Fehler mithilfe seines eigenen Überprüfungsschemas nach dem Schreiben erkennt?
Alx9r
1
@ alx9r Ich fürchte nicht. Es sieht so aus, als ob niemand genau weiß, und ich bin mir nicht sicher, wie Sie die Daten absichtlich durcheinander bringen können, unmittelbar nachdem sie vom Bandkopf geschrieben wurden, aber bevor sie von einem beliebigen Mechanismus gelesen werden, der das Überprüfen nach dem Schreiben durchführt, damit Sie sehen können Wie Ihre Sicherungssoftware auf einen erkannten Fehler reagiert.
Chris Magnuson
1

Erstens ist diese automatische Überprüfung kein Ersatz für eine End-to-End-Überprüfung. Ich habe Laufwerke gesehen, die mit einem Firmware-Fehler ausgeliefert wurden, der dazu führte, dass das Lesen von Wiederherstellungen weniger zuverlässig war als das Lesen von Überprüfungen.

Das Ergebnis war, dass Sie die Bänder schreiben konnten, ohne dass Fehler gemeldet wurden. Beim Versuch, sie wiederherzustellen, wurden jedoch Lesevorgänge angezeigt, bei denen Fehler auftraten oder die Geschwindigkeit um mehrere Größenordnungen abnahm.

Die meisten Kunden haben diesen Firmware-Fehler nie bemerkt. Laut Hersteller, weil die Kunden keine Testwiederherstellungen durchgeführt haben. Dieser spezielle Fehler wurde behoben. Aber ich bin sicher, wir haben den letzten Firmware-Fehler nicht gesehen, und einige Firmware-Fehler werden nur entdeckt, wenn Sie tatsächlich echte Lesevorgänge testen.

Wenn die Überprüfung fehlschlägt, schreibt die Firmware automatisch eine zweite Kopie (und während der Wiederherstellung der Firmware auf dem Host wird nur eine der beiden Kopien zurückgegeben). Dies bedeutet, dass die verfügbare Kapazität je nach Laufwerkszustand und Medienqualität variiert.

Wenn beim Lesen der Überprüfung zu viele Schreibversuche fehlschlagen, wird ein Fehler auf SCSI-Ebene zurückgemeldet. Man würde denken, dass ein auf diese Weise gemeldeter Fehler auf der Softwareebene schwer zu übersehen ist, aber Fehler in Codepfaden, die nur durch schuppige Hardware ausgelöst werden, sind bekanntermaßen schwer zu testen.

Kasperd
quelle