Das Unternehmen, für das ich arbeite, implementiert derzeit die Erfassung von Änderungsdaten auf einem Microsoft BI-Stack, um inkrementelle Änderungen zu erfassen, die in das Data Warehouse geladen werden müssen. Bisher hat dies für uns hervorragend funktioniert. Wir haben das Datenbankreplikations-Setup und das CDC-Setup auf Tabellenebene in der replizierten Datenbank für die spezifischen Tabellen und Spalten, die wir verfolgen müssen. Das Problem, auf das wir stoßen, ist, dass sowohl die Replikation als auch CDC das Potenzial haben, zu brechen. In diesem Fall werden Änderungen, die von der Unterbrechung bis zur Auflösung auftreten, nicht erfasst und können daher nicht an das Data Warehouse übergeben werden.
Ich frage mich, wie Sie am besten alle Deltas identifizieren und in das Data Warehouse laden können. Theoretisch können Sie Ihr gesamtes Data Warehouse neu erstellen. Was ist dann der beste Weg, um historische Typ-2-Daten zu speichern?
Antworten:
Unter der Annahme, dass ein schwerwiegender Fehler aufgetreten ist, der dazu führt, dass Sie die fehlenden Änderungen vom Typ 2 "wiederherstellen" müssen, können Sie möglicherweise Ihre Quellendatenbankdaten und Protokollsicherungen verwenden. Wenn Sie diese Sicherungen beibehalten haben, können Sie Folgendes tun:
Hinweis: Wenn Ihre Datenbank eine Spaltenversion (oder einen Zeitstempel) verwendet, ist das Auffinden der geänderten Zeilen einfacher.
Dies ist kein perfekter Prozess und wird zweifellos einige Details übersehen. Aber es würde Ihnen einen Ansatz geben, der Ihnen hilft, den Schaden zu beheben.
Trotzdem: Es liegt an Ihnen, zu entscheiden, ob sich dieser Prozess lohnt.
quelle