Wir versuchen, eine große Anzahl von Datensätzen in einer Multi-Milliarden-Zeilentabelle zu aktualisieren / löschen. Da dies ein beliebter Tisch ist, gibt es in verschiedenen Abschnitten dieses Tisches eine Menge Aktivität. Jede große Aktualisierungs- / Löschaktivität wird für längere Zeit blockiert (da darauf gewartet wird, dass alle Zeilen, Seitensperren oder Tabellensperren gesperrt werden), was zu Zeitüberschreitungen führt oder die Ausführung der Aufgabe mehrere Tage in Anspruch nimmt.
Daher ändern wir den Ansatz, um einen kleinen Stapel von Zeilen gleichzeitig zu löschen. Wir möchten jedoch prüfen, ob die ausgewählten (beispielsweise 100 oder 1000 oder 2000 Zeilen) derzeit durch einen anderen Prozess gesperrt sind oder nicht.
- Wenn nicht, fahren Sie mit Löschen / Aktualisieren fort.
- Wenn sie gesperrt sind, fahren Sie mit der nächsten Gruppe von Datensätzen fort.
- Kehren Sie am Ende zum Anfang zurück und versuchen Sie, die ausgelassenen zu aktualisieren / löschen.
Ist das machbar?
Vielen Dank, ToC
Antworten:
Wenn ich die Anforderung richtig verstehe, besteht das Ziel darin, Stapel von Zeilen zu löschen, während gleichzeitig DML-Vorgänge für Zeilen in der gesamten Tabelle ausgeführt werden. Das Ziel ist das Löschen eines Stapels. Wenn jedoch zugrunde liegende Zeilen in dem von diesem Stapel definierten Bereich gesperrt sind, müssen wir diesen Stapel überspringen und zum nächsten Stapel übergehen. Wir müssen dann zu allen Stapeln zurückkehren, die zuvor nicht gelöscht wurden, und unsere ursprüngliche Löschlogik wiederholen. Wir müssen diesen Zyklus wiederholen, bis alle erforderlichen Zeilenstapel gelöscht sind.
Wie bereits erwähnt, ist es sinnvoll, einen READPAST-Hinweis und die Isolationsstufe READ COMMITTED (Standard) zu verwenden, um vergangene Bereiche zu überspringen, die möglicherweise blockierte Zeilen enthalten. Ich werde noch einen Schritt weiter gehen und empfehlen, die Isolationsstufe SERIALISIERBAR zu verwenden und Löschvorgänge zu knabbern.
SQL Server verwendet Schlüsselbereichssperren, um einen Bereich von Zeilen zu schützen, die implizit in einem Datensatz enthalten sind, der von einer Transact-SQL-Anweisung gelesen wird, während die serialisierbare Transaktionsisolationsstufe verwendet wird. Weitere Informationen finden Sie hier: https://technet.microsoft.com /en-US/library/ms191272(v=SQL.105).aspx
Beim Löschen von Nibbeln ist es unser Ziel, einen Bereich von Zeilen zu isolieren und sicherzustellen, dass keine Änderungen an diesen Zeilen vorgenommen werden, während sie gelöscht werden. Das heißt, wir möchten keine Phantom-Lesevorgänge oder Einfügungen. Die serialisierbare Isolationsstufe soll dieses Problem lösen.
Bevor ich meine Lösung demonstriere, möchte ich hinzufügen, dass ich weder empfehle, die Standardisolationsstufe Ihrer Datenbank auf SERIALIZABLE zu ändern, noch empfehle ich, dass meine Lösung die beste ist. Ich möchte es nur vorstellen und sehen, wo wir von hier aus hingehen können.
Ein paar haushaltsnotizen:
Zu Beginn meines Experiments werde ich eine Testdatenbank und eine Beispieltabelle einrichten und die Tabelle mit 2.000.000 Zeilen füllen.
Zu diesem Zeitpunkt benötigen wir einen oder mehrere Indizes, auf die die Sperrmechanismen der Isolationsstufe SERIALIZABLE einwirken können.
Überprüfen wir nun, ob unsere 2.000.000 Zeilen erstellt wurden
Wir haben also unsere Datenbank, Tabelle, Indizes und Zeilen. Lassen Sie uns also das Experiment zum Knabbern von Löschvorgängen einrichten. Zunächst müssen wir entscheiden, wie ein typischer Knabber-Löschmechanismus am besten erstellt werden soll.
Wie Sie sehen, habe ich die explizite Transaktion in die while-Schleife eingefügt. Wenn Sie das Löschen von Protokollen begrenzen möchten, können Sie es auch außerhalb der Schleife platzieren. Da wir uns im vollständigen Wiederherstellungsmodell befinden, möchten Sie möglicherweise häufiger Transaktionsprotokollsicherungen erstellen, während Sie die Löschvorgänge für das Nibbeln ausführen, um sicherzustellen, dass Ihr Transaktionsprotokoll nicht übermäßig anwächst.
Also, ich habe ein paar Ziele mit diesem Setup. Erstens möchte ich meine Tastensperren; Deshalb versuche ich, die Chargen so klein wie möglich zu halten. Ich möchte auch die Nebenläufigkeit auf meinem "gigantischen" Tisch nicht negativ beeinflussen. Also möchte ich meine Schlösser nehmen und sie so schnell wie möglich verlassen. Daher empfehle ich, dass Sie die Losgrößen klein halten.
Nun möchte ich ein sehr kurzes Beispiel für diese Löschroutine in Aktion geben. Wir müssen ein neues Fenster in SSMS öffnen und eine Zeile aus unserer Tabelle löschen. Ich werde dies innerhalb einer impliziten Transaktion mit der Standardisolationsstufe READ COMMITTED tun.
Wurde diese Zeile tatsächlich gelöscht?
Ja, es wurde gelöscht.
Um unsere Sperren anzuzeigen, öffnen wir jetzt ein neues Fenster in SSMS und fügen ein oder zwei Codefragmente hinzu. Ich verwende Adam Mechanics sp_whoisactive, das hier zu finden ist: sp_whoisactive
Nun sind wir bereit zu beginnen. Beginnen wir in einem neuen SSMS-Fenster eine explizite Transaktion, die versucht, die eine gelöschte Zeile erneut einzufügen. Zur gleichen Zeit werden wir unsere Knabber-Löschoperation auslösen.
Der Einfügungscode:
Beginnen wir beide Operationen mit der Einfügung und führen dann die Löschvorgänge aus. Wir können die Schlüsselbereichsschlösser und exklusiven Schlösser sehen.
Die Einfügung erzeugte diese Sperren:
Das knabbernde Löschen / Auswählen hält diese Sperren:
Unser Insert blockiert das Löschen wie erwartet:
Lassen Sie uns nun die Insert-Transaktion festschreiben und sehen, was los ist.
Und wie erwartet sind alle Transaktionen abgeschlossen. Nun müssen wir prüfen, ob es sich bei der Einfügung um ein Phantom handelte oder ob die Löschoperation es ebenfalls entfernt hat.
Tatsächlich wurde die Einfügung gelöscht. Daher war keine Phantomeinfügung zulässig.
Abschließend möchte ich sagen, dass die wahre Absicht dieser Übung nicht darin besteht, jede einzelne Sperre auf Zeilen-, Seiten- oder Tabellenebene nachzuverfolgen und zu ermitteln, ob ein Element eines Stapels gesperrt ist und daher unsere Löschoperation erforderlich machen würde warten. Das mag die Absicht der Fragesteller gewesen sein; Diese Aufgabe ist jedoch herkulisch und im Grunde unpraktisch, wenn nicht unmöglich. Das eigentliche Ziel ist es, sicherzustellen, dass keine unerwünschten Phänomene auftreten, sobald wir den Bereich unserer Charge mit eigenen Sperren isoliert und die Charge anschließend gelöscht haben. Die Isolationsstufe SERIALIZABLE erreicht dieses Ziel. Der Schlüssel ist, Ihre Knabbereien klein zu halten, Ihr Transaktionsprotokoll unter Kontrolle zu halten und unerwünschte Phänomene zu beseitigen.
Wenn Sie Geschwindigkeit wünschen, sollten Sie keine riesigen Tabellen erstellen, die nicht partitioniert werden können, und daher Partitionswechsel nicht verwenden, um die schnellsten Ergebnisse zu erzielen. Der Schlüssel zur Geschwindigkeit liegt in Partitionierung und Parallelität. Der Schlüssel zum Leiden sind Knabbereien und Live-Locking.
Bitte sag mir was du denkst.
Ich habe einige weitere Beispiele für die Isolationsstufe SERIALIZABLE in Aktion erstellt. Sie sollten unter den folgenden Links verfügbar sein.
Vorgang löschen
Operation einfügen
Gleichstellungsoperationen - Tastensperre für die nächsten Schlüsselwerte
Gleichstellungsoperationen - Singleton-Abruf vorhandener Daten
Gleichstellungsoperationen - Singleton-Abruf nicht vorhandener Daten
Ungleichungsoperationen - Schlüsselbereich sperrt den Bereich und die nächsten Schlüsselwerte
quelle
Dies ist eine wirklich gute Idee, um in kleinen, sorgfältigen Mengen oder Stücken zu löschen . Ich würde ein kleines und je nach Wiederherstellungsmodell der Datenbank - wenn , dann ein und wenn, dann ein , um ein Aufblähen des Transaktionsprotokolls zu vermeiden - zwischen den Stapeln hinzufügen .
waitfor delay '00:00:05'
FULL
log backup
SIMPLE
manual CHECKPOINT
Was Sie sagen, ist nicht ohne weiteres möglich (beachten Sie Ihre 3 Aufzählungszeichen). Wenn der obige Vorschlag -
small batches + waitfor delay
nicht funktioniert (vorausgesetzt, Sie führen ordnungsgemäße Tests durch), können Sie den verwendenquery HINT
.Nicht verwenden
NOLOCK
- siehe kb / 308886 , SQL Server- Lesekonsistenzprobleme von Itzik Ben-Gan , NOLOCK überall einsetzen - Von Aaron Bertrand und SQL Server NOLOCK Hinweis und andere schlechte Ideen .READPAST
Hinweis wird in Ihrem Szenario helfen. Der Kern desREADPAST
Hinweises ist: Wenn es eine Sperre auf Zeilenebene gibt, wird sie von SQL Server nicht gelesen.Während meiner begrenzten Tests fand ich wirklich gut Durchsatz bei der Verwendung
DELETE from schema.tableName with (READPAST, READCOMMITTEDLOCK)
und Einstellung der Abfragesitzung IsolationsstufeREAD COMMITTED
verwenden ,SET TRANSACTION ISOLATION LEVEL READ COMMITTED
die ohnehin Standardisolationsstufe ist.quelle
Zusammenfassung anderer Ansätze, die ursprünglich in Kommentaren zur Frage angeboten wurden.
Verwenden Sie
NOWAIT
diese Option, wenn das gewünschte Verhalten darin besteht, den gesamten Block zu schließen, sobald eine inkompatible Sperre festgestellt wird.Aus der
NOWAIT
Dokumentation :Verwenden Sie
SET LOCK_TIMEOUT
diese Option , um ein ähnliches Ergebnis zu erzielen, jedoch mit einem konfigurierbaren Timeout:Aus der
SET LOCK_TIMEOUT
Dokumentationquelle
Angenommen, wir haben zwei Parallelen-Abfragen:
connect / session 1: sperrt die Zeile = 777
connect / session 2: ignoriert die gesperrte Zeile = 777
ODER connect / session 2: Löst eine Ausnahme aus
quelle
Versuchen Sie, nach so etwas zu filtern - es kann kompliziert werden, wenn Sie wirklich, wirklich spezifisch werden möchten. Suchen Sie in BOL nach der Beschreibung von sys.dm_tran_locks
quelle
Sie können NoLOCK verwenden, während Sie löschen. Wenn die Zeilen gesperrt sind, werden sie nicht gelöscht. Es ist nicht ideal, kann aber den Trick für Sie tun.
quelle
Msg 1065, Level 15, State 1, Line 15 The NOLOCK and READUNCOMMITTED lock hints are not allowed for target tables of INSERT, UPDATE, DELETE or MERGE statements.
, seit 2005 als veraltet