Ich habe folgende SQL-Abfrage:
SELECT
Event.ID,
Event.IATA,
Device.Name,
EventType.Description,
Event.Data1,
Event.Data2
Event.PLCTimeStamp,
Event.EventTypeID
FROM
Event
INNER JOIN EventType ON EventType.ID = Event.EventTypeID
INNER JOIN Device ON Device.ID = Event.DeviceID
WHERE
Event.EventTypeID IN (3, 30, 40, 41, 42, 46, 49, 50)
AND Event.PLCTimeStamp BETWEEN '2011-01-28' AND '2011-01-29'
AND Event.IATA LIKE '%0005836217%'
ORDER BY Event.ID;
Ich habe auch einen Index auf der Event
Tabelle für die Spalte TimeStamp
. Nach meinem Verständnis wird dieser Index aufgrund der IN()
Anweisung nicht verwendet . Meine Frage ist also, ob es eine Möglichkeit gibt, einen Index für diese bestimmte IN()
Anweisung zu erstellen, um diese Abfrage zu beschleunigen.
Ich habe auch versucht, Event.EventTypeID IN (2, 5, 7, 8, 9, 14)
den Index als Filter hinzuzufügen TimeStamp
, aber wenn ich mir den Ausführungsplan ansehe, scheint er diesen Index nicht zu verwenden. Anregungen oder Einblicke in diese würden sehr geschätzt.
Unten ist der grafische Plan:
Und hier ist ein Link zur .sqlplan-Datei .
Antworten:
Gegebene Tabellen der folgenden allgemeinen Form:
Der folgende Index ist nützlich:
Für die Abfrage:
Der Filter erfüllt die
AND
Klauselanforderung, der erste Schlüssel des Index ermöglicht eine Suche[TimeStamp]
nach dem gefiltertenEventTypeIDs
und einschließlich derDeviceID
Spalte das Index-Covering (daDeviceID
dies für den Join zurDevice
Tabelle erforderlich ist ).Der zweite Schlüssel des Index
EventTypeID
ist nicht unbedingt erforderlich (es kann sich auch um eineINCLUDEd
Spalte handeln). Ich habe es enthalten im Schlüssel für die hier genannten Gründe . Im Allgemeinen rate ich Leuten, zumindestINCLUDE
Spalten aus einer gefiltertenWHERE
Indexklausel zu verwenden.Aufgrund des aktualisierten Abfrage- und Ausführungsplans in der Frage stimme ich zu, dass der von SSMS vorgeschlagene allgemeinere Index wahrscheinlich die bessere Wahl ist, es sei denn, die gefilterte Liste
EventTypeIDs
ist statisch, wie Aaron auch in seiner Antwort erwähnt:Vorgeschlagener Index (deklarieren Sie ihn als eindeutig, falls dies angemessen ist):
Kardinalitätsinformationen aus dem Ausführungsplan (undokumentierte Syntax, nicht in Produktionssystemen verwenden):
Aktualisierte Abfrage (Wiederholung der
IN
Liste für dieEventType
Tabelle hilft dem Optimierer in diesem speziellen Fall):Geschätzter Ausführungsplan:
Der Plan, den Sie erhalten, wird wahrscheinlich anders sein, weil ich erratene Statistiken verwende. Der allgemeine Punkt ist, dem Optimierer so viele Informationen wie möglich zu geben und eine effiziente Zugriffsmethode (Index) für die 4-Millionen-Zeilentabelle bereitzustellen
[Event]
.quelle
Der Großteil der Kosten entfällt auf den Clustered-Index-Scan. Sofern diese Tabelle nicht sehr umfangreich ist oder Sie nicht wirklich alle diese Spalten in der Ausgabe benötigen, ist SQL Server meiner Meinung nach der optimale Pfad im aktuellen Szenario, an dem sich nichts anderes geändert hat . Es wird eine Bereichsüberprüfung (als CI-Suche bezeichnet) verwendet, um den Bereich der Zeilen einzugrenzen, an denen es interessiert ist. Aufgrund der Ausgabe ist jedoch auch bei dem von Ihnen erstellten gefilterten Index eine Suche oder eine CI-Überprüfung erforderlich ist auf diesen Bereich ausgerichtet, und selbst in diesem Fall ist der CI-Scan wahrscheinlich immer noch am günstigsten (oder zumindest wird er von SQL Server als solcher eingeschätzt).
Der Ausführungsplan sagt Ihnen, dass dieser Index nützlich wäre:
Abhängig von Ihrer Datenverschiebung ist es möglicherweise umgekehrt besser, z. B .:
Aber ich würde beides testen, um sicherzugehen, welches besser ist, wenn entweder - der Unterschied zwischen einem dieser Indizes und dem, was Sie jetzt haben, ist möglicherweise nur marginal (zu viele Variablen, als dass wir sie kennen), und Sie müssen dies zusätzlich berücksichtigen Index erfordert zusätzliche Wartung, und dies kann Ihre DML-Vorgänge (Einfügen / Aktualisieren / Löschen) spürbar beeinträchtigen. Sie können auch in Betracht ziehen, die Filterkriterien in diesen Index aufzunehmen, wie von @SQLKiwi vorgeschlagen , jedoch nur dann, wenn dies der Satz von EventTypeID-Werten ist, nach denen Sie häufig suchen. Wenn sich dieser Satz im Laufe der Zeit ändert, ist der gefilterte Index nur für diese bestimmte Abfrage nützlich.
Bei so einer geringen Zeilenanzahl muss ich mich fragen, wie schlecht die Leistung derzeit sein könnte? Diese Abfrage gibt 3 Zeilen zurück (es gibt jedoch keinen Hinweis darauf, wie viele Zeilen sie zurückgewiesen hat). Wie viele Zeilen in der Tabelle?
quelle
Ich habe gerade festgestellt, dass SQL Server 2008 R2 tatsächlich einen Indexvorschlag gemacht hat, als ich den Ausführungsplan ausgeführt habe. Durch diesen vorgeschlagenen Index wird die Abfrage etwa 90% schneller ausgeführt.
Der Index, den es vorschlug, war der folgende:
quelle