Index Suchbetreiberkosten

9

Für die folgende AdventureWorks- Beispieldatenbankabfrage:

SELECT 
    P.ProductID, 
    CA.TransactionID
FROM Production.Product AS P
CROSS APPLY
(
    SELECT TOP (1)
        TH.TransactionID
    FROM Production.TransactionHistory AS TH
    WHERE
        TH.ProductID = P.ProductID
    ORDER BY 
        TH.TransactionID DESC
) AS CA;

Die Ausführungsplan zeigt eine geschätzte Betriebskosten von 0.0850383 (93%) für den Index Seek :

planen

Die Kosten sind unabhängig vom verwendeten Kardinalitätsschätzungsmodell.

Es ist keine einfache Addition der geschätzten CPU-Kosten und der geschätzten E / A-Kosten . Es sind auch nicht die Kosten für eine Ausführung der Indexsuche multipliziert mit der geschätzten Anzahl von Ausführungen .

Wie kommt diese Kostennummer zustande?

Paul White 9
quelle

Antworten:

10

Die vollständige Kostenableitungslogik ist komplex, aber für den relativ einfachen Fall in der Frage:

Eingänge

  1. Die Häufigkeit, mit der der Operator ausgeführt wird
    Dies ist die geschätzte Anzahl der Ausführungen : 504

  2. Die Kardinalität (Gesamtzahl der Zeilen) im Index
    Die TableCardinality- Eigenschaft des Index Seek- Operators gibt Folgendes an : 113.443

  3. Die Anzahl der Datenseiten im Index: 201
    Diese Anzahl kann auf verschiedene Arten abgerufen werden, zum Beispiel von sys.allocation_units:

    SELECT 
        AU.data_pages
    FROM sys.allocation_units AS AU
    JOIN sys.partitions AS P
        ON P.hobt_id = AU.container_id
    WHERE
        AU.[type_desc] = N'IN_ROW_DATA'
        AND P.[object_id] = OBJECT_ID(N'Production.TransactionHistory', N'U')
        AND P.index_id = 
            INDEXPROPERTY(P.[object_id], N'IX_TransactionHistory_ProductID', 'IndexID');
  4. Die Dichte (1 / unterschiedliche Werte ) des Index: 0,002267574
    Dies ist im Dichtevektor der Indexstatistik verfügbar:

    DBCC SHOW_STATISTICS 
    (
        N'Production.TransactionHistory', 
        N'IX_TransactionHistory_ProductID'
    ) 
    WITH DENSITY_VECTOR;

    Dichte

Berechnung

-- Input numbers
DECLARE
    @Executions float = 504,
    @Density float = 0.002267574,
    @IndexDataPages float = 201,
    @Cardinality float = 113443;

-- SQL Server cost model constants
DECLARE
    @SeqIO float = 0.000740740740741,
    @RandomIO float = 0.003125,
    @CPUbase float = 0.000157,
    @CPUrow float = 0.0000011;

-- Computation
DECLARE
    @IndexPages float = CEILING(@IndexDataPages * @Density),
    @Rows float = @Cardinality * @Density,
    @Rebinds float = @Executions - 1e0;

DECLARE
    @CPU float = @CPUbase + (@Rows * @CPUrow),
    @IO float = @RandomIO + (@SeqIO * (@IndexPages - 1e0)),
    -- sample with replacement
    @PSWR float = @IndexDataPages * (1e0 - POWER(1e0 - (1e0 / @IndexDataPages), @Rebinds));

-- Cost components (no rewinds)
DECLARE
    @InitialCost float = @RandomIO + @CPUbase + @CPUrow,
    @RebindCPU float = @Rebinds * (1e0 * @CPUbase + @CPUrow),
    @RebindIO float = (1e0 / @Rows) * ((@PSWR - 1e0) * @IO);

-- Result
SELECT 
    OpCost = @InitialCost + @RebindCPU + @RebindIO;

db <> Geige

Ergebnis

Paul White 9
quelle
Tolle Arbeit, es ist schön zu wissen, woher die geschätzten Kosten stammen, welche Variablen sie beeinflussen und in welchem ​​Verhältnis. Ist dies die Mechanik für alle SQL Server-Versionen? Vielleicht ein paar Änderungen in den Konstanten?
EzLo
2
Dieser Aspekt der Kalkulation hat sich meines Wissens seit 2005 nicht geändert.
Paul White 9