Plötzlicher Abfall der Matrixmultiplikationsleistung

Ich habe über die Implementierung einer dichten Matrixmultiplikation gelesen, wenn die Matrix nicht in den Cache passt. Eine der Grafiken, die ich gesehen habe (Folie 9 von diesen Folien ), zeigt plötzliche Leistungseinbußen unter Verwendung des naiven Algorithmus. Diese Tropfen betragen ungefähr 50% der Geschwindigkeit, treten auf, während die Matrix noch in den Cache passt, und treten nur für eine oder zwei Größen auf. Ich habe nicht vor, den naiven Algorithmus zu verwenden, aber ich würde gerne wissen, woher die plötzlichen Leistungsabfälle kommen. (Die Tropfen treten auch bei blockierten Algorithmen auf, sind jedoch viel kleiner.)

linear-algebra matrix blas cjordan1
quelle

Antworten:

Das ist ein klassisches Beispiel für Cache-Assoziativität. Der mit dieser Problemgröße verbundene Schritt besteht darin, bestimmte Sätze zu füllen, was zu einer Cache-Räumung führt, obwohl in anderen Sätzen viel Platz vorhanden ist.

Cache-Assoziativität

Abbildung aus Gustavo Duartes ausgezeichnetem Blogbeitrag zum Thema

Siehe auch Dreppers Was jeder Programmierer über Speicher wissen sollte .

Jed Brown
quelle