Ich habe über die Implementierung einer dichten Matrixmultiplikation gelesen, wenn die Matrix nicht in den Cache passt. Eine der Grafiken, die ich gesehen habe (Folie 9 von diesen Folien ), zeigt plötzliche Leistungseinbußen unter Verwendung des naiven Algorithmus. Diese Tropfen betragen ungefähr 50% der Geschwindigkeit, treten auf, während die Matrix noch in den Cache passt, und treten nur für eine oder zwei Größen auf. Ich habe nicht vor, den naiven Algorithmus zu verwenden, aber ich würde gerne wissen, woher die plötzlichen Leistungsabfälle kommen. (Die Tropfen treten auch bei blockierten Algorithmen auf, sind jedoch viel kleiner.)
quelle