Wie beurteilen wir anhand von zwei Histogrammen, ob sie ähnlich sind oder nicht?
Reicht es aus, nur die beiden Histogramme zu betrachten? Bei der einfachen Eins-zu-Eins-Zuordnung tritt das Problem auf, dass ein Histogramm, das sich geringfügig unterscheidet und geringfügig verschoben ist, nicht das gewünschte Ergebnis liefert.
Irgendwelche Vorschläge?
histogram
image-processing
Mew 3.4
quelle
quelle
Antworten:
Eine aktuelle Veröffentlichung, die es wert sein könnte, gelesen zu werden, ist:
Cao, Y. Petzold, L. Genauigkeitsbeschränkungen und die Messung von Fehlern in der stochastischen Simulation chemisch reagierender Systeme, 2006.
Obwohl sich dieser Aufsatz auf den Vergleich stochastischer Simulationsalgorithmen konzentriert, besteht die Hauptidee darin, zwei Histogramme zu vergleichen.
Sie können das PDF über die Webseite des Autors aufrufen.
quelle
Es gibt viele Abstandsmaße zwischen zwei Histogrammen. Eine gute Kategorisierung dieser Maßnahmen finden Sie in:
Die beliebtesten Entfernungsfunktionen sind hier aufgeführt:
Eine Matlab-Implementierung einiger dieser Entfernungen ist in meinem GitHub-Repository verfügbar: https://github.com/meshgi/Histogram_of_Color_Advancements/tree/master/distance Sie können auch nach Leuten wie Yossi Rubner, Ofir Pele, Marco Cuturi und Haibin Ling suchen mehr Entfernungen auf dem neuesten Stand der Technik.
Update: Eine alternative Erklärung für die Entfernungen erscheint hier und da in der Literatur, deshalb liste ich sie hier der Vollständigkeit halber auf.
quelle
hist1 < hist2
Die Standardantwort auf diese Frage ist der Chi-Quadrat-Test . Der KS-Test bezieht sich auf nicht kategorisierte Daten, nicht auf kategorisierte Daten. (Wenn Sie die nicht kategorisierten Daten haben, verwenden Sie auf jeden Fall einen KS-Test. Wenn Sie jedoch nur das Histogramm haben, ist der KS-Test nicht geeignet.)
quelle
Sie suchen den Kolmogorov-Smirnov-Test . Vergessen Sie nicht, die Balkenhöhen durch die Summe aller Beobachtungen jedes Histogramms zu dividieren.
Beachten Sie, dass der KS-Test auch dann einen Unterschied meldet, wenn zB die Mittelwerte der Verteilungen gegeneinander verschoben sind. Wenn die Übersetzung des Histogramms entlang der x-Achse in Ihrer Anwendung nicht sinnvoll ist, möchten Sie möglicherweise zuerst den Mittelwert von jedem Histogramm subtrahieren.
quelle
Wie Davids Antwort darauf hinweist, ist der Chi-Quadrat-Test für gruppierte Daten erforderlich, da der KS-Test kontinuierliche Verteilungen voraussetzt. In Bezug auf die Unangemessenheit des KS-Tests (Kommentar von naught101) wurde das Problem in der Literatur zur angewandten Statistik erörtert, das hier zur Sprache gebracht werden sollte.
quelle
Sie können die Kreuzkorrelation (Faltung) zwischen beiden Histogrammen berechnen. Dabei werden geringfügige Übersetzungen berücksichtigt.
quelle