Kullback-Leibler gegen Kolmogorov-Smirnov Abstand

37

Ich kann feststellen, dass es viele formale Unterschiede zwischen den Abstandsmaßen Kullback-Leibler und Kolmogorov-Smirnov gibt. Beide werden jedoch verwendet, um den Abstand zwischen Verteilungen zu messen.

  • Gibt es eine typische Situation, in der einer anstelle des anderen verwendet werden sollte?
  • Was ist der Grund dafür?
Greg
quelle
Eine verwandte Frage: stats.stackexchange.com/questions/4/…
GaBorgulya

Antworten:

23

Die KL-Divergenz wird typischerweise in informationstheoretischen Einstellungen oder sogar in Bayes-Einstellungen verwendet, um die Informationsänderung zwischen Verteilungen vor und nach dem Anwenden von Inferenz zu messen. Es ist keine Distanz im typischen (metrischen) Sinne, da Symmetrie und Dreiecksungleichheit fehlen, und wird daher an Orten verwendet, an denen die Richtwirkung von Bedeutung ist.

1

Suresh Venkatasubramanian
quelle
5
X1,X2,p0p1Tn=n1i=1nlog(p1(Xi)/p0(Xi))Tnp0TnD(p0||p1)p1TnD(p1||p0)D(||)Tn>0p0
Tatsächlich. Das ist ein hervorragendes Beispiel. Tatsächlich verwenden die meisten allgemeinen Versionen der Chernoff-Hoeffding-Schwanzgrenzen die KL-Divergenz.
Suresh Venkatasubramanian
2

Eine andere Möglichkeit, das Gleiche wie in der vorherigen Antwort zu sagen:

KL-Divergenz - Liefert tatsächlich ein Maß dafür, wie groß der Unterschied zwischen zwei Verteilungen ist. Wie in der vorherigen Antwort erwähnt, ist dieses Maß keine geeignete Abstandsmetrik, da es nicht symmetrisch ist. Dh der Abstand zwischen Verteilung A und B ist ein anderer Wert als der Abstand zwischen Verteilung B und A.

Kolmogorov-Smirnov-Test - Hierbei handelt es sich um eine Bewertungsmetrik, die den größten Unterschied zwischen der kumulativen Verteilung einer Testverteilung und einer Referenzverteilung untersucht. Darüber hinaus können Sie diese Metrik wie einen Z-Score für die Kolmogorov-Verteilung verwenden, um einen Hypothesentest durchzuführen, um festzustellen, ob die Testverteilung mit der Referenzverteilung identisch ist. Diese Metrik kann als Distanzfunktion verwendet werden, da sie symmetrisch ist. Die größte Trennung zwischen CDF von A und CDF von B ist die gleiche wie die größte Trennung zwischen CDF von B und CDF von A.

SriK
quelle