Die Entfernung des Erdbewegers kann als , wobei das Infimum über alle gemeinsamen Verteilungen von X und übernommen wird Y Rn X \ sim P , Y \ sim Q . Dies ist auch als der erste Wasserstein-Abstand bekannt , der W_p = \ inf \ left (\ E \ lVert X - Y \ rVert ^ p \ right) ^ {1 / p} mit demselben Infimum ist.EMD(P,Q)=infE∥X−Y∥XYX∼PY∼QWp=inf(E∥X−Y∥p)1/p
Sei X∼P=N(μx,Σx) , Y∼Q=N(μy,Σy) .
Untergrenze: Nach Jensens Ungleichung ist
die EMD , da die Normen konvex sind, immer
E∥X−Y∥≥∥E(X−Y)∥=∥μx−μy∥,
mindestens der Abstand zwischen den Mitteln (für etwaige Verteilungen).
Obere Schranke basierend auf W2 :
Wiederum durch Jensens Ungleichung
(E∥X−Y∥)2≤E∥X−Y∥2 . Also W1≤W2 . Aber Dowson und Landau (1982) stellen fest, dass
Somit gebunden ein oberes für ist . Leider ist eine geschlossene Form für diese Erwartung überraschend unangenehm für die allgemeinen multivariate Normale aufzuschreiben: siehe diese Frage , aber auch diese ein .W1(P,Q)E∥D∥
Wenn die Varianz von endet sphärisch (zB wenn , , dann ist die Varianz von wird ), der ehemaligen Frage gibt die Antwort in Bezug auf ein verallgemeinertes Laguerre-Polynom.DΣx=σ2xIΣy=σ2yID(σx−σy)2I
Im Allgemeinen haben wir eine einfache obere Schranke für basierend auf Jensens Ungleichung, abgeleitet zB aus der ersten Frage:
E∥D∥
Die Gleichheit am Ende ist, weil die Matrizen und ähnlich sind Sie haben also die gleichen Eigenwerte, und daher haben ihre Quadratwurzeln die gleiche Spur.ΣxΣyΣ12xΣyΣ12x=Σ−12x(ΣxΣy)Σ12x
Diese Ungleichung ist streng, solange nicht entartet ist, was in den meisten Fällen bei .∥D∥Σx≠Σy
Eine Vermutung : Vielleicht ist diese engere obere Schranke, , eng. ich hier lange Zeit eine andere Obergrenze, von der ich vermutete, dass sie enger war als die , also sollten Sie dieser Vermutung vielleicht nicht zu sehr vertrauen. :)E∥D∥W2
Antworten:
SeiX∼P=N(μx,Σx) , Y∼Q=N(μy,Σy) .
Untergrenze: Nach Jensens Ungleichung ist die EMD , da die Normen konvex sind, immerE∥X−Y∥≥∥E(X−Y)∥=∥μx−μy∥, mindestens der Abstand zwischen den Mitteln (für etwaige Verteilungen).
Obere Schranke basierend aufW2 :
Wiederum durch Jensens Ungleichung
(E∥X−Y∥)2≤E∥X−Y∥2 . Also W1≤W2 . Aber Dowson und Landau (1982) stellen fest, dass
W2(P,Q)2=∥μx−μy∥2+tr(Σx+Σy−2(ΣxΣy)1/2),
mit einer Obergrenze für EMD=W1 .
Eine engere obere Schranke: Betrachten Sie die Kopplung Dies ist die von Knott und Smith (1984) abgeleitete Karte. , Zur optimalen Abbildung von Verteilungen , Journal of Optimization Theory and Applications, 43 (1), S. 39-49 als optimale Abbildung für ; Siehe auch diesen Blog-Beitrag . Beachten Sie, dass undXY∼N(μx,Σx)=μy+Σ−12x(Σ12xΣyΣ12x)12Σ−12xA(X−μx). W2A=ATEYW2 A=AT EYVarY=μy+A(EX−μx)=μy=AΣxAT=Σ−12x(Σ12xΣyΣ12x)12Σ−12xΣxΣ−12x(Σ12xΣyΣ12x)12Σ−12x=Σ−12x(Σ12xΣyΣ12x)Σ−12x=Σy,
damit die Kopplung gültig ist.
Der Abstand ist dann , wobei nun was normal ist mit∥X−Y∥ ∥D∥ D=X−Y=X−μy−A(X−μx)=(I−A)X−μy+Aμx, EDVarD=μx−μy=(I−A)Σx(I−A)T=Σx+AΣxA−AΣx−ΣxA=Σx+Σy−Σ−12x(Σ12xΣyΣ12x)12Σ12x−Σ12x(Σ12xΣyΣ12x)12Σ−12x.
Somit gebunden ein oberes für ist . Leider ist eine geschlossene Form für diese Erwartung überraschend unangenehm für die allgemeinen multivariate Normale aufzuschreiben: siehe diese Frage , aber auch diese ein .W1(P,Q) E∥D∥
Wenn die Varianz von endet sphärisch (zB wenn , , dann ist die Varianz von wird ), der ehemaligen Frage gibt die Antwort in Bezug auf ein verallgemeinertes Laguerre-Polynom.D Σx=σ2xI Σy=σ2yI D (σx−σy)2I
Im Allgemeinen haben wir eine einfache obere Schranke für basierend auf Jensens Ungleichung, abgeleitet zB aus der ersten Frage:E∥D∥ (E∥D∥)2≤E∥D∥2=∥μx−μy∥2+tr(Σx+Σy−AΣx−ΣxA)=∥μx−μy∥2+tr(Σx)+tr(Σy)−2tr(Σ−12x(Σ12xΣyΣ12x)12Σ12x)=∥μx−μy∥2+tr(Σx)+tr(Σy)−2tr((Σ12xΣyΣ12x)12)=W2(P,Q)2.
Die Gleichheit am Ende ist, weil die Matrizen und ähnlich sind Sie haben also die gleichen Eigenwerte, und daher haben ihre Quadratwurzeln die gleiche Spur.ΣxΣy Σ12xΣyΣ12x=Σ−12x(ΣxΣy)Σ12x
Diese Ungleichung ist streng, solange nicht entartet ist, was in den meisten Fällen bei .∥D∥ Σx≠Σy
Eine Vermutung : Vielleicht ist diese engere obere Schranke, , eng. ich hier lange Zeit eine andere Obergrenze, von der ich vermutete, dass sie enger war als die , also sollten Sie dieser Vermutung vielleicht nicht zu sehr vertrauen. :)E∥D∥ W2
quelle