Erwartete Größe eines Vektors aus einer multivariaten Normalen

7

Was ist die erwartete Größe, dh der euklidische Abstand vom Ursprung, eines Vektors, der aus einer p-dimensionalen sphärischen Normalen mit und , wo die Identitätsmatrix?Np(μ,Σ)μ=0Σ=σ2II

Im univariaten Fall läuft dies auf , wobei . Dies ist der Mittelwert einer gefalteten Normalverteilung mit Mittelwert und Varianz , der wie folgt berechnet werden kann:E[|x|]xN(0,σ2)μY0σ2

μY=σ2πexp(μ22σ2)μerf(μ2σ)=μ=0σ2π

Da die multivariate Normale sphärisch ist, habe ich darüber nachgedacht, das Problem durch Umschalten auf Polarkoordinaten zu vereinfachen. Sollte der Abstand zum Ursprung in keiner Richtung durch eine gefaltete Normalverteilung gegeben sein? Könnte ich über alle Entfernungen integrieren, mit der (infinitesimalen) Wahrscheinlichkeit multiplizieren, auf eine Stichprobe mit dieser Entfernung zu stoßen (z. B. CDF (Radius) -CDF (Radius-h), h0 ) und schließlich den Sprung zu mehr als einer Dimension machen durch Multiplikation mit der "Anzahl der Punkte" auf einer Hypersphäre der Dimension p ? ZB 2πr für einen Kreis, 4πr2 für eine Kugel? Ich bin der Meinung, dass dies eine einfache Frage sein könnte, bin mir aber nicht sicher, wie ich die Wahrscheinlichkeit für h \ rightarrow 0 analytisch ausdrücken soll h0.

Einfache Experimente legen nahe, dass der erwartete Abstand der Form folgt , aber ich bin nicht sicher, wie ich den Sprung zu einer multivariaten Verteilung schaffen soll. Eine Lösung für wäre übrigens in Ordnung.cσp3

Geben Sie hier die Bildbeschreibung ein

cw '
quelle

Antworten:

8

Die Summe der Quadrate von unabhängigen Standardnormalverteilungen ist eine Chi-Quadrat-Verteilung mit Freiheitsgraden. Die Größe ist die Quadratwurzel dieser Zufallsvariablen. Es wird manchmal als Chi-Verteilung bezeichnet. (Siehe diesen Wikipedia-Artikel .) Die allgemeine Varianz ist ein einfacher Skalierungsfaktor.ppσ2

Einbindung einiger Kommentare in diese Antwort:

Der Mittelwert der Chi-Verteilung mit Freiheitsgraden ist p

μ=2Γ((p+1)/2)Γ(p/2)

Sonderfälle wie angegeben:

Für hat die gefaltete Normalverteilung den Mittelwert .p=12Γ(1/2)=2π

Für wird die Verteilung auch als Rayleigh-Verteilung (mit Skalenparameter 1) bezeichnet und ihr Mittelwert ist .p=22Γ(3/2)Γ(1)=2π2=π2

Für ist die Verteilung als Maxwell-Verteilung mit Parameter 1 bekannt; Der Mittelwert ist .p=38π

Wenn die gemeinsame Varianz nicht 1 ist, muss das Mittel mit multipliziert werden .σ2σ

user3697176
quelle
2
Insbesondere wird die Verteilung für den euklidischen Abstand zum Ursprung mit als Rayleigh-Verteilung bezeichnet, mit als Maxwell-Boltzmann-Verteilung (beide sind Chi-Verteilungen). p=2p=3
Caracal
Vielleicht sollte man hinzufügen, dass der Mittelwert der Chi-Verteilung gleich und OP-Bedürfnisse um es mit zu multiplizieren .
μ=2Γ((p+1)/2)Γ(p/2),
σ
Amöbe
5

Die Antwort von user3697176 enthält alle erforderlichen Informationen. Dennoch gibt es hier eine etwas andere Ansicht des Problems.

Wenn , dann hat eine Gammaverteilung mit den Parametern . Wenn nun , dann ist was natürlich die Eigenschaft genießt, dass die Fläche unter der Kurve . Dies hilft uns, ohne ein Integral explizit auszuwerten. Wir haben das XiN(0,σ2)Y=i=1nXi2(n2,12σ2)WΓ(t,λ)

fW(w)=λ(λw)t1Γ(t)exp(λw)1{w:w>0}
1E[W]
E[W]=0wλ(λw)t1Γ(t)exp(λw)dw=1λΓ(t+12)Γ(t)0λ(λw)t+121Γ(t+12)exp(λw)dw=1λΓ(t+12)Γ(t).
Wenn wir dies auf , erhalten wir das Diese Gammafunktionen können weiter vereinfacht werden und wir erhalten immer ein im Nenner oder im Zähler, je nachdem, ob ungerade oder gerade ist.Y
E[X12+X22++Xn2]=2Γ(n+12)Γ(n2)σ.
Γ(1/2)=πn
Dilip Sarwate
quelle