Dichte der Normalverteilung mit zunehmenden Abmessungen

15

Die Frage, die ich stellen möchte, lautet: Wie ändert sich der Anteil der Stichproben innerhalb von 1 SD des Mittelwerts einer Normalverteilung, wenn die Anzahl der Variablen zunimmt?

(Fast) jeder weiß, dass in einer eindimensionalen Normalverteilung 68% der Proben innerhalb einer Standardabweichung vom Mittelwert gefunden werden können. Was ist mit 2, 3, 4, ... Dimensionen? Ich weiß, es wird weniger ... aber um wie viel (genau)? Es wäre praktisch, eine Tabelle mit den Zahlen für 1, 2, 3 ... 10 Dimensionen sowie 1, 2, 3 ... 10 SDs zu haben. Kann jemand auf eine solche Tabelle verweisen?

Ein bisschen mehr Kontext - Ich habe einen Sensor, der Daten auf bis zu 128 Kanälen liefert. Jeder Kanal ist (unabhängigen) elektrischen Störungen ausgesetzt. Wenn ich ein Kalibrierungsobjekt wahrnehme, kann ich eine ausreichende Anzahl von Messungen mitteln und einen Mittelwert über die 128 Kanäle sowie 128 einzelne Standardabweichungen erhalten.

ABER ... wenn es um die einzelnen Momentanablesungen geht, antworten die Daten nicht so sehr wie bei 128 Einzelablesungen, sondern wie bei einer einzelnen Ablesung einer (bis zu) 128-dimensionalen Vektorgröße. Dies ist sicherlich die beste Methode, um die wenigen kritischen Messwerte zu behandeln (normalerweise 4-6 von 128).

Ich möchte ein Gefühl dafür bekommen, was "normale" Variation ist und was "Ausreißer" in diesem Vektorraum ist. Ich bin mir sicher, dass ich einen Tisch wie den von mir beschriebenen gesehen habe, der auf diese Art von Situation zutrifft - kann jemand auf einen zeigen?

omatai
quelle
Bitte - kann ich nur empirische Antworten haben - ich verstehe die meisten mathematischen Notationen nicht.
Omatai

Antworten:

19

Nehmen wir : Jedes X i ist normal N ( 0 , 1 ) und das X i ist unabhängig - ich denke, das ist, was Sie mit höheren Dimensionen meinen.X=(X1,,Xd)N(0,ich)XichN(0,1)Xich

Man würde sagen, dass innerhalb von 1 sd des Mittelwerts liegt, wenn | | X | | < 1 (der Abstand zwischen X und seinem Mittelwert ist kleiner als 1). Jetzt | | X | | 2 = X 2 1 + + X 2 dχ 2 ( d ), also geschieht dies mit der Wahrscheinlichkeit P ( ξ < 1 ), wobei ξ χ 2 ( d )X||X||<1||X||2=X12++Xd2χ2(d)P(ξ<1)ξχ2(d). Sie können dies in guten Chi-Quadrat-Tischen finden ...

Hier sind einige Werte:

dP(ξ<1)10.6820.3930.2040.09050.03760.01470.005280.001890.00056100.00017

Und für 2 sd:

dP(ξ<4)10.9520.8630.7440.5950.4560.3270.2280.1490.089100,053

Sie können diese Werte in R mit commads wie erhalten pchisq(1,df=1:10), pchisq(4,df=1:10)usw.

Post Scriptum Wie Kardinal in den Kommentaren betont hat, kann man das asymptotische Verhalten dieser Wahrscheinlichkeiten abschätzen. Die CDF einer -Variablen ist F d ( x ) = P ( d / 2 , x / 2 ) = γ ( d / 2 , x / 2 )χ2(d) wobeiγ(s,y)=y0ts-1e-tdtist dieunvollständigeγ-functionund classicalyΓ(n)=0ts-1e-tdt.

Fd(x)=P(d/2,x/2)=γ(d/2,x/2)Γ(d/2)
γ(s,y)=0yts1etdtγΓ(s)=0ts1etdt

s

P(s,y)=eyk=sykk!,

P(s,y)yss!eysd

P(ξ<x)=P(d/2,x/2)1(d/2)!(x2)d/2ex/21πde12(dx)(xd)d21πe12xd12d,
for big even d, the penultimate equivalence using Stirling formula. From this formula we see that the asymptotic decay is very fast as d increase.
Elvis
quelle
Welcome to our site, Elvis! Nice answer. (+1)
whuber
1
(+1) Good answer. Here are a couple suggestions for your consideration: (1) It might help to make explicit what ξ is for clarity's sake, (2) briefly give an intuitive argument for the choice you've made for the meaning of "one standard deviation" in this context and why it is even well-defined in the first place, and (3) add a statement regarding the growth of this quantity as a function of d. (The OP asks for only "empirical" answers, but other readers might appreciate a small mathematical addendum.)
cardinal
Thank you for your comments. I didn’t think this answer would receive much attention! It is true that this is a nice form of the curse of dimensionality... @cardinal concerning (3) I don’t know any asymptotic equivalent of the incomplete gamma function when the first parameters goes to infinity, the second being fixed, this is not easy! A rough majoration could be done, I may write that later.
Elvis
2
Regarding (3), to avoid a computation, you can employ the following argument: Let d be even and such that d=2k. Note that Zi=X2i12+X2i2 is an Exp(1/2) random variable. So X2=i=1kZi. But, then X2 is just the time until the kth renewal of a Poisson process with rate 1/2. So P(X2<1)=P(N1/2(0,1)k)=e1/2x=k2x/x!. The tail of the Poisson is dominated by the leading term, so P(X2<1)e1/22k/Γ(k+1) as d (Again: k=d/2).
cardinal
1
Part of the point of the foregoing comment is that we get an exact answer for all even d. Also, using Stirling's approximation, we get that P(X2<1)e1/22k/Γ(k+1)e(d1)/2d(d+1)/2/π.
cardinal