Frage
Wenn IID sind, dann berechne , wobei .
X1,⋯,Xn∼N(μ,1) E(X1∣T) T=∑iXi
Versuch : Bitte überprüfen Sie, ob das unten stehende korrekt ist.
Nehmen wir an, wir nehmen die Summe dieser bedingten Erwartungen so, dass
Dies bedeutet, dass jedes da IID sind.
Somit ist . Ist es richtig?
probability
self-study
mathematical-statistics
conditional-probability
conditional-expectation
Lernen
quelle
quelle
Antworten:
Die Idee ist richtig - aber es geht darum, sie etwas strenger auszudrücken. Ich werde mich daher auf die Notation konzentrieren und das Wesentliche der Idee herausstellen.
Beginnen wir mit der Idee der Austauschbarkeit:
Offensichtlich iid impliziert austauschbar.
Als eine Frage der Notation, schreibtXσi=Xσ(i) für die ith Komponente von Xσ und läßt Tσ=∑i=1nXσi=∑i=1nXi=T.
Seij ein beliebiger Index und sei σ eine Permutation der Indizes, die 1 zu j=σ(1). (Ein solches σ existiert, weil man immer nur 1 und j. tauschen kann . ) Die Austauschbarkeit von X impliziert
weil wir (in der ersten Ungleichung) lediglichX durch den gleichverteilten Vektor Xσ. Das ist der springende Punkt.
Folglich
woher
quelle
LetX=(X1,…,Xn)T und 1=(1,…,1)T , um T=1TX . Wir konditionieren dann für das Ereignis, dass 1TX=t für einige t∈R , also ist dies wie das Zeichnen von multivariaten Gaußschen, die auf Rn aber es werden nur diejenigen betrachtet, die im affinen Raum { x ∈ R enden{x∈Rn:1Tx=t} . Dann wollen wir den Durchschnitt derx1 Koordinaten der Punkte kennen, die in diesem affinen Raum landen (egal, dass es sich um eine Teilmenge mit dem Maß Null handelt).
Wir kennenX∼N(μ1,I)
, haben also einen sphärischen Gaußschen Wert mit einem konstanten Mittelwertvektor und der Mittelwertvektor μ1 liegt auf der gleichen Linie wie der Normalvektor der Hyperebene xT1=0 .
Dies gibt uns eine Situation wie das folgende Bild:
Die Schlüsselidee: Stellen Sie sich zunächst die Dichte über dem affinen UnterraumHt:={x:xT1=t} . Die Dichte von X ist symmetrisch um x1=x2 da E(X)∈span 1 . Die Dichte ist auch auf Ht symmetrisch, da Ht auch über dieselbe Linie symmetrisch ist, und der Punkt, um den es symmetrisch ist, ist der Schnittpunkt der Linien x1+x2=t undx1=x2 . Dies geschieht fürx=(t/2,t/2) .
To pictureE(X1|T) we can imagine sampling over and over, and then whenever we get a point in Ht we take just the x1 coordinate and save that. From the symmetry of the density on Ht the distribution of the x1 coordinates will also be symmetric, and it'll have the same center point of t/2 . The mean of a symmetric distribution is the central point of symmetry so this means E(X1|T)=T/2 , and that E(X1|T)=E(X2|T) since X1 and X2 can be excahnged without affecting anything.
In higher dimensions this gets hard (or impossible) to exactly visualize, but the same idea applies: we've got a spherical Gaussian with a mean in the span of1 , and we're looking at an affine subspace that's perpendicular to that. The balance point of the distribution on the subspace will still be the intersection of span 1 and {x:xT1=t} which is at x=(t/n,…,t/n) , and the density is still symmetric so this balance point is again the mean.
Again, that's not a proof, but I think it gives a decent idea of why you'd expect this behavior in the first place.
Beyond this, as some such as @StubbornAtom have noted, this doesn't actually requireX to be Gaussian. In 2-D, note that if X is exchangeable then f(x1,x2)=f(x2,x1) (more generally, f(x)=f(xσ) ) so f must be symmetric over the line x1=x2 . We also have E(X)∈span 1 so everything I said regarding the "key idea" in the first picture still exactly holds. Here's an example where the Xi are iid from a Gaussian mixture model. All the lines have the same meaning as before.
quelle
I think your answer is right, although I'm not entirely sure about the killer line in your proof, about it being true "because they are i.i.d". A more wordy way to the same solution is as follows:
Think about whatE(xi|T) actually means. You know that you have a sample with N readings and that their mean is T. What this actually means, is that now, the underlying distribution they were sampled from no longer matters (you'll notice you at no point used the fact it was sampled from a Gaussian in your proof).
quelle