Lassen den Median bezeichnen und lassen das Mittel bezeichnet, eine Stichprobe der Größe aus einer Verteilung , das ist . Wie kann ich berechnen ?
Aufgrund der Normalitätsannahme ist es intuitiv sinnvoll zu behaupten, dass und dies ist in der Tat die richtige Antwort. Kann das konsequent gezeigt werden?
Mein erster Gedanke war, dieses Problem unter Verwendung der bedingten Normalverteilung anzugehen, die im Allgemeinen ein bekanntes Ergebnis ist. Das Problem besteht darin, dass ich, da ich den erwarteten Wert und folglich die Varianz des Medians nicht kenne, diese unter Verwendung der Statistik Ordnung berechnen müsste. Aber das ist sehr kompliziert und ich würde lieber nicht dorthin gehen, wenn ich nicht unbedingt muss.
self-study
normal-distribution
mathematical-statistics
expected-value
conditional-expectation
JohnK
quelle
quelle
Antworten:
Lassen bezeichnet die Originalprobe und Z den Zufallsvektor mit Einträgen Z k = X k - ˉ X . Dann ist Z normal zentriert (aber seine Einträge sind nicht unabhängig, wie aus der Tatsache ersichtlich ist, dass ihre Summe mit voller Wahrscheinlichkeit Null ist). Als lineare Funktion von X ist der Vektor ( Z , ˉ X ) normal, daher reicht die Berechnung seiner Kovarianzmatrix aus, um zu zeigen, dass Z unabhängig von ˉ X ist .X Z Zk=Xk−X¯ Z X (Z,X¯) Z X¯
Mit Bezug auf , sieht man , dass Y = ˉ X + T , wo T der Median ist Z . Insbesondere hängt T nur von Z ab , daher ist T unabhängig von ˉ X , und die Verteilung von Z ist symmetrisch, daher ist T zentriert.Y Y=X¯+T T Z T Z T X¯ Z T
Schließlich
quelle
Der Stichprobenmedian ist eine Ordnungsstatistik und weist eine nicht normale Verteilung auf, sodass die gemeinsame Verteilung von Stichprobenmedian und Stichprobenmittelwert (die eine normale Verteilung aufweist) nicht bivariant normal wäre. Unter asymptotischer Berücksichtigung von Annäherungen gilt Folgendes (siehe meine Antwort hier ):
mit
Dabei ist der Stichprobenmittelwert und μ der Populationsmittelwert, Y n der Stichprobenmedian und v der Populationsmedian, f ( ) die Wahrscheinlichkeitsdichte der beteiligten Zufallsvariablen und σ 2 die Varianz.X¯n μ Yn v f() σ2
Ungefähr für große Proben ist ihre gemeinsame Verteilung also bivariat normal, also haben wir das
wobei der Korrelationskoeffizient ist.ρ
Manipuliert man die asymptotische Verteilung, um die ungefähre gemeinsame Verteilung von Stichprobenmittelwert und Stichprobenmedian (und nicht der standardisierten Größen) für große Stichproben zu erhalten, so ergibt sich
So
We have that2f(v)=2/σ2π−−√ due to the symmetry of the normal density so we arrive at
where we have usedv=μ . Now the standardized variable is a standard normal, so its absolute value is a half-normal distribution with expected value equal to 2/π−−−√ (since the underlying variance is unity). So
quelle
The answer isx¯ .
Letx=(x1,x2,…,xn) have a multivariate distribution F for which all the marginals are symmetric about a common value μ . (It does not matter whether they are independent or even are identically distributed.) Define x¯ to be the arithmetic mean of the xi, x¯=(x1+x2+⋯+xn)/n and write x−x¯=(x1−x¯,x2−x¯,…,xn−x¯) for the vector of residuals. The symmetry assumption on F implies the distribution of x−x¯ is symmetric about 0 ; that is, when E⊂Rn is any event,
Applying the generalized result at /stats//a/83887 shows that the median ofx−x¯ has a symmetric distribution about 0 . Assuming its expectation exists (which is certainly the case when the marginal distributions of the xi are Normal), that expectation has to be 0 (because the symmetry implies it equals its own negative).
Now since subtracting the same valuex¯ from each of a set of values does not change their order, Y (the median of the xi ) equals x¯ plus the median of x−x¯ . Consequently its expectation conditional on x¯ equals the expectation of x−x¯ conditional on x¯ , plus E(x¯ | x¯) . The latter obviously is x¯ whereas the former is 0 because the unconditional expectation is 0 . Their sum is x¯, QED.
quelle
This is simpler than the above answers make it. The sample mean is a complete and sufficient statistic (when the variance is known, but our results do not depend on the variance, hence will be valid also in the situation when the variance is unknown). Then the Rao-Blackwell together with the Lehmann-Scheffe theorems (see wikipedia ...) will imply that the conditional expectation of the median, given the arithmetic mean, is the unique minimum variance unbiased estimator of the expectationμ . But we know that is the arithmetic mean, hence the result follows.
We did also use that the median is an unbiased estimator, which follows from symmetry.
quelle