Ermittlung des wahren Mittels aus verrauschten Beobachtungen

13

Ich habe eine große Menge von Datenpunkten der Form (Mittelwert, stdev). Ich möchte dies auf einen einzigen (besseren) Mittelwert und eine (hoffentlich) kleinere Standardabweichung reduzieren.

Offensichtlich konnte ich einfach berechnen berücksichtigt jedoch nicht die Tatsache, dass einige der Datenpunkte wesentlich genauer sind als andere.datameanN

Vereinfacht ausgedrückt möchte ich einen gewichteten Durchschnitt dieser Datenpunkte bilden, weiß aber nicht, wie die Gewichtungsfunktion in Bezug auf die Standardabweichung aussehen soll.

Michael
quelle

Antworten:

24

Sie suchen einen linearen Schätzer für den Mittelwert der Formμ

μ^=i=1nαixi

wobei die Gewichte und x i die Beobachtungen sind. Ziel ist es, geeignete Werte für die Gewichte zu finden. Sei σ i die wahre Standardabweichung von x i , die möglicherweise mit der geschätzten Standardabweichung übereinstimmt, die Sie wahrscheinlich haben. Angenommen, die Beobachtungen sind unvoreingenommen. das heißt, ihre Erwartungen sind alle gleich dem Mittelwert μ . In diesem Sinne können wir berechnen , dass die Erwartung von μ istαixiσixiμμ^

E[μ^]=i=1nαiE[xi]=μi=1nαich

und (vorausgesetzt, die sind nicht korreliert) die Varianz dieses Schätzers istxi

Var[μ^]=i=1nαi2σi2.

An diesem Punkt verlangen viele Leute, dass der Schätzer unvoreingenommen ist; Das heißt, wir möchten, dass seine Erwartung dem wahren Mittelwert entspricht. Dies impliziert, dass die Gewichte zu einer Einheit summieren müssen. Vorbehaltlich dieser Einschränkung wird die Genauigkeit des Schätzers (gemessen mit dem mittleren quadratischen Fehler) durch Minimierung der Varianz optimiert. Die einzigartige Lösung (leicht mit einem Lagrange-Multiplikator oder durch geometrische Neuinterpretation der Situation als Entfernungsminimierungsproblem zu erhalten) besteht darin, dass die Gewichte proportional zu 1 / σ 2 i sein müssen . αi1/σi2 Die Summe-zu-Einheit-Beschränkung legt ihre Werte fest und ergibt

μ^=i=1nxi/σi2i=1n1/σi2

und

Var[μ^]=1i=1n1/σi2=1n(1ni=1n1σi2)1.

In Worten,

the minimum-variance unbiased estimator of the mean is obtained by making the weights inversely proportional to the variances; the variance of that estimator is 1/n times the harmonic mean of the variances.

We usually do not know the true variances σi. About all we can do is to make the weights inversely proportional to the estimated variances (the squares of your standard deviations) and trust this will work well.

whuber
quelle
1
and related to this answer, also from whuber: stats.stackexchange.com/questions/9071/…
Henry
What would happen if we do not "Assume the observations are unbiased"? With that statement you are saying that if infinite random individual measurements are add to the observation xi we get the mean mu ?
user1420303