Nehmen wir an, dass und jeweils gezogen iid von einigen Distributionen, mit unabhängig von . Die sind streng positiv. Sie beobachten alle , aber nicht die ; vielmehr beobachtest du . Ich bin daran interessiert, anhand dieser Informationen zu schätzen . Es ist klar, dass der Schätzer unvoreingenommen ist und anhand der Informationen berechnet werden kann.x 1 , x 2 , . . . , x n w i x i w i w i x i ∑ i x i w i E [ x ] ˉ x = ∑ i w i x i
Wie könnte ich den Standardfehler dieses Schätzers berechnen? Für den Unterfall, in dem nur die Werte 0 und 1 annimmt, habe ich naiv versucht, wobei die Variabilität in im Grunde ignoriert wurde , aber festgestellt wurde, dass dies bei Stichprobengrößen unter 250 schlecht . (Und dies hängt wahrscheinlich von der Varianz von .) Es scheint, dass ich möglicherweise nicht genug Informationen dazu habe Berechnen Sie einen "besseren" Standardfehler. s e ≈ √wiwi
quelle
w=rep(1, length(x))
, dannweighted.var.se(rnorm(50), rep(1, 50))
geht es um0.014
. Ich denke die Formel fehlt asum(w^2)
im Zähler, seit wannP=1
ist die Varianz1/(n*(n-1)) * sum((x-xbar)^2)
. Ich kann den zitierten Artikel nicht überprüfen, da er sich hinter einer Paywall befindet, aber ich denke, diese Korrektur. Merkwürdigerweise degeneriert die (andere) Lösung von Wikipedia, wenn alle Gewichte gleich sind: en.wikipedia.org/wiki/… .quelle