Ich bin Mathematiker, lerne selbst Statistik und habe vor allem mit der Sprache zu kämpfen.
In dem Buch, das ich verwende, gibt es das folgende Problem:
Eine Zufallsvariable wird als -verteilt mit . (Natürlich können Sie für diese Frage eine beliebige Verteilung in Abhängigkeit von einem Parameter wählen.) Dann wird eine Stichprobe von fünf Werten , , , , gegeben.Pareto ( α , 60 ) α > 0 14 21 6 32 2
Erster Teil: "Verwenden Sie die Methode der maximalen Wahrscheinlichkeit, um eine Schätzung von basierend auf [der Stichprobe] zu finden." Das war kein Problem. Die Antwort lautet . & agr; & agr; ≈4,6931
Aber dann: "Geben Sie eine Schätzung für den Standardfehler von ."
Was ist damit gemeint? Da nur eine feste reelle Zahl ist, verstehe ich nicht, inwiefern es einen Standardfehler geben könnte. Soll ich die Standardabweichung von bestimmen ? Pareto( α ,60)
Wenn Sie der Meinung sind, dass die Frage nicht klar ist, helfen mir diese Informationen ebenfalls.
quelle
Antworten:
Die andere Antwort hat die Herleitung des Standardfehlers behandelt. Ich möchte Ihnen nur bei der Notation helfen:
Ihre Verwirrung beruht auf der Tatsache, dass wir in der Statistik genau dasselbe Symbol verwenden, um den Schätzer (der eine Funktion ist) und einen bestimmten Schätzer (der der Wert ist, den der Schätzer annimmt, wenn er eine bestimmte realisierte Stichprobe als Eingabe erhält) zu bezeichnen.
So α = h ( X ) und α ( X = x ) = 4,6931 für x = { 14 ,α^=h(X) α^(X=x)=4.6931 . So α ( X ) eine Funktion des Zufallsvariablen ist und so eine Zufallsvariable selbst, dassSicherheit eine Varianz hat. x={14,21,6,32,2} α^(X)
Bei der ML-Schätzung können wir in vielen Fällen den asymptotischen Standardfehler berechnen , da die Verteilung der endlichen Stichproben des Schätzers nicht bekannt ist (nicht abgeleitet werden kann).
Streng genommen α keine Häufigkeitsverteilung haben, da es zu einer reellen Zahl (in fast allen Fällen von ML Schätzung der wahre Zahl) konvergiert. Aber die Menge √α^ konvergiert auf eine normale Zufallsvariable (durch Anwendung des zentralen Grenzwertsatzes).n−−√(α^−α)
Ein zweiter Punkt , der Notations Verwirrung : die meisten, wenn nicht alle Texte, schreibt ( „Avar“ = asymptotische Varianz ") , während , was sie bedeuten , ist Avar ( √Avar(α^) , dh sieauf der asymptotischen Varianz der Menge beziehen √Avar(n−−√(α^−α)) , nicht von... Für den Fall einer basischen ParetoVerteilung haben wirn−−√(α^−α) α^
und so ist
(aber was Sie geschrieben vorfinden, ist )Avar(α^)=α2
Inwiefern hat der Estimator eine "asymptotische Varianz", da er, wie gesagt, asymptotisch gegen eine Konstante konvergiert? Nun, im ungefähren Sinne und für große, aber endliche Proben. Dh irgendwo zwischen einer "kleinen" Stichprobe, bei der der Estimator eine Zufallsvariable mit (normalerweise) unbekannter Verteilung ist, und einer "unendlichen" Stichprobe, bei der der Estimator eine Konstante ist, gibt es dieses "große, aber begrenzte Stichprobengebiet" Der Schätzer ist noch keine Konstante geworden, und seine Verteilung und Varianz wird auf Umwegen abgeleitet, indem zuerst der zentrale Grenzwertsatz verwendet wird, um die richtig asymptotische Verteilung der Größe abzuleiten Z=√α^ α = 1Z=n−−√(α^−α) (was aufgrund der CLT normal ist) und dann die Dinge umdrehen und schreiben (dabei einen Schritt zurückgehen und als endlich behandeln), was zeigt als affine Funktion der normalen Zufallsvariablen und damit normalverteilt (immer ungefähr).nαZα^=1n√Z+α n α^ Z
quelle
& agr;α^ - ein Maximum-Likelihood-Schätzer - ist eine Funktion einer Zufallsstichprobe und daher auch zufällig (nicht festgelegt). Eine Schätzung des Standardfehlers von kann den Fisher-Informationen entnommen werden.α^
Wobei ; ein Parameter ist und die logarithmische Wahrscheinlichkeitsfunktion von ist, die von der Zufallsstichprobe abhängig ist . Intuitiv geben die Fisher-Informationen die Steilheit der Krümmung der Log-Likelihood-Oberfläche um den MLE an, und damit die Menge an "Informationen", die über liefert .L ( θ | Y = y ) θ y y θθ L(θ|Y=y) θ y y θ
Für eine -Verteilung mit einer einzelnen Realisierung ist die log-Wahrscheinlichkeit, mit der bekannt ist:Y = y y 0Pareto(α,y0) Y=y y0
I(α)=1
quelle