Was ist mit dem Standardfehler einer Maximum-Likelihood-Schätzung gemeint?

21

Ich bin Mathematiker, lerne selbst Statistik und habe vor allem mit der Sprache zu kämpfen.

In dem Buch, das ich verwende, gibt es das folgende Problem:

Eine Zufallsvariable wird als -verteilt mit . (Natürlich können Sie für diese Frage eine beliebige Verteilung in Abhängigkeit von einem Parameter wählen.) Dann wird eine Stichprobe von fünf Werten , , , , gegeben.Pareto ( α , 60 ) α > 0 14 21 6 32 2XPareto(α,60)α>014216322

Erster Teil: "Verwenden Sie die Methode der maximalen Wahrscheinlichkeit, um eine Schätzung von basierend auf [der Stichprobe] zu finden." Das war kein Problem. Die Antwort lautet . & agr; & agr;4,6931α^αα^4.6931

Aber dann: "Geben Sie eine Schätzung für den Standardfehler von ."α^

Was ist damit gemeint? Da nur eine feste reelle Zahl ist, verstehe ich nicht, inwiefern es einen Standardfehler geben könnte. Soll ich die Standardabweichung von bestimmen ? Pareto( α ,60)α^Pareto(α^,60)

Wenn Sie der Meinung sind, dass die Frage nicht klar ist, helfen mir diese Informationen ebenfalls.

Stefan
quelle
Wofür stehen ? 60
Alecos Papadopoulos
Haben Sie eine Formel für haben α ? Dadurch können Sie den Standardfehler abschätzen. α^
Soakley
1
@ Glen_b Aber wenn es die Untergrenze wäre, wie könnte es sein, dass alle Werte der realisierten Stichprobe kleiner sind?
Alecos Papadopoulos
1
@ Alecos Das ist ein ausgezeichneter Punkt. Mein Kommentar ergibt keinen Sinn; Ich habe es gelöscht.
Glen_b
1
@Alecos: Pareto(α,λ) ist die Verteilung mit der Dichte . f(x)=αλα(λ+x)α+1
Stefan

Antworten:

17

Die andere Antwort hat die Herleitung des Standardfehlers behandelt. Ich möchte Ihnen nur bei der Notation helfen:

Ihre Verwirrung beruht auf der Tatsache, dass wir in der Statistik genau dasselbe Symbol verwenden, um den Schätzer (der eine Funktion ist) und einen bestimmten Schätzer (der der Wert ist, den der Schätzer annimmt, wenn er eine bestimmte realisierte Stichprobe als Eingabe erhält) zu bezeichnen.

So α = h ( X ) und α ( X = x ) = 4,6931 für x = { 14 ,α^=h(X)α^(X=x)=4.6931 . So α ( X ) eine Funktion des Zufallsvariablen ist und so eine Zufallsvariable selbst, dassSicherheit eine Varianz hat. x={14,21,6,32,2}α^(X)

Bei der ML-Schätzung können wir in vielen Fällen den asymptotischen Standardfehler berechnen , da die Verteilung der endlichen Stichproben des Schätzers nicht bekannt ist (nicht abgeleitet werden kann).

Streng genommen α keine Häufigkeitsverteilung haben, da es zu einer reellen Zahl (in fast allen Fällen von ML Schätzung der wahre Zahl) konvergiert. Aber die Menge α^konvergiert auf eine normale Zufallsvariable (durch Anwendung des zentralen Grenzwertsatzes).n(α^α)

Ein zweiter Punkt , der Notations Verwirrung : die meisten, wenn nicht alle Texte, schreibt ( „Avar“ = asymptotische Varianz ") , während , was sie bedeuten , ist Avar ( Avar(α^), dh sieauf der asymptotischen Varianz der Menge beziehenAvar(n(α^α)), nicht von... Für den Fall einer basischen ParetoVerteilung haben wirn(α^α)α^

Avar[n(α^α)]=α2

und so ist

Avar(α^)=α2/n

(aber was Sie geschrieben vorfinden, ist ) Avar(α^)=α2

Inwiefern hat der Estimator eine "asymptotische Varianz", da er, wie gesagt, asymptotisch gegen eine Konstante konvergiert? Nun, im ungefähren Sinne und für große, aber endliche Proben. Dh irgendwo zwischen einer "kleinen" Stichprobe, bei der der Estimator eine Zufallsvariable mit (normalerweise) unbekannter Verteilung ist, und einer "unendlichen" Stichprobe, bei der der Estimator eine Konstante ist, gibt es dieses "große, aber begrenzte Stichprobengebiet" Der Schätzer ist noch keine Konstante geworden, und seine Verteilung und Varianz wird auf Umwegen abgeleitet, indem zuerst der zentrale Grenzwertsatz verwendet wird, um die richtig asymptotische Verteilung der Größe abzuleiten Z=α^ α = 1Z=n(α^α)(was aufgrund der CLT normal ist) und dann die Dinge umdrehen und schreiben (dabei einen Schritt zurückgehen und als endlich behandeln), was zeigt als affine Funktion der normalen Zufallsvariablen und damit normalverteilt (immer ungefähr).nαZα^=1nZ+αnα^Z

Alecos Papadopoulos
quelle
+1 zur Unterscheidung zwischen und - sicherlich kann die Notation inkonsistent sein. α^n(α^α)
Nate Pope
21

& agr;α^ - ein Maximum-Likelihood-Schätzer - ist eine Funktion einer Zufallsstichprobe und daher auch zufällig (nicht festgelegt). Eine Schätzung des Standardfehlers von kann den Fisher-Informationen entnommen werden.α^

I(θ)=E[2L(θ|Y=y)θ2|θ]

Wobei ; ein Parameter ist und die logarithmische Wahrscheinlichkeitsfunktion von ist, die von der Zufallsstichprobe abhängig ist . Intuitiv geben die Fisher-Informationen die Steilheit der Krümmung der Log-Likelihood-Oberfläche um den MLE an, und damit die Menge an "Informationen", die über liefert .L ( θ | Y = y ) θ y y θθL(θ|Y=y)θyyθ

Für eine -Verteilung mit einer einzelnen Realisierung ist die log-Wahrscheinlichkeit, mit der bekannt ist:Y = y y 0Pareto(α,y0)Y=yy0

I(α)=1

L(α|y,y0)=logα+αlogy0(α+1)logyL(α|y,y0)=1α+logy0logyL(α|y,y0)=1α2
Wenn Sie die Definition der Fisher-Informationen übernehmen, ist Für eine Stichprobe Der Maximum Likelihood Estimator ist asymptotisch verteilt als: Wobei die Stichprobengröße ist. Da unbekannt ist, können wir einstecken {y1,y2,. . . ,Yn} α α n ~ N (α, 1
I(α)=1α2
{y1,y2,...,yn}α^nααSE(α)
α^nN(α,1nI(α))=N(α,α2n), 
nαα^ , um eine Schätzung des Standardfehlers zu erhalten:
SE(α^)α^2/n4.69312/52.1
Nate Papst
quelle
1
Für Ihre vorletzte Zeile , die Schreibweise scheint nicht korrekt zu sein. Wenn , kann nicht auf der rechten Seite angezeigt werden. Stattdessen möchten Sienn α ˙ N(α,1α^nN(α,1nI(α))nnα^˙N(α,1nI(α))
align