Angenommen, ich habe ein Münzwurf-Experiment, bei dem ich die maximale Wahrscheinlichkeitsschätzung des Münzparameters berechnen möchte, wenn ich die Münze mal werfe . Nach der Berechnung der Ableitung der Binomialwahrscheinlichkeitsfunktion L (p) = {n \ wähle x} p ^ x (1-p) ^ {nx} erhalte ich den optimalen Wert für p als p ^ {*} = \ frac {x} {n} , wobei x die Anzahl der Erfolge ist.np ∗ = x x
Meine Fragen sind jetzt:
- Wie würde ich den erwarteten Wert / die erwartete Varianz dieser Maximum-Likelihood-Schätzung für p berechnen ?
- Muss ich den erwarteten Wert / die erwartete Varianz für L (p ^ {*}) berechnen ?
- Wenn ja, wie würde ich das machen?
Antworten:
Zuallererst ist dies eine Frage zum Selbststudium, daher werde ich zu sehr auf jedes kleine technische Detail eingehen, aber ich werde auch keinen Ableitungsrausch erleben. Es gibt viele Möglichkeiten, dies zu tun. Ich werde Ihnen helfen, indem ich allgemeine Eigenschaften des Maximum-Likelihood-Schätzers verwende.
Hintergrundinformation
Um Ihr Problem zu lösen, müssen Sie meiner Meinung nach von Anfang an die maximale Wahrscheinlichkeit untersuchen. Sie verwenden wahrscheinlich eine Art Lehrbuch, und die Antwort sollte wirklich irgendwo da sein. Ich werde Ihnen helfen, herauszufinden, wonach Sie suchen müssen.
Maximum Likelihood ist eine Schätzmethode, die wir im Grunde genommen als M-Schätzer bezeichnen (stellen Sie sich das "M" als "Maximieren / Minimieren" vor). Wenn die für die Verwendung dieser Methoden erforderlichen Bedingungen erfüllt sind, können wir zeigen, dass die Parameterschätzungen konsistent und asymptotisch normalverteilt sind. Wir haben also:
wobei und einige Matrizen sind. Wenn wir die maximale Wahrscheinlichkeit verwenden, können wir zeigen, dass , und daher haben wir einen einfachen Ausdruck: Wir haben das wobei das bezeichnet. Dies ist, was Sie schätzen müssen, um Ihre Varianz zu erhalten.B 0 A 0 = B 0 √A0 B0 A0=B0 A0≡-E(H(θ0))H.
Ihr spezifisches Problem
Wie machen wir das? Nennen wir hier unseren Parameter vector was Sie tun: . Dies ist nur ein Skalar, daher ist unsere "Punktzahl" nur die Ableitung und die "Hessische" nur die Ableitung zweiter Ordnung. Unsere Wahrscheinlichkeitsfunktion kann wie folgt geschrieben werden: was wir maximieren möchten. Sie haben die erste Ableitung davon oder die Log-Wahrscheinlichkeit verwendet, um Ihr zu finden . Anstatt die erste Ableitung gleich Null zu setzen, können wir erneut differenzieren, um die Ableitung zweiter Ordnung . Zuerst nehmen wir Protokolle: Dann ist unsere 'Punktzahl': und unser 'Hessisch': p l ( p ) = ( p ) x (θ p p ∗ H ( p )
quelle
Lassen Sie uns zunächst den erwarteten Wert ausführen:
Wenn die Anzahl der Erfolge in Würfen ist, ist der Anteil der Erfolge in Ihrer Stichprobe. Betrachten Sie ; Für jeden Wurf beträgt die Erfolgswahrscheinlichkeit gemäß den Annahmen. Wenn Sie also die Münze einmal werfen, beträgt die erwartete "Anzahl der Erfolge" , richtig? Wenn Sie also die Münze mal werfen , würden Sie mal Erfolg erwarten, da die Würfe unabhängig sind. Da die Anzahl der erwarteten Erfolge in Würfen ist, erhalten Sien x / n E xx n x/n Ex p p×1+(1−p)×0=p n np np n
Der Schätzer ist also unvoreingenommen. Können Sie herausfinden, wie Sie die Varianz von hier aus durchführen können?
Edit: Lass uns auch die Varianz machen. Wir verwenden . Den zweiten Term haben wir bereits aus der Berechnung des erwarteten Wertes, also machen wir den ersten: Um einige zu vereinfachen können wir die Anzahl der Erfolge in Würfen wie folgt ausdrücken : wobei den Wert 1 annimmt, wenn der Wurf ein Erfolg war, und ansonsten 0. Daher ist Wenn Sie also die Dinge zusammenfügen, gelangen Sie zu .E p ∗ 2 = n - 2Var(p∗)=Ep∗2−(Ep∗)2
quelle