Ich bin auf ein Problem im Lehrbuch gestoßen, um den Mittelwert abzuschätzen. Das Lehrbuchproblem ist wie folgt:
Es sei angenommen, dass Datenpunkte , ,. . . , , wurden durch ein eindimensionales Gaußsches PDF mit unbekanntem Mittelwert, aber bekannter Varianz erzeugt. Leiten Sie die ML-Schätzung des Mittelwerts ab.
Meine Frage ist: Warum müssen wir den Mittelwert mithilfe von MLE schätzen, wenn wir bereits wissen, dass der Mittelwert der Durchschnitt der Daten ist? Die Lösung besagt auch, dass die MLE-Schätzung der Durchschnitt der Daten ist. Muss ich alle anstrengenden MLE-Maximierungsschritte ausführen, um herauszufinden, dass der Mittelwert nichts anderes als der Durchschnitt der Daten ist, dh ?
self-study
normal-distribution
maximum-likelihood
Niranjan Kotha
quelle
quelle
Antworten:
Das Lehrbuchproblem besagt, dass von x ∼ 1 istx1,x2, … ,xN.
Sie sagen dir, dassσbekannt ist, aberμgeschätzt werden muss.
Ist es wirklich so offensichtlich , dass eine gute Schätzung μ = ˉ x ?μ^=x¯
Hier ist .x¯= 1N.∑N.i = 1xich
Es war mir nicht klar und ich war ziemlich überrascht zu sehen, dass es sich tatsächlich um eine MLE-Schätzung handelt.
Beachten Sie auch Folgendes: Was wäre, wenn bekannt und σ unbekannt wäre? In diesem Fall ist MLE Schätzer σ 2 = 1μ σ
Beachten Sie, dass dieser Schätzer nicht mit einem Stichprobenvarianzschätzer identisch ist! Wissen wir nicht bereits, dass die Stichprobenvarianz durch die folgende Gleichung gegeben ist?
quelle
In diesem Fall wird der Durchschnitt der Probe geschieht auch der Maximum - Likelihood - Schätzer sein. Wenn Sie also die gesamte Arbeit ableiten, fühlt sich die MLE wie eine unnötige Übung an, da Sie zu Ihrer intuitiven Schätzung des Mittelwerts zurückkehren, den Sie ursprünglich verwendet hätten. Nun, das war nicht "nur Zufall"; Dies wurde speziell gewählt, um zu zeigen, dass MLE-Schätzer häufig zu intuitiven Schätzern führen.
Aber was wäre, wenn es keinen intuitiven Schätzer gäbe? Angenommen, Sie hatten eine Stichprobe von iid-Gamma-Zufallsvariablen und waren daran interessiert, die Form und die Ratenparameter abzuschätzen. Vielleicht könnten Sie versuchen, einen Schätzer aus den Eigenschaften zu ermitteln, die Sie über Gamma-Verteilungen kennen. Aber was wäre der beste Weg, dies zu tun? Verwenden Sie eine Kombination aus geschätztem Mittelwert und Varianz? Warum nicht den geschätzten Median anstelle des Mittelwerts verwenden? Oder der Log-Mittelwert? Diese alle könnten verwendet werden, um eine Art Schätzer zu erstellen, aber welcher wird ein guter sein?
Wie sich herausstellt, gibt uns die MLE-Theorie eine großartige Möglichkeit, eine prägnante Antwort auf diese Frage zu erhalten: Nehmen Sie die Werte der Parameter, die die Wahrscheinlichkeit der beobachteten Daten maximieren (was ziemlich intuitiv erscheint), und verwenden Sie diese als Ihre Schätzung. Tatsächlich haben wir eine Theorie, die besagt, dass dies unter bestimmten Bedingungen ungefähr der beste Schätzer ist. Dies ist viel besser, als zu versuchen, einen eindeutigen Schätzer für jeden Datentyp zu ermitteln und dann viel Zeit zu investieren, um sich Sorgen zu machen, ob dies wirklich die beste Wahl ist.
Kurz gesagt: Während MLE bei der Schätzung des Mittelwerts normaler Daten keine neuen Erkenntnisse liefert , ist es im Allgemeinen ein sehr, sehr nützliches Werkzeug.
quelle
Es ist eine Frage des verwirrenden Wortschatzes, wie diese Zitate direkt von Google zeigen:
Wie in diesem Wikipedia- Eintrag vorgeschlagen, gilt der Mittelwert sowohl für Verteilungen als auch für Stichproben oder Datensätze. Der Mittelwert eines Datensatzes oder einer Stichprobe ist auch der Mittelwert der mit dieser Stichprobe verbundenen empirischen Verteilung. Der Eintrag veranschaulicht auch die Möglichkeit einer Verwechslung zwischen den Begriffen, da er Durchschnitt und Erwartung als Synonyme angibt.
quelle