Wie kann man verstehen, dass MLE of Varianz in einer Gaußschen Verteilung voreingenommen ist?

12

PRML-Darstellung, wie Verzerrungen bei der Verwendung der maximalen Wahrscheinlichkeit zur Bestimmung der Varianz eines Gaußschen entstehen

Ich lese PRML und verstehe das Bild nicht. Könnten Sie bitte einige Hinweise geben, um das Bild zu verstehen und warum die MLE der Varianz in einer Gaußschen Verteilung voreingenommen ist?

Formel 1,55: Formel 1,56 σ 2 M L E =1

μMLE=1Nn=1Nxn
σMLE2=1Nn=1N(xnμMLE)2
Ningyuwhut
quelle
Bitte fügen Sie das Selbststudien-Tag hinzu.
StatsStudent
2
Warum ist für jedes Diagramm nur ein blauer Datenpunkt für mich sichtbar? Übrigens, während ich versuchte, den Überlauf von zwei Indizes in diesem Beitrag zu bearbeiten, benötigt das System "mindestens 6 Zeichen" ... peinlich.
Zhanxiong
Was möchten Sie wirklich verstehen, das Bild oder warum ist die MLE-Varianzschätzung voreingenommen? Ersteres ist sehr verwirrend, aber ich kann Letzteres erklären.
TrynnaDoStat
Ja, ich habe in einer neuen Version festgestellt, dass jedes Diagramm zwei blaue Daten enthält. Mein PDF ist alt
ningyuwhut
@ TrynnaDoStat Entschuldigung für meine Frage ist nicht klar. Ich möchte wissen, warum die MLE-Varianzschätzung voreingenommen ist. und wie dies in dieser Grafik ausgedrückt wird
ningyuwhut

Antworten:

24

Intuition

E[x¯2]μ2E[x¯2]μ2μx¯μdurch eine negative Zahl) wird ebenfalls quadriert und wird somit positiv. Somit wird es nicht mehr abgebrochen und es besteht eine leichte Tendenz zur Überschätzung.

x2μ2E[x2]

Lassen Sie uns beweisen, dass der MLE der Varianz für eine iid-Stichprobe voreingenommen ist. Dann werden wir unsere Intuition analytisch überprüfen.

Beweis

σ^2=1Nn=1N(xnx¯)2

E[σ^2]σ2

E[σ^2]=E[1Nn=1N(xnx¯)2]=1NE[n=1N(xn22xnx¯+x¯2)]=1NE[n=1Nxn2n=1N2xnx¯+n=1Nx¯2]

n=1Nxn=Nx¯n=1Nx¯2=Nx¯2

1NE[n=1Nxn2n=1N2xnx¯+n=1Nx¯2]=1NE[n=1Nxn22Nx¯2+Nx¯2]=1NE[n=1Nxn2Nx¯2]=1NE[n=1Nxn2]E[x¯2]=1Nn=1NE[xn2]E[x¯2]=E[xn2]E[x¯2]

E[xn2]n

σx2=E[x2]E[x]2

E[xn2]E[x¯2]=σx2+E[xn]2σx¯2E[xn]2=σx2σx¯2=σx2Var(x¯)=σx2Var(1Nn=1Nxn)=σx2(1N)2Var(n=1Nxn)

Beachten Sie, dass wir die Konstante entsprechend quadriert haben1NVar()

σx2(1N)2Var(n=1Nxn)=σx2(1N)2Nσx2=σx21Nσx2=N1Nσx2

σx2

Überprüfen Sie analytisch unsere Intuition

μμμ2E[x¯2]σ^2

Lassen σ^μ2=1Nn=1N(xnμ)2

E[xn2]E[x¯2]x¯μ

E[xn2]E[μ2]=E[xn2]μ2=σx2+E[xn]2μ2=σx2

das ist unvoreingenommen!

TrynnaDoStat
quelle
3
X
1
Danke für Ihre Erklärung. Ich brauche etwas Zeit, um es zu verstehen. Außerdem habe ich einen Fehler in den Gleichungen gefunden. Können Sie ihn überprüfen? Vielen Dank!
Ningyuwhut
X eine Gaußsche Verteilung hat.". Wir würden nicht für jede Verteilung über eine ML-Varianzlösung sprechen, beispielsweise eine Binomialverteilung. Wir gehen also implizit davon aus, dass die X-Verteilung eine Varianz als einen der Parameter hat.
KGhatak