Ich denke, ich habe die mathematische Definition eines konsistenten Schätzers bereits verstanden. Korrigiere mich, wenn ich falsch liege:
ist ein konsistenter Schätzer für wenn
Wo ist der parametrische Raum. Aber ich möchte verstehen, dass ein Schätzer konsistent sein muss. Warum ist ein Schätzer, der nicht konsistent ist, schlecht? Können Sie mir einige Beispiele nennen?
Ich akzeptiere Simulationen in R oder Python.
Antworten:
Wenn der Schätzer nicht konsistent ist, konvergiert er nicht zum wahren Wahrscheinlichkeitswert . Mit anderen Worten, es besteht immer eine Wahrscheinlichkeit, dass Ihr Schätzer und Ihr wahrer Wert einen Unterschied aufweisen, unabhängig davon, wie viele Datenpunkte Sie haben. Das ist eigentlich schlecht, denn selbst wenn Sie eine immense Datenmenge erfassen, wird Ihre Schätzung immer eine positive Wahrscheinlichkeit haben, dass sich ein Wert von vom wahren Wert unterscheidet. In der Praxis können Sie diese Situation so betrachten, als würden Sie einen Schätzer für eine Menge verwenden, bei der nicht einmal die gesamte Bevölkerung befragt wird, sondern nur eine kleine Stichprobe.ϵ>0
quelle
Betrachten Sie Beobachtungen aus der Standard-Cauchy-Verteilung, die mit der Student-t-Verteilung mit 1 Freiheitsgrad identisch ist. Die Schwänze dieser Verteilung sind so schwer, dass sie keinen Mittelwert haben; Die Verteilung ist auf den Median zentriertn = 10000 η= 0.
Eine Folge von ist für das Zentrum der Cauchy-Verteilung nicht konsistent. Grob gesagt, ist die Schwierigkeit , dass es sehr extreme Beobachtungen (positiv oder negativ) mit ausreichender Regelmäßigkeit auftritt , dass es keine Chance für ist zu Converge (Die sind nicht nur langsam zu konvergieren, sie nicht immer konvergieren. Die Verteilung von ist wieder Standard Cauchy [ Beweis ].)EINj= 1j∑ji=1Xi Xi Aj η=0. Aj Aj
Im Gegensatz dazu wird bei jedem Schritt in einem fortgesetzten Abtastprozess ungefähr die Hälfte der Beobachtungen auf beiden Seiten von liegen so dass die Sequenz von konvergiertXi η, Hj η.
Dieser Mangel an Konvergenz von und Konvergenz von wird durch die folgende Simulation veranschaulicht.Aj Hj
Hier ist eine Liste von Schritten, bei denen Sie können die Auswirkung einiger dieser extremen Beobachtungen auf die laufenden Durchschnitte im Diagramm links (an den vertikalen roten gepunkteten Linien) sehen.|Xi|>1000.
Konsistenz in wichtig bei der Schätzung: In Probennahme aus einer Cauchy - Population, die Probe Mittelwert einer Probe von Beobachtungen ist nicht besser zum Abschätzen der Mitte als nur eine Beobachtung. Im Gegensatz dazu konvergiert der konsistente Stichprobenmedian gegen sodass größere Stichproben bessere Schätzungen liefern.n=10000 η η,
quelle
Ein wirklich einfaches Beispiel dafür, warum es wichtig ist, an Konsistenz zu denken, die meines Erachtens nicht genügend Beachtung findet, ist das eines übermäßig vereinfachten Modells.
Nehmen wir als theoretisches Beispiel an, Sie möchten ein lineares Regressionsmodell auf einige Daten anwenden, bei denen die tatsächlichen Effekte nicht linear waren. Dann können Ihre Vorhersagen nicht für alle Kombinationen von Kovariaten für den wahren Mittelwert konsistent sein, während dies für einen flexibleren möglich ist. Mit anderen Worten, das vereinfachte Modell weist Mängel auf, die durch die Verwendung weiterer Daten nicht behoben werden können.
quelle
@BruceET hat bereits eine hervorragende technische Antwort gegeben, aber ich möchte noch einen Punkt zur Interpretation hinzufügen.
Ein grundlegendes Konzept in der Statistik ist, dass wir mit zunehmender Stichprobengröße genauere Schlussfolgerungen über unsere zugrunde liegende Verteilung ziehen können. Sie können sich das so vorstellen, dass durch das Entnehmen vieler Samples der zufällige Jitter in den Daten beseitigt wird, sodass wir eine bessere Vorstellung von der zugrunde liegenden Struktur erhalten.
Damit ein Schätzer konsistent ist, muss er auch diese Regel einhalten: Da es seine Aufgabe ist, einen unbekannten Parameter zu schätzen, möchten wir, dass er zu diesem Parameter als Stichprobe konvergiert (lesen: diesen Parameter willkürlich gut schätzen ) Größe neigt zur Unendlichkeit.
Die gleichung
quelle