Ausreichende Statistik, Besonderheiten / Intuitionsprobleme

16

Ich bringe mir zum Spaß ein paar Statistiken bei und bin verwirrt, was ausreichende Statistiken angeht . Ich schreibe meine Verwirrungen in Listenform auf:

  1. Wenn eine Distribution Parameter hat, hat sie dann ausreichende Statistiken?nnn

  2. Gibt es eine direkte Korrespondenz zwischen der ausreichenden Statistik und den Parametern? Oder dienen die ausreichenden Statistiken nur als "Informationspool", damit wir die Einstellung neu erstellen und die gleichen Schätzungen für die Parameter der zugrunde liegenden Verteilung berechnen können.

  3. Verfügen alle Distributionen über ausreichende Statistiken? dh Kann der Faktorisierungssatz jemals versagen?

  4. Anhand unserer Datenstichprobe gehen wir von einer Verteilung aus, aus der die Daten mit größter Wahrscheinlichkeit stammen, und können dann Schätzungen (z. B. die MLE) für die Parameter für die Verteilung berechnen. Ausreichende Statistiken sind eine Möglichkeit, die gleichen Schätzungen für die Parameter zu berechnen, ohne sich auf die Daten selbst verlassen zu müssen, oder?

  5. Verfügen alle ausreichenden Statistiken über eine ausreichende Mindeststatistik?

Dies ist das Material, mit dem ich versuche, das Thema zu verstehen: https://onlinecourses.science.psu.edu/stat414/node/283

Soweit ich weiß, haben wir einen Faktorisierungssatz, der die gemeinsame Verteilung in zwei Funktionen unterteilt, aber ich verstehe nicht, wie wir die ausreichende Statistik extrahieren können, nachdem wir die Verteilung in unsere Funktionen zerlegt haben.

  1. Die in diesem Beispiel angegebene Poisson-Frage hatte eine klare Faktorisierung, aber dann wurde festgestellt, dass die ausreichende Statistik der Stichprobenmittelwert und die Stichprobensumme waren. Woher wussten wir, dass dies die ausreichende Statistik ist, wenn wir uns nur die Form der ersten Gleichung ansehen?

  2. Wie ist es möglich, dieselben MLE-Schätzungen unter Verwendung ausreichender Statistiken durchzuführen, wenn die zweite Gleichung des Faktorisierungsergebnisses manchmal von den Datenwerten selbst abhängt ? Im Poisson-Fall zum Beispiel hing die zweite Funktion von der Umkehrung des Produkts der Fakultäten der Daten ab, und wir hätten die Daten nicht mehr!Xi

  3. Warum ist die Stichprobengröße im Vergleich zum Poisson-Beispiel auf der Webseite keine ausreichende Statistik ? Wir würden n benötigen, um bestimmte Teile der ersten Funktion zu rekonstruieren. Warum ist dies nicht auch eine ausreichende Statistik?nn

Kimchi
quelle
Nur eine kurze Klärungsfrage - aus welchem ​​"Winkel" kommen Sie in ausreichendem Maße? Maximale Wahrscheinlichkeit? Bayesian? Maximale Entropie? Stichprobentheorie? Etwas anderes?
Wahrscheinlichkeitsrechnung
Ich komme aus Sicht von MLE, sorry, wenn mein Beitrag nicht der beste war, ist es mein erster Beitrag in diesem Forum!
Kimchi

Antworten:

12

Sie würden wahrscheinlich davon profitieren, wenn Sie in einem Lehrbuch über theoretische Statistik lesen, in dem die meisten dieser Fragen ausführlich behandelt werden. Kurz ...

  1. (0,θ)θ(θ1,θ+1)

  2. Ich weiß nicht, was Sie unter "direkter Korrespondenz" verstehen. Die Alternative, die Sie angeben, scheint eine angemessene Methode zu sein, um ausreichende Statistiken zu beschreiben.

  3. Ja, trivialerweise reichen die Daten insgesamt aus. (Wenn Sie jemanden sagen hören, dass es keine ausreichende Statistik gibt, bedeutet dies, dass es keine niedrig dimensionierte gibt.)

  4. Ja, das ist die Idee. (Was übrig bleibt - die Verteilung der Daten, die von der ausreichenden Statistik abhängig ist - kann zur Überprüfung der Verteilungsannahme unabhängig von den unbekannten Parametern verwendet werden.)

  5. Anscheinend nicht, obwohl ich die Gegenbeispiele zusammenfasse, handelt es sich nicht um Verteilungen, die Sie wahrscheinlich in der Praxis verwenden möchten. [Es wäre schön, wenn jemand dies erklären könnte, ohne sich zu sehr mit der Maßtheorie zu befassen.]

Als Antwort auf die weiteren Fragen ...

  1. e-nλλxichλxichxichxichxich/n(xich)2

  2. 1x1!x2!xn!λλf(x;λ)

  3. n

xich

n N(xich,n)nθxich

Scortchi - Wiedereinsetzung von Monica
quelle
1
Ich würde gerne die Gegenbeispiele zu 5 sehen. Ich habe versucht, das Gegenteil für eine Weile mit Zorns Lemma zu beweisen, aber es bricht an einem Punkt zusammen. Aber von dem, was ich gesammelt habe, sollte das Gegenbeispiel wirklich verrückt sein. Haben Sie einen Bezugspunkt, an dem ich ihn finden könnte? Es macht mir nichts aus, dass es schwer ist, die Theorie zu messen.
sjm.majewski
@ sjm.majewski: Lehmann gibt Pitcher (1957), "Mengen von Maßnahmen, die keine notwendigen und ausreichenden Statistiken oder Unterfelder zulassen", Ann. Mathematik. Statist. , 28 , p267-268; und Landers & Rogge (1973). "Über Suffizienz und Invarianz", Ann. Statist. , 1 , p543-544.
Scortchi - Wiedereinsetzung von Monica