Was ist der intuitive Sinn hinter dem Zweck und der Mechanik ausreichender Statistiken?

9

Die Definition einer ausreichenden Statistik lautet: Sei eine Zufallsstichprobe aus einer Verteilung, die durch einen Parameter indiziert ist . Sei eine Statistik. Angenommen, für jedes und jeden möglichen Wert von hängt die bedingte gemeinsame Verteilung von , dass nur von , nicht aber von abhängt . Dann ist eine ausreichende Statistik für den Parameter .X1,...,XnθTθtTX1,...,XnT=ttθTθ

Ich habe das Gefühl, dass ich einige Teile des Puzzles (wie den Faktorisierungssatz) kenne, um ausreichende Statistiken zu verstehen, aber die Gesamttheorie nicht auf den Punkt gebracht habe.

Meine Hauptfragen sind:

1) Warum sagen sie, dass eine ausreichende Statistik für den Parameter ? Wenn das Populationsmittel einer Normalverteilung wäre, sagen wir , bedeutet dies, dass wir immer dann die Wahrscheinlichkeit finden möchten, dass beispielsweise auf eine bestimmte Weise auftreten, die wir nicht benötigen der Wert des Mittelwerts der Bevölkerung?TθθμX1,...,Xn

2) Warum wollen wir im wirklichen Leben eine ausreichende Statistik verwenden? Scheint, dass nur die Berechnung der Statistik nicht so viel Arbeit bedeuten sollte (wie die Summe der X). Warum brauchen wir sie also?

Vielen Dank!

user123276
quelle

Antworten:

7
  1. Nein. Sie sagen, wenn eine weitere Zufallsstichprobe aus derselben Population wie die Originaldaten , enthält sie eine gleiche Menge probabilistischer Informationen über . Daher können wir "die Daten wiederherstellen", wenn wir beibehalten und verwerfen . Deshalb ist "ausreichend".X1,,XnX1,,XnθTX1,,XnT

  2. Datenreduzierung. Wenn ausreicht, ist die von "zusätzliche Information" wertlos, solange betroffen ist. Es ist dann nur natürlich, Inferenzverfahren zu berücksichtigen, die diese zusätzlichen irrelevanten Informationen nicht verwenden. Dies führt zum Erfolgsprinzip: Jedes Inferenzverfahren sollte nur durch ausreichende Statistiken von den Daten abhängen.TXθ

Sehen Sie hier für weitere Einzelheiten über Grundsätze in Datenreduktion beteiligt.

Winterschlaf
quelle