Dies ist die Definition für Statistik auf Wikipedia
Genauer gesagt definiert die statistische Theorie eine Statistik als Funktion einer Stichprobe, wobei die Funktion selbst unabhängig von der Verteilung der Stichprobe ist. Das heißt, die Funktion kann vor der Realisierung der Daten angegeben werden. Der Begriff Statistik wird sowohl für die Funktion als auch für den Wert der Funktion für eine bestimmte Stichprobe verwendet.
Ich glaube, ich verstehe den größten Teil dieser Definition, aber den Teil, in dem die Funktion unabhängig von der Verteilung des Samples ist, konnte ich nicht aussortieren.
Mein bisheriges Verständnis von Statistik
Eine Stichprobe ist eine Reihe von Realisierungen einiger unabhängiger, identisch verteilter (iid) Zufallsvariablen mit der Verteilung F (10 Realisierungen eines Würfels mit 20 fairen Würfeln, 100 Realisierungen von 5 Würfeln mit 6 fairen Würfeln, zufällig 100 Personen aus einer Bevölkerung ziehen).
Eine Funktion, deren Domäne diese Menge ist und deren Bereich die reellen Zahlen sind (oder die möglicherweise andere Dinge erzeugen kann, wie z. B. einen Vektor oder ein anderes mathematisches Objekt ...), wird als Statistik betrachtet .
Wenn ich an Beispiele denke, sind Mittelwert, Median und Varianz in diesem Zusammenhang sinnvoll. Sie sind eine Funktion auf der Grundlage von Erkenntnissen (Blutdruckmessungen aus einer Zufallsstichprobe). Ich kann auch sehen, wie ein lineares Regressionsmodell als Statistik betrachtet werden kann. - ist dies nicht nur eine Funktion auf einer Reihe von Realisierungen?
Wo ich verwirrt bin
Unter der Annahme, dass mein Verständnis von oben richtig ist, konnte ich nicht verstehen, wo eine Funktion möglicherweise nicht unabhängig von der Verteilung des Samples ist. Ich habe versucht, ein Beispiel zu finden, um es zu verstehen, aber kein Glück. Jede Einsicht wäre sehr dankbar!
quelle
Ich interpretiere das so, dass Sie entscheiden sollten, bevor Sie die Daten sehen, welche Statistik Sie berechnen werden. Wenn Sie beispielsweise Ausreißer ausschließen möchten, sollten Sie entscheiden, bevor Sie die Daten sehen, was einen "Ausreißer" ausmacht. Wenn Sie sich entscheiden, nachdem Sie die Daten angezeigt haben, ist Ihre Funktion von den Daten abhängig.
quelle