Ich habe erfahren, dass eine Statistik ein Attribut ist, das Sie aus Stichproben erhalten können. Wenn Sie viele Stichproben gleicher Größe nehmen, dieses Attribut für alle berechnen und das PDF-Dokument zeichnen, erhalten Sie die Verteilung des entsprechenden Attributs oder die Verteilung der entsprechenden Statistiken.
Ich habe auch gehört, dass Statistiken als Schätzer dienen. Worin unterscheiden sich diese beiden Konzepte?
Antworten:
Definition
Aus Wikipedia:
Und
Der wichtige Unterschied ist:
(Was "Menge" bedeutet, siehe Abschnitt unten.)
Eine Statistik ist kein Schätzer
Ein Schätzer ist eine Statistik, der etwas hinzugefügt wurde. Um aus einer Statistik einen Schätzer zu machen, geben Sie einfach an, welche Zielmenge Sie schätzen möchten. Dies ist verwirrend, da Sie der Statistik nichts "Reales" hinzufügen, sondern nur eine Absicht.
Um zu sehen, dass der Unterschied wichtig ist, müssen Sie erkennen, dass Sie die Eigenschaften eines Schätzers (z. B. Bias , Varianz usw.) für eine bloße Statistik nicht berechnen können . Zur Berechnung Bias haben Sie die Differenz zwischen dem Wert Ihrer Statistik , Sie zu finden und den wahren Wert verleiht. Nur ein Schätzer kommt mit einem "wahren Wert", der die Berechnung eines Bias ermöglicht. Eine Statistik ist lediglich eine Funktion der Daten und weder richtig noch falsch.
Unterschiedliche Schätzer basierend auf derselben Statistik
Sie können unterschiedliche Zielmengen für dieselbe Statistik buchstabieren, was zu unterschiedlichen Schätzern führt. Jeder solche Schätzer hat seine eigene Tendenz, obwohl sie alle (basierend auf) dem gleichen Wert und der gleichen Statistik sind.
Die Aussage "Stichprobenmittelwert ist unvoreingenommen" ist also nicht sinnvoll. Der Stichprobenmittelwert ist unbefangen, wenn Sie ihn zur Schätzung des Verteilungsmittelwerts verwenden. Gleichzeitig ist es jedoch voreingenommen, wenn es zum Schätzen der Verteilungsvarianz verwendet wird.
Verteilungsmengen und Probenmengen
Hier bezieht sich die Menge auf eine Eigenschaft der Verteilung, die normalerweise unbekannt ist und daher geschätzt werden muss. Dies steht im Gegensatz zu einer Statistik , die eine Eigenschaft einer Stichprobe ist, z. B. ist das Verteilungsmittel eine Größe Ihrer Verteilung, während das Stichprobenmittel eine Statistik ist (eine Größe Ihrer Stichprobe).
quelle
Dieser Thread ist ein bisschen alt, aber es scheint, dass Wikipedia seine Definition geändert hat, und wenn er korrekt ist, erklärt er es mir deutlicher:
Eine Statistik bezieht sich also auf die Daten selbst und eine Berechnung mit diesen Daten. Während ein Schätzer auf einen Parameter in einem Modell verweist.
Wenn ich es richtig verstehe, ist der Mittelwert eine Statistik und kann auch ein Schätzer sein. Der Mittelwert einer Stichprobe ist eine Statistik (Summe der Stichprobe geteilt durch die Stichprobengröße). Der Mittelwert einer Stichprobe ist auch ein Schätzer für den Mittelwert der Grundgesamtheit, vorausgesetzt, er ist normal verteilt.
Ich würde @whuber und andere, die dieses Zeug wirklich kennen, fragen, ob das (neue?) Wikipedia-Zitat korrekt ist.
quelle
Da andere Antworten, die besagen, dass sie gleich sind, keinen maßgeblichen Hinweis geben, möchte ich Ihnen zwei Zitate aus dem Handbuch für statistische Folgerungen von Casella und Berger geben:
und
Ich sage hier nicht , dass dies die endgültige Antwort auf die Frage ist, da ich mit den beiden am häufigsten gestellten Antworten, die darauf hindeuten, dass es einen Unterschied gibt, einverstanden zu sein scheint klarer Fall.
quelle
"6" ist ein Beispiel eines Schätzers. Angenommen, Ihre Frage lautete: "Was ist die Steigung der besten linearen Funktionszuordnung von x zu y?" Ihre Antwort könnte "6" sein. Oder es könnte . Beide sind Schätzer. Welches besser ist, bleibt Ihnen überlassen.(X′X)−1X′Y
Ein wirklich guter TA hat mir einmal das Konzept eines Schätzers so erklärt.
Grundsätzlich ist ein Schätzer eine Sache, die Sie auf Daten anwenden, um eine Größe zu erhalten, deren Wert Sie nicht kennen. Sie kennen den Wert einer Statistik - sie ist eine Funktion der Daten, über die es kein "Bestes" oder "Optimum" gibt. Es gibt keinen "besten" Mittelwert. Es gibt nur einen Mittelwert.
Angenommen, Sie haben einen Datensatz über die Anzahl der Ziegen pro Person und das Glück jeder Person. Sie interessieren sich dafür, wie sich das Glück der Menschen mit der Anzahl der Ziegen ändert, die sie besitzen. Ein Schätzer kann Ihnen helfen, diese Beziehung anhand Ihrer Daten abzuschätzen. Statistiken sind nur Funktionen der Daten, die Sie haben. Zum Beispiel kann die Varianz des Ziegenbesitzes gleich 7 sein. Die Formel zur Berechnung der Varianz wäre zwischen Ziegen und Toastern identisch, oder ob Sie an Glück oder Krebserkrankungen interessiert sind. In diesem Sinne sind alle vernünftigen Schätzer Statistiken.
quelle
Interessante Frage. Schätzer und Statistiken müssen jedoch nicht unterschiedlich sein. Sie sind unterschiedliche Konzepte.
Eine Statistik ist eine Funktion (im Allgemeinen), in der die Eingabe (statistische) Daten enthält. Der Effekt ist, dass Sie aus dieser Statistik ein Ergebnis erhalten, normalerweise eine Zahl. In einem abstrakteren Begriff kann eine Statistik mehr als eine Zahl ergeben. Die Statistik hängt von den Daten ab, das Verfahren ist jedoch deterministisch. Die Statistik könnte also lauten: "Alle Zahlen summieren und durch die Zählung dividieren" oder im weiteren Sinne "die BIP-Daten nehmen und einen Bericht darüber erstellen".
Im statistischen Sinne handelt es sich natürlich um eine mathematische Funktion als Statistik.
Dies hat die Bedeutung, dass Sie, wenn Sie die Eigenschaften der von Ihnen eingegebenen Daten kennen (z. B. eine Zufallsvariable), die Eigenschaften Ihrer Statistik berechnen können, ohne tatsächlich empirische Daten einzugeben.
Schätzer sind Schätzer, weil Sie beabsichtigen, eine Immobilie zu schätzen. Wie sich herausstellt, sind einige Statistiken gute Schätzer.
Wenn Sie beispielsweise Datenpunkte aus einem Pool von iid-Variablen ziehen, ist das arithmetische Mittel - eine Statistik, die auf den von Ihnen gezogenen Daten basiert - wahrscheinlich ein guter Schätzer für den erwarteten Wert dieser Verteilung. Aber alles, was eine Schätzung hervorbringt, ist ein Schätzer.
In der Praxis sind die von Ihnen verwendeten Schätzer Statistiken, aber es gibt Statistiken, die keine Schätzer sind. Zum Beispiel Teststatistik - obwohl man sich über die Semantik dieser Aussage streiten und die Sache noch verschlimmern kann, kann eine Teststatistik nicht nur Schätzer sein, sondern auch solche enthalten. Obwohl dies konzeptionell nicht der Fall sein muss.
Und natürlich kann man Schätzer haben, die keine Statistiken sind, obwohl sie wahrscheinlich nicht sehr gut schätzen können.
quelle
Ich denke, ein besseres Verständnis darüber, was eine Probe ist, hilft.
[Aktualisiert: Sample ist ein sehr umfassendes Konzept, ich sprach von "der Zufallsstichprobe". Ich weiß nicht, ob ein Schätzer Sinn macht oder nicht, wenn die Stichprobe nicht zufällig ist .]
aus Wikipedia :
Wir ersetzen die Stichprobe im Schätzer durch den Wert der Stichprobe. Wir erhalten einen Schätzerwert, dies ist ein spezifisches Maß. Und diese spezifische Kennzahl ist eine Statistik.
(Überprüfen Sie diesen Link für die Definition eines Schätzers, der letzte Satz zeigt, warum wir immer verwirrt sind.)
quelle
Das Ziel dieser Schrift:
Ich möchte Ihnen hier die Ähnlichkeiten und Unterschiede zwischen den beiden eng verwandten Konzepten "Statistik" und "Schätzer" erläutern. Ich möchte jedoch nicht auf die Unterschiede zwischen einem Parameter und einer Statistik eingehen, von denen ich annehme, dass sie für jeden klar genug sind, der mit den Unterschieden zwischen einer Statistik und einem Schätzer zu kämpfen hat. Wenn dies bei Ihnen nicht der Fall ist, müssen Sie zuerst frühere Beiträge studieren und dann mit dem Studium dieses Beitrags beginnen.
Beziehung:
Grundsätzlich wird jede reelle Funktion beobachtbarer Zufallsvariablen in einer Stichprobe als Statistik bezeichnet. Es gibt Statistiken, die bei gutem Design und guten Eigenschaften (z. B. Konsistenz, ...) die Parameter der zugrunde liegenden Verteilung der Population schätzen lassen. Daher sind Statistiken eine große Menge, und Schätzer sind eine Teilmenge der Statistik. Daher ist jeder Schätzer eine Statistik, aber nicht jede Statistik ist ein Schätzer.
Ähnlichkeiten:
Apropos Ähnlichkeiten, wie bereits erwähnt, sind beide Funktionen von Zufallsvariablen. Außerdem haben beide Verteilungen die Bezeichnung "Stichprobenverteilungen".
Unterschiede:
Apropos Unterschiede, sie unterscheiden sich in ihren Zielen und Aufgaben. Die Ziele und Aufgaben einer Statistik könnten darin bestehen, die Informationen in einer Stichprobe zusammenzufassen (unter Verwendung ausreichender Statistiken) und manchmal einen Hypothesentest usw. durchzuführen. Im Gegensatz dazu besteht das Hauptziel und die Hauptaufgabe eines Schätzers darin, wie der Name schon sagt, zu schätzen die Parameter der untersuchten Bevölkerung. Es ist wichtig zu erwähnen, dass es eine Vielzahl von Schätzern gibt, von denen jeder seine eigene Rechenlogik hat, wie z. B. MOMEs, MLEs, OLS-Schätzer und so weiter. Ein weiterer Unterschied zwischen diesen beiden Konzepten liegt in den gewünschten Eigenschaften. Während eine der am meisten gewünschten Eigenschaften einer Statistik "Suffizienz" ist, sind die gewünschten Eigenschaften eines Schätzers Dinge wie "Konsistenz", "Unparteilichkeit", "Präzision" usw.
Vorsicht:
Daher müssen Sie beim Umgang mit Statistiken und Schätzern auf die korrekte Verwendung der Terminologie achten. Zum Beispiel ist es wenig sinnvoll, über die Voreingenommenheit einer bloßen Statistik zu sprechen, die keineswegs ein Schätzer ist, da in einem solchen Kontext kein Parameter beteiligt ist, um die Voreingenommenheit berechnen zu können, und Rede darüber. Daher müssen Sie mit der Terminologie vorsichtig sein!
Das Fazit:
Zusammenfassend ist jede Funktion beobachtbarer Zufallsvariablen in einer Stichprobe eine Statistik. Wenn eine Statistik in der Lage ist, einen Parameter einer Population zu schätzen, nennen wir ihn einen Schätzer (des interessierenden Parameters). Es gibt jedoch einige Statistiken, die nicht zur Schätzung von Parametern dienen. Diese Statistiken sind also keine Schätzer, und hier nennen wir sie "bloße Statistiken".
Was ich oben angeboten habe, ist die Art und Weise, wie ich diese beiden Konzepte betrachte und denke, und ich habe mein Bestes gegeben, um es in einfachen Worten auszudrücken. Ich hoffe, es hilft!
quelle
Neue Antwort auf ein altes Q:
Definition 1. Eine Statistik ist eine Funktion, die jede Stichprobe einer reellen Zahl zuordnet.
Jeder Schätzer ist eine Statistik.
Wir neigen jedoch dazu, nur die Statistiken, die zur Erstellung von Schätzungen ("Vermutungen") verwendet werden, als Schätzer zu bezeichnen.
So sind beispielsweise die t-Statistik und der Stichprobenmittelwert BEIDE Statistiken. Der Stichprobenmittelwert ist auch ein Schätzer (da wir ihn häufig verwenden, um den wahren Populationsmittelwert zu schätzen).
Im Gegensatz dazu bezeichnen wir die t-Statistik selten / nie als Schätzer, da wir sie selten / nie zum Schätzen von Parametern verwenden.
quelle
Beim Testen von Hypothesen :
Bei einer Teststatistik geht es um das Testen von Hypothesen. Eine Teststatistik ist eine Zufallsvariable unter der Nullhypothese. Einige nennen nun eine Statistik den Wert / das Maß der Teststatistik bei gegebener Stichprobe.
Mit diesen beiden können Sie den p-Wert erhalten, der ein Maß ist, das dabei hilft, die Nullhypothese abzulehnen oder nicht abzulehnen. Alles in allem ist eine Statistik eine Schätzung, wie weit / nah Ihre Hypothese ist.
Dieser Link kann nützlich sein.
quelle