Warum sagt dieser Auszug, dass eine unvoreingenommene Schätzung der Standardabweichung normalerweise nicht relevant ist?

14

Ich habe über die Berechnung der unverzerrten Schätzung der Standardabweichung und die von mir gelesene Quelle gelesen

(...) Außer in einigen wichtigen Situationen ist die Aufgabe für die Anwendung der Statistik von geringer Bedeutung, da ihre Notwendigkeit durch Standardverfahren wie Signifikanztests und Konfidenzintervalle oder durch die Verwendung der Bayes'schen Analyse vermieden wird.

Ich habe mich gefragt, ob jemand die Gründe für diese Aussage erläutern kann. Verwendet das Konfidenzintervall beispielsweise nicht die Standardabweichung als Teil der Berechnung? Würde eine voreingenommene Standardabweichung die Konfidenzintervalle nicht beeinflussen?

BEARBEITEN:

Vielen Dank für die bisherigen Antworten, aber ich bin mir nicht sicher, ob ich einige der Gründe für sie befolge. Deshalb füge ich ein sehr einfaches Beispiel hinzu. Der Punkt ist, dass, wenn die Quelle korrekt ist, von meiner Schlussfolgerung bis zum Beispiel etwas nicht stimmt und ich möchte, dass jemand darauf hinweist, wie der p-Wert nicht von der Standardabweichung abhängt.

Angenommen, ein Forscher wollte testen, ob die durchschnittliche Punktzahl von Fünftklässlern bei einem Test in seiner Stadt vom nationalen Mittelwert von 76 mit einem Signifikanzniveau von 0,05 abweicht. Der Forscher befragte zufällig die Ergebnisse von 20 Studenten. Der Probenmittelwert betrug 80,85 mit einer Probenstandardabweichung von 8,87. Dies bedeutet: t = (80,85-76) / (8,87 / sqrt (20)) = 2,44. Eine t-Tabelle wird dann verwendet, um zu berechnen, dass der zweiseitige Wahrscheinlichkeitswert von at von 2,44 mit 19 df 0,025 beträgt. Dies liegt unter unserem Signifikanzniveau von 0,05, daher lehnen wir die Nullhypothese ab.

Würde sich in diesem Beispiel der p-Wert (und möglicherweise Ihre Schlussfolgerung) nicht ändern, je nachdem, wie Sie die Standardabweichung Ihrer Stichprobe geschätzt haben?

BYS2
quelle
2
Das erscheint aus dem von Ihnen angegebenen Grund seltsam. Vielleicht könnten Sie uns den Absatz auch vorher geben, falls etwas fehlt? Eine Sache, die die Verzerrung nicht zu einer großen Sache macht, ist, dass sie mit zunehmender Stichprobengröße ziemlich unwichtig wird und im Vergleich zu allen anderen Problemen, z. B. Modellfehlspezifikationen, die wir normalerweise haben, wahrscheinlich nicht wesentlich ist in Ihrer Quelle angegeben.
Peter Ellis
1
@PeterEllis, das ist eigentlich von der Wikipedia-Seite über "unvoreingenommene Schätzung der Standardabweichung" ( en.wikipedia.org/wiki/Unbiased_estimation_of_standard_deviation ).
BYS2

Antworten:

17

Da stimme ich Glen_b zu. Vielleicht kann ich ein paar Worte hinzufügen, um den Punkt noch klarer zu machen. Wenn Daten aus einer Normalverteilung (iid-Situation) mit unbekannter Varianz stammen, ist die t-Statistik die zentrale Größe, die zur Erstellung von Konfidenzintervallen und zur Durchführung von Hypothesentests verwendet wird. Das einzige, was für diese Folgerung von Bedeutung ist, ist die Verteilung unter der Nullhypothese (zur Bestimmung des kritischen Werts) und unter der Alternative (zur Bestimmung von Leistung und Stichprobe). Dies sind die zentralen und nicht zentralen t-Verteilungen. Betrachtet man nun für einen Moment das Problem einer Stichprobe, so hat der t-Test sogar optimale Eigenschaften als Test für den Mittelwert einer Normalverteilung. Nun ist die Stichprobenvarianz ein unverzerrter Schätzer der Populationsvarianz, aber ihre Quadratwurzel ist ein BIASED-Schätzer der Populationsstandardabweichung. Tut es nicht' Dabei spielt es keine Rolle, dass dieser BIASED-Schätzer den Nenner der Schlüsselgröße angibt. Jetzt spielt es eine Rolle, da es ein konsistenter Schätzer ist. Das ist es, was es der t-Verteilung ermöglicht, sich dem Standardnormal anzunähern, wenn die Stichprobengröße gegen unendlich geht. Aber voreingenommen für irgendetwas Festes beeinflusst die guten Eigenschaften des Tests nicht.n

Meiner Meinung nach wird Unparteilichkeit in einführenden Statistikklassen überbetont. Genauigkeit und Konsistenz der Schätzer sind die wirklichen Eigenschaften, die hervorgehoben werden müssen.

Bei anderen Problemen, bei denen parametrische oder nichtparametrische Methoden angewendet werden, wird die Standardabweichung nicht einmal geschätzt.

Michael R. Chernick
quelle
7
Es hängt von der Schätzung ab, aber es gibt nur eine Schätzung, für die das t mit 19 Freiheitsgraden gilt, und diese Schätzung ist die Quadratwurzel der üblichen Schätzung der Stichprobenvarianz. Wenn Sie eine andere Schätzung der Standardabweichung verwenden, haben Sie eine andere Referenzverteilung für die Teststatistik unter der Nullhypothese. Es ist nicht das t.
Michael R. Chernick
2
@ BYS2: Beachten Sie, dass sich in Bezug auf das in dem von Ihnen angegebenen Beispiel erstellte Intervall nichts ändert, wenn Sie die Standardabweichung der Stichprobe mit einem Skalierungsfaktor multiplizieren (z. B. um sie unverzerrt zu machen). Die Verteilung der Teststatistik würde sich in diesem Fall (geringfügig) ändern, aber das konstruierte CI würde genau gleich sein! Wenn Sie nun eine "Korrektur" vornehmen würden, die von den Daten selbst abhängt, würde dies (im Allgemeinen) zu etwas anderem führen. Siehe meinen Kommentar unter Glen's Antwort.
Kardinal
4
@ BYS2: Im normalen Modellfall mit der Statistik besteht eine gute Übereinstimmung zwischen CIs und p- Wert. Der p- Wert ändert sich also nicht, wenn Sie die Standardabweichung der Stichprobe um eine bekannte Konstante "neu skalieren". Zum Beispiel: Es sei ~ T b = ( ˉ X - μ ) / ( b & sgr; ) = T / b für festen b > 0 . Dann P ( ~ T b > u ) = P (tppT~b=(X¯μ)/(bσ^)=T/bb>0 und damit der kritische Wert ˜ t b , α = b t α , dh es besteht eine Eins-zu-Eins-Entsprechung zwischen ihnen. Ist das sinnvoll?
P(T~b>u)=P(T>bu)
t~b,α=btα
Kardinal
1
Nein, worauf Cardinal korrekt hinweist, ist, dass es möglich ist, die t-Statistik mit einer Konstante zu multiplizieren, um im Wesentlichen eine andere Schätzung der Standardabweichung zu verwenden. Die Teststatistik hat nicht mehr die t-Verteilung. Es ist eine etwas andere Verteilung wegen der Konstanten. Der Mittelwert ändert sich um den Faktor b, ebenso die Standardabweichung. Wenn Sie den kritischen Wert für die Teststatistik berechnen, ändert sich dieser entsprechend, wie oben gezeigt.
Michael R. Chernick
1
@ BYS2 Ja das stimmt.
Michael R. Chernick
5

Betrachten Sie ein Intervall, das auf der Grundlage einer zentralen Größe wie einer t-Statistik berechnet wird. Der Mittelwert des Schätzers für die Standardabweichung kommt nicht wirklich zum Tragen - das Intervall basiert auf der Verteilung der Statistik. Insofern ist die Aussage richtig.

Glen_b - Setzen Sie Monica wieder ein
quelle
1
Ja, aber hängt die Verteilung der Statistik nicht von der Standardabweichung ab, die in den meisten Fällen unbekannt ist, sodass Sie einen Schätzer verwenden müssen.
BYS2
4
(+1) Glen. Zu @ BYS2: Hier gibt es ein paar wichtige Punkte. Erstens, wenn wir eine zentrale Größe zur Hand haben, bietet sie ein sehr bequemes Mittel zum Erstellen von Konfidenzmengen, aber sie existieren nicht oft. Der springende Punkt einer zentralen Größe ist, dass die Verteilung nur von bekannten Größen abhängt . Zweitens ist die zentrale Größe eng mit dem zugrunde liegenden Modell verknüpft. Wenn die Daten vom angenommenen Modell abweichen, ist möglicherweise auch die Verteilung der Teststatistik und ihre Charakterisierung als zentrale Größe nicht ganz so relevant. :)
Kardinal
4

Interpretation ist immer Teilspekulation, aber ich denke, die implizite Bedeutung ist, dass Sie oft das gewünschte Ergebnis erzielen können, ohne die Standardabweichung explizit abzuschätzen. Mit anderen Worten, ich denke, der Autor bezieht sich auf Situationen, in denen Sie keine Schätzung der Standardabweichung anstelle einer voreingenommenen Schätzung verwenden würden.

Wenn Sie beispielsweise eine Schätzung der gesamten Verteilung einer Statistik erstellen können, können Sie Konfidenzintervalle berechnen, ohne die Standardabweichung zu verwenden. Tatsächlich reicht für viele (nicht normale) Verteilungen die Standardabweichung selbst (und der Mittelwert) nicht aus, um eine Schätzung des Konfidenzintervalls zu berechnen. In anderen Fällen, z. B. bei einem Vorzeichentest , benötigen Sie auch keine Schätzung für die Standardabweichung.

(Natürlich ist es nicht trivial, eine unvoreingenommene Schätzung einer vollständigen Verteilung zu erstellen, und in der Bayes'schen Statistik ist es tatsächlich durchaus üblich, Bias explizit durch den Prior einzuführen.)

MLS
quelle
1
Es könnte interessant sein, etwas ausführlicher auf das einzugehen, was Sie mit dem letzten Absatz gemeint haben. Wenn ich zum Beispiel aus der Verteilung der vorliegenden Statistik eine Stichprobe machen kann, bietet die empirische cdf ein sehr einfaches Mittel, um eine punktuell unverzerrte Schätzung der Verteilungsfunktion zu generieren. :)
Kardinal
1
maxiXimaxiXiXi
1
XiimaxiXi
2
Dies ist wahr und nahe an dem Punkt, den ich herauszuholen versuchte. Der erste Satz des letzten Absatzes bezieht sich auf die Konstruktion einer unverzerrten Schätzung einer nichtlinearen statistischen Funktion aus z. B. einer einzelnen Zufallsstichprobe. Dies unterscheidet sich erheblich von der Erstellung einer unverzerrten Schätzung einer vollständigen Verteilung aus einer Zufallsstichprobe der Funktion selbst. :-)
Kardinal