Ich habe über die Berechnung der unverzerrten Schätzung der Standardabweichung und die von mir gelesene Quelle gelesen
(...) Außer in einigen wichtigen Situationen ist die Aufgabe für die Anwendung der Statistik von geringer Bedeutung, da ihre Notwendigkeit durch Standardverfahren wie Signifikanztests und Konfidenzintervalle oder durch die Verwendung der Bayes'schen Analyse vermieden wird.
Ich habe mich gefragt, ob jemand die Gründe für diese Aussage erläutern kann. Verwendet das Konfidenzintervall beispielsweise nicht die Standardabweichung als Teil der Berechnung? Würde eine voreingenommene Standardabweichung die Konfidenzintervalle nicht beeinflussen?
BEARBEITEN:
Vielen Dank für die bisherigen Antworten, aber ich bin mir nicht sicher, ob ich einige der Gründe für sie befolge. Deshalb füge ich ein sehr einfaches Beispiel hinzu. Der Punkt ist, dass, wenn die Quelle korrekt ist, von meiner Schlussfolgerung bis zum Beispiel etwas nicht stimmt und ich möchte, dass jemand darauf hinweist, wie der p-Wert nicht von der Standardabweichung abhängt.
Angenommen, ein Forscher wollte testen, ob die durchschnittliche Punktzahl von Fünftklässlern bei einem Test in seiner Stadt vom nationalen Mittelwert von 76 mit einem Signifikanzniveau von 0,05 abweicht. Der Forscher befragte zufällig die Ergebnisse von 20 Studenten. Der Probenmittelwert betrug 80,85 mit einer Probenstandardabweichung von 8,87. Dies bedeutet: t = (80,85-76) / (8,87 / sqrt (20)) = 2,44. Eine t-Tabelle wird dann verwendet, um zu berechnen, dass der zweiseitige Wahrscheinlichkeitswert von at von 2,44 mit 19 df 0,025 beträgt. Dies liegt unter unserem Signifikanzniveau von 0,05, daher lehnen wir die Nullhypothese ab.
Würde sich in diesem Beispiel der p-Wert (und möglicherweise Ihre Schlussfolgerung) nicht ändern, je nachdem, wie Sie die Standardabweichung Ihrer Stichprobe geschätzt haben?
quelle
Antworten:
Da stimme ich Glen_b zu. Vielleicht kann ich ein paar Worte hinzufügen, um den Punkt noch klarer zu machen. Wenn Daten aus einer Normalverteilung (iid-Situation) mit unbekannter Varianz stammen, ist die t-Statistik die zentrale Größe, die zur Erstellung von Konfidenzintervallen und zur Durchführung von Hypothesentests verwendet wird. Das einzige, was für diese Folgerung von Bedeutung ist, ist die Verteilung unter der Nullhypothese (zur Bestimmung des kritischen Werts) und unter der Alternative (zur Bestimmung von Leistung und Stichprobe). Dies sind die zentralen und nicht zentralen t-Verteilungen. Betrachtet man nun für einen Moment das Problem einer Stichprobe, so hat der t-Test sogar optimale Eigenschaften als Test für den Mittelwert einer Normalverteilung. Nun ist die Stichprobenvarianz ein unverzerrter Schätzer der Populationsvarianz, aber ihre Quadratwurzel ist ein BIASED-Schätzer der Populationsstandardabweichung. Tut es nicht' Dabei spielt es keine Rolle, dass dieser BIASED-Schätzer den Nenner der Schlüsselgröße angibt. Jetzt spielt es eine Rolle, da es ein konsistenter Schätzer ist. Das ist es, was es der t-Verteilung ermöglicht, sich dem Standardnormal anzunähern, wenn die Stichprobengröße gegen unendlich geht. Aber voreingenommen für irgendetwas Festes beeinflusst die guten Eigenschaften des Tests nicht.n
Meiner Meinung nach wird Unparteilichkeit in einführenden Statistikklassen überbetont. Genauigkeit und Konsistenz der Schätzer sind die wirklichen Eigenschaften, die hervorgehoben werden müssen.
Bei anderen Problemen, bei denen parametrische oder nichtparametrische Methoden angewendet werden, wird die Standardabweichung nicht einmal geschätzt.
quelle
Betrachten Sie ein Intervall, das auf der Grundlage einer zentralen Größe wie einer t-Statistik berechnet wird. Der Mittelwert des Schätzers für die Standardabweichung kommt nicht wirklich zum Tragen - das Intervall basiert auf der Verteilung der Statistik. Insofern ist die Aussage richtig.
quelle
Interpretation ist immer Teilspekulation, aber ich denke, die implizite Bedeutung ist, dass Sie oft das gewünschte Ergebnis erzielen können, ohne die Standardabweichung explizit abzuschätzen. Mit anderen Worten, ich denke, der Autor bezieht sich auf Situationen, in denen Sie keine Schätzung der Standardabweichung anstelle einer voreingenommenen Schätzung verwenden würden.
Wenn Sie beispielsweise eine Schätzung der gesamten Verteilung einer Statistik erstellen können, können Sie Konfidenzintervalle berechnen, ohne die Standardabweichung zu verwenden. Tatsächlich reicht für viele (nicht normale) Verteilungen die Standardabweichung selbst (und der Mittelwert) nicht aus, um eine Schätzung des Konfidenzintervalls zu berechnen. In anderen Fällen, z. B. bei einem Vorzeichentest , benötigen Sie auch keine Schätzung für die Standardabweichung.
(Natürlich ist es nicht trivial, eine unvoreingenommene Schätzung einer vollständigen Verteilung zu erstellen, und in der Bayes'schen Statistik ist es tatsächlich durchaus üblich, Bias explizit durch den Prior einzuführen.)
quelle