Gibt es einen Unterschied zwischen den Ausdrücken "Prüfung der Hypothese" und "Prüfung der Signifikanz" oder sind sie gleich?
Nach einer ausführlichen Antwort von Michael Lew, habe ich eine Verwirrung, dass heutzutage Hypothesen (z. B. t-Test, um Mittelwert zu testen) entweder Beispiele für "Signifikanztests" oder "Hypothesentests" sind. Oder ist es eine Kombination aus beidem? Wie würden Sie sie anhand eines einfachen Beispiels unterscheiden?
hypothesis-testing
statistical-significance
Liebesstatistiken
quelle
quelle
Antworten:
Signifikanztests wurden von Fisher entwickelt, und Hypothesentests wurden von Neyman und Pearson entwickelt, um Signifikanztests zu ersetzen. Sie sind nicht gleich und in einem Ausmaß miteinander unvereinbar, das die meisten Benutzer von Nullhypothesentests überraschen würde.
Fischers Signifikanztests ergeben einen p-Wert, der angibt, wie extrem die Beobachtungen unter der Nullhypothese sind. Dieser p-Wert ist ein Beweisindex gegen die Nullhypothese und das Signifikanzniveau.
Die Hypothesentests von Neyman und Pearson stellen sowohl eine Nullhypothese als auch eine Alternativhypothese auf und dienen als Entscheidungsregel für die Annahme der Nullhypothese. Kurz gesagt (es gibt mehr, als ich hier sagen kann), wählen Sie eine akzeptable Rate falsch positiver Schlussfolgerungen, Alpha (normalerweise 0,05), und akzeptieren oder lehnen Sie die Null ab, je nachdem, ob der p-Wert über oder unter Alpha liegt. Sie müssen sich an die Entscheidung des statistischen Tests halten, wenn Sie sich vor falsch positiven Fehlern schützen möchten.
Mit dem Fisher-Ansatz können Sie bei der Interpretation des Ergebnisses alles berücksichtigen, was Sie möchten. Beispielsweise können bereits vorhandene Belege bei der Interpretation und Präsentation des Ergebnisses informell berücksichtigt werden. Im NP-Ansatz ist dies nur in der experimentellen Entwurfsphase möglich und scheint selten zu geschehen. Meiner Meinung nach ist der Fisher-Ansatz für die grundlegende biowissenschaftliche Arbeit nützlicher als der NP-Ansatz.
Es gibt eine umfangreiche Literatur über Inkonsistenzen zwischen Signifikanztests und Hypothesentests und über die unglückliche Hybridisierung der beiden. Sie könnten mit diesem Artikel beginnen: Goodman, Hin zu evidenzbasierter medizinischer Statistik. 1: Der P-Wert-Irrtum. http://www.ncbi.nlm.nih.gov/sites/entrez?Db=pubmed&Cmd=ShowDetailView&TermToSearch=10383371
quelle
In vielen Fällen bedeuten diese beiden Aussagen dasselbe. Sie können aber auch ganz anders sein.
Das Testen einer Hypothese besteht darin, zuerst zu sagen, was Ihrer Meinung nach mit einem Phänomen passieren wird, dann eine Art Test für dieses Phänomen zu entwickeln und dann zu bestimmen, ob das Phänomen tatsächlich aufgetreten ist oder nicht. In vielen Fällen muss zum Testen einer Hypothese kein statistischer Test durchgeführt werden. Ich werde von dem Physiker Ernest Rutherford an dieses Zitat erinnert - Wenn Ihr Experiment Statistiken benötigt, sollten Sie ein besseres Experiment durchgeführt haben. Abgesehen davon verwendet das Testen von Hypothesen normalerweise eine Art statistisches Werkzeug.
Signifikanztests sind dagegen ein rein statistisches Konzept. Im Wesentlichen hat man zwei Hypothesen - die Nullhypothese, die besagt, dass es keinen Unterschied zwischen Ihren zwei (oder mehr) Datensammlungen gibt. Die alternative Hypothese ist, dass es einen Unterschied zwischen Ihren beiden Proben gibt, der nicht zufällig auftrat.
Basierend auf dem Design Ihrer Studie vergleichen Sie dann die zwei (oder mehr) Stichproben mit einem statistischen Test, der Ihnen eine Zahl gibt, die Sie dann mit einer Referenzverteilung (wie der Normal-, T- oder F-Verteilung) vergleichen und wenn Wenn diese Teststatistik einen kritischen Wert überschreitet, lehnen Sie die Nullhypothese ab und schließen daraus, dass zwischen den zwei (oder mehr) Stichproben ein Unterschied besteht. Dieses Kriterium ist normalerweise, dass die Wahrscheinlichkeit, dass der Unterschied zufällig auftritt, kleiner als eins zu zwanzig ist (p <0,05), obwohl manchmal andere verwendet werden.
quelle