Ich bin kürzlich auf die Arbeit "The Insignificance of Null Hypothesis Significance Testing" von Jeff Gill (1999) gestoßen . Der Autor brachte einige häufige Missverständnisse in Bezug auf Hypothesentests und p-Werte auf, zu denen ich zwei spezifische Fragen habe:
- Der p-Wert ist technisch , die, wie erwähnt durch das Papier, in der Regel ist es uns nicht sagen nichts über P ( H 0 | o b s e r v a t i o n ), es sei denn, wir kennen zufällig die Grenzverteilungen, was beim "alltäglichen" Testen von Hypothesen selten der Fall ist. Wenn wir einen kleinen p-Wert erhalten und „lehnt die Nullhypothese“ , was genau die Wahrscheinlichkeitsrechnung ist , dass wir machen, da wir nichts sagen können ?
- Die zweite Frage bezieht sich auf eine bestimmte Aussage von Seite 6 (652) des Papiers:
Da der p-Wert oder der Bereich der durch Sterne angegebenen p-Werte nicht von vornherein festgelegt wird, handelt es sich nicht um die langfristige Wahrscheinlichkeit, einen Fehler vom Typ I zu machen, sondern wird in der Regel als solche behandelt.
Kann jemand erklären, was mit dieser Aussage gemeint ist?
hypothesis-testing
p-value
gung - Wiedereinsetzung von Monica
quelle
quelle
Antworten:
(Technisch gesehen ist der P-Wert die Wahrscheinlichkeit, Daten zu beobachten, die mindestens so extrem sind wie die tatsächlich beobachteten, wenn man die Nullhypothese zugrunde legt.)
Q1. Die Entscheidung, die Nullhypothese auf der Grundlage eines kleinen P-Werts abzulehnen, hängt in der Regel von der „Fisher-Disjunktion“ ab: Entweder ist ein seltenes Ereignis eingetreten oder die Nullhypothese ist falsch. Tatsächlich ist es eher die Seltenheit des Ereignisses, die der P-Wert angibt, als die Wahrscheinlichkeit, dass die Null falsch ist.
Die Wahrscheinlichkeit, dass die Null falsch ist, kann aus den experimentellen Daten nur mit Hilfe des Bayes-Theorems ermittelt werden, das die Angabe der "vorherigen" Wahrscheinlichkeit der Nullhypothese erfordert (vermutlich das, was Gill als "Grenzverteilungen" bezeichnet).
Q2. Dieser Teil Ihrer Frage ist viel schwieriger als es scheint. In Bezug auf P-Werte und Fehlerraten herrscht große Verwirrung, und das ist vermutlich das, worauf sich Gill bezieht, "das aber typischerweise als solches behandelt wird". Die Kombination von Fisherian P-Werten mit Neyman-Pearsonian-Fehlerraten wurde als inkohärentes Mischmasch bezeichnet und ist leider sehr verbreitet. Keine kurze Antwort wird hier völlig ausreichen, aber ich kann Sie auf ein paar gute Artikel hinweisen (ja, einer gehört mir). Beides wird Ihnen helfen, das Gill-Papier zu verstehen.
Hurlbert, S. & Lombardi, C. (2009). Endgültiger Zusammenbruch des entscheidungswissenschaftlichen Rahmens von Neyman-Pearson und Aufstieg des NeoFisherian. Annales Zoologici Fennici, 46 (5), 311–349. (Link zum Artikel)
Lew, MJ (2012). Schlechte statistische Praxis in der Pharmakologie (und anderen biomedizinischen Grunddisziplinen): Sie kennen P. British Journal of Pharmacology, 166 (5), 1559–1567 wahrscheinlich nicht. doi: 10.1111 / j.1476-5381.2012.01931.x (Link zum Artikel)
quelle
"the small p-value indicates that the sample mean(or regression coefficient, etc) is significantly different from zero"
? Die Quelle der Verwirrung scheint zu sein, dass keine echte wahrscheinlichkeitstheoretische Behauptung auf die Nullhypothese erhoben wird, wenn wir sagen, dass die Null "abgelehnt" wird.+1 an @MichaelLew, der Ihnen eine gute Antwort gegeben hat. Vielleicht kann ich noch einen Beitrag leisten, indem ich über Q2 nachdenke. Betrachten Sie die folgende Situation:
quelle
...this fallacy shows up in statistics textbooks, as when Canavos and Miller (1999, p.255) stipulate: "If the null hypothesis is true, then a type I error occurs if (due to sampling error) the P-value is less than or equal to $alpha$"
Ich möchte einen Kommentar zum Thema "Die Bedeutungslosigkeit von Nullhypothesen-Signifikanztests" abgeben, der jedoch die Frage des OP nicht beantwortet.
quelle