Ich lese Gelman & Carlin "Jenseits von Leistungsberechnungen: Bewertung von Fehlern vom Typ S (Vorzeichen) und Typ M (Größe)" (2014). Ich versuche, die Hauptidee, die Hauptidee, zu verstehen, aber ich bin verwirrt. Könnte mir jemand helfen, die Essenz zu destillieren?
Das Papier geht ungefähr so (wenn ich es richtig verstanden habe).
- Statistische Studien in der Psychologie werden oft von kleinen Stichproben geplagt.
- Abhängig von einem statistisch signifikanten Ergebnis in einer bestimmten Studie wird
(1) die wahre Effektgröße wahrscheinlich stark überschätzt und
(2) das Vorzeichen des Effekts kann mit hoher Wahrscheinlichkeit entgegengesetzt sein - es sei denn, die Stichprobengröße ist groß genug. - Das Obige wird unter Verwendung einer vorherigen Schätzung der Effektgröße in der Population gezeigt, und dieser Effekt wird typischerweise als gering angesehen.
Mein erstes Problem ist, warum Bedingung für das statistisch signifikante Ergebnis? Soll es die Publikationsbias widerspiegeln? Dies scheint jedoch nicht der Fall zu sein. Warum also?
Mein zweites Problem ist, wenn ich selbst eine Studie mache, sollte ich meine Ergebnisse anders behandeln als ich es gewohnt bin (ich mache frequentistische Statistiken, die mit Bayesian nicht sehr vertraut sind)? Zum Beispiel würde ich eine Datenprobe nehmen, ein Modell schätzen und eine Punktschätzung für einen interessierenden Effekt und ein damit verbundenes Vertrauen aufzeichnen. Soll ich jetzt meinem Ergebnis misstrauen? Oder sollte ich ihm misstrauen, wenn es statistisch signifikant ist? Wie ändert eine bestimmte vorherige Änderung das?
Was ist der wichtigste Aspekt (1) für einen "Produzenten" statistischer Forschung und (2) für einen Leser angewandter statistischer Arbeiten?
Verweise:
- Gelman, Andrew und John Carlin. "Jenseits von Leistungsberechnungen: Bewertung von Fehlern vom Typ S (Vorzeichen) und Typ M (Größe)." Perspectives on Psychological Science 9.6 (2014): 641-651.
PS Ich denke, das neue Element für mich ist die Aufnahme von Vorinformationen, deren Behandlung ich nicht sicher bin (aus dem frequentistischen Paradigma).
quelle
Antworten:
Ich habe die Zeitung noch einmal gelesen und diesmal scheint es viel klarer zu sein. Nun machen auch die hilfreichen Kommentare von @Glen_b und @amoeba viel Sinn.
Die gesamte Diskussion basiert auf dem Ausgangspunkt, dass ein statistisch signifikantes Ergebnis erzielt wurde. Bedingt durch das, wir haben die geschätzte Effekt Größe unterschiedlich verteilt , als es die Konditionierung nicht vorhanden sein Das Papier scheint auf zwei Probleme abzuzielen:
Die gute Nachricht ist, dass beide Probleme zufriedenstellend angegangen werden können.
Um meine eigenen zwei Fragen kurz zu beantworten:
quelle
Es gibt einen anderen Aspekt dieses Dokuments, der hilfreich sein kann, wenn Sie bereits eine Bayes'sche Analyse anwenden und sich nicht um den statistischen Signifikanzteil kümmern.
Sie müssen darauf achten, dass niemand diese "Potenz" -Metrik missbraucht, als wäre es dasselbe wie eine häufig verwendete Potenzberechnung, was ziemlich schwierig ist. Alle diese Metriken sind jedoch für die prospektive und retrospektive Entwurfsanalyse sehr nützlich, selbst wenn das gesamte Modellierungsverfahren Bayes'sch ist und sich nicht auf statistische Signifikanzergebnisse bezieht.
quelle