Ist in der Bayes'schen Statistik eine Leistungsanalyse erforderlich?

19

Ich habe in letzter Zeit die Bayes'sche Sichtweise der klassischen Statistik untersucht. Nachdem ich über den Bayes-Faktor gelesen hatte, fragte ich mich, ob in dieser Statistikansicht eine Leistungsanalyse erforderlich ist. Mein Hauptgrund für diese Frage ist, dass der Bayes-Faktor offenbar nur ein Wahrscheinlichkeitsverhältnis ist. Sobald es 25: 1 ist, kann ich es wohl eine Nacht nennen.

Bin ich weit weg Kann ich sonst noch lesen, um mehr zu erfahren? Momentan lese ich dieses Buch: Introduction to Bayesian Statistics , von WM Bolstad (Wiley-Interscience; 2nd ed., 2007).

Justin Bozonier
quelle

Antworten:

10

Bei der Potenz handelt es sich um die langfristige Wahrscheinlichkeit von p <0,05 (Alpha) in zukünftigen Studien. In Bayes fließen die Beweise aus Studie A in die Prioritäten für Studie B usw. ein. Macht, wie sie in der frequentistischen Statistik definiert ist, gibt es daher nicht wirklich.

John
quelle
12
Eine weniger eingeschränkte Sicht der Macht sieht sie als Ausdruck der Risikokurve für eine 0-1-Verlustfunktion. Eine Bayes'sche Analyse integriert dieses Risiko über die vorherige Wahrscheinlichkeit. Gute Bayesianische Analysen berücksichtigen jedoch die Empfindlichkeit ihrer Ergebnisse gegenüber der Wahl der vorherigen Verteilung. Das scheint uns wieder in den Bereich der Machtanalyse zu versetzen. Obwohl es möglicherweise nicht unter diesem Namen geführt wird und anders berechnet wird, ist der Zweck derselbe: Es muss bestimmt werden, wie groß die zu beschaffende Stichprobe ist, um die Studienziele mit hinreichender Sicherheit zu erreichen.
Whuber
2
Das ist ein sehr guter Punkt, Whuber. Dies ist jedoch nicht der einzige Grund für Leistungsberechnungen, und viele Bayesianer würden argumentieren, dass dies unnötig ist, da Sie N nicht vorher bestimmen müssen (ein Fehler).
John
5
N
2
Ich bin nicht auf die Idee gekommen, es gibt eine Reihe von Artikeln, in denen Bayesianer argumentieren, dass Sie Themen hinzufügen können, bis Sie genügend Beweise haben, um eine Entscheidung zu treffen. Ich könnte eine Referenz nachschlagen, nehme ich an. Dies ist insbesondere der Fall, wenn vorgeschlagen wird, wie Daten in klinischen Studien analysiert werden sollen.
John
8
N
14

Sie können Hypothesentests mit Bayes-Statistiken durchführen. Sie könnten beispielsweise den Schluss ziehen, dass ein Effekt größer als Null ist, wenn mehr als 95% der hinteren Dichte größer als Null sind. Alternativ können Sie eine Form der binären Entscheidung verwenden, die auf Bayes-Faktoren basiert.

Sobald Sie ein solches Entscheidungsfindungssystem eingerichtet haben, können Sie die statistische Leistung unter der Annahme eines bestimmten Datenerzeugungsprozesses und einer bestimmten Stichprobengröße bewerten. Sie können dies in einem bestimmten Kontext mit Hilfe von Simulationen leicht beurteilen.

Ein bayesianischer Ansatz konzentriert sich jedoch häufig mehr auf das Glaubwürdigkeitsintervall als auf die Punktschätzung und den Grad des Glaubens als auf eine binäre Entscheidung. Wenn Sie diesen kontinuierlicheren Inferenzansatz verwenden, können Sie stattdessen andere Auswirkungen auf die Inferenz Ihres Designs bewerten. Insbesondere möchten Sie möglicherweise die erwartete Größe Ihres Glaubwürdigkeitsintervalls für einen bestimmten Datenerzeugungsprozess und eine bestimmte Stichprobengröße bewerten.

Jeromy Anglim
quelle
3

Dieses Problem führt zu vielen Missverständnissen, da Benutzer Bayesianische Statistiken verwenden, um häufig gestellte Fragen zu stellen. Zum Beispiel möchten die Leute feststellen, ob Variante B besser ist als Variante A. Sie können diese Frage mit Bayes'schen Statistiken beantworten, indem Sie bestimmen, ob das 95% -igste Dichteintervall der Differenz zwischen diesen beiden hinteren Verteilungen (BA) größer als 0 oder a ist Region von praktischer Bedeutung um 0. Wenn Sie zur Beantwortung von häufig gestellten Fragen bayesianische Statistiken verwenden, können Sie dennoch häufig auftretende Fehler machen: Typ I (falsch positiv; opps - B ist eigentlich nicht besser) und Typ II (fehlgeschlagen; nicht erkannt) das B ist wirklich besser).

Bei einer Leistungsanalyse geht es darum, Fehler vom Typ II zu reduzieren (z. B. mit einer Wahrscheinlichkeit von mindestens 80%, einen Effekt zu finden, falls vorhanden). Eine Leistungsanalyse sollte auch verwendet werden, wenn Bayesianische Statistiken verwendet werden, um häufig auftretende Fragen wie die oben genannte zu stellen.

Wenn Sie keine Leistungsanalyse verwenden und dann beim Sammeln wiederholt auf Ihre Daten blicken und erst dann aufhören, wenn Sie einen signifikanten Unterschied feststellen, werden Sie mehr Fehler vom Typ I (Fehlalarme) machen, als Sie vielleicht erwarten - genau so, als ob Sie eine frequentistische Statistik verwendet hätten.

Auschecken:

https://doingbayesiandataanalysis.blogspot.com/2013/11/optional-stopping-in-data-collection-p.html

http://varianceexplained.org/r/bayesian-ab-testing/

Bemerkenswert - Einige Bayes'sche Ansätze können die Wahrscheinlichkeit eines Fehlers vom Typ I (z. B. ein geeigneter informativer Prior) verringern, aber nicht beseitigen.

captain_ahab
quelle
0

Die Notwendigkeit einer Leistungsanalyse in einer klinischen Studie besteht beispielsweise darin, berechnen / schätzen zu können, wie viele Teilnehmer rekrutiert werden müssen, um eine Chance zu haben, einen Behandlungseffekt (mit einer bestimmten Mindestgröße) zu finden, falls vorhanden. Es ist nicht möglich, eine endlose Anzahl von Patienten zu rekrutieren, zum einen aus Zeitgründen und zum anderen aus Kostengründen.

Stellen Sie sich vor, wir verfolgen einen bayesianischen Ansatz für diese klinische Studie. Obwohl flache Prioritäten theoretisch möglich sind, ist eine Sensibilität für den Prior auf jeden Fall ratsam, da leider mehr als eine flache Priorität verfügbar ist (was ich jetzt merkwürdig finde, da es eigentlich nur eine Möglichkeit geben sollte, völlige Unsicherheit auszudrücken).

Stellen Sie sich also vor, dass wir weiterhin eine Sensitivitätsanalyse durchführen (das Modell und nicht nur der Prior würden hier ebenfalls geprüft). Dies beinhaltet die Simulation eines plausiblen Modells für 'die Wahrheit'. In der klassischen / frequentistischen Statistik gibt es hier vier Kandidaten für 'die Wahrheit': H0, mu = 0; H1, mu! = 0, wobei entweder mit Fehler (wie in unserer realen Welt) oder ohne Fehler (wie in der nicht beobachtbaren realen Welt) beobachtet werden. In der Bayes'schen Statistik gibt es hier zwei Kandidaten für 'die Wahrheit': mu ist eine Zufallsvariable (wie in der nicht beobachtbaren realen Welt); mu ist eine Zufallsvariable (wie in unserer beobachtbaren realen Welt aus der Sicht eines unsicheren Individuums).

Es kommt also wirklich darauf an, wen Sie versuchen, A) durch den Versuch und B) durch die Sensitivitätsanalyse zu überzeugen. Wenn es nicht dieselbe Person ist, wäre das ziemlich seltsam.

Was tatsächlich in Frage kommt, ist ein Konsens darüber, was Wahrheit ist und was konkrete Beweise begründet. Der gemeinsame Grund ist, dass in unserer realen beobachtbaren Welt Verteilungen von Signaturwahrscheinlichkeiten beobachtbar sind, die auf irgendeine Weise offensichtlich eine mathematische Wahrheit enthalten, die zufällig oder beabsichtigt ist. Ich werde hier aufhören, da dies keine Arts-Seite ist, sondern eine Science-Seite, oder so verstehe ich das.

Olivia Grigg
quelle