In einem kürzlich hier veröffentlichten Kommentar verwies ein Kommentator auf einen Blog von Larry Wasserman, der (ohne Quellenangabe) darauf hinwies, dass frequentistische Schlussfolgerungen mit dem Wahrscheinlichkeitsprinzip in Konflikt stehen.
Das Wahrscheinlichkeitsprinzip besagt einfach, dass Experimente mit ähnlichen Wahrscheinlichkeitsfunktionen ähnliche Schlussfolgerungen liefern sollten.
Zwei Teile zu dieser Frage:
Welche Teile, der Geschmack oder die Schule der frequentistischen Folgerung verstoßen spezifisch gegen das Wahrscheinlichkeitsprinzip?
Wenn es zu einem Konflikt kommt, müssen wir dann den einen oder anderen wegwerfen? Wenn ja, welche? Ich möchte der Diskussion zuliebe vorschlagen, dass wir, wenn wir etwas verwerfen müssen, die Teile der frequentistischen Folgerung verwerfen, die aufeinander treffen, weil Hacking und Royall mich davon überzeugt haben, dass das Wahrscheinlichkeitsprinzip axiomatisch ist.
quelle
Antworten:
Der Teil des frequentistischen Ansatzes, der mit dem Wahrscheinlichkeitsprinzip kollidiert, ist die Theorie des statistischen Testens (und der p-Wert-Berechnung). Es wird normalerweise durch das folgende Beispiel hervorgehoben.
Angenommen, zwei Frequentisten wollen eine voreingenommene Münze studieren, die mit unbekannter Wahrscheinlichkeit „Köpfe“ dreht . Sie vermuten , dass es in Richtung ‚Schwanz‘ vorgespannt ist, so dass sie die gleiche Nullhypothese postulieren p = 1 / 2 und die gleiche alternative Hypothese p < 1 / 2 .p p=1/2 p<1/2
Der erste Statistiker wirft die Münze, bis "Köpfe" auftauchen, was zufällig sechsmal der Fall ist. Der zweite Spieler wirft die Münze sechsmal und erhält beim letzten Wurf nur einen "Kopf".
Nach dem Modell des ersten Statistikers wird der p-Wert wie folgt berechnet:
Nach dem Modell des zweiten Statistikers wird der p-Wert wie folgt berechnet:
Ersetzen von von 1 / 2 , der ersten findet einen p-Wert von gleich 1 / 2 5p 1/2 , gleich die zweiten findet ein p-Wert auf 7 / 2 × 1 / 2 51/25=0.03125 .7/2×1/25=0.109375
Sie erzielen unterschiedliche Ergebnisse, weil sie unterschiedliche Dinge getan haben, richtig? Nach dem Wahrscheinlichkeitsprinzip sollten sie jedoch zu demselben Ergebnis kommen. Kurz gesagt, das Wahrscheinlichkeitsprinzip besagt, dass die Wahrscheinlichkeit alles ist, was für die Schlussfolgerung von Bedeutung ist. Der Konflikt ergibt sich hier aus der Tatsache, dass beide Beobachtungen die gleiche Wahrscheinlichkeit haben, proportional zu (Wahrscheinlichkeit wird bis zu einer Proportionalitätskonstante bestimmt).p(1−p)5
Soweit ich weiß, ist die Antwort auf Ihre zweite Frage eher eine umstrittene Meinung. Ich persönlich versuche zu vermeiden, Tests durchzuführen und p-Werte zu berechnen, aus dem oben genannten Grund und für andere, die in diesem Blog-Beitrag erläutert werden .
EDIT: Nun, da ich darüber nachdenke, würden sich auch die Schätzungen von nach Konfidenzintervallen unterscheiden. Wenn sich die Modelle unterscheiden, unterscheidet sich das CI tatsächlich durch die Konstruktion.p
quelle
Ich mag das Beispiel von @ gui11aume (+1), aber es kann den Eindruck erwecken, dass der Unterschied in zweip Werten nur aufgrund der unterschiedlichen Stoppregeln der beiden Experimentatoren entsteht.
Tatsächlich glaube ich, dass es ein viel allgemeineres Phänomen ist. Betrachten Sie den zweiten Experimentator in @ gui11aumes Antwort: derjenige, der sechs Mal eine Münze wirft und nur beim letzten Wurf Köpfe beobachtet. Die Ergebnisse sehen so aus:
Spekulativer Teil
Aus philosophischer Sicht würde ich nun sagen, dass die häufigste Auswahl der Teststatistik in einem vagen Sinn der Bayes'schen Auswahl der Prior ähnelt. Wir wählen die eine oder andere Teststatistik, weil wir glauben, dass sich die unfaire Münze auf diese oder jene Weise verhält (und wir möchten die Macht haben, dieses Verhalten zu erkennen). Ist es nicht ähnlich, die Münztypen vorzuziehen?
Wenn ja, dann kollidiert das Wahrscheinlichkeitsprinzip, das besagt, dass alle Beweise in der Wahrscheinlichkeit sind, nicht mit demp p p Wert versucht, sowohl den Beweis als auch eine Art von früheren Erwartungen (wie in der Wahl der Teststatistik dargestellt) in einer skalaren Menge zu kombinieren. Wenn ja, dann sollte es nicht mit der Wahrscheinlichkeit selbst verglichen werden, sondern vielleicht eher mit dem posterioren?
Es würde mich sehr interessieren, hier oder im Chat einige Meinungen zu diesem spekulativen Teil zu hören.
Aktualisiere folgende Diskussion mit @MichaelLew
Ich muss mir noch überlegen, was das für meinen "spekulativen" Teil oben bedeutet.
quelle