In der Frequenzstatistik besteht ein enger Zusammenhang zwischen Konfidenzintervallen und Tests. Am Beispiel der Inferenz über in der N ( μ , σ 2 ) -Verteilung ist das 1 - α- Konfidenzintervall ˉ x ± t α / 2 ( n - 1 ) ⋅ s / √ enthält alle Werte vonμ, die vomt-Test auf dem Signifikanzniveauαnicht verworfen werden.
Frequentistische Konfidenzintervalle sind in diesem Sinne invertierte Tests. (Dies bedeutet übrigens, dass wir den Wert als den kleinsten Wert von α interpretieren können, für den der Nullwert des Parameters in das 1 - α- Konfidenzintervall einbezogen werden würde . Ich finde, dass dies eine nützliche Möglichkeit ist, um zu erklären, was passiert p- Werte sind wirklich für Leute, die ein bisschen Statistik kennen.)
Als ich über die entscheidungstheoretische Grundlage der Bayes'schen glaubwürdigen Regionen las , begann ich mich zu fragen, ob es einen ähnlichen Zusammenhang bzw. eine ähnliche Entsprechung zwischen glaubwürdigen Regionen und Bayes'schen Tests gibt.
- Gibt es einen allgemeinen Zusammenhang?
- Wenn es keine allgemeine Verbindung gibt, gibt es Beispiele, bei denen eine Verbindung besteht?
- Wie können wir das sehen, wenn es keinen allgemeinen Zusammenhang gibt?
Antworten:
Ich habe ein Beispiel gefunden, bei dem eine Verbindung besteht. Es scheint jedoch stark von meiner Wahl der Verlustfunktion und der Verwendung von zusammengesetzten Hypothesen abzuhängen.
Ich beginne mit einem allgemeinen Beispiel, dem dann ein einfacher Sonderfall mit der Normalverteilung folgt.
Allgemeines Beispiel
Für einen unbekannten Parameter sei Θ der Parameterraum und betrachte die Hypothese θ ∈ Θ 0 gegen die Alternative θ ∈ Θ 1 = Θ ∖ Θ 0 .θ Θ θ ∈ Θ0 θ ∈ Θ1= Θ ∖ Θ0
Lassen eine Testfunktion sein, mit der Notation in Xi'an ‚s Die Bayes Wahl (die Art von rückwärts ist , was ich zumindest bin es gewohnt), so dass wir ablehnen Θ 0 , wenn φ = 0 und akzeptieren Θ 0 , wenn φ = 1 . Betrachten Sie die Verlustfunktion L ( θ , φ ) = { 0 , wenn φ = I Θ 0 ( θ ) a 0 , wenn θ ∈ Θφ Θ0 φ = 0 Θ0 φ=1
Der Bayes-Test ist dannφπ(x)=1
Nehmen Sie und eine 1 = 1 - α . Die Nullhypothese Θ 0 wird akzeptiert, wenn P ( θ ∈ Θ 0 | x ) ≥ 1 - α ist .a0=α≤0.5 a1=1−α Θ0 P(θ∈Θ0|x)≥1−α
Ein einfacher Sonderfall
Um besser zu veranschaulichen, welche Art von Test wir im obigen Beispiel haben, betrachten Sie den folgenden Sonderfall.
Bemerkungen
Die obige Verlustfunktion, bei der wir denken, dass es schlimmer ist, die Nullhypothese falsch zu akzeptieren, als sie falsch abzulehnen, mag auf den ersten Blick wie eine leicht künstliche aussehen. Es kann jedoch in Situationen von erheblichem Nutzen sein, in denen "falsche Negative" kostspielig sein können, beispielsweise beim Screening auf gefährliche ansteckende Krankheiten oder Terroristen.
quelle
Michael und Fraijo schlugen vor, dass die einfache Überprüfung, ob der Parameterwert von interest in einer glaubwürdigen Region enthalten ist, das bayesianische Äquivalent der Umkehrung von Konfidenzintervallen ist. Ich war diesbezüglich zunächst etwas skeptisch, da mir nicht klar war, dass dieses Verfahren tatsächlich zu einem Bayes-Test (im üblichen Sinne) führte.
Wie sich herausstellt, ist dies zumindest dann der Fall, wenn Sie bereit sind, bestimmte Verlustfunktionen zu akzeptieren. Vielen Dank an Zen , der sich auf zwei Artikel bezog, die eine Verbindung zwischen HPD-Regionen und Hypothesentests herstellen:
Weitere Informationen zu diesem Thema finden Sie in einer Liste von Veröffentlichungen, in denen Madruga et al. Artikel .
Update Oktober 2012:
Dies scheint mir eine ziemlich vernünftige Verlustfunktion zu sein. Ich diskutiere diesen Verlust, den Madruga-Esteves-Wechsler-Verlust und das Testen mit glaubwürdigen Sätzen weiter unten im Manuskript zu arXiv.
quelle
Ich habe zufällig Ihr arXiv-Papier gelesen , bevor ich auf diese Frage gekommen bin , und habe bereits einen Blogeintrag darüber geschrieben ( voraussichtlich am 08. Oktober ). Zusammenfassend finde ich Ihre Konstruktion von theoretischem Interesse, denke aber auch, dass sie zu erfunden ist, um empfohlen zu werden. da es die Punkt-Null-Hypothese nicht zu lösen scheint Bayes'sches Testproblem, das traditionell erfordert, eine vorherige Masse auf den Punkt-Null-Parameterwert zu setzen.
quelle
Sie können ein glaubwürdiges Intervall (oder einen HPD-Bereich) für das Testen der Bayes'schen Hypothese verwenden. Ich denke nicht, dass es üblich ist; Um fair zu sein, sehe ich weder viel, noch verwende ich formale Bayesianische Hypothesentests in der Praxis. Bayes-Faktoren werden gelegentlich verwendet (und in Roberts "Bayesian Core" etwas gelobt), um Hypothesentests aufzustellen.
quelle
Eine glaubwürdige Region ist nur eine Region, in der das Integral der hinteren Dichte über der Region eine festgelegte Wahrscheinlichkeit ist, z. B. 0,95. Eine Möglichkeit, einen Bayes'schen Hypothesentest zu bilden, besteht darin, zu ermitteln, ob die hypothetischen Nullwerte der Parameter in den glaubwürdigen Bereich fallen. Auf diese Weise können wir eine ähnliche 1: 1-Entsprechung zwischen Hypothesentests und glaubwürdigen Regionen erhalten, wie es die Frequentisten mit Konfidenzintervallen und Hypothesentests tun. Dies ist jedoch nicht die einzige Möglichkeit, Hypothesentests durchzuführen.
quelle
Lassen Sie mich sagen, wie ich Tims Antwort gelesen habe .
Es basiert auf den Tabellenansichten mit Hypothese (geschätzter Parameter) in Spalten und Beobachtungen in den Zeilen.
In der ersten Tabelle haben Sie die Spaltenwahrscheinlichkeiten summiert mit 1, dh es handelt sich um bedingte Wahrscheinlichkeiten, deren Bedingung, die in das Spaltenereignis einfließt, in der unteren Zeile mit dem Namen 'prior' angegeben wird. In der letzten Tabelle summieren sich die Zeilen ähnlich zu 1, und in der Mitte haben Sie gemeinsame Wahrscheinlichkeiten, dh bedingte Wahrscheinlichkeiten, die Sie in der ersten und letzten Tabelle finden, multiplizieren die Wahrscheinlichkeit der Bedingung mit den Prioritäten.
Die Tabellen führen im Grunde genommen die Bayes'sche Transformation durch: In der ersten Tabelle geben Sie die Beobachtungen (Zeilen) in jeder Spalte als PDF an, setzen den Prioritätswert für diese Hypothese (ja, die Hypothesenspalte ist ein PDF mit Beobachtungen unter dieser Hypothese), und Sie tun dies Für jede Spalte und Tabelle wird sie zuerst in die Tabelle der gemeinsamen Wahrscheinlichkeiten und dann in die Wahrscheinlichkeiten Ihrer Hypothese aufgenommen, die durch Beobachtungen bedingt sind.
Wie aus Tims Antwort hervorgeht (korrigieren Sie mich, wenn ich mich irre), betrachtet der Ansatz "Kritisches Intervall" die erste Tabelle. Das heißt, sobald das Experiment abgeschlossen ist, kennen wir die Tabellenzeile (in meinem Beispiel entweder Kopf oder Zahl, aber Sie können komplexere Experimente durchführen, z. B. 100 Münzwürfe, und eine Tabelle mit 2 ^ 100 Zeilen erstellen). Der Frequentialist durchsucht seine Spalten, die, wie gesagt, eine Verteilung möglicher Ergebnisse unter der Bedingung darstellen, dass die Hypothese wahr ist (z. B. ist die Münze in meinem Beispiel fair), und lehnt die Hypothese (Spalten) ab, die einen sehr niedrigen Wahrscheinlichkeitswert von hat die beobachtete Reihe.
Der Bayesianer stellt zuerst die Wahrscheinlichkeiten ein, wandelt Spalten in Zeilen um und sucht in Tabelle 3 die Zeile des beobachteten Ergebnisses. Da es sich auch um ein PDF handelt, geht er die Zeile mit den Testergebnissen durch und wählt die Hypethese mit den höchsten Wahrscheinlichkeiten aus, bis seine 95% ige Glaubwürdigkeitstasche voll ist. Der Rest der Hypothese wird abgelehnt.
Wie gefällt es Ihnen? Ich bin noch dabei zu lernen und Grafik scheint mir hilfreich zu sein. Ich glaube, dass ich auf dem richtigen Weg bin, da ein seriöser Benutzer das gleiche Bild liefert, wenn er den Unterschied zwischen zwei Ansätzen analysiert . Ich habe eine grafische Darstellung der Auswahlmechanismen für Hypothesen vorgeschlagen.
Ich ermutige jeden, die letzte Antwort von Keith zu lesen, aber mein Bild der Hypothesentestmechanik kann sofort sagen, dass der Frequentist die andere Hypothese nicht betrachtet, wenn er die aktuelle überprüft, während die Berücksichtigung einer Hypothese mit hoher Glaubwürdigkeit die Rezeption / Ablehnung anderer Hypothesen in Bayes stark beeinflusst Analyse, da Sie, wenn Sie eine einzelne Hypothese haben, die 95% der Fälle unter beobachteten Daten auftritt, alle anderen Hypothesen sofort auslösen, unabhängig davon, wie gut die Daten in sie passen. Lassen Sie uns die statistische Potenzanalyse beiseite legen, bei der sich zwei Hypothesen aufgrund ihrer Konfidenzintervalle überlappen.
Aber ich scheine die Ähnlichkeit zwischen zwei Ansätzen entdeckt zu haben: Sie scheinen durch
P(A | B) > P(A) <=> P(B|A) > P(B)
Eigentum verbunden zu sein . Wenn es eine Abhängigkeit zwischen A und B gibt, wird sie im Grunde genommen als Korrelation sowohl in der Freq- als auch in der Bayes'schen Tabelle angezeigt. Wenn also ein Hypothesentest mit dem anderen korreliert, müssen sie sorta die gleichen Ergebnisse liefern. Wenn Sie die Wurzeln der Korrelation studieren, erhalten Sie wahrscheinlich die Verbindung zwischen den beiden. In meiner Frage dort frage ich eigentlich, warum der Unterschied statt der absoluten Korrelation ist?quelle