Ich analysiere eine 2x2-Tabelle aus einem kleinen Datensatz von 30 Patienten. Wir versuchen nachträglich, einige Variablen zu finden, die einen Hinweis darauf geben, welche Behandlung gewählt werden soll. Die Variablen (obs normal / seltsam) und die Behandlungsentscheidung (A / B) sind von besonderem Interesse und daher sehen die Daten folgendermaßen aus:
Offensichtlich fehlt einer Zelle bei Einträgen, die einen Chi-Quadrat-Test ausschließen, und der exakte Fisher-Test ergibt keinen sättigenden p-Wert (aber immer noch <10%). Meine erste Idee war es also, einen Test mit größerer Leistung zu finden. In einem Blog und in diesem Artikel über den Barnard- und Boschloos-Test las ich, dass es im Allgemeinen drei Szenarien gibt, die zu einem leistungsstarken Test führen:
- Spalte und Zeilenumfang behoben rechter Fisher-Test
- Spalten- oder (xclusive) Zeilenumbrüche behoben Barnards exakter Test
- Keiner ist fest Boschloos exakten Test
In dem obigen Artikel wurde darauf hingewiesen, dass die Summe aus Behandlung A und Behandlung B so gut wie nie zuvor bekannt ist, sodass wir den genauen Fisher-Test ausschließen können. Aber was ist mit den anderen Alternativen? Bei der Kontrolle, bei der wir gesunde Kontrollen haben, können wir die Placebo- und Verum-Gruppe kontrollieren, welche Zahlen wir kontrollieren können, also würde man 2 wählen: Barnard. In meinem Fall bin ich mir nicht sicher, weil wir einerseits ein ähnliches mathematisches Problem haben (Summe der Beobachtungsniveaus, das der Summe von Placebo / Verum entspricht), das zu Barnard führt, aber das Design ist anders, weil wir das nicht kontrollieren können nr. der Beobachtung normal / seltsam vor der Probenahme, was zu 3: Boschloo führt.
Welcher Test sollte also verwendet werden und warum? Natürlich möchte ich hohe Leistung.
(Eine andere Frage, die ich gerne wissen würde, ist, ob es im Fall von chisq.test
in r nicht besser wäre, sie zu verwenden prop.test(x, alternative = "greater")
? Die theoretischen Aspekte werden hier erklärt .)
Antworten:
Es kann einige Verwirrung über den Begriff "Barnard" -Test oder "Boschloo" -Test geben. Der genaue Test von Barnard ist ein bedingungsloser Test in dem Sinne, dass er nicht an beiden Rändern bedingt ist. Daher sind sowohl die zweite als auch die dritte Kugel Barnards Test. Wir sollten stattdessen schreiben:
Der genaue Test von Barnard umfasst zwei Arten von Tabellen, daher unterscheiden wir die beiden, indem wir je nach Bedarf "Binomial" - oder "Multinomial" -Modell sagen.
In der Regel verwendet Barnards genauer Test entweder eine Z-Pool-Statistik (auch als Score-Statistik bezeichnet), um die "as" - oder "extremeren" -Tabellen zu bestimmen. Beachten Sie, dass das Originalpapier von Barnard (1947) einen komplizierteren Ansatz verwendet, um die extremeren Tabellen zu bestimmen (als "CSM" bezeichnet). Der genaue Test von Boschloo verwendet den p-Wert von Fisher, um die "als oder extremer" -Tabellen zu bestimmen. Boschloos Test ist einheitlich leistungsfähiger als der exakte Fisher-Test.
Für Ihren Datensatz klingt es so, als ob keine Ränder festgelegt wurden. Daher würde ich empfehlen, den genauen Test von Boschloo mit einem multinomialen Modell zu verwenden. Ich fand Boschloos Test etwas besser für unausgeglichene Margenverhältnisse (obwohl er normalerweise Barnards genauem Test mit Z-Pool-Statistik sehr ähnlich ist). Da jedoch sowohl das Test- als auch das Multinomialmodell von Boschloo viel rechenintensiver sind, können Sie auch das Binomialmodell verwenden (die Begründung, warum dies immer noch angemessen wäre, ist etwas kompliziert; kurz zusammengefasst sind die Ränder eine annähernd ergänzende Statistik Es ist in Ordnung, am Rand zu konditionieren. Weitere Informationen zu den genauen Tests und Informationen zur Implementierung finden Sie im Exact R-Paket ( https://cran.r-project.org/web/packages/Exact/Exact.pdf)). Ich bin der Autor des Pakets und es ist eine aktualisierte Version des Codes im Blog.
quelle