Welcher Test für die Kreuztabellenanalyse: Boschloo oder Barnard?

11

Ich analysiere eine 2x2-Tabelle aus einem kleinen Datensatz von 30 Patienten. Wir versuchen nachträglich, einige Variablen zu finden, die einen Hinweis darauf geben, welche Behandlung gewählt werden soll. Die Variablen (obs normal / seltsam) und die Behandlungsentscheidung (A / B) sind von besonderem Interesse und daher sehen die Daten folgendermaßen aus:

Obs/Tr. Dec.ABnormal121325strange055121830

Offensichtlich fehlt einer Zelle bei Einträgen, die einen Chi-Quadrat-Test ausschließen, und der exakte Fisher-Test ergibt keinen sättigenden p-Wert (aber immer noch <10%). Meine erste Idee war es also, einen Test mit größerer Leistung zu finden. In einem Blog und in diesem Artikel über den Barnard- und Boschloos-Test las ich, dass es im Allgemeinen drei Szenarien gibt, die zu einem leistungsstarken Test führen:

  1. Spalte und Zeilenumfang behoben rechter Fisher-Test
  2. Spalten- oder (xclusive) Zeilenumbrüche behoben Barnards exakter Test
  3. Keiner ist fest Boschloos exakten Test

In dem obigen Artikel wurde darauf hingewiesen, dass die Summe aus Behandlung A und Behandlung B so gut wie nie zuvor bekannt ist, sodass wir den genauen Fisher-Test ausschließen können. Aber was ist mit den anderen Alternativen? Bei der Kontrolle, bei der wir gesunde Kontrollen haben, können wir die Placebo- und Verum-Gruppe kontrollieren, welche Zahlen wir kontrollieren können, also würde man 2 wählen: Barnard. In meinem Fall bin ich mir nicht sicher, weil wir einerseits ein ähnliches mathematisches Problem haben (Summe der Beobachtungsniveaus, das der Summe von Placebo / Verum entspricht), das zu Barnard führt, aber das Design ist anders, weil wir das nicht kontrollieren können nr. der Beobachtung normal / seltsam vor der Probenahme, was zu 3: Boschloo führt.

Welcher Test sollte also verwendet werden und warum? Natürlich möchte ich hohe Leistung.

(Eine andere Frage, die ich gerne wissen würde, ist, ob es im Fall von chisq.testin r nicht besser wäre, sie zu verwenden prop.test(x, alternative = "greater")? Die theoretischen Aspekte werden hier erklärt .)

Taz
quelle
Hätten Sie diese Frage gestellt, wenn der Fisher-Test einen Wert unterhalb Ihres Signifikanzniveaus ergeben hätte?
Michael M
Da die Spalten fest sind (es hört sich so an, als würde Ihr Artikel Barnards vorschlagen), konnte ich es aber nicht erreichen, ohne zu zahlen :(
MikeP
@ Michael: Ich denke, es ist ein relevantes Problem im Allgemeinen, aber ohne das spezifische Problem hätte ich möglicherweise keine tiefere Forschung in Betracht gezogen.
Taz
@ Mike: Sry, ich war im Institut und habe nicht an Paywall gedacht. Wenn ich eine kostenlose Lösung finde, werde ich sie hinzufügen. Ich glaube jedoch, dass ich nicht klar genug auf das Problem hingewiesen habe. In meinem Fall werden die Behandlungsgruppen nicht kontrolliert, sondern sind eine Folge einer manuellen Diagnose durch einen Arzt, und ich möchte herausfinden, ob die Entscheidung für Behandlung A oder B mit der Beobachtungsvariablen zusammenhängt. Und auch, welcher Test angewendet werden soll und wie er optimal angewendet werden soll.
Taz
Ahhh, also könnte eine Person, die an der Studie teilnimmt, am Ende möglicherweise in einer der vier Kategorien gelandet sein?
MikeP

Antworten:

13

Es kann einige Verwirrung über den Begriff "Barnard" -Test oder "Boschloo" -Test geben. Der genaue Test von Barnard ist ein bedingungsloser Test in dem Sinne, dass er nicht an beiden Rändern bedingt ist. Daher sind sowohl die zweite als auch die dritte Kugel Barnards Test. Wir sollten stattdessen schreiben:

  1. Beide Ränder fest (Hypergeometrischer Abstand) → Exakter Fisher-Test
  2. Ein Rand fest (Double Binomial Dist'n) → Barnards exakter Test
  3. Keine Ränder festgelegt (Multinomial Dist'n) → Barnards exakter Test

Der genaue Test von Barnard umfasst zwei Arten von Tabellen, daher unterscheiden wir die beiden, indem wir je nach Bedarf "Binomial" - oder "Multinomial" -Modell sagen.

In der Regel verwendet Barnards genauer Test entweder eine Z-Pool-Statistik (auch als Score-Statistik bezeichnet), um die "as" - oder "extremeren" -Tabellen zu bestimmen. Beachten Sie, dass das Originalpapier von Barnard (1947) einen komplizierteren Ansatz verwendet, um die extremeren Tabellen zu bestimmen (als "CSM" bezeichnet). Der genaue Test von Boschloo verwendet den p-Wert von Fisher, um die "als oder extremer" -Tabellen zu bestimmen. Boschloos Test ist einheitlich leistungsfähiger als der exakte Fisher-Test.

Für Ihren Datensatz klingt es so, als ob keine Ränder festgelegt wurden. Daher würde ich empfehlen, den genauen Test von Boschloo mit einem multinomialen Modell zu verwenden. Ich fand Boschloos Test etwas besser für unausgeglichene Margenverhältnisse (obwohl er normalerweise Barnards genauem Test mit Z-Pool-Statistik sehr ähnlich ist). Da jedoch sowohl das Test- als auch das Multinomialmodell von Boschloo viel rechenintensiver sind, können Sie auch das Binomialmodell verwenden (die Begründung, warum dies immer noch angemessen wäre, ist etwas kompliziert; kurz zusammengefasst sind die Ränder eine annähernd ergänzende Statistik Es ist in Ordnung, am Rand zu konditionieren. Weitere Informationen zu den genauen Tests und Informationen zur Implementierung finden Sie im Exact R-Paket ( https://cran.r-project.org/web/packages/Exact/Exact.pdf)). Ich bin der Autor des Pakets und es ist eine aktualisierte Version des Codes im Blog.

Peter Calhoun
quelle
1
Vielen Dank für Ihre klare Aussage! Sehr schön, diese Erklärung in ein paar Zeilen zu haben. Am Ende habe ich es so gemacht, wie du es geschrieben hast, nachdem du die Zeitung gelesen hast, die sehr gut, aber auch sehr lang ist ;-)
Taz