Fisher's Exact Test mit Gewichten?

12

Kennt jemand eine Variation von Fisher's Exact Test, die Gewichte berücksichtigt? Zum Beispiel Stichprobengewichte .
Anstelle der üblichen 2x2-Kreuztabelle hat jeder Datenpunkt einen Wert für "Masse" oder "Größe", der den Punkt wiegt.

Beispieldaten:

A B weight
N N 1
N N 3
Y N 1
Y N 2
N Y 6
N Y 7
Y Y 1
Y Y 2
Y Y 3
Y Y 4

Fisher's Exact Test verwendet dann diese 2x2 Kreuztabelle:

A\B  N  Y All
 N   2  2   4
 Y   2  4   6
All  4  6  10

Wenn wir das Gewicht als 'tatsächliche' Anzahl von Datenpunkten annehmen würden, würde dies Folgendes ergeben:

A\B  N  Y All
 N   4 13  17
 Y   3 10  13
All  7 23  30

Das würde aber zu einem viel zu hohen Selbstvertrauen führen. Ein Datenpunkt, der von N / Y nach N / N wechselt, würde einen großen Unterschied in der Statistik bewirken.
Außerdem würde es nicht funktionieren, wenn irgendein Gewicht Bruchteile enthalten würde.

Michel de Ruiter
quelle

Antworten:

10

Ich habe den Verdacht, dass "exakte" Tests und Stichprobengewichte im Wesentlichen inkompatible Konzepte sind. Ich habe in Stata eingecheckt, das gute Möglichkeiten für Stichprobenerhebungen und vernünftige Möglichkeiten für genaue Tests bietet. In den 8 möglichen Teststatistiken für eine Kreuztabelle mit Stichprobengewichten sind keine "genauen" Tests wie die von Fisher enthalten.

Der entsprechende manuelle Eintrag für Stata (für svy: tabulate twoway ) rät in allen Fällen zur Verwendung des Standardtests. Diese Standardmethode basiert auf der üblichen Pearson-Chi-Quadrat-Statistik. Zitieren:

"Um das Umfragedesign zu berücksichtigen, wird die Statistik mithilfe einer Rao und Scott-Korrektur zweiter Ordnung (1981, 1984) in eine F-Statistik mit nicht ganzzahligen Freiheitsgraden umgewandelt."

Refs:

  • Rao, JNK und AJ Scott. 1981. Die Analyse kategorialer Daten aus komplexen Stichprobenerhebungen: Chi-Quadrat-Tests auf Passgenauigkeit und Unabhängigkeit in Zwei-Wege-Tabellen. Journal of the American Statistical Association 76: 221–230.
  • Rao, JNK und AJ Scott. 1984. Bei Chi-Quadrat-Tests für Mehrwege-Kontingenztabellen mit Zellanteilen, die aus Umfragedaten geschätzt wurden. Annals of Statistics 12: 46-60.
ein Stop
quelle
3

Interessante Frage. Was meinst du mit Gewicht?

Ich würde gerne einen Bootstrap machen ... wählen Sie Ihre Lieblingsstatistik (dh Fisher's Exact) aus und berechnen Sie sie anhand Ihrer Daten. Ordnen Sie dann jeder Instanz gemäß Ihrer Nullhypothese neue Zellen zu und wiederholen Sie den Vorgang 999 Mal. Dies sollte eine ziemlich gute empirische Verteilung für Ihre Teststatistik unter der Nullhypothese ergeben und eine einfache Berechnung Ihres p-Werts ermöglichen!

user549
quelle
Vielen Dank! Aber ich hoffte auf eine schnellere und stabilere Statistik ...
Michel de Ruiter
2

Eine kurze Anmerkung zu den Stichprobengewichten: Sie bieten normalerweise die Möglichkeit, Informationen über die Grundgesamtheit, aus der eine Stichprobe entnommen wird, einzubeziehen. In der Regel basieren sie jedoch auf Szenarien vom Typ "große Stichprobe" (normalerweise beschränkte BLUP- oder BLUE-Vorhersage in Verkleidung). Daher würde ich mir vorstellen, dass Stichprobengewichte wahrscheinlich nicht besser sind als keine Gewichte. Ich denke, es wäre besser, die Informationen über die Grundgesamtheit zu verwenden, auf die sich das Stichprobendesign direkt stützt.

R1,,RkkR1;11,R1;12,R1;21,R1;22,l=1kRl;ichjdas ist das Ziel der Schlussfolgerung (wie viele in der Bevölkerung geben Antwort N / N ??). Du versuchst dann darüber nachzudenkenRl;ichj aus den abgetasteten Zahlen rl;ichj vorbehaltlich der Einschränkung, dass ich,jRl;ichj=Rl zum (l=1,,k). (maxent jemand?)

Beachten Sie, dass wenn die Stichprobenwahrscheinlichkeiten nur auf den Daten basieren, die Sie wahrscheinlich erhalten haben, diese irrelevant sind (und der genaue Test von Fisher gilt), da Sie nach Erhalt der Daten wissen, welche Stichprobe Sie erhalten haben. Es ist also kohärent, die Abtastwahrscheinlichkeit auf den neuesten Stand zu bringenP(Dm)=1 wenn sich die m-te Einheit in der Stichprobe befindet, und P(Dm)=0wenn sie nicht in der Stichprobe wären. Normalerweise basiert das Design jedoch auf mehr Informationen als nur den Daten, die man wahrscheinlich beobachtet. Beachten Sie jedoch, dass die Informationen und nicht das Umfragedesign an sich wichtig sind. Konstruktionsbasierte Inferenz ist nur eine sehr effiziente Methode, um all diese Informationen in Ihre Analyse einzubeziehen.

Wahrscheinlichkeitslogik
quelle