Ich teste die Unabhängigkeit von zwei Variablen, A und B, die durch C geschichtet sind. A und B sind binäre Variablen und C ist kategorisch (5 Werte). Wenn ich den genauen Fisher-Test für A und B (alle Schichten zusammen) durchführe, bekomme ich:
## (B)
## (A) FALSE TRUE
## FALSE 1841 85
## TRUE 915 74
OR: 1.75 (1.25 -- 2.44), p = 0.0007 *
Dabei ist OR das Odds Ratio (Schätzung und 95% -Konfidenzintervall) und *
bedeutet, dass p <0,05 ist.
Wenn ich für jede Schicht (C) den gleichen Test durchführe, erhalte ich:
C=1, OR: 2.31 (0.78 -- 6.13), p = 0.0815
C=2, OR: 2.75 (1.21 -- 6.15), p = 0.0088 *
C=3, OR: 0.94 (0.50 -- 1.74), p = 0.8839
C=4, OR: 1.48 (0.77 -- 2.89), p = 0.2196
C=5, OR: 3.38 (0.62 -- 34.11), p = 0.1731
Wenn ich schließlich den Cochran-Mantel-Haenszel (CMH) -Test mit A, B und C durchführe, erhalte ich:
OR: 1.56 (1.12 -- 2.18), p = 0.0089 *
Das Ergebnis des CMH-Tests legt nahe, dass A und B nicht in jeder Schicht unabhängig sind (p <0,05); Die meisten Tests innerhalb der Schicht waren jedoch nicht signifikant, was darauf hindeuten würde, dass wir nicht genügend Beweise haben, um zu verwerfen, dass A und B in jeder Schicht unabhängig sind.
Welche Schlussfolgerung ist also richtig? Wie kann man die Schlussfolgerung angesichts dieser Ergebnisse melden? Kann C als verwirrende Variable angesehen werden oder nicht?
EDIT: Ich habe den Breslow-Day-Test für die Nullhypothese durchgeführt, dass das Odds Ratio über alle Schichten hinweg gleich ist und der p-Wert 0,1424 beträgt.
Antworten:
Der erste Test zeigt Ihnen, dass sich das Quotenverhältnis zwischen A und B, wobei C ignoriert wird , von 1 unterscheidet. Wenn Sie sich die geschichtete Analyse ansehen, können Sie entscheiden, ob es in Ordnung ist, C zu ignorieren.
Der CMH-Test zeigt Ihnen, dass sich das Quotenverhältnis zwischen A und B, bereinigt um C, von eins unterscheidet. Es wird ein gewichteter Durchschnitt der schichtenspezifischen Quotenverhältnisse zurückgegeben. Wenn diese also in einigen Schichten und in anderen , können sie sich aufheben und Ihnen fälschlicherweise mitteilen, dass es keine Assoziation zwischen A und B gibt. Wir müssen also testen, ob Es ist anzunehmen, dass die Quotenverhältnisse (auf Bevölkerungsebene) auf allen Ebenen von C gleich sind. Der Breslow-Day-Interaktionstest macht genau dies mit der Nullhypothese, dass alle Schichten das gleiche Quotenverhältnis haben, das benötigt wird nicht gleich eins sein. Dieser Test ist im EpiR R-Paket implementiert. Der Breslow-Day-p-Wert von 0,14 bedeutet, dass wir diese Annahme treffen können, sodass das angepasste Quotenverhältnis legitim ist.<1 >1
Dies hilft uns jedoch nicht bei der Entscheidung zwischen CMH und Fisher's exakten (oder Pearson's ) Tests. Wenn der Breslow-Day-Test signifikant wäre, müssten Sie schichtenspezifische Quotenverhältnisse angeben. Da dies nicht der Fall ist, müssen Sie sich fragen, ob eine Anpassung für C erforderlich ist. Verwechselt C die Assoziation zwischen A und B? Die Heuristik, die ich gelernt habe (kein statistischer Test), bestand darin, zu überprüfen, ob die proportionale Differenz zwischen dem nicht angepassten und dem angepassten Quotenverhältnis mehr als 10% beträgt. Hier ist also ist CMH angemessen.χ2 1.75−1.561.75=0.108
quelle