McNemar oder Fisher exakter Test für Neigungsbewertung übereinstimmende Daten?

7

Ich möchte einige mit dem Neigungswert übereinstimmende Daten analysieren. In der Literatur wird üblicherweise ein McNemar-Test verwendet, da die Daten "gepaart" sind. Matching ist jedoch keine Paarung im gesunden Menschenverstand.

Wäre es korrekter, den genauen Fisher-Test zu verwenden? Welche Meinungen gibt es zur Verwendung gepaarter Tests für übereinstimmende Daten?

Viktor
quelle
Eine verwandte Frage mit technischen Details: stats.stackexchange.com/questions/147559/…
Viktor

Antworten:

8

Dies ist definitiv eine anhaltende Debatte in der Literatur, aber an diesem Punkt deuten die Beweise darauf hin, dass zur Analyse von Standardfehlern und p-Werten eine gepaarte Analyse verwendet wird. Obwohl das Ziel des Matchings darin besteht, zwei Stichproben zu erhalten, die eine randomisierte Kontrollstudie imitieren, nicht eine paarweise randomisierte Kontrollstudie, führt das Matching dennoch zu einer Kovarianz zwischen den Ergebnissen innerhalb jedes Matched-Sets, die in der Inferenz berücksichtigt werden muss. PC Austin hat viel darüber geschrieben (z. B. Austin & Small, 2014). Zubizarreta, Paredes & Rosenbaum (2014) zeigten, dass nach dem Matching (dh dem Verwerfen nicht übereinstimmender Einheiten) das Pairing (dh das Erstellen übereinstimmender Paare) die Empfindlichkeit der eventuellen Schätzung für nicht gemessene Verwechslungen verringern und Standardfehler reduzieren kann, die nur realisiert werden konnten wenn gepaarte Analysen für die Probe verwendet wurden.

Noah
quelle
"... das Ziel des Matchings ist es, zwei Proben zu erhalten, die eine randomisierte Kontrollstudie imitieren." Das ist nicht wahr. Das Ziel der Anpassung ist Verwechselung zu entfernen , indem jede Assoziation zwischen den Anpassungsfaktoren und Behandlung eliminiert Option . RCTs tun dies mit Randomisierung. Die Verteilung der Störfaktoren in einer randomisierten Stichprobe ist repräsentativ für die Studienteilnehmer. Mit der passenden Verteilung dieser Störfaktoren ähnelt es überproportional der von Menschen, die sich für die seltenere Behandlung entscheiden.
AdamO
1
Das stimmt, aber es ist möglich, mit der ATE übereinzustimmen, was in einem RCT geschätzt wird. Ich habe nur die Intuition von OP bekräftigt, dass PS-Matching offensichtlich nicht dasselbe ist wie Pairing, genauso wie ein RCT nicht dasselbe ist wie ein gepaartes RCT.
Noah
Okay, scheint uns zuzustimmen. Kurz gesagt: Matching / Randomisierung ist insofern dasselbe, als es Verwirrung beseitigen soll, aber sie führen zu unterschiedlichen Verteilungen von Faktoren in der resultierenden Stichprobe. Die Entwürfe sind gültig, um ATEs zu schätzen, wenn keine unerkannten Wechselwirkungen mit der Behandlung vorliegen. Andernfalls können die beiden Ansätze zu unterschiedlichen / widersprüchlichen Ergebnissen führen.
AdamO
Da übereinstimmende Daten keine gepaarten Daten sind und keine Daten von unabhängigen Gruppen sind, können möglicherweise einige neue Tests speziell für übereinstimmende Daten entwickelt werden?
Viktor
1
Viele haben diese Arbeit versucht. Die Arbeit von Abadie und Imbens fällt mir ein, aber ich weiß nicht viel darüber. Im Moment ist die gepaarte Analyse am besten geeignet.
Noah