Nachdem ich wertvolle Rückmeldungen aus früheren Fragen und Diskussionen gesammelt habe, habe ich folgende Frage gestellt: Angenommen, das Ziel besteht darin, Effektunterschiede zwischen zwei Gruppen zu erkennen, beispielsweise zwischen Männern und Frauen. Es gibt zwei Möglichkeiten, dies zu tun:
Führen Sie zwei separate Regressionen für die beiden Gruppen durch und verwenden Sie den Wald-Test, um die Nullhypothese abzulehnen (oder nicht) : b 1 - b 2 = 0 , wobei b 1 der Koeffizient einer IV in der männlichen Regression ist und b 2 ist der Koeffizient der gleichen IV in der weiblichen Regression.
Bündeln Sie die beiden Gruppen und führen Sie ein gemeinsames Modell durch, indem Sie einen Gender-Dummy und einen Interaktionsbegriff (IV * genderdummy) einfügen. Die Erkennung des Gruppeneffekts basiert dann auf dem Zeichen der Wechselwirkung und dem t-Test auf Signifikanz.
Was ist, wenn Ho in Fall (1) abgelehnt wird, dh der Gruppenunterschied ist signifikant, aber der Interaktionskoeffiziententerm in Fall (2) ist statistisch nicht signifikant, dh der Gruppenunterschied ist nicht signifikant. Oder umgekehrt, Ho wird in Fall (1) nicht abgelehnt, und der Interaktionsterm ist in Fall (2) signifikant. Ich bin mehrmals zu diesem Ergebnis gekommen und habe mich gefragt, welches Ergebnis zuverlässiger ist und was der Grund für diesen Widerspruch ist.
Danke vielmals!
Antworten:
Das erste Modell interagiert das Geschlecht vollständig mit allen anderen Kovariaten im Modell. Im Wesentlichen die Wirkung jeder Kovariate (b2, b3 ... bn). Im zweiten Modell wird die Auswirkung des Geschlechts nur mit Ihrer IV interagiert. Angenommen, Sie haben mehr Kovariaten als nur die IV und das Geschlecht, kann dies zu etwas anderen Ergebnissen führen.
Wenn Sie nur die beiden Kovariaten haben, gibt es dokumentierte Fälle, in denen der Unterschied in der Maximierung zwischen dem Wald-Test und dem Likelihood-Ratio-Test zu unterschiedlichen Antworten führt (siehe mehr auf Wikipedia ).
Nach meiner eigenen Erfahrung versuche ich, mich von der Theorie leiten zu lassen. Wenn es eine dominante Theorie gibt, die besagt, dass das Geschlecht nur mit der IV, nicht aber mit den anderen Kovariaten interagiert, würde ich mich für die partielle Interaktion entscheiden.
quelle
Jedes Mal, wenn zwei verschiedene Verfahren zum Testen einer bestimmten Hypothese verwendet werden, ergeben sich unterschiedliche p-Werte. Zu sagen, dass eines von Bedeutung ist und das andere nicht, kann nur eine Schwarz-Weiß-Entscheidung auf der Ebene von 0,05 treffen. Wenn ein Test einen p-Wert von 0,03 ergibt und der andere 0,07, würde ich die Ergebnisse nicht als widersprüchlich bezeichnen. Wenn Sie so streng über die Bedeutung nachdenken, ist es leicht, dass entweder die Situation (i) oder (ii) auftritt, wenn die Bedeutung der Boardline der Fall ist.
Wie ich als Antwort auf die vorherige Frage erwähnt habe, ist es meine Präferenz, nach einer Interaktion zu suchen, eine kombinierte Regression durchzuführen.
quelle
Im zweiten Fall schlägt die Standardsoftware einen t-stat mit t-student p-Werten vor, während im ersten Fall die Wald-Tests zwei Optionen haben können. Unter der Annahme der Fehlernormalität folgt die Wald-Statistik einer exakten Fisher-Statistik (die der t-Statistik entspricht, da sie die Normalität des Fehlers annimmt). Während bei asymptotischer Normalität die Wald-Statistik einer Chi2-Verteilung folgt (die analog zur a t-Statistik nach einer Normalverteilung asimptotisch ist). Welche Verteilung nehmen Sie an? Abhängig davon können Ihre p-Werte zu unterschiedlichen Ergebnissen führen.
In Lehrbüchern finden Sie, dass für bilaterale Einzeltests (ein Parameter) sowohl die T-Student- als auch die Fisher-Statistik gleichwertig sind.
Wenn Ihre Stichprobe nicht groß ist, würde ein Vergleich der Chi2- und T-Stat-Werte mit Sicherheit zu unterschiedlichen Ergebnissen führen. In diesem Fall wäre die Annahme einer asymptotischen Verteilung nicht sinnvoll. Wenn Ihre Stichprobe eher klein ist und die Normalität vernünftiger erscheint, impliziert dies t-stat- und Fisher-p-Werte für Fall 2 bzw. 1.
quelle