Ich hoffe, jemand kann mir dabei helfen, einen Punkt der Verwirrung auszuräumen. Angenommen, ich möchte testen, ob sich zwei Regressionskoeffizientensätze signifikant voneinander unterscheiden, und zwar mit folgendem Aufbau:
- mit 5 unabhängigen Variablen.
- 2 Gruppen mit ungefähr gleichen Größen (obwohl dies variieren kann)
- Tausende von ähnlichen Regressionen werden gleichzeitig durchgeführt, daher muss eine Art Mehrfachhypothesenkorrektur durchgeführt werden.
Ein Ansatz, der mir vorgeschlagen wurde, ist die Verwendung eines Z-Tests:
Ein anderer Vorschlag, den ich auf dieser Tafel gesehen habe, ist die Einführung einer Dummy-Variablen zum Gruppieren und Neuschreiben des Modells als:
; i , wobei g die Gruppierungsvariable ist, codiert als 0, 1.
Meine Frage ist, wie unterscheiden sich diese beiden Ansätze (z. B. unterschiedliche Annahmen, Flexibilität)? Ist einer angemessener als der andere? Ich vermute, das ist ziemlich einfach, aber jede Klarstellung wäre sehr dankbar.
Antworten:
Die beiden Ansätze unterscheiden sich.
Die kombinierte Regression geht davon aus, dass die Varianzen der Residuen in beiden getrennten Regressionen im Wesentlichen gleich sind. Ist dies nicht der Fall, ist der Z-Test auch nicht gut (es sei denn, die Stichproben sind groß): Sie würden einen CABF-Test oder einen Welch-Satterthwaite-T-Test verwenden.
quelle
Der direkteste Weg, um den Koeffizientenunterschied zwischen zwei Gruppen zu testen, besteht darin, einen Interaktionsterm in Ihre Regression einzubeziehen. Dies ist fast das, was Sie in Ihrer Frage beschreiben. Das Modell, das Sie ausführen würden, ist das folgende:
quelle