Was ist der Unterschied zwischen der Steuerung einer Variablen in einem Regressionsmodell und der Steuerung einer Variablen in Ihrem Studiendesign?

11

Ich stelle mir vor, dass die Steuerung einer Variablen in Ihrem Studiendesign die Fehler wirksamer reduziert als die post-hoc-Steuerung in Ihrem Regressionsmodell.

Würde es jemandem etwas ausmachen, formal zu erklären, wie sich diese beiden Fälle von "Controlling" unterscheiden? Wie vergleichsweise effektiv können sie Fehler reduzieren und genauere Vorhersagen liefern?

mrt
quelle

Antworten:

13

Unter "Steuern einer Variablen in Ihrem Studiendesign" verstehen Sie vermutlich, dass eine Variable über alle Lerneinheiten hinweg konstant ist, oder dass Sie eine Variable so manipulieren, dass die Ebene dieser Variablen für jede Lerneinheit unabhängig festgelegt wird. Das heißt, die Steuerung einer Variablen in Ihrem Studiendesign bedeutet, dass Sie ein echtes Experiment durchführen . Dies hat den Vorteil, dass es bei der Schlussfolgerung der Kausalität helfen kann .

Theoretisch kann die Steuerung einer Variablen in Ihrem Regressionsmodell auch dazu beitragen, auf die Kausalität zu schließen. Dies ist jedoch nur dann der Fall, wenn Sie für jede Variable steuern, die einen direkten Kausalzusammenhang mit der Antwort hat. Wenn Sie eine solche Variable weglassen (vielleicht haben Sie nicht gewusst, dass sie eingeschlossen wird) und sie mit einer der anderen Variablen korreliert , sind Ihre kausalen Schlussfolgerungen verzerrt und falsch. In der Praxis kennen wir nicht alle relevanten Variablen, daher ist die statistische Kontrolle ein ziemlich heikles Unterfangen, das auf großen Annahmen beruht, die Sie nicht überprüfen können.

In Ihrer Frage geht es jedoch darum, "Fehler zu reduzieren und genauere Vorhersagen zu erzielen" und nicht auf Kausalität zu schließen. Dies ist ein anderes Problem. Wenn Sie eine bestimmte Variable durch Ihr Studiendesign konstant halten würden, würde die gesamte Variabilität der Antwort aufgrund dieser Variablen eliminiert. Wenn Sie dagegen einfach eine Variable steuern, schätzen Sie deren Auswirkung, die mindestens einem Stichprobenfehler unterliegt . Mit anderen Worten, die statistische Kontrolle wäre auf lange Sicht nicht so gut, um die Restvarianz in Ihrer Stichprobe zu reduzieren.

Wenn Sie jedoch daran interessiert sind, Fehler zu reduzieren und genauere Vorhersagen zu erhalten, kümmern Sie sich vermutlich in erster Linie um die Eigenschaften der Stichprobe, nicht um die Genauigkeit Ihrer Stichprobe. Und darin liegt die Reibung. Wenn Sie eine Variable steuern, indem Sie sie in irgendeiner Form manipulieren (konstant halten usw.), erzeugen Sie eine Situation, die künstlicher ist als die ursprüngliche, natürliche Beobachtung. Das heißt, Experimente haben tendenziell eine geringere externe Validität / Generalisierbarkeit als Beobachtungsstudien.


Falls es nicht klar ist, könnte ein Beispiel für ein echtes Experiment, das etwas konstant hält, die Bewertung einer Behandlung in einem Mausmodell unter Verwendung von Inzuchtmäusen sein, die alle genetisch identisch sind. Andererseits könnte ein Beispiel für die Steuerung einer Variablen darin bestehen, die Familiengeschichte von Krankheiten durch einen Dummy-Code darzustellen und diese Variable in ein multiples Regressionsmodell aufzunehmen (vgl. Wie genau kontrolliert man andere Variablen? Und wie) Kann das Hinzufügen einer 2. IV die 1. IV signifikant machen? ).

gung - Monica wieder einsetzen
quelle
1
Tolle Erklärungen! @gung
Aaron Zeng