Warum führen Menschen häufig eine Regression mit und ohne Kontrollvariablen durch?

8

Ich führe häufig Regressionen aus einem Low-n-Datensatz aus (~ 100 Beobachtungen). Oft sind die Ergebnisse nur unter Einbeziehung von Kontrollvariablen signifikant. Ich sehe jedoch oft Zeitschriftenartikel, in denen Leute (immer mit einer großen Anzahl von Beobachtungen) behaupten, ihre Regression "mit und ohne Kontrollvariablen" durchgeführt zu haben.

Warum führen Menschen häufig eine Regression mit und ohne Kontrollvariablen durch?

ChrisStata
quelle
Wenn ich also nur dann ein Ergebnis erhalte, wenn ich einige Variablen statistisch kontrolliere, was bedeutet das?
ChrisStata

Antworten:

5

Ein bisschen zu den Bedingungen zuerst. Per Definition wird die Kontrollvariable während der Studie konstant gehalten, sodass Sie sie nicht für die Regression verwenden können. Sie meinen wahrscheinlich Variablen, für die statistisch kontrolliert werden sollte . Wie Kovariaten oder Blockierungsfaktoren (wie nach experimentellem Blockdesign)

Menschen führen eine Regression oder ANOVA mit solchen Variablen durch, um nicht nur ihren Effekt von Prädiktorvariablen abzuwaschen, sondern hauptsächlich um zu überprüfen, ob ihr eigener Effekt signifikant ist. Wenn es von Bedeutung ist, ist ihre Aufnahme in das Modell vollständig gewährleistet. Wenn nicht, können sie besser vom Modell ausgeschlossen werden.

Dies ist vor allem für einen Blockierungsfaktor wichtig. Wenn Sie es im Modell belassen, obwohl es nicht signifikant ist, besteht die Gefahr, dass Sie den Effekt von Prädiktorvariablen aufgrund der Abnahme des Fehlerterms df verpassen. Der Blockierungsfaktor verringert sowohl den Fehler als auch seinen df , und es scheint eine Wettbewerbssituation zu bestehen. Die Signifikanz von Prädiktoren kann sinken oder steigen, abhängig von "was gewinnt" - Fall of Error Summe der Quadrate des Falls seines df . Dies kann der Grund sein, warum Menschen manchmal prägnantere Modelle bevorzugen.

Ein weiterer Grund dafür kann sein, dass bei einer Stichprobe von bis zu 100 Einschlüssen viele IVs, selbst wenn sie alle wichtig oder signifikant erscheinen, zu einer Überanpassung führen .

ttnphns
quelle
Ja, sorry, ich meine eine Variable, für die ich statistisch kontrolliere.
ChrisStata
Unabhängig davon, ob dies angemessen ist oder nicht, werden Kovariaten in der Wirtschaft häufig als Kontrollvariablen oder Kontrollen bezeichnet.
Peutch
3

Ein weiterer Grund, Kovariaten aufzunehmen, ist, dass sie in der Literatur wichtig sind. Wenn Sie nachweisen können, dass eine Kovariate, bei der in der Vergangenheit große Auswirkungen festgestellt wurden (entweder allein oder durch Beeinflussung anderer Parameter), in Ihrer Studie KEINE großen Auswirkungen hat, haben Sie etwas Interessantes entdeckt.

Peter Flom
quelle
2

In der Regel bedeutet dies, dass es eine Regression mit einem Ergebnis und einer Behandlungsvariablen gibt. Dann gibt es andere Steuerelemente, die dem Modell hinzugefügt werden könnten - andere Kovariaten, die wichtig sein könnten. Die Autoren führen zunächst ein einfaches Modell durch, das nur die Behandlung umfasst. Anschließend überprüfen sie die Robustheit ihrer Ergebnisse unter Einbeziehung anderer Variablen. Insbesondere fragen sie, ob die Einbeziehung anderer Kovariaten die im einfachen Modell geschätzten Auswirkungen verringert oder beseitigt.

Darüber hinaus reduziert die Einbeziehung anderer Kovariaten typischerweise Standardfehler. In diesem Fall stellen die Autoren möglicherweise fest, dass die geschätzten Auswirkungen zwischen dem einfachen Modell und dem Modell, das Kontrollen enthält, relativ ähnlich sind, aber nur in letzterem Fall ist die Schätzung signifikant (normalerweise verschieden von 0). Die Autoren würden dann das letztere Modell verwenden, um aufgrund seiner kleineren Standardfehler eine Inferenz (Hypothesentests, Konfidenzintervalle) durchzuführen.

Charlie
quelle
1

Zusätzlich zu den obigen Antworten gibt es einige kovariate Auswahlverfahren, bei denen Modelle mit und ohne vorhandene Variable verglichen werden. Und wenn man den Effekt des Hinzufügens einer Kovariate veranschaulichen möchte, ist zunächst das rohe (nicht angepasste) Modell als Referenz erforderlich.

Fomite
quelle