Wenn wir mehrere Regressionen durchführen und sagen, dass wir die durchschnittliche Änderung in der Variablen auf eine Änderung in einer Variablen untersuchen und alle anderen Variablen konstant halten, bei welchen Werten halten wir die anderen Variablen konstant? Ihr gemeiner? Null? Irgendein Wert?
Ich bin geneigt zu glauben, dass es irgendeinen Wert hat. nur auf der Suche nach Klarstellung. Wenn jemand einen Beweis hätte, wäre das auch großartig.
multiple-regression
interpretation
least-squares
regression-coefficients
controlling-for-a-variable
EconStats
quelle
quelle
Antworten:
Du hast recht. Technisch gesehen ist es jeder Wert . Wenn ich dies unterrichte, sage ich den Leuten normalerweise, dass Sie die Wirkung einer Änderung von einer Einheit inXj wenn alle anderen Variablen auf ihren jeweiligen Mitteln gehalten werden. Ich glaube, dies ist eine übliche, für mich nicht spezifische Erklärungsweise.
Normalerweise erwähne ich weiter, dass , wenn Sie keine Wechselwirkungen haben, der Effekt einer Änderung um eine Einheit in X j ist , unabhängig von den Werten Ihrer anderen Variablen. Ich beginne aber gerne mit der Mittelwertformulierung. Der Grund ist, dass es zwei Effekte gibt, wenn mehrere Variablen in ein Regressionsmodell einbezogen werden. Zuerst erhalten Sie den Effekt von X j, das für die anderen Variablen steuert (sehen Sie meine Antwort hier ). Das zweite ist, dass das Vorhandensein der anderen Variablen (normalerweise) die Restvarianz des Modells reduziert und Ihre Variablen (einschließlich X j) erstelltβj Xj Xj Xj ) 'bedeutendere'. Es ist schwer für die Leute zu verstehen, wie dies funktioniert, wenn die anderen Variablen Werte haben, die überall vorkommen. Das scheint die Variabilität irgendwie zu erhöhen . Wenn Sie daran denken, jeden Datenpunkt für den Wert der anderen Variablen nach oben oder unten anzupassen, bis alle übrigen Variablen auf ihre jeweiligen Mittelwerte verschoben wurden, ist es einfacher zu erkennen, dass die Restvariabilität verringert wurde. X
Ich komme erst nach ein oder zwei Klassen zu Interaktionen, nachdem ich die Grundlagen der multiplen Regression eingeführt habe. Wenn ich jedoch zu ihnen komme, kehre ich zu diesem Material zurück. Das oben Gesagte gilt, wenn keine Wechselwirkungen vorliegen. Wenn es Wechselwirkungen gibt, ist es komplizierter. In diesem Fall wird die interagierende Variable (s) (sehr spezifisch) auf und auf keinem anderen Wert konstant gehalten .0
Wenn Sie sehen möchten, wie dies algebraisch abläuft, ist es ziemlich einfach. Wir können mit dem Fall ohne Interaktion beginnen. Lassen Sie uns die Änderung der Bestimmung Y , wenn alle anderen Variablen konstant bleiben an ihren jeweiligen Mittel sind. Ohne Beschränkung der Allgemeinheit, sagen wir mal , dass es drei X - Variablen und wir verstehen interessiert , wie die Änderung in Y mit einer Einheitsänderung in zugeordnet ist , X 3 , hält X 1 und X 2 konstant an ihren jeweiligen Mitteln:Y^ X Y^ X3 X1 X2
Nun ist es offensichtlich, dass wir in den ersten beiden Gleichungen jeden Wert für X 1 und X 2 eingeben könnten , solange wir in beiden den gleichen Wert für X 1 ( X 2 ) eingeben. Das heißt, solange wir X 1 und X 2 konstant halten .X1 X2 X1 X2 X1 X2
Auf der anderen Seite funktioniert es nicht so, wenn Sie eine Interaktion haben. Hier zeige ich den Fall, in dem es einen -Interaktionsbegriff gibt:X1X3
In diesem Fall ist es nicht möglich, alles andere konstant zu halten. Da der Interaktionsterm eine Funktion von und X 3 ist , ist es nicht möglich, X 3 zu ändern, ohne dass sich auch der Interaktionsterm ändert. Somit ß 3 die Änderung in gleich Y mit einer Einheitsänderung in zugeordnete X 3 nur dann , wenn die Wechselwirkungsvariable ( X 1 ) gehalten wird , bei 0 anstelle von ˉ X 1 (oder einem anderen Wert , aber 0 ), in welchem Fall der letzte Term in der unteren Gleichung entfällt.X1 X3 X3 β^3 Y^ X3 X1 0 X¯1 0
In dieser Diskussion habe ich mich auf Interaktionen konzentriert, aber im Allgemeinen ist das Problem, wenn es eine Variable gibt, die eine Funktion einer anderen ist, so dass es nicht möglich ist, den Wert der ersten zu ändern, ohne den jeweiligen Wert der anderen Variablen zu ändern . In solchen Fällen ist die Bedeutung des ß j wird komplizierter. Zum Beispiel, wenn Sie ein Modell mit hatten X j und X 2 j , dann β j ist die Ableitung d Yβ^j Xj X2j β^j hält alle anderen gleich undXj=0(siehe meine Antworthier). Andere, noch kompliziertere Formulierungen sind ebenfalls möglich. dYdXj Xj=0
quelle
Die Mathematik ist einfach. Nehmen Sie einfach den Unterschied zwischen zwei Modellen mit einer um 1 geänderten x-Variablen und Sie werden sehen, dass die anderen Variablen keine Rolle spielen (vorausgesetzt, es gibt keine Wechselwirkungen, Polynome oder andere komplizierende Begriffe).
Ein Beispiel:
quelle
Ich glaube, Sie sprechen von Abhängigkeit in Kovariaten ( ). Wenn das Modell also Y = β 0 + β 1 X 1 + β 2 X 2 ist, wäre die Auswirkung von X i auf Y , wenn alle anderen Dinge gleich sind, Δ YXi
quelle