Was bedeutet "alle anderen gleich" bei multipler Regression?

22

Wenn wir mehrere Regressionen durchführen und sagen, dass wir die durchschnittliche Änderung in der Variablen auf eine Änderung in einer Variablen untersuchen und alle anderen Variablen konstant halten, bei welchen Werten halten wir die anderen Variablen konstant? Ihr gemeiner? Null? Irgendein Wert?yx

Ich bin geneigt zu glauben, dass es irgendeinen Wert hat. nur auf der Suche nach Klarstellung. Wenn jemand einen Beweis hätte, wäre das auch großartig.

EconStats
quelle
2
Ich fand Beispiel 10 in Peter Kennedys Artikel sehr hilfreich, um dies zu verstehen.
Dimitriy V. Masterov
Ja, das gewisse Etwas, bei dem es darum geht, die Anzahl der Räume zu erhöhen und gleichzeitig die Quadratmeter konstant zu halten, ist ein wirklich aufmerksamer Punkt. Das Papier ist tatsächlich eine Goldmine nützlicher Ideen, wie in den Doktorandennotizen zu lesen ist.
EconStats
1
Das ist eigentlich eine sehr interessante Frage, ich frage mich, ob sich Ökonomen fragen, was "ceteris paribus" genau bedeutet.
mugen

Antworten:

26

Du hast recht. Technisch gesehen ist es jeder Wert . Wenn ich dies unterrichte, sage ich den Leuten normalerweise, dass Sie die Wirkung einer Änderung von einer Einheit in Xj wenn alle anderen Variablen auf ihren jeweiligen Mitteln gehalten werden. Ich glaube, dies ist eine übliche, für mich nicht spezifische Erklärungsweise.

Normalerweise erwähne ich weiter, dass , wenn Sie keine Wechselwirkungen haben, der Effekt einer Änderung um eine Einheit in X j ist , unabhängig von den Werten Ihrer anderen Variablen. Ich beginne aber gerne mit der Mittelwertformulierung. Der Grund ist, dass es zwei Effekte gibt, wenn mehrere Variablen in ein Regressionsmodell einbezogen werden. Zuerst erhalten Sie den Effekt von X j, das für die anderen Variablen steuert (sehen Sie meine Antwort hier ). Das zweite ist, dass das Vorhandensein der anderen Variablen (normalerweise) die Restvarianz des Modells reduziert und Ihre Variablen (einschließlich X j) erstelltβjXjXjXj) 'bedeutendere'. Es ist schwer für die Leute zu verstehen, wie dies funktioniert, wenn die anderen Variablen Werte haben, die überall vorkommen. Das scheint die Variabilität irgendwie zu erhöhen . Wenn Sie daran denken, jeden Datenpunkt für den Wert der anderen Variablen nach oben oder unten anzupassen, bis alle übrigen Variablen auf ihre jeweiligen Mittelwerte verschoben wurden, ist es einfacher zu erkennen, dass die Restvariabilität verringert wurde. X

Ich komme erst nach ein oder zwei Klassen zu Interaktionen, nachdem ich die Grundlagen der multiplen Regression eingeführt habe. Wenn ich jedoch zu ihnen komme, kehre ich zu diesem Material zurück. Das oben Gesagte gilt, wenn keine Wechselwirkungen vorliegen. Wenn es Wechselwirkungen gibt, ist es komplizierter. In diesem Fall wird die interagierende Variable (s) (sehr spezifisch) auf und auf keinem anderen Wert konstant gehalten . 0

Wenn Sie sehen möchten, wie dies algebraisch abläuft, ist es ziemlich einfach. Wir können mit dem Fall ohne Interaktion beginnen. Lassen Sie uns die Änderung der Bestimmung Y , wenn alle anderen Variablen konstant bleiben an ihren jeweiligen Mittel sind. Ohne Beschränkung der Allgemeinheit, sagen wir mal , dass es drei X - Variablen und wir verstehen interessiert , wie die Änderung in Y mit einer Einheitsänderung in zugeordnet ist , X 3 , hält X 1 und X 2 konstant an ihren jeweiligen Mitteln: Y^XY^X3X1X2

Y^i=β^0+β^1X¯1+β^2X¯2+β^3X3iY^i=β^0+β^1X¯1+β^2X¯2+β^3(X3i+1) subtracting the first equation from the second: Y^iY^i=β^0β^0+β^1X¯1β^1X¯1+β^2X¯2β^2X¯2+β^3(X3i+1)β^3X3iΔY=β^3X3i+β^3β^3X3iΔY=β^3

Nun ist es offensichtlich, dass wir in den ersten beiden Gleichungen jeden Wert für X 1 und X 2 eingeben könnten , solange wir in beiden den gleichen Wert für X 1 ( X 2 ) eingeben. Das heißt, solange wir X 1 und X 2 konstant halten . X1X2X1X2X1X2

Auf der anderen Seite funktioniert es nicht so, wenn Sie eine Interaktion haben. Hier zeige ich den Fall, in dem es einen -Interaktionsbegriff gibt: X1X3

Y^i=β^0+β^1X¯1+β^2X¯2+β^3X3i +β^4X¯1X3iY^i=β^0+β^1X¯1+β^2X¯2+β^3(X3i+1)+β^4X¯1(X3i+1) subtracting the first equation from the second: Y^iY^i=β^0β^0+β^1X¯1β^1X¯1+β^2X¯2β^2X¯2+β^3(X3i+1)β^3X3i+ β^4X¯1(X3i+1)β^4X¯1X3iΔY=β^3X3i+β^3β^3X3i+β^4X¯1X3i+β^4X¯1β^4X¯1X3iΔY=β^3+β^4X¯1

In diesem Fall ist es nicht möglich, alles andere konstant zu halten. Da der Interaktionsterm eine Funktion von und X 3 ist , ist es nicht möglich, X 3 zu ändern, ohne dass sich auch der Interaktionsterm ändert. Somit ß 3 die Änderung in gleich Y mit einer Einheitsänderung in zugeordnete X 3 nur dann , wenn die Wechselwirkungsvariable ( X 1 ) gehalten wird , bei 0 anstelle von ˉ X 1 (oder einem anderen Wert , aber 0 ), in welchem Fall der letzte Term in der unteren Gleichung entfällt. X1X3X3β^3Y^X3 X10X¯10

In dieser Diskussion habe ich mich auf Interaktionen konzentriert, aber im Allgemeinen ist das Problem, wenn es eine Variable gibt, die eine Funktion einer anderen ist, so dass es nicht möglich ist, den Wert der ersten zu ändern, ohne den jeweiligen Wert der anderen Variablen zu ändern . In solchen Fällen ist die Bedeutung des ß j wird komplizierter. Zum Beispiel, wenn Sie ein Modell mit hatten X j und X 2 j , dann β j ist die Ableitung d Yβ^jXjXj2β^j hält alle anderen gleich undXj=0(siehe meine Antworthier). Andere, noch kompliziertere Formulierungen sind ebenfalls möglich. dYdXjXj=0

gung - Wiedereinsetzung von Monica
quelle
1
Danke Gung, diese Antwort ist auf ein paar Ebenen großartig. Erstens beantwortet es den wichtigsten Punkt, an dem ich interessiert war. Zweitens haben Sie vorhergesagt, was meine Folgefrage sein würde, weil ich fragen wollte, wie sich dies mit der Einführung von Interaktionsbegriffen ändern würde. Danke auch für die Mathe. Ich weiß, dass diese Frage grundlegend ist, aber ich bin der Meinung, dass Sie mit diesen Konzepten niemals zu deutlich werden können.
EconStats
Gern geschehen, @EconStats. Das Einbeziehen der Mathematik ist kein Problem, manchmal ist es viel einfacher zu verstehen, was vor sich geht.
gung - Reinstate Monica
Nun, ich muss sagen, dass, als Sie die erste Gleichung von der zweiten Gleichung subtrahierten, meine ursprünglichen Überlegungen endgültig bestätigt wurden, dass es egal ist, wie die Werte von und X 3 sind, solange sie in beiden Gleichungen gleich sind. Es scheint mir so offensichtlich zu sein, aber ich hatte noch nie darüber nachgedacht, das β so zu berechnen . Bestimmtes Glühbirnenmoment für mich. X2X3β
EconStats
Sie können auch die Ableitung von nach X j nehmen, um zum selben Ort zu gelangen. Dies ist jedoch einfacher zu verstehen (im Wesentlichen Algebra der Highschool), sodass es einem breiteren Publikum zugänglich ist. YXj
gung - Wiedereinsetzung von Monica
1
@beetroot, wenn ich Sie richtig verstehe, halten Sie es einfach auf einem bestimmten Niveau. (Andernfalls könnten Sie dies als neue Frage stellen.)
gung - Reinstate Monica
8

Die Mathematik ist einfach. Nehmen Sie einfach den Unterschied zwischen zwei Modellen mit einer um 1 geänderten x-Variablen und Sie werden sehen, dass die anderen Variablen keine Rolle spielen (vorausgesetzt, es gibt keine Wechselwirkungen, Polynome oder andere komplizierende Begriffe).

Ein Beispiel:

y[1]=b0+b1×x1+b2×x2

y[2]=b0+b1×(x1+1)+b2×x2

y[2]y[1]=b0b0+b1×x1b1×x1+b1×1+b2×x2b2×x2=b1

Greg Snow
quelle
6

Ich glaube, Sie sprechen von Abhängigkeit in Kovariaten ( ). Wenn das Modell also Y = β 0 + β 1 X 1 + β 2 X 2 ist, wäre die Auswirkung von X i auf Y , wenn alle anderen Dinge gleich sind, Δ YXi

Y=β0+β1X1+β2X2
XiY für jedesΔXi,wobei alle anderenXjauf einem beliebigen Wert konstant gehalten werden.ΔYΔXiΔXiXj

X1X2β12=0Y=β0+β1X1+β2X2+β12X1X2

X1N(0,σ12)X2=X12+N(0,σ22)X1X2

cov(X1,X2)=E(X1X2)E(X1)E(X2)
=E[X1(X12+a)]E(X1).E(X12a)withaN(0,σ22)
=E(X13)E(X1.a)0.E(X12a)=000=0

X1X2ΔYΔXiX1ΔYΔXiXiY

ΔYΔXi

Hans Roggeman
quelle
Danke Hans, ich habe eigentlich versucht, an den Punkt zu kommen, an dem Gung gemacht wurde, aber dies ist ein gutes Beispiel dafür, wenn die beiden Variablen abhängig sind.
EconStats