Kann ich eine krummlinige Beziehung nachweisen, wenn die lineare unabhängige Variable nicht signifikant ist?

8

Ich untersuche einen krummlinigen Effekt zwischen X und Y mithilfe einer hierarchischen Regressionsanalyse. Um krummlinige Effekte zu testen, wurde der quadratische Term für X berechnet (ich meine Zentrum auch Variable X).

In Modell 1 wurden die Steuervariablen eingegeben. In Modell 2 wurde X (linear) eingegeben. In Modell 3 wurde X (quadratisch) eingegeben.

In Modell 2 ist X linear signifikant. Wenn der quadratische Term in Modell 3 eingegeben wird, ist der quadratische Term signifikant, der lineare Term jedoch nicht. Beweist dies einen krummlinigen Effekt? Oder ist es wichtig, dass in Modell 3 beide (linear und quadratisch) signifikant sind?

Wenn ich nicht meine, die unabhängige Variable zu zentrieren, hat Modell 3 X linear und X quadratisch signifikant angegeben. Das Problem hierbei sind Multikollinearitätsprobleme.

Sanne
quelle

Antworten:

6

Nein, es ist nicht wesentlich, dass sowohl der lineare als auch der quadratische Term signifikant sind. Nur der quadratische Term muss signifikant sein.

In der Tat ist zu beachten, dass der lineare Term im Kontext eines Modells, das auch den quadratischen Term enthält, eine etwas andere Interpretation annimmt. In einem solchen Modell repräsentiert der lineare Term nun die Steigung der Linie, die x am y-Achsenabschnitt tangiert, dh die vorhergesagte Steigung von x, wenn und nur wenn x = 0 ist . Ein Test des linearen Terms in einem Modell wie diesem ist also im Allgemeinen nicht das gleiche wie in einem Modell, das nur den linearen Term ohne das Quadrat enthält.

Jake Westfall
quelle
0

Überlegen Sie, was Bedeutung bedeutet. Eine Beziehung der von Ihnen vorgeschlagenen Form kann als charakterisiert und empirisch als geschätzt werden .Y = α 1 X 2 + α 2 X + β + εY=a1X2+a2X+bY^=α1X^2+α2X^+β+ϵ

Was bedeutet die Bedeutung einer Schätzung - sagen wir -? Die Signifikanz ist Pr (Daten | H0), und bei einer Wahrscheinlichkeit, die "nicht signifikant" ist, lehnen Sie die Möglichkeit, dass der Koeffizient tatsächlich Null sein könnte, wirklich nicht ab.α2

Macht dies die Annahme einer krummlinigen Beziehung ungültig? Nicht meiner Meinung nach. Vielmehr scheint es nahezulegen, dass wirklich Null ist.a2

Betrachten Sie das folgende Beispiel (geschrieben in Stata).

Zuerst generieren wir einige Daten:

set obs 20000
gen x = uniform()
gen control_one = uniform()
gen control_two = uniform()
drawnorm e, m(0) sd(0.5)

Wir geben dann eine neue Variable X = x ^ 2 und eine Beziehung für eine Ergebnisvariable Y an

gen Y = control_one+control_two+X+e

(Dies entspricht einem mehrdimensionalen krummlinigen Modell in x mit einem Koeffizienten des linearen und konstanten Terms gleich Null).

Wir führen dann einige Regressionen durch:

reg Y control_one control_two
reg Y control_one control_two x
reg Y control_one control_two X x

Der x-Term ist im zweiten Modell signifikant, im dritten jedoch nicht. Soweit ich weiß, spiegelt dies Ihre Erfahrung mit realen Daten wider.

abaumann
quelle
0

Es ist eigentlich nicht wesentlich, dass einer der beiden Begriffe von Bedeutung ist, aber Sie beweisen nie etwas mit nur einem Modell.

Die angegebenen Schätzungen der Koeffizienten sind Schätzungen und liefern Belege. Ein großer Koeffizient auf dem quadratischen Term liefert viele Beweise, ein kleiner Koeffizient liefert ein wenig Beweise für eine krummlinige Beziehung. Der lineare Term ist irrelevant. Es kann positiv, negativ, nahe 0 oder was auch immer sein.

Eine grafische Darstellung der Daten liefert auch Hinweise auf eine krummlinige Beziehung.

Statistische Signifikanz bedeutet eine sehr genaue Sache: Wenn in der Population, aus der diese Stichprobe gezogen wurde, der Effekt tatsächlich 0 war, besteht eine 5% ige Wahrscheinlichkeit, dass in einer Stichprobe der verfügbaren Größe eine Teststatistik bis jetzt oder weiter von 0 würde bekommen werden.

Peter Flom
quelle
0

Wie bereits erwähnt, steht die Bedeutung des krummlinigen Terms unabhängig von der Bedeutung des linearen Terms in der Regression für sich. Wenn der lineare Term nahe Null ist, ist die Kurve ein U oder ein invertiertes U, wenn sie signifikant ist. Wenn beide Terme signifikant sind, ähnelt die resultierende Linie eher einem Hügel mit einer beschleunigenden (oder verlangsamenden) Steigung.

StatistikDoc-Beratung
quelle