Was ist ein Nullmodell in der Regression und wie hängt es mit der Nullhypothese zusammen?

16

Was ist ein Nullmodell in der Regression und in welcher Beziehung steht das Nullmodell zur Nullhypothese?

Für mein Verständnis bedeutet es

  • Verwenden Sie "Durchschnitt der Antwortvariablen", um eine kontinuierliche Antwortvariable vorherzusagen?
  • Verwendung der "Etikettenverteilung" zur Vorhersage diskreter Antwortvariablen?

Wenn dies der Fall ist, scheinen die Verbindungen zwischen der Nullhypothese zu fehlen.

Haitao Du
quelle
4
Beachten Sie, in R können Sie versuchen, fit = lm(formula = y ~ 1, data) und Sie sollten den Mittelwert von sehen y. Siehe auch MorganBalls Antwort. Ich würde seiner Antwort am meisten zustimmen. Ein Nullmodell kann auch ein Modell mit Prädiktoren sein, wobei ein alternatives Modell eines mit , wobei k 1,2, ... zusätzliche Kovariaten sein kann. p + kpp+k
Jon
3
Hier ist eine Referenz für Sie: onlinecourses.science.psu.edu/stat501/node/295
Jon

Antworten:

11

Nein, ich würde sagen, "Nullmodell" hat im Wesentlichen die gleiche Bedeutung wie "Nullhypothese": das Modell, wenn die Nullhypothese wahr ist. Was dies im Einzelfall bedeutet, hängt natürlich von der konkreten Nullhypothese ab.

Ihre Interpretation als "Durchschnittswert" (Sie möchten wahrscheinlich "die Grenzverteilung der Antwortvariablen" sagen) ohne Berücksichtigung von Prädiktoren ist eine Möglichkeit, die der Nullhypothese eines "Omnibus-Tests" entspricht, bei dem alle Parameter getestet werden (außer dem Schnittpunkt) gleichzeitig.

Das Interesse könnte sich jedoch auf ein Modell der Form wobei die Prädiktoren enthält, von denen Sie wissen, dass sie das Ergebnis beeinflussen nicht testen wollen, während die Prädiktoren enthält, die Sie testen. x 1 x 2

yich=β0+β1Tx1ich+β2Tx2ich+ϵich
x1x2

So dass die Nullhypothese wird und das Nullmodell wäre y i = β 0 + β T 1 x 1 i + ε i . Es kommt also darauf an.β2=0yich=β0+β1Tx1ich+ϵich

kjetil b halvorsen
quelle
2
Die Nullhypothese ist normalerweise etwas Spezifisches an Parameterwerten. Ich würde sagen, dass das Nullmodell die Nullhypothese plus aller begleitenden Annahmen ist, unter denen die Nullverteilung der Teststatistik abgeleitet wird - es sind die Annahmen, die den größten Teil des Modells enthalten. Zum Beispiel erwähnt die Nullhypothese keine Unabhängigkeit, aber ich würde definitiv sagen, dass sie Teil des Nullmodells ist.
Glen_b
18

Ein Nullmodell hängt mit einer Nullhypothese zusammen. Nehmen Sie das folgende univariate Modell:

Y.=α+β1X+ϵ

β1

H0:β1=0

HEIN:β10

β1X

Y.=α+ϵ

Y.

Morgan Ball
quelle
1
Bis zum letzten Punkt ist das ja richtig. In R können Sie dies sehen, indem Sie den Achsenabschnitt von lm(y ~ 1, data)und vergleichen mean(y).
Jon
2
+1 Schöne Antwort Morgan! Ich habe mir erlaubt, Ihre Notation ein wenig zu bearbeiten, weil sie merkwürdig aussah.
Alexis
9

In der teilweise in den beiden anderen Antworten beschriebenen Regression ist das Nullmodell die Nullhypothese, dass alle Regressionsparameter 0 sind. Sie können dies also so interpretieren, dass es unter der Nullhypothese keinen Trend und die beste Schätzung / Vorhersage für eine neue gibt Beobachtung ist der Mittelwert, der 0 ist, wenn kein Abschnitt vorliegt.

Michael R. Chernick
quelle
1
Diese Antwort hat mir geholfen, null = 0 in Koeffizienten (außer Intercept) zu verstehen. Danke!
Haitao Du
1
Das Modell kann auch das einzige Intercept-Modell im Vergleich zu einem anderen Modell sein.
D_Williams
1
+1, dies ist eine nützliche Ergänzung zum Thread. Ich würde jedoch sagen, dass dies eine spezifische und sehr restriktive Verwendung des Begriffs "Nullmodell" ist. Der Begriff wird (nach meiner Einschätzung meistens) häufiger verwendet.
gung - Wiedereinsetzung von Monica