Warum wird der Achsenabschnitt in Statistikpaketen (R, Python) als 1 eingegeben?

Wenn Sie eine Statistiksoftware verwenden, warum wird bei der Definition Ihrer linearen Modelle der Achsenabschnitt als 1 eingegeben und nicht als "const" oder "intercept" oder so. Welche Bedeutung hat ich?

Gibt es einen historischen Grund? Oder ist das irgendwie logisch, was ich nicht verstehe? Der Achsenabschnitt könnte sehr gut eine beliebige Zahl sein.

Beispiel aus der Statistikmodellbibliothek in Python:

model = smf.ols('Height ~ 1', data = height_sample_data)

Ich weiß, dass das Lmer-Paket für R sehr ähnlich ist.

regression software intercept Adam B.
quelle

Der Achsenabschnitt ist der Koeffizient (der tatsächlich einen beliebigen Wert haben kann), aber was Sie in das Regressionsprogramm eingeben, wenn Sie das Modell anpassen, sind nicht die Koeffizienten, sondern die Dinge, mit denen Sie die Koeffizienten in der Regressionsgleichung multiplizieren (die

x

$x$ 's). Womit multiplizieren Sie den Achsenabschnitt in der Regressionsgleichung? (Beachten Sie, dass

β_{0} \times 1 = β_{0}

$\beta_0 \times 1 = \beta_0$ .)

Glen_b -Reinstate Monica

Antworten:

Wenn Sie die Matrixnotation berücksichtigen, ist es logisch, dass Ihre Formel intern übersetzt wird. In der Matrix werden die nicht konstanten Prädiktoren in (eine oder mehrere) Spalten übersetzt, und der Achsenabschnitt wird in eine Spalte übersetzt, die vollständig aus Einsen besteht.

Zum Beispiel würden Sie in R ein sehr einfaches OLS schreiben als:

lm(z~1+x+y)

In der Matrixnotation würde dies in ein Modell übersetzt

(\begin{matrix} z_{1} \\ z_{2} \\ ⋮ \\ z_{n} \end{matrix}) = (\begin{matrix} 1 & x_{1} & y_{1} \\ 1 & x_{2} & y_{2} \\ ⋮ & ⋮ & ⋮ \\ 1 & x_{n} & y_{n} \end{matrix}) (\begin{matrix} β_{0} \\ β_{x} \\ β_{z} \end{matrix}) + (\begin{matrix} ϵ_{1} \\ ϵ_{2} \\ ⋮ \\ ϵ_{n} \end{matrix}),

$\begin{pmatrix} z_1 \\ z_2 \\ \vdots \\ z_n \end{pmatrix} = \begin{pmatrix} 1 & x_1 & y_1 \\ 1 & x_2 & y_2 \\ \vdots & \vdots & \vdots \\ 1 & x_n & y_n \end{pmatrix} \begin{pmatrix} \beta_0 \\ \beta_x \\ \beta_z \end{pmatrix} +\begin{pmatrix} \epsilon_1 \\ \epsilon_2 \\ \vdots \\ \epsilon_n \end{pmatrix},$

und jetzt siehst du wo die $1$ kommt von.

Eigentlich könnten Sie das 1+weglassen, da R immer davon ausgeht, dass Sie einen Achsenabschnitt einschließen möchten, also ist dies völlig gleichbedeutend mit

lm(z~x+y).

Wenn Sie jedoch den Achsenabschnitt unterdrücken möchten , würden Sie so etwas wie schreiben

lm(z~x+y-1),

was in eine Matrix ohne 1 Spalte übersetzt werden würde:

(\begin{matrix} z_{1} \\ z_{2} \\ ⋮ \\ z_{n} \end{matrix}) = (\begin{matrix} x_{1} & y_{1} \\ x_{2} & y_{2} \\ ⋮ & ⋮ \\ x_{n} & y_{n} \end{matrix}) (\begin{matrix} β_{x} \\ β_{z} \end{matrix}) + (\begin{matrix} ϵ_{1} \\ ϵ_{2} \\ ⋮ \\ ϵ_{n} \end{matrix}),

$\begin{pmatrix} z_1 \\ z_2 \\ \vdots \\ z_n \end{pmatrix} = \begin{pmatrix} x_1 & y_1 \\ x_2 & y_2 \\ \vdots & \vdots \\ x_n & y_n \end{pmatrix} \begin{pmatrix} \beta_x \\ \beta_z \end{pmatrix} +\begin{pmatrix} \epsilon_1 \\ \epsilon_2 \\ \vdots \\ \epsilon_n \end{pmatrix},$

Stephan Kolassa
quelle