Wenn Sie eine Statistiksoftware verwenden, warum wird bei der Definition Ihrer linearen Modelle der Achsenabschnitt als 1 eingegeben und nicht als "const" oder "intercept" oder so. Welche Bedeutung hat ich?
Gibt es einen historischen Grund? Oder ist das irgendwie logisch, was ich nicht verstehe? Der Achsenabschnitt könnte sehr gut eine beliebige Zahl sein.
Beispiel aus der Statistikmodellbibliothek in Python:
model = smf.ols('Height ~ 1', data = height_sample_data)
Ich weiß, dass das Lmer-Paket für R sehr ähnlich ist.
regression
software
intercept
Adam B.
quelle
quelle
Antworten:
Wenn Sie die Matrixnotation berücksichtigen, ist es logisch, dass Ihre Formel intern übersetzt wird. In der Matrix werden die nicht konstanten Prädiktoren in (eine oder mehrere) Spalten übersetzt, und der Achsenabschnitt wird in eine Spalte übersetzt, die vollständig aus Einsen besteht.
Zum Beispiel würden Sie in R ein sehr einfaches OLS schreiben als:
In der Matrixnotation würde dies in ein Modell übersetzt
und jetzt siehst du wo die1 kommt von.
Eigentlich könnten Sie das
1+
weglassen, da R immer davon ausgeht, dass Sie einen Achsenabschnitt einschließen möchten, also ist dies völlig gleichbedeutend mitWenn Sie jedoch den Achsenabschnitt unterdrücken möchten , würden Sie so etwas wie schreiben
was in eine Matrix ohne 1 Spalte übersetzt werden würde:
quelle