Gibt es eine intuitive Erklärung für diese Terminologie? Warum ist es so und nicht der / die Prädiktor (en) wird / werden in Bezug auf das Ergebnis zurückgebildet?
Im Idealfall hoffe ich, dass eine korrekte Erklärung, warum diese Terminologie existiert, den Schülern hilft, sich daran zu erinnern und sie daran zu hindern, es falsch herum auszudrücken.
regression
terminology
teaching
user1205901 - Setzen Sie Monica wieder ein
quelle
quelle
Antworten:
Ich weiß nicht, worauf sich die Etymologie von "zurückgebildet" bezieht, aber hier ist die Interpretation, die ich im Sinn habe, wenn ich diesen Ausdruck sage oder höre. Betrachten Sie die folgende Abbildung aus den Elementen des statistischen Lernens von Hastie et al .:
In ihrem Kern entspricht die lineare Regression der orthogonalen Projektion von auf (auf) , wobei der dimensionale Beobachtungsvektor der abhängigen Variablen und der von den Prädiktorvektoren aufgespannte Unterraum ist .y X y n X
Dies ist eine sehr nützliche Interpretation der linearen Regression.
Da auf projiziert wird, denke ich, wenn ich das hörey X y auf "regressiv" ist . Unter diesem Gesichtspunkt wäre es weniger sinnvoll zu sagen, dass X auf y zurückgegangen ist oder dass y "gegen" oder "mit" X zurückgegangen ist .X X y y X
Wie gesagt, ich bezweifle, dass dies eine Erklärung dafür ist, warum diese Terminologie existiert (vielleicht nur, warum sie fortbesteht?), Aber ich bin sicher, dass sie den Schülern helfen kann, sich daran zu erinnern.
quelle
Ich habe diese Art zu sprechen oft benutzt und gehört. Ich würde vermuten, dass die Sequenz, in der das Ergebnis oder die Reaktion vor den Prädiktoren erwähnt wird, aus Konventionen in schriftlicher Form, mit Worten oder mit Notation oder durch Mischen der beiden bis zum Ende folgt
Abgesehen von der ebenso interessanten (oder uninteressanten!) Frage, was wir verschiedene Arten von Variablen nennen.
Es scheint jedoch mathematisch und statistisch gleichermaßen gültig zu sein, die Prädiktoren zuerst zu erwähnen, ebenso wie viele Mathematiker Zuordnungen oder Funktionen zuerst mit Argumenten schreiben.
Was vielleicht häufig die Reihenfolge bestimmt, die wir in statistischen Diskussionen verwenden, ist, dass wir wissenschaftlich oder praktisch normalerweise eine klare Vorstellung davon haben, was wir vorhersagen wollen - es ist die Sterblichkeit oder das Einkommen oder der Weizenertrag oder die Stimmen bei einer Wahl oder was auch immer - während der Pool potenzieller oder tatsächlicher Prädiktoren möglicherweise nicht so klar ist. Auch wenn es klar ist, ist es sinnvoll, die wichtigen Dinge zuerst zu erwähnen. Was versuchst du zu machen? Was auch immer vorhersagen . Wie wirst du das machen? Verwenden Sie einige oder alle dieser Variablen .
Ich habe keine Geschichte für "on", anstatt ein anderes passendes Wort. Ich höre nicht "rückläufig gegen" oder "rückläufig mit". Möglicherweise gibt es hier keine Logik, nur Meme, die in Lehrbüchern, Lehren und Diskussionen weitergegeben werden.
quelle
1) Der Begriff Regression ergibt sich aus der Tatsache, dass im üblichen einfachen linearen Regressionsmodell:
Wenn wir zum Beispiel den in R eingebauten BSB-Datenrahmen verwenden, dann:
Einen Beweis finden Sie unter: https://en.wikipedia.org/wiki/Regression_toward_the_mean
2) Der Ausdruck on stammt von der Tatsache, dass die angepassten Werte die Projektion der Ergebnisvariablen auf den von den Prädiktorvariablen (einschließlich des Achsenabschnittes) aufgespannten Unterraum sind, wie in vielen Quellen wie http: //people.eecs.ku näher erläutert .edu / ~ jhuan / EECS940_S12 / slide / linearRegression.pdf .
quelle
Persönlich, wenn es um die Erklärung von Terminologie geht, finde ich, dass die Definition des Begriffs selbst immer hilfreich ist, besonders wenn man es den Schülern erklärt. Die eigentliche Definition des Wortes Regression lautet:
"Rückkehr in einen früheren oder weniger entwickelten Zustand".
Eine Möglichkeit, dies zu erklären, ist vermutlich die folgende:
"Wenn wir das Ergebnis als den vollständig entwickelten Zustand betrachten, versuchen wir, das Ergebnis unter Verwendung weniger entwickelter Zustände, dh der unabhängigen Variablen, zu erklären. Auf diese Weise wird das Ergebnis auf die Prädiktoren zurückgebildet."
Ich hoffe, das hilft.
quelle