Die Sprache zur Beschreibung von Regressionsmodellen, wie die oben angegebene sehr einfache lineare Regression, variiert häufig, und solche Variationen weisen häufig geringfügige Bedeutungsverschiebungen auf. Zum Beispiel kann der Teil des Modells auf der linken Seite der Gleichung mit Konnotationen und Bezeichnungen in Klammern bezeichnet werden (unter anderem, die ich nicht kenne):
- Abhängige Variable (Hinweise auf kausale Abhängigkeit)
- Vorhergesagte Variable (impliziert die Modellvorhersagen / macht Vorhersagen)
- Antwortvariable (impliziert Kausalität oder zumindest zeitliche Sequenzierung)
- Ergebnisvariable (impliziert Kausalität)
Die Variation in der Nomenklatur gilt auch auf der rechten Seite der Gleichung (der gleiche Haftungsausschluss, den ich für andere Begriffe ignoriere):
- Unabhängige Variable (impliziert kausale Priorität, Hinweise auf experimentelles Design)
- Prädiktorvariable (impliziert Prognosen, impliziert, dass der Variablen eine Parameterschätzung ungleich Null zugeordnet ist)
Während ich eine Überprüfung vorschlug oder Forschungsergebnisse kommunizierte, hatte ich Gelegenheit, nicht nur auf die Verwendung des einen oder anderen Begriffs zurückzugreifen, sondern später auf den Begriff, durch den ich ihn ersetzen wollte. Während die anrufenden Leute natürlich pedantisch waren (NB: Ich bin ein professioneller Pedant, also sympathisiere ich), frage ich mich immer noch: Natürlich haben wir alle verstanden, was kommuniziert wurde:
Gibt es häufig verwendete Begriffe für die Variablen für die linke und die rechte Hand in Regressionsmodellen, die in Bezug auf (a) die externen Verwendungen des Modells, (b) kausale Beziehungen zwischen den Variablen und (c) Aspekte der Studie agnostisch sind? Entwürfe verwendet, um die Variablen selbst zu erzeugen?
NB: Ich frage nicht nach den wichtigen Fragen der richtigen Modellierung und Interpretation (dh ich kümmere mich sehr um Kausalität, Studiendesign usw.), sondern interessiere mich mehr für eine Sprache, um allgemein über solche Modelle zu sprechen.
(Mir ist klar, dass "linke Variablen" und "rechte Variablen" vermutlich als glaubwürdige Antwort ausgelegt werden können, aber diese Begriffe scheinen klobig zu sein ... vielleicht ist dies eine klobige Frage. :)
quelle
Antworten:
Dies ist eine ausgezeichnete Frage. Eigentlich ist es so gut, dass es keine Antwort darauf gibt. Nach meinem besten Wissen gibt es keinen wahren "agnostischen" Begriff für die Beschreibung von Y.
In meinen Erfahrungen und Lesungen stellte ich fest, dass die Semantik domänenspezifisch und auch modellzielspezifisch ist.
Ökonomen verwenden die abhängigen variablen Begriffe, wenn sie ein erklärendes Modell erstellen. Sie können die Begriffe "vorhergesagte oder angepasste" oder "geschätzte Variable" verwenden, wenn sie ein Prognosemodell erstellen, das sich mehr auf eine genaue Schätzung / Vorhersage als auf die theoretische Erklärungskraft konzentriert.
Die Big Data / Deep Learning-Crowd verwendet eine völlig andere Sprache. In der Regel werden die Begriffe Antwortvariable oder Zielvariable verwendet. Ihre Modelle sind solche Black Boxes, dass sie normalerweise nicht versuchen, ein Phänomen zu erklären, sondern es vorherzusagen und genau abzuschätzen. Aber irgendwie würden sie nicht mit dem Begriff "Vorhersagen" erwischt werden. Sie bevorzugen bei weitem die Begriffe Antwort oder Ziel.
Ich bin mit dem Begriff Ergebnisvariable weniger vertraut. Es kann in anderen Bereichen, denen ich weniger ausgesetzt bin, wie den Sozialwissenschaften wie Psychologie, Medizin, klinischen Studien und Epidemiologie, weit verbreitet sein.
In Anbetracht des oben Gesagten konnte ich Ihnen keine "agnostische" Semantik zur Beschreibung von Y zur Verfügung stellen. Stattdessen gab ich einige Informationen darüber, welche Semantik verwendet werden soll, wenn unterschiedliche Zielgruppen angesprochen werden sollen, und spiegelt auch das Ziel Ihres Modells wider. Zusammenfassend glaube ich nicht, dass jemand verletzt wird, wenn Sie mit Ökonomen über abhängige Variablen und mit Deep-Learning-Typen über Antwort- oder Zielvariablen sprechen. Hoffentlich können Sie diese Menschenmengen voneinander trennen, sonst könnten Sie einen verbalen Essenskampf auf Ihrer Hand haben.
quelle