Nomenklatur für die linke und rechte Seite in Regressionsmodellen

9

y=β0+β1x1+ε0

Die Sprache zur Beschreibung von Regressionsmodellen, wie die oben angegebene sehr einfache lineare Regression, variiert häufig, und solche Variationen weisen häufig geringfügige Bedeutungsverschiebungen auf. Zum Beispiel kann der Teil des Modells auf der linken Seite der Gleichung mit Konnotationen und Bezeichnungen in Klammern bezeichnet werden (unter anderem, die ich nicht kenne):

  • Abhängige Variable (Hinweise auf kausale Abhängigkeit)
  • Vorhergesagte Variable (impliziert die Modellvorhersagen / macht Vorhersagen)
  • Antwortvariable (impliziert Kausalität oder zumindest zeitliche Sequenzierung)
  • Ergebnisvariable (impliziert Kausalität)

Die Variation in der Nomenklatur gilt auch auf der rechten Seite der Gleichung (der gleiche Haftungsausschluss, den ich für andere Begriffe ignoriere):

  • Unabhängige Variable (impliziert kausale Priorität, Hinweise auf experimentelles Design)
  • Prädiktorvariable (impliziert Prognosen, impliziert, dass der Variablen eine Parameterschätzung ungleich Null zugeordnet ist)

Während ich eine Überprüfung vorschlug oder Forschungsergebnisse kommunizierte, hatte ich Gelegenheit, nicht nur auf die Verwendung des einen oder anderen Begriffs zurückzugreifen, sondern später auf den Begriff, durch den ich ihn ersetzen wollte. Während die anrufenden Leute natürlich pedantisch waren (NB: Ich bin ein professioneller Pedant, also sympathisiere ich), frage ich mich immer noch: Natürlich haben wir alle verstanden, was kommuniziert wurde:

Gibt es häufig verwendete Begriffe für die Variablen für die linke und die rechte Hand in Regressionsmodellen, die in Bezug auf (a) die externen Verwendungen des Modells, (b) kausale Beziehungen zwischen den Variablen und (c) Aspekte der Studie agnostisch sind? Entwürfe verwendet, um die Variablen selbst zu erzeugen?

NB: Ich frage nicht nach den wichtigen Fragen der richtigen Modellierung und Interpretation (dh ich kümmere mich sehr um Kausalität, Studiendesign usw.), sondern interessiere mich mehr für eine Sprache, um allgemein über solche Modelle zu sprechen.

(Mir ist klar, dass "linke Variablen" und "rechte Variablen" vermutlich als glaubwürdige Antwort ausgelegt werden können, aber diese Begriffe scheinen klobig zu sein ... vielleicht ist dies eine klobige Frage. :)

Alexis
quelle
Es sollte keine Verwirrung darüber geben.
Carl
1
Ich denke die kurze Antwort ist nein. Dies ist meiner Meinung nach aus gutem Grund. In formalen Fällen sollte die zur Identifizierung von Variablen verwendete Sprache so nuanciert sein, dass eine eindeutige Interpretation innerhalb der beabsichtigten Anwendung / Domäne eines Modells impliziert wird (dh es ist sehr wichtig zu wissen, ob Kausalität in einem Regressionsmodell impliziert ist oder nicht, und die ordnungsgemäße Verwendung der Nomenklatur hilft mit diesem).
Zachary Blumenfeld
2
@ZacharyBlumenfeld (a) Antworte nicht in Kommentaren. :) (b) Und doch sprechen wir allgemein über "Regression" selbst, ohne auf Studiendesign, disziplinäre Wissensbereiche usw. zurückzugreifen (z. B. sprechen und schreiben viele Leute über den Schätzer der kleinsten Quadrate, ohne sich auf Studiendesign und Kausalität zu berufen , etc.). Wenn wir eine anwendungsunabhängige Sprache haben, um eine breite Klasse statistischer Bestrebungen zu beschreiben, warum gibt es dann keine ähnlich agnostische Sprache für die Komponenten solcher Bestrebungen?
Alexis
1
Ich bin mir nicht sicher, ob dies eine Antwort wert ist, deshalb ich es als Kommentar: Vielleicht gibt es eine Terminologie, die aus Projektionen stammt (da eine Projektion von auf das Feld)? Wie Projektoren und Projektand (ich mache diese jetzt, da ich mich nicht an die relevanten Begriffe erinnere). Diese Terminologie sollte frei von (a), (b) und (c) sein. X(XX)1XyyX
Richard Hardy
1
@ Kenji Ich stimme dem größten Teil Ihrer Perspektive voll und ganz zu. Ich stimme jedoch nicht zu, dass man nur in einem angewandten Fall über Regressionsgleichungen sprechen kann / sollte: Wir sollten eine Sprache haben, die über linke und rechte Variablen aller Regressionsmodelle sprechen kann , beispielsweise wenn wir die Anwendung solcher Methoden untersuchen auf einer Metaebene über Disziplinen hinweg.
Alexis

Antworten:

6

Dies ist eine ausgezeichnete Frage. Eigentlich ist es so gut, dass es keine Antwort darauf gibt. Nach meinem besten Wissen gibt es keinen wahren "agnostischen" Begriff für die Beschreibung von Y.

In meinen Erfahrungen und Lesungen stellte ich fest, dass die Semantik domänenspezifisch und auch modellzielspezifisch ist.

Ökonomen verwenden die abhängigen variablen Begriffe, wenn sie ein erklärendes Modell erstellen. Sie können die Begriffe "vorhergesagte oder angepasste" oder "geschätzte Variable" verwenden, wenn sie ein Prognosemodell erstellen, das sich mehr auf eine genaue Schätzung / Vorhersage als auf die theoretische Erklärungskraft konzentriert.

Die Big Data / Deep Learning-Crowd verwendet eine völlig andere Sprache. In der Regel werden die Begriffe Antwortvariable oder Zielvariable verwendet. Ihre Modelle sind solche Black Boxes, dass sie normalerweise nicht versuchen, ein Phänomen zu erklären, sondern es vorherzusagen und genau abzuschätzen. Aber irgendwie würden sie nicht mit dem Begriff "Vorhersagen" erwischt werden. Sie bevorzugen bei weitem die Begriffe Antwort oder Ziel.

Ich bin mit dem Begriff Ergebnisvariable weniger vertraut. Es kann in anderen Bereichen, denen ich weniger ausgesetzt bin, wie den Sozialwissenschaften wie Psychologie, Medizin, klinischen Studien und Epidemiologie, weit verbreitet sein.

In Anbetracht des oben Gesagten konnte ich Ihnen keine "agnostische" Semantik zur Beschreibung von Y zur Verfügung stellen. Stattdessen gab ich einige Informationen darüber, welche Semantik verwendet werden soll, wenn unterschiedliche Zielgruppen angesprochen werden sollen, und spiegelt auch das Ziel Ihres Modells wider. Zusammenfassend glaube ich nicht, dass jemand verletzt wird, wenn Sie mit Ökonomen über abhängige Variablen und mit Deep-Learning-Typen über Antwort- oder Zielvariablen sprechen. Hoffentlich können Sie diese Menschenmengen voneinander trennen, sonst könnten Sie einen verbalen Essenskampf auf Ihrer Hand haben.

Sympa
quelle
Ich wünschte, ich könnte Ihnen eine zusätzliche Stimme für "verbalen Essenskampf" geben: D
Alexis