Wie fair ist es, das Wort „Vorhersagen“ für (logistische) Regression zu verwenden?

9

Mein Verständnis ist, dass selbst Regression keine Kausalität gibt. Es kann nur eine Assoziation zwischen y-Variablen und x-Variablen und möglicherweise eine Richtung geben. Hab ich recht? Ich habe oft Sätze gefunden, die "x sagt y voraus" ähneln, selbst in den meisten Lehrbüchern und auf verschiedenen Kursseiten online. Und Sie nennen die Regressoren oft als Prädiktoren und das y als Antwort.

  1. Wie fair ist es, es für die lineare Regression zu verwenden?
  2. Wie wäre es mit logistischer Regression? (Wenn ich einen Schwellenwert t habe, mit dem ich die Wahrscheinlichkeit vergleichen kann?)
rk567
quelle
1
Es ist in Ordnung zu verwenden, solange Sie erkennen, dass es keine Möglichkeit gibt, den Fehlerteil vorherzusagen, es ist völlig zufällig.
Aksakal
1
Es gibt keinen zufälligen oder sonstigen Fehlerteil.
Frank Harrell

Antworten:

21

Es gibt kein Problem mit der Verwendung des Wortes "vorhersagen".

Es ist wichtig zu erkennen, dass Vorhersagen nichts mit Kausalität zu tun haben. Stellen Sie sich einen Fall vor, in dem die meisten Menschen, die in einer Notaufnahme eines Krankenhauses sterben, an einem Herzinfarkt sterben. Wenn Sie hören, dass ein Patient gestorben ist, aber die Ursache nicht kannte, können Sie vorhersagen, dass es sich wahrscheinlich um einen Herzinfarkt handelt, da Sie wissen, dass Herzinfarkte für> 50% verantwortlich sind. Sie machen eine Vorhersage, aber Sie sagen eine unbekannte Ursache aus einer bekannten Wirkung voraus. Außerdem ist die Vorhersage in diesem Beispiel kategorisch und daher analog zur logistischen Regression. (Die Analogie zur multinomialen logistischen Regression ist wahrscheinlich stärker , aber das spielt hier keine Rolle.)

Für das, was es wert ist, müssen Vorhersagen überhaupt nicht mit einem direkten Kausalzusammenhang zusammenhängen. Sie können eine Vorhersage basierend auf einer falschen Korrelation treffen, solange die Beziehung zuverlässig ist. Erwägen Sie, die unbekannte Größe eines identischen Zwillings anhand des Geschwisters des Zwillings vorherzusagen. In diesem Fall sind beide Höhen Auswirkungen einer Reihe gemeinsamer Ursachen (gemeinsame Genetik und Umwelt). Die Höhe eines der beiden Zwillinge ist eine Ursache oder eine Wirkung des anderen. Trotzdem können Sie in dieser Situation sehr gute Vorhersagen treffen.

gung - Monica wieder einsetzen
quelle
Beispiel 'falsche Regression' +1!
PatrickT