Rücktransformation von Regressionskoeffizienten

16

Ich mache eine lineare Regression mit einer transformierten abhängigen Variablen. Die folgende Transformation wurde durchgeführt, damit die Annahme der Normalität der Residuen gelten würde. Die nicht transformierte abhängige Variable war negativ verzerrt, und die folgende Transformation hat sie nahezu normalisiert:

Y=50Yorig

wobei Yorig ist die abhängige Variable auf dem Originalmaßstab.

Ich halte es für sinnvoll, die β Koeffizienten zu transformieren , um zur ursprünglichen Skala zurückzukehren. Unter Verwendung der folgenden Regressionsgleichung

Y=50Yorig=α+βX

und durch Festsetzung von haben wirX=0

α=50Yorig=50αorig

Und schlussendlich,

αorig=50α2

Mit der gleichen Logik fand ich

βorig=α (α2β)+β2+αorig50

Jetzt funktionieren die Dinge für ein Modell mit 1 oder 2 Prädiktoren sehr gut. Die rücktransformierten Koeffizienten ähneln den ursprünglichen, nur jetzt kann ich den Standardfehlern vertrauen. Das Problem tritt auf, wenn ein Interaktionsbegriff wie z

Y=α+X1βX1+X2βX2+X1X2βX1X2

Dann sind die Rücktransformationen für die nicht so nah an denen der ursprünglichen Skala, und ich bin mir nicht sicher, warum das passiert. Ich bin mir auch nicht sicher, ob die gefundene Formel für die Rücktransformation eines Beta-Koeffizienten wie für das 3. β verwendbar istββ (für den Interaktionsterm) verwendet werden kann. Bevor ich in die verrückte Algebra ging, dachte ich, ich würde um Rat fragen ...

Dominic Comtois
quelle
Wie definieren Sie und β o r i g ? αorigβorig
Mark999
Wie der Wert von Alpha und Beta auf den ursprünglichen Skalen
Dominic Comtois
1
Aber was heißt das?
Mark999
Ich würde etwas riskieren wie: Die Schätzungen, die wir erhalten würden, waren die ursprünglichen Daten, die für die lineare Regression geeignet sind.
Dominic Comtois
2
Das scheint mir ein sinnloses Konzept zu sein. Ich stimme Gungs Antwort zu.
Mark999

Antworten:

19

Ein Problem ist, dass Sie geschrieben haben

Y=α+βX

Das ist ein einfaches deterministisches (dh nicht zufälliges) Modell. In diesem Fall Sie könnten die Koeffizienten auf der ursprünglichen Skala Transformation zurück, da es nur eine Frage von einem paar einfachen Algebra ist. In der üblichen Regression haben Sie jedoch nur ; Sie haben den Fehlerbegriff aus Ihrem Modell entfernt. Wenn Transformation von Y zurück zu Y o r i g nicht-linear ist, können Sie ein Problem haben , da E ( f ( X ) )f ( E (E(Y|X)=α+βXYYorigE(f(X))f(E(X)) im Allgemeinen. Ich denke, das hat möglicherweise mit der Diskrepanz zu tun, die Sie sehen.

Bearbeiten: Beachten Sie, dass Sie bei einer linearen Transformation eine Rücktransformation durchführen können, um Schätzungen der Koeffizienten auf der ursprünglichen Skala zu erhalten, da die Erwartung linear ist.

Makro
quelle
4
+1 für die Erklärung, warum wir die Betas nicht zurücktransformieren können.
gung - Wiedereinsetzung von Monica
15

y^i

gung - Wiedereinsetzung von Monica
quelle
1
Was ist mit der Tatsache zu tun, dass die rücktransformierten Koeffizienten denjenigen sehr nahe kommen, die beim Modellieren der nicht transformierten Variablen erhalten werden? Lässt das keine Rückschlüsse auf den ursprünglichen Maßstab zu?
Dominic Comtois
2
Ich weiß es nicht genau. Es kann von vielen Dingen abhängen. Meine erste Vermutung ist, dass Sie mit Ihren ersten Betas Glück haben, aber dann geht Ihnen das Glück aus. Ich muss mit @ mark999 übereinstimmen, dass "die Schätzungen, die wir erhalten würden, die ursprünglichen Daten waren, die für die lineare Regression geeignet sind", eigentlich keinen Sinn ergeben; Ich wünschte, es wäre so und es scheint auf den ersten Blick rot zu werden, aber leider nicht. Und es werden keine Rückschlüsse auf den ursprünglichen Maßstab lizenziert.
gung - Wiedereinsetzung von Monica
1
@gung für nichtlineare Transformationen (z. B. Box Cox): Ich kann angepasste Werte sowie Vorhersageintervalle zurücktransformieren, aber weder Betas noch Koeffizientenintervalle für die Betas transformieren. Gibt es eine zusätzliche Einschränkung, die ich beachten sollte? Übrigens, dies ist ein sehr interessantes Thema, wo kann ich ein besseres Verständnis bekommen?
mugen
2
@ Mugen, es ist schwer zu sagen, was Sie sonst noch wissen sollten. Vielleicht sollte man bedenken, dass die Rücktransformation von y-hat den bedingten Median ergibt, wohingegen der nicht rücktransformierte (bleckende) y-hat das bedingte Mittel ist. Davon abgesehen sollte dieses Material in einem guten Regressionslehrbuch behandelt werden.
gung - Wiedereinsetzung von Monica
3
@ Mugen, du bist willkommen. Fühlen Sie sich frei, weitere Fragen über die normalen Mechanismen zu stellen (Klicken ASK QUESTION); Es wird mehr Ressourcen für die Beantwortung geben, Sie werden die Aufmerksamkeit von mehr CVern erhalten und die Informationen werden für die Nachwelt besser zugänglich sein.
gung - Wiedereinsetzung von Monica