Ich mache eine lineare Regression mit einer transformierten abhängigen Variablen. Die folgende Transformation wurde durchgeführt, damit die Annahme der Normalität der Residuen gelten würde. Die nicht transformierte abhängige Variable war negativ verzerrt, und die folgende Transformation hat sie nahezu normalisiert:
wobei ist die abhängige Variable auf dem Originalmaßstab.
Ich halte es für sinnvoll, die Koeffizienten zu transformieren , um zur ursprünglichen Skala zurückzukehren. Unter Verwendung der folgenden Regressionsgleichung
und durch Festsetzung von haben wir
Und schlussendlich,
Mit der gleichen Logik fand ich
Jetzt funktionieren die Dinge für ein Modell mit 1 oder 2 Prädiktoren sehr gut. Die rücktransformierten Koeffizienten ähneln den ursprünglichen, nur jetzt kann ich den Standardfehlern vertrauen. Das Problem tritt auf, wenn ein Interaktionsbegriff wie z
Dann sind die Rücktransformationen für die nicht so nah an denen der ursprünglichen Skala, und ich bin mir nicht sicher, warum das passiert. Ich bin mir auch nicht sicher, ob die gefundene Formel für die Rücktransformation eines Beta-Koeffizienten wie für das 3. β verwendbar ist (für den Interaktionsterm) verwendet werden kann. Bevor ich in die verrückte Algebra ging, dachte ich, ich würde um Rat fragen ...
quelle
Antworten:
Ein Problem ist, dass Sie geschrieben haben
Das ist ein einfaches deterministisches (dh nicht zufälliges) Modell. In diesem Fall Sie könnten die Koeffizienten auf der ursprünglichen Skala Transformation zurück, da es nur eine Frage von einem paar einfachen Algebra ist. In der üblichen Regression haben Sie jedoch nur ; Sie haben den Fehlerbegriff aus Ihrem Modell entfernt. Wenn Transformation von Y zurück zu Y o r i g nicht-linear ist, können Sie ein Problem haben , da E ( f ( X ) ) ≠ f ( E (E(Y|X)=α+β⋅X Y Yorig E(f(X))≠f(E(X)) im Allgemeinen. Ich denke, das hat möglicherweise mit der Diskrepanz zu tun, die Sie sehen.
Bearbeiten: Beachten Sie, dass Sie bei einer linearen Transformation eine Rücktransformation durchführen können, um Schätzungen der Koeffizienten auf der ursprünglichen Skala zu erhalten, da die Erwartung linear ist.
quelle
quelle
ASK QUESTION
); Es wird mehr Ressourcen für die Beantwortung geben, Sie werden die Aufmerksamkeit von mehr CVern erhalten und die Informationen werden für die Nachwelt besser zugänglich sein.