Ich nehme derzeit an meiner ersten Klasse für angewandte lineare Regression teil und habe Probleme mit der Transformation von Prädiktorvariablen bei der multiplen linearen Regression. Der Text, den ich verwende, Kutner et al. "Angewandte lineare statistische Modelle", scheint die Frage, die ich habe, nicht abzudecken. (abgesehen davon, dass es eine Box-Cox-Methode zur Transformation mehrerer Prädiktoren gibt).
Welche Bedingungen möchte man mit einer Antwortvariablen und mehreren Prädiktorvariablen für jede Prädiktorvariable erfüllen? Ich verstehe, dass wir letztendlich nach Konstanz der Fehlervarianz und normalverteilten Fehlern suchen (zumindest in den Techniken, die mir bisher beigebracht wurden). Ich habe viele Übungen zurückkommen lassen, wo die Lösung als Beispiel war y ~ x1 + (1/x2) + log(x3)
, wo ein oder mehrere Prädiktoren wurden transformiert.
Ich verstand die Gründe unter einfacher linearer Regression, da es einfach war, y ~ x1 und die damit verbundenen Diagnosen (qq-Diagramme von Residuen, Residuen gegen y, Residuen gegen x usw.) zu betrachten und zu testen, ob y ~ log ( x1) passen besser zu unseren Annahmen.
Gibt es einen guten Ort, um zu verstehen, wann ein Prädiktor in Gegenwart vieler Prädiktoren transformiert werden muss?
Vielen Dank im Voraus. Matt