Vergleichen Sie Modellanpassungen mit transformierten und nicht transformierten Antworten

11

Ich möchte Daten mit Proportionen zwischen drei verschiedenen Gruppen vergleichen, z.

 ID Group Prop.Nitrogen
 1    A     0.89
 2    A     0.85
 3    B     0.92
 4    B     0.97

Nach Wharton und Hui (doi: 10.1890 / 10-0340.1 1 ) dachte ich, ich würde sehen, ob diese Daten besser mit einem transformierten Logit behandelt werden könnten.

Wenn ich mir Diagnosediagramme für lineare Modelle der transformierten und nicht transformierten Daten ansehe, sehen sie ohne offensichtliche Probleme sehr ähnlich aus, und es gibt nur kleine Unterschiede bei den geschätzten Parametern. Ich möchte jedoch noch etwas darüber sagen können, wie gut das Modell zu den transformierten und nicht transformierten Versionen der Daten passt - ich weiß, dass ich AIC-Werte nicht direkt vergleichen kann. Gibt es eine Korrektur und ich kann dies überprüfen? Oder sollte ich einen anderen Ansatz wählen?

David W.
quelle
Vielleicht möchten Sie eine Box-Cox-Transformation ( boxcox()in der MASS-Bibliothek) versuchen , obwohl ich nicht sicher bin, ob sie Logit-Transformationen verarbeiten kann.
Marius
@Marius: Schlagen Sie zur Verdeutlichung boxcox()die Rohdaten oder die transformierten Daten vor?
Michelle
Wie wäre es, wenn Sie die Daten und die angepassten Werte in die themenrelevante Skala umwandeln (Sie erhalten also eine einheitliche Skala) und dann den AIC für alle konkurrierenden Modelle berechnen, die Sie haben? Sie müssten die AIC-Werte für Modelle, die ursprünglich in einem anderen Maßstab angepasst waren, manuell berechnen, aber ich denke nicht, dass dies ein Problem sein könnte.
Richard Hardy

Antworten:

1

Meine Erfahrung mit transformierten Daten legt nahe, dass sich die Korrelation nach der Transformation sowie die Homoskedastizität und / oder Normalität verbessert, obwohl sie nicht unbedingt alle für eine einzelne Transformation optimal sind. Eine einfache Antwort könnte darin bestehen, Korrelationskoeffizienten zwischen den beiden Modellen und ihren jeweiligen Datensätzen zu berechnen. Man kann sogar die Signifikanz der Differenz korrelierter Korrelationskoeffizienten testen. Tests auf Homoskedastizität und Dichtefunktionstyp von Residuen können auch ein Mittel zur Bewertung dieser Residuen bieten.

Carl
quelle