Warum sollte

8

Beide Antworten in diesen Threads, eins und zwei, behaupten, dass transformiert werden sollte, bevor eine andere Transformation auf die Prädiktoren angewendet wird. In der Tat konzentriert sich das Weisberg- Kapitel über Transformationen mehr auf DV als auf Prädiktoren, ebenso wie die Handbuchseite des R-Car-Pakets powerTransform ().Y

Wir wissen jedoch, dass die Normalität der DV-Verteilung in OLS keine Anforderung zur Schätzung der BLAUEN Koeffizienten ist, und selbst wenn die Residuen nicht streng normalverteilt sind, ist OLS immer noch ein vernünftiger Schätzer .

Warum also die Betonung auf die Transformation von ? Es gibt einige Gründe, aus denen ich denke, dass es eigentlich vorzuziehen ist, Y nicht zu transformieren : Erstens erschwert es das Lesen der IVs-Beziehung und zweitens erfordert es bei der Vorhersage eine Rücktransformation vom geschätzten Wert zur ursprünglichen Y- Skala. Je nachdem, was Sie tun, kann dies ein Problem sein.YYY

Robert Kubrick
quelle
2
Wir haben seit 1972 verallgemeinerte lineare Modelle im Namen und in bestimmten Fällen viel länger. Das heißt, die Verwendung geeigneter Verknüpfungsfunktionen bietet Ihnen alle Vorteile der Verwendung einer nichtlinearen Skala mit allen Vorteilen des Erhaltens von Vorhersagen auf der Skala der Originaldaten. Warum ist dies nicht bekannter und praktizierter? Längere Antworten sind erforderlich und werden in Kürze verfügbar sein, aber die Analyse nichtlinearer Beziehungen mit linearen Werkzeugen, die auf nicht transformierte Daten angewendet werden, funktioniert selten gut.
Nick Cox
1
+1 bis @Nick. Darüber hinaus ist die Analyse von Beziehungen zu fast jedem Standardverfahren (dh basierend auf nahezu Normalverteilungen) unter Umständen, in denen die Fehlerverteilung stark verzerrt ist, normalerweise auch kompliziert und unbefriedigend. Nichtlineare Re-Ausdrücke erreichen tatsächlich drei Dinge (und tun sie oft alle gleichzeitig): Sie symmetrisieren Verteilungen von Residuen, erzeugen Homoskedastizität und linearisieren Beziehungen.
whuber

Antworten:

5

Die Transformation von X wirkt sich weder auf die Form der bedingten Verteilung noch auf die Heteroskedastizität aus. Die Transformation von X dient also nur dazu, nichtlineare Beziehungen zu behandeln. (Wenn Sie additive Modelle anpassen, kann dies dazu beitragen, die Interaktion zu eliminieren, aber selbst das bleibt oft am besten der Transformation von Y überlassen.)

Ein Beispiel, bei dem die Transformation nur von X sinnvoll ist:
Geben Sie hier die Bildbeschreibung ein

Wenn dies - mangelnde Anpassung an den bedingten Mittelwert - Ihr Hauptproblem ist, kann die Transformation von X sinnvoll sein, aber wenn Sie aufgrund der Form des bedingten Y oder aufgrund der Heteroskedastizität transformieren, wenn Sie dies durch Transformation lösen ( Nicht unbedingt die beste Wahl, aber wir nehmen die Transformation als gegeben für diese Frage an. Dann müssen Sie Y auf irgendeine Weise transformieren, um sie zu ändern.

Stellen Sie sich zum Beispiel ein Modell vor, bei dem die bedingte Varianz proportional zum Mittelwert ist:

Ein Beispiel, bei dem die Transformation von nur X die Probleme nicht lösen kann:
Geben Sie hier die Bildbeschreibung ein

Das Verschieben von Werten auf der x-Achse ändert nichts an der Tatsache, dass die Streuung für Werte auf der rechten Seite größer ist als für Werte auf der linken Seite. Wenn Sie diese sich ändernde Varianz durch Transformation korrigieren möchten, müssen Sie hohe Y-Werte reduzieren und niedrige Y-Werte strecken.

Wenn Sie nun überlegen, Y zu transformieren, ändert sich dadurch die Form der Beziehung zwischen Antwort und Prädiktoren. Wenn Sie also ein lineares Modell möchten (wenn es vor der Transformation linear war, werden Sie häufig auch X transformieren). es wird nicht danach sein). Manchmal (wie im zweiten Diagramm oben) wird die Beziehung durch eine Y = -Transformation gleichzeitig linearer - dies ist jedoch nicht immer der Fall.

Wenn Sie sowohl X als auch Y transformieren, möchten Sie zuerst Y ausführen, da sich die Form der Beziehung zwischen Y und X ändert. Normalerweise müssen Sie nach der Transformation sehen, wie Beziehungen aussehen. Die nachfolgende Transformation von X zielt dann darauf ab, eine Linearität der Beziehung zu erhalten.

Wenn Sie also überhaupt transformieren, müssen Sie häufig Y transformieren, und wenn Sie dies tun, möchten Sie es fast immer zuerst tun.

Glen_b -Reinstate Monica
quelle
Y=β0+β1X5+ϵX1X
1
@ RobertKubrick nicht relativ zu ihrem lokalen Mittelwert. Siehe meinen bearbeiteten Beitrag.
Glen_b -State Monica
ϵYX
Var(ϵ)=Var(Y|X)
1
Es ändert nur den bedingten Mittelwert. Darauf kommt es in meiner Antwort an.
Glen_b -State Monica
2

Die Transformation von Y ist zunächst ein anachronistischer Ansatz zur Datenanalyse. Unsere Ur-Ur-Ur-Großväter haben das getan. Warum sollten wir das nicht tun? Viele Gründe und Ihr Beitrag, der widerspiegelt, dass Gaußsche Annahmen ausschließlich auf den Fehlern eines Modells beruhen, NICHT der Y-Reihe, sind tot.

IrishStat
quelle
4
Ich stimme dem ersten Satz mehr zu als ich nicht zustimme; Trotzdem ist die Antwort mehr als ein wenig vereinfacht. Beispiele wie pH-Wert oder Dezibel zeigen, dass wissenschaftliche Messungen häufig bereits in einem transformierten Maßstab durchgeführt werden, und das aus guten Gründen. Viele Ökonomen verwenden routinemäßig das Log-Einkommen und nicht das Einkommen als Antwortvariable. Dies passt zu der Art und Weise, wie normale Menschen viele Entscheidungen treffen (z. B. in Prozent des Denkens). (Die Geschichte hier ist meiner Meinung nach auch fraglich; Transformationen waren vor der Mitte des 20. Jahrhunderts nicht besonders häufig.)
Nick Cox
@Nick Ich sprach ironisch über meine Vorfahren. Transformationen begannen Mitte der fünfziger Jahre .....
IrishStat
3
Zunge in die Wange und bunte Übertreibung kaufe ich gerne, aber dennoch sollten präzise Aussagen richtig sein. Die Literatur über das Lognormale begann im 19. Jahrhundert, ebenso wie das logarithmische Millimeterpapier. Transformationen waren vor den 1950er Jahren Gegenstand mehrerer Übersichten, z. B. Bartletts Artikel in Biometrics 1947, daher ist die Literatur älter. Ich denke, das stimmt mit meiner früheren Behauptung überein, dass sie "nicht besonders häufig" sind.
Nick Cox
3
@ Nick Wissenschaftler verwendeten Transformationen lange vor 1947, weil sie so natürlich sind. Ein gutes Beispiel hierfür ist Rydbergs Herleitung seiner Formel für das Wasserstoffspektrum , die in den 1880er Jahren durch Auswahl geeigneter nichtlinearer Transformationen der Variablen erhalten wurde. Man könnte sich auf Fechners Arbeit in der Psychophysik berufen. C. 1860 auch. Diese Praxis ist in den Wissenschaften so effektiv und wichtig, dass man die erste Aussage in dieser Antwort nicht ernst nehmen kann, dass sie "anachronistisch" ist.
whuber
3
@whuber Wir sind uns im Wesentlichen einig. Es gibt ein Spektrum (Wortspiel beabsichtigt) von der Verwendung von Transformationen in physikalischen und anderen Wissenschaften, die häufig als Mittel oder als Folge der Entdeckung nichtlinearer Beziehungen entstehen, bis zur absichtlichen Verwendung von Transformationen von Rohdaten, wie von (einigen) Statistikern empfohlen. Ich würde keine Grenze zwischen den beiden ziehen wollen, da dies zwecklos und nicht hilfreich wäre.
Nick Cox