Kann ich die Korrelation zwischen Variablen testen, bevor ich sie standardisiere?

7

Was ich tun möchte, ist, GLMMs zu konstruieren, um die Ressourcenauswahl zu bewerten, und ich habe eine Reihe von Variablen (einige repräsentieren Entfernungen und andere repräsentieren% der Landbedeckung).

Kann ich die Korrelation zwischen Variablen testen, bevor ich sie standardisiere? Ich bin mir nicht ganz sicher, was ich zuerst tun soll.

mtao
quelle

Antworten:

11

Kann ich die Korrelation zwischen Variablen testen, bevor ich sie standardisiere? Ich bin mir nicht ganz sicher, was ich zuerst tun soll.

Die Korrelation ist gleich, unabhängig davon, ob Sie sie vor oder nach der Standardisierung berechnen. Um dies zu sehen, reicht es zu wissen, dass die Korrelation nicht skalierbar ist. NehmenbR und a>0, dann

Corr(einX.- -b,Y.)=Cov(einX.- -b,Y.)Var(einX.- -b)(Var(Y.)=Cov(einX.,Y.)Var(einX.)Var(Y.)=einCov(X.,Y.)ein2Var(X.)Var(Y.)=einCov(X.,Y.)einVar(X.)Var(Y.)=Cov(X.,Y.)Var(X.)Var(Y.)=Corr(X.,Y.)

Die erste Gleichheit ist eine Definition.
Die zweite verwendet die Eigenschaft, dass Kovarianz und Varianz für Ortsverschiebungen unveränderlich sind.
Der dritte verwendet die Eigenschaften von Kovarianz und Varianz in Bezug auf die Multiplikation mit einer Konstanten.
Der vierte nutzt die Tatsache, dassein>0.
Der fünfte löscht nur die Multiplikatoren.
Der sechste ist wieder eine Definition.

Dies umfasst die Standardisierung, bei der der Mittelwert subtrahiert und durch die Standardabweichung (eine positive Zahl) dividiert wird.

Richard Hardy
quelle
Vielen Dank für Ihre Antwort, es ist sehr klar!
mtao
5

Ja, die Überprüfung der Korrelationen zwischen Ihren erklärenden Variablen ist Teil der Datenexploration, wie in Zuur et al. (2010) Ein Protokoll zur Datenexploration, um häufige statistische Probleme zu vermeiden . Dies sollte erfolgen, bevor Sie sie standardisieren und Ihre GLMMs erstellen.

Ich bin mir jedoch nicht sicher, wie sich dies auf die Korrelationen auswirken würde, wenn Sie zuerst Ihre erklärenden Variablen standardisieren würden, aber ich würde vermuten, dass die Korrelationsergebnisse relativ gleich wären.

Schlammkrieger
quelle
4

+1 auf beide Antworten, aber nur um das Offensichtliche zu sagen:

Die lineare Korrelation ist definiert als die skalierte Version der Kovarianz zwischen zwei Variablen. Die Skalierung selbst ist einfach das Produkt der Standardabweichungen der beiden Variablen. Daher ändert die Standardisierung (oder eine lineare Transformation der für diese Angelegenheit untersuchten Variablen) die Korrelation nicht, da ein vorheriger Neuskalierungseffekt, der die Kovarianz beeinflussen könnte, durch die Skalennormalisierung aufgehoben wird, die die endgültige Korrelationsschätzung ergibt.

usεr11852
quelle