Soweit ich weiß, können wir eine Korrelation erhalten, indem wir die Kovarianz mithilfe der Gleichung normalisieren
Dabei ist die Standardabweichung von . Xi
Meine Sorge ist, was ist, wenn die Standardabweichung gleich Null ist? Gibt es eine Bedingung, die garantiert, dass sie nicht Null sein kann?
Vielen Dank.
correlation
standard-deviation
covariance
chepukha
quelle
quelle
Antworten:
Es ist wahr, dass diese Gleichung undefiniert ist, wenn eine Ihrer SDs 0 ist. Eine bessere Möglichkeit, darüber nachzudenken, ist jedoch, dass es keine Korrelation gibt, wenn eine Ihrer SDs 0 ist. In losen begrifflichen Begriffen sagt Ihnen eine Korrelation, wie sich eine Variable bewegt, während sich die andere Variable bewegt. Eine SD von 0 impliziert, dass sich die Variable nicht bewegt. Sie müssten einen Vektor einer Konstanten haben, wie z
rep(constant, n_times)
.quelle
Das andere, woran man denken muss, sind die zugrunde liegenden Annahmen, wenn wir über Mittelwerte und Standardabweichungen sowie Korrelationen sprechen.
Wenn es sich um eine Datenstichprobe handelt, wird häufig davon ausgegangen, dass die Daten (zumindest näherungsweise) normalverteilt sind oder so transformiert werden können (z. B. über eine Protokolltransformation). Wenn Sie eine Standardabweichung von Null beobachten, gibt es zwei Szenarien: Entweder ist die Standardabweichung tatsächlich ungleich Null, aber sehr klein, und daher enthält der Datensatz Stichproben, die alle auf dem Mittelwert liegen (dies könnte beispielsweise vorkommen) wenn Sie Daten mit einer groben Genauigkeit messen); oder das Modell ist falsch angegeben.
In diesem zweiten Szenario ist die Standardabweichung und folglich die Korrelation ein bedeutungsloses Maß.
Im Allgemeinen müssen die zugrunde liegenden Verteilungen beide endliche zweite Momente und daher Standardabweichungen ungleich Null aufweisen, damit die Korrelation ein gültiges Konzept ist.
quelle
Eine Korrelation ist der Kosinus des Winkels zwischen zwei Vektoren. Zu sagen, dass die Standardabweichung für Y Null ist, ist dasselbe wie zu sagen, dass der Vektor Y-Mittelwert (Y) Null ist (oder genauer gesagt, dass er im entsprechenden Vektorraum Null darstellt). Die Frage lautet also "Was kann man über den (Kosinus des) Winkels zwischen dem Nullvektor und dem Vektor X-Mittelwert (X) sagen?". Was ist allgemeiner in jedem Vektorraum mit einem inneren Produkt mit dem Winkel zwischen dem Nullvektor und einem anderen Vektor gemeint? Meiner Meinung nach gibt es nur eine Antwort darauf, nämlich dass das Konzept des "Winkels" in dieser Situation bedeutungslos ist und daher das Konzept der Korrelation in dieser Situation bedeutungslos ist.
quelle
Ausschlussklausel, mir ist klar, dass es bereits eine akzeptierte Qualitätsantwort gibt, daher sollte dies eine Antwort sein, aber ich habe nicht die Erfahrungspunkte, um dies zuzulassen. @ Dilip erwähnte, dass Sie die Korrelation als 0 für die Konvention definieren können, aber dies scheint problematisch zu sein, da es eine ganz andere Interpretation als eine Korrelation gibt, die wirklich Null ist (mit SDs ungleich Null). Die ursprüngliche Frage lautet "Wenn die SD einer Variablen Null ist". Wenn wir nur an die Definition von 'Variable' denken, erhalten wir einen viel direkteren Weg zur Antwort. Eine Variable mit 0 SD ist überhaupt keine Variable, sondern eine Konstante. In diesem Fall haben Sie also keine zwei Variablen. Daher ist es konzeptionell nicht sinnvoll, überhaupt eine Korrelation zu definieren.
quelle