Hat jemand eine Vorstellung davon, warum die bedingte Korrelation zwischen zwei Variablen als "partielle" Korrelation und die einfache Korrelation zwischen ihnen (wenn sie also nicht von einer anderen Variablen abhängig ist) als "marginale" Korrelation bezeichnet wird? Was ist die Intuition hinter den Wörtern "partiell" und "marginal"? Was machen sie mit "Teilen" oder "Rändern"?
Es wäre gut, die Antwort zu lernen, um diese Konzepte besser zu verstehen.
correlation
terminology
marginal
partial-correlation
user35159
quelle
quelle
Antworten:
Der Begriff "marginal" ist sehr alt. Wenn Sie in der Geschichte weit genug zurückgehen, gab es keine wissenschaftlichen Zeitschriften (offensichtlich begannen sie um 1665 ). Stattdessen wurden Zwischenergebnisse über handgeschriebene Briefe kommuniziert und die Endergebnisse in Büchern festgehalten. Vor Playfair gab es nicht viel an Datengrafiken , aber Bücher hatten oft Tabellen mit Zahlen unter verschiedenen Bedingungen. Betrachten Sie diese Tabelle:
Diese Werte sind allebedingt; Das heißt, sie geben eine Nummer für eine bestimmte Kombination von Bedingungen an. Manchmal wollten die Leser jedoch wissen, wie eine bestimmte Bedingung ohne Berücksichtigung der anderen Variablen aussieht. Stellen Sie sichxI,Avor, wie oft etwas passiert ist, als die erste VariableI war
Was haben diese Zahlen mit Korrelationen zu tun? Nun, es ist keine direkte Verbindung, aber wenn Sie einmal die Idee haben, andere Variablen nicht zu berücksichtigen, und Sie einen Namen dafür haben ("marginal"), wenn ein neuer Kontext entsteht, der analog ist (dh Korrelationen) , der Name und die Idee werden einfach angewendet.
Ich kenne die Etymologie partieller Korrelationen nicht, aber ich kann Ihnen die Intuition geben. Eigentlich ist es ziemlich einfach: Sie haben es mit der Korrelation zwischen einem Teil einer Variablen und einem Teil einer anderen zu tun. Betrachten Sie diese Abbildung:
Wir können der linke Kreis vorstellen , ist eine Variable , der rechte Kreis ist eine Variable Y , und der obere Kreis ist eine Variable Z . Die Korrelation zwischen zwei Variablen hängt davon ab, wie stark sich die Kreise überlappen (tatsächlich können wir uns vorstellen, dass die Fläche der Kreise die Variabilität jeder Variablen darstellt und dass der Prozentsatz der Fläche r 2 beträgt ). Nun ist es klar , dass es eine Korrelation zwischen dem , X und Y , aber es gibt auch eine gewisse Korrelation zwischen X und Z , und zwischen Y und Z . Was wäre, wenn Sie wissen wollten, wie die Korrelation zwischen diesen Teilen von war ?X Y Z r2 X Y X Z Y Z und Y , die nichts mit Z zu tun hattenX Y Z ? Das wäre dieteilweise Korrelation. Dies hängt mit der Überlappung zwischen den beidenTeilender Kreise zusammen, die nicht die oberen Splitter enthalten, die sich mit dem oberen Kreis schneiden.
Ich mag diese Webseite sehr, weil sie eine leicht verständliche Diskussion über Teilkorrelationen und verwandte Themen bietet. Nur im ersten Abschnitt geht es um Teilkorrelationen an sich, aber ich empfehle dringend, die ganze Seite zu lesen (obwohl sie ziemlich lang ist). Obwohl nicht direkt verwandt, die Diskussion in diesem Thread: Wo ist die gemeinsame Varianz zwischen allen IVs in einer linearen multiplen Regressionsgleichung? kann auch hilfreich sein.
quelle
The correlationρXY between 2 variables X,Y (which you call marginal correlation) indicates that both variables samples show some dependence.
The partial correlationρXY⋅Z measures the residual correlation between X,Y once the influence of the confounding variable Z has been removed by linear regression.
In mathematical terms, this is expressed as:ρXY⋅Z:=ρXY−ρXZρYZ1−ρ2XZ−−−−−−−√1−ρ2YZ−−−−−−√
To illustrate the properties coming from this definition, we can consider two limit cases:
ifX and Y are both 0% correlated with the variable Z , then the partial correlation is the correlation: ρXY⋅Z=ρXY
IfY is 100% correlated with Z however, then the partial correlation is always 0 no matter the value of ρXY .
quelle