Nichttransitivität der Korrelation: Korrelationen zwischen Geschlecht und Gehirngröße sowie zwischen Gehirngröße und IQ, aber keine Korrelation zwischen Geschlecht und IQ

18

In einem Blog habe ich folgende Erklärung gefunden und möchte mehr über die Nicht-Transitivität der Korrelation erfahren:

Wir haben die folgenden unbestreitbaren Tatsachen:

  • Im Durchschnitt gibt es einen Unterschied im Gehirnvolumen zwischen Männern und Frauen
  • Es gibt eine Korrelation zwischen dem IQ und der Gehirngröße. Die Korrelation beträgt 0,33 und entspricht somit 10% der Variabilität des IQ

Aus diesen Prämissen 1 und 2 scheint es logisch zu folgen: Frauen haben im Durchschnitt einen niedrigeren IQ als Männer. Aber es ist ein Irrtum! In der Statistik sind Korrelationen nicht transitiv. Der Beweis ist, dass Sie sich nur die Ergebnisse von IQ-Tests ansehen müssen, und sie zeigen, dass sich der IQ von Männern und Frauen im Durchschnitt nicht unterscheidet.

Ich möchte diese Nicht-Transitivität der Korrelation etwas tiefer verstehen.

Wenn die Korrelation zwischen dem IQ und der Gehirngröße 0,9 wäre (wovon ich weiß, dass dies nicht der Fall ist (1)), wäre die Schlussfolgerung, dass Frauen im Durchschnitt einen niedrigeren IQ haben als Männer, immer noch ein Irrtum?

Bitte, ich bin nicht hier, um über IQ (und die Grenzen des Tests), Sexismus, Frauenstereotyp, Arroganz usw. zu sprechen (2). Ich möchte nur die logischen Gründe für den Irrtum verstehen.


(1) was ich nicht weiß: Neandertaler hatten größere Gehirne als Homo Sapiens, waren aber nicht schlauer;

(2) Ich bin eine Frau, und insgesamt betrachte ich mich selbst oder die anderen Frauen nicht als weniger klug als Männer. Der IQ-Test ist mir egal, denn was zählt, ist der Wert der Menschen, und er basiert nicht auf dem intellektuellen Fähigkeiten.


Die Originalquelle in Französisch:

Auf einem les faits indiscutables suivants:

  • il ya une différence de volume cérébral en moyenne entre hommes et femmes
  • il ya une corrélation entre QI et volume cérébral; Die Korrelation beträgt 0,33 und entspricht 10% der Variabilität

Die letzten 1 und 2 Tage, in denen die Daten logiziert wurden, lauten: Sie haben eine Frage zu Ihrer Person.

Dies ist eine Errichtung der Raisonnement! En statistique, les corrélations ne sont pas transitives. Wir empfehlen Ihnen, die Ergebnisse der QI-Tests zu überprüfen und die Frage zu beantworten, ob Sie sich für ein Hotel oder eine Unterkunft entschieden haben.

Bildbeschreibung hier eingeben

MagTun
quelle
5
Ich verstehe nicht, inwiefern diese Aussagen überhaupt etwas mit Korrelation zu tun haben (und die Bezugnahme auf "Transitivität" erscheint in diesem Zusammenhang völlig unangemessen). Die Schlussfolgerung hat schließlich mit einem mittleren Unterschied zu tun . Diese Statistik (die ein erster Moment ist) ist völlig unabhängig von der Korrelation (die aus zweiten Momenten abgeleitet ist). Selbst wenn die Korrelation ein perfekt kann man keine Rückschlüsse auch immer über den Unterschied des mittels des zweiten Variable auf der Differenz des mittels des ersten variablen stützen. ±1
Whuber
5
Man kann zeigen (Langford, Schwertman und Owens (2001)), dass eine positive Korrelation transitiv ist, wenn die Summe der quadratischen Korrelationen größer als 1 ist:ρXY2+ρYX2>1ρXZ>0
CloseToC
2
@whuber: Ja, aber das ist eine Frage, bei der es nicht um die Beziehung zwischen den Mitteln von X und Y (Gehirngröße und IQ) geht, sondern um die Beziehung zwischen den Mitteln von Y in zwei verschiedenen Clustern ... Ich denke, das ist offensichtlich Wenn die Korrelation zwischen der Gehirngröße und dem IQ perfekt ist (dh, der IQ ist eine lineare Funktion der Gehirngröße) und wenn sich die mittlere Gehirngröße zwischen Männern und Frauen unterscheidet, unterscheidet sich der mittlere IQ zwischen Männern und Frauen.
Amöbe sagt Reinstate Monica
2
@Amoeba Danke für diese Interpretation. Das Zitat macht (endlich!) Sinn. Aber dies als "Transitivität der Korrelation" zu bezeichnen, ist so dunkel, dass es offen irreführend ist. (Der Satz ist im französischen Original vorhanden, daher können wir der Übersetzung nicht einmal die Schuld geben.)
whuber
3
@amoeba Das ist plausibel. Aber ich denke, Sie müssen die Dinge ziemlich dehnen, um dort anzukommen! Das Zitat charakterisiert die Beziehung zwischen Geschlecht und Gehirngröße nicht als "Korrelation" - nur als Mittelwertunterschied zwischen den beiden Gruppen (was übrigens kein Standardmaß für die Korrelation ist). Aber ich denke, wir sollten "Korrelation" im weiteren Sinne als "Mangel an Abhängigkeit" oder so etwas verstehen.
whuber

Antworten:

16

Ja, es wäre immer noch ein Irrtum.

Hier ist eine sehr einfache Abbildung, die vier verschiedene Situationen zeigt. In jedem Fall stehen rote Punkte für Frauen, blaue Punkte für Männer, die horizontale Achse für die Gehirngröße und die vertikale Achse für den IQ. Ich habe alle vier Datensätze so generiert, dass:

  • Es gibt immer den gleichen Unterschied in der mittleren Gehirngröße zwischen Männern ( ) und Frauen ( - Einheiten sind willkürlich). Dies sind Populationsmittelwerte, aber dieser Unterschied ist groß genug, um bei jeder angemessenen Stichprobengröße statistisch signifikant zu sein.282228

  • Es gibt immer null Unterschiede im mittleren IQ zwischen Männern und Frauen (beide ) und auch keine Korrelation zwischen Geschlecht und IQ.100

  • Die Stärke der Korrelation zwischen Gehirngröße und IQ variiert wie in der Abbildung gezeigt.

Korrelationen

In der linken oberen Teilkurve beträgt die geschlechtsspezifische Korrelation (getrennt über Männer und getrennt über Frauen berechnet, dann gemittelt) wie in Ihrem Zitat . In der oberen rechten Teilkurve beträgt die Gesamtkorrelation (über Männer und Frauen zusammen) . Beachten Sie, dass in Ihrem Angebot nicht angegeben ist, worauf sich die Zahl von bezieht. In der unteren linken Teilkurve beträgt die geschlechtsspezifische Korrelation , wie in Ihrem hypothetischen Beispiel. in der unteren rechten Nebenkurve beträgt die Gesamtkorrelation .0,3 0,33 0,9 0,90.30.30.330.90.9

Sie können also einen beliebigen Wert für die Korrelation haben, und es spielt keine Rolle, ob sie insgesamt oder innerhalb der Gruppe berechnet wird. Unabhängig vom Korrelationskoeffizienten ist es sehr gut möglich, dass keine Korrelation zwischen Geschlecht und IQ und keine geschlechtsspezifische Differenz im mittleren IQ besteht.


Erkundung der Nicht-Transitivität

Lassen Sie uns den vollen Raum der Möglichkeiten erkunden, indem wir dem von @kjetil vorgeschlagenen Ansatz folgen. Angenommen , Sie haben drei Variablen und (ohne Beschränkung der Allgemeinheit) annehmen , dass Korrelation zwischen und ist und Korrelation zwischen und ist . Die Frage ist: Was ist der minimal mögliche positive Wert der Korrelation zwischen und ? Ist es manchmal haben zu positiv sein, oder kann es immer Null sein?x 1 x 2 a > 0 x 2 x 3 b > 0 λ x 1 x 3x1,x2,x3x1x2a>0x2x3b>0λx1x3

Die Korrelationsmatrix ist und muss eine nicht negative Determinante haben, dh was bedeutet, dass zwischenWenn beide Wurzeln positiv sind, ist der minimal mögliche Wert von gleich der kleineren Wurzel (und muss positiv sein!). Liegt Null zwischen diesen beiden Wurzeln, kann Null sein. d e t R = - λ 2 + 2 a b λ - ( a 2 + b 2 - 1 ) 0 , λ a b ±

R=(1aλa1bλb1)
detR=λ2+2abλ(a2+b21)0,
λλλλ
ab±(1a2)(1b2).
λλλ

Wir können dies numerisch lösen und den minimal möglichen positiven Wert von für verschiedene und :a bλab

Nicht-Transitivität erforschen

Informell könnte man sagen, dass Korrelationen transitiv wären, wenn man und annimmt, dass . Wir sehen , dass für die meisten Werte und , Null sein kann, was bedeutet , dass Korrelationen nicht transitiv sind. Für einige ausreichend hohe Werte von und muss die Korrelation jedoch positiv sein , was bedeutet, dass es "einen gewissen Transitivitätsgrad" gibt, der jedoch nur auf sehr hohe Korrelationen beschränkt ist. Beachten Sie, dass beide Korrelationen und hoch sein müssen.b > 0 λ > 0 a b λ a b λ a ba>0b>0λ>0abλabλ ab

Wir können eine genaue Bedingung für diese "Transitivität" herausfinden: Wie oben erwähnt, sollte die kleinere Wurzel positiv sein, dh , was ist äquivalent zu . Dies ist eine Kreisgleichung! Wenn Sie sich die Abbildung oben ansehen, werden Sie feststellen, dass der blaue Bereich ein Viertel eines Kreises bildet.a2+b2>1ab(1a2)(1b2)>0a2+b2>1

In Ihrem speziellen Beispiel ist die Korrelation zwischen Geschlecht und Gehirngröße ziemlich moderat (vielleicht ) und die Korrelation zwischen Gehirngröße und IQ ist , was fest im blauen Bereich liegt ( ). was bedeutet, dass positiv, negativ oder null sein kann.b = 0,33 a 2 + b 2 < 1 λa=0.5b=0.33a2+b2<1λ


Relevante Figur aus der Originalstudie

Sie wollten es vermeiden, über Geschlecht und Verstand zu sprechen, aber ich kann nicht umhin, darauf hinzuweisen, dass bei Betrachtung der vollständigen Abbildung des Originalartikels ( Gur et al. 1999 ) festzustellen ist, dass es beim verbalen IQ-Score keinen geschlechtsspezifischen Unterschied gibt ein offensichtlicher und signifikanter Unterschied in der räumlichen IQ-Punktzahl! Vergleiche die Untergrundstücke D und F.

Gur et al.

Amöbe sagt Reinstate Monica
quelle
2
Ich liebe die Handlungen, die du generiert hast. Die aus der Zeitung, nicht so sehr ...
Shadowtalker
1
@AleksandrBlekh: Um die Wahrheit zu sagen, ich bin nicht sicher. "Heatmap"? "Konturplot" aber farbig und ohne Konturen?
Amöbe sagt Reinstate Monica
2
|λ|λ
1
xyyzxzab0λ0
1
Vielen Dank an Amoeba für diese lange und ausführliche Antwort (und sogar noch etwas mehr, übrigens sehr willkommen)! Es macht die Dinge klar! Das Konzept ist für mein statistisch nicht geschultes Gehirn so schwer zu fassen, und Sie haben das Problem beleuchtet! Vielen Dank für die Zeit, die Sie gebraucht haben, um Ihre Antwort zu posten!
MagTun
8

x1=IQ,x2=genderx3

cor(x1,x2)=λ,cor(x1,x3)=cor(x2,x3)=ρ=0.9
λ
R=(1λρλ1ρρρ1)
ρ
detR=1(1-ρ2)-λ(λ-ρ2)+ρ(λρ-ρ)=1-λ2-2ρ2+2λρ20,
ρ2λ+12ρ=0.9λ0.62

Aktualisieren:

p=0.5μ1=E(x1|x2=1)μ0=E(x1|x2=0)μ=E(x1)μ=0=μ1+μ0μ0=μ1x1N(μ=0,σ2)x2p=1/2

corr(x1,x2)=E(x1μ)E(x2p)σ12=Δ2σ
Δ=μ1μ0=2μ1σ=10Δ/20Angaben zum IQ-Mittelwertunterschied sind falsch! Das wäre wahr, wenn das Geschlecht eine kontinuierliche Variable wäre, was es offensichtlich nicht ist. Beachten Sie, dass diese Tatsache mit der Tatsache zusammenhängt, dass die Varianz für die Binomialverteilung eine Funktion des Mittelwerts ist (wie es sein muss, da es nur einen freien Parameter gibt, der variiert werden kann). Was wir oben getan haben, ist wirklich, dies auf Kovarianz / Korrelation auszudehnen.

ρ=0.33λ0.7822λ=0

kjetil b halvorsen
quelle
1
cor(x1,x2)0.62E(x1)E(x2)
5
+1 - Aber ich finde das Konzept der Korrelation zwischen Männer- und Frauen-IQs etwas verwirrend, da man einen solchen Wert niemals berechnen könnte.
Andy W
1
Was soll die Korrelation zwischen dem IQ von Männern und Frauen bedeuten ?!
Amöbe sagt Reinstate Monica
ja, das stimmt @amoeba! Ich habe möglicherweise nicht die richtigen Wörter verwendet, um meine Verwirrung auszudrücken (es ist schwierig, weil ich nicht an Statistiken gewöhnt bin), aber die Variablen sind tatsächlich Geschlecht, IQ und Gehirngröße.
MagTun
7

Dies ist eine Situation, in der ich gerne Pfaddiagramme verwende, um direkte und indirekte Effekte zu veranschaulichen und wie sich diese beiden auf die Gesamtkorrelationen auswirken.

Gemäß der ursprünglichen Beschreibung haben wir unten eine Korrelationsmatrix. Die Gehirngröße hat eine Korrelation von 0,3 mit dem IQ, die weibliche und der IQ haben eine Korrelation von 0 miteinander. Ich fülle die negative Korrelation zwischen weiblicher und Gehirngröße mit -0,3 (wenn ich vermuten müsste, dass sie viel kleiner ist, aber dies dient nur zur Veranschaulichung).

       Brain  Female  IQ
 Brain   1
Female  -0.3    1
    IQ   0.3    0      1

Wenn wir ein Regressionsmodell einpassen, bei dem der IQ eine Funktion der Gehirngröße und der Weiblichkeit ist, können wir dies anhand eines Pfaddiagramms veranschaulichen. Ich habe die partiellen Regressionskoeffizienten auf den Pfeilen ausgefüllt, und der B-Knoten steht für Gehirngröße und der F-Knoten steht für weiblich.

Bildbeschreibung hier eingeben

Nun, wie verrückt ist das - wenn man die Gehirngröße unter Berücksichtigung dieser Zusammenhänge kontrolliert, haben Frauen eine positive Beziehung zum IQ. Warum ist das so, wenn die marginale Korrelation Null ist? Gemäß den Regeln mit linearen Wegdiagrammen ( Wright, 1934 ) können wir die marginale Korrelation als Funktion des direkten Effekts bei der Kontrolle der Gehirngröße und des indirekten Effekts zerlegen:

TotalF,IQ=DirectF,IQ+IndirectF,B,IQ

TotalF,IQ=Cor(F,IQ)

IndirectF,B,IQ=Cor(F,B)Cor(B,IQ|F)0.099=0.30.33

Da der Gesamteffekt Null ist, wissen wir, dass der direkte Effekt einfach das genau entgegengesetzte Vorzeichen und die genau entgegengesetzte Größe des indirekten Effekts haben muss. Daher entspricht der direkte Effekt in diesem Beispiel 0,099. Nun, hier haben wir eine Situation, in der wir den erwarteten IQ von Frauen beurteilen. Wir erhalten zwei verschiedene Antworten, obwohl dies wahrscheinlich nicht das ist, was Sie ursprünglich erwartet haben, als Sie die Frage spezifizierten. Wenn Sie einfach den marginalen erwarteten IQ von Frauen gegenüber Männern abschätzen, ist der Unterschied Null, wie Sie ihn definiert haben (durch eine Null-Korrelation). Bei der Beurteilung des erwarteten Unterschieds, der von der Gehirngröße abhängt, haben Frauen einen höheren IQ als Männer.

Sie können in dieses Beispiel entweder größere Korrelationen zwischen Gehirngröße und IQ (oder kleinere Korrelationen zwischen weiblicher und Gehirngröße) einfügen, vorausgesetzt, die Grenzen, die kjetil in seiner Antwort angibt. Durch die Erhöhung des ersteren wird die Disparität zwischen dem bedingten IQ von Frauen und Männern zugunsten von Frauen noch größer, durch die Verringerung des letzteren werden die Unterschiede kleiner.

Andy W
quelle
Betrachtet man das Bild, so zeigt es eine positive (und stärkere als die Männer) Korrelation des Gehirnvolumens von Frauen mit dem IQ.
Alecos Papadopoulos
1
@Andy W Ich schäme mich total, diese dumme Frage zu stellen, aber mit welcher Software haben Sie das Knotendiagramm gezeichnet?
mugen
1
Es war ein schneller Job in inkscape @mugen. Wenn ich mir mehr Zeit nehme, finde ich die, die ich mit Latex und Tikz mache, schöner.
Andy W
+1 Können Sie mich auf die Theorie Ihrer zweiten Formel hinweisen?
Aleksandr Blekh
2
@AleksandrBlekh - das Wright-Papier, das ich zitiere, ist die wegweisende Quelle. Judea Pearl geht in seinem Causality- Buch auf einen ausführlicheren Kommentar ein , obwohl es einfachere Behandlungen gibt. (Für lineare Modelle werden die Zerlegungen in Strukturgleichungsmodellen oftmals flüchtig behandelt.)
Andy W
3

vq12

(1)E(v1)>E(v2)=βE(v1),0<β<1,ρ(v1,q1)>0,ρ(v2,q2)>0

Beachten Sie, dass der zitierte Text zwar allgemein von "Korrelation zwischen Gehirnvolumen und IQ" handelt, das bereitgestellte Bild jedoch eine Unterscheidung zwischen den beiden Trendlinien vornimmt (dh die Korrelation für die beiden Untergruppen wird separat angezeigt). Also betrachten wir sie getrennt (was der richtige Weg ist).

Dann

ρ(v1,q1)>0COv(v1,q1)>0E(v1q1)>E(v1)E(q1)

(2)E(v1q1)E(q1)>E(v1)

und

ρ(v2,q2)>0COv(v2,q2)>0E(v2q2)>E(v2)E(q2)

(3)E(v2q2)βE(q2)>E(v1)

E(q1)>E(q2)

(4)E(q1)=E(q2)=q¯

Dann muss es so sein

(5)(2),(4)E(v1q1)q¯>E(v1)

und das

(6)(3),(4)E(v2q2)βq¯>E(v1)

(5)(6)
(1)

(1)E(q1)E(q2)(1)

Alecos Papadopoulos
quelle
2
Trotz aller hier gezeigten Berechnungen sehe ich immer noch nicht, wie die Korrelation irgendetwas über die Beziehungen zwischen Mittelwerten aussagt (oder irgendwelche Einschränkungen auferlegt) .
Whuber
@whuber Bei der gesamten Antwort geht es darum zu zeigen, dass dies nicht der Fall ist. Die letzten Sätze sagen genau das. Fügen wir noch einen hinzu.
Alecos Papadopoulos
Aber das ist absolut grundlegend: Man braucht keine ganze Seite von Gleichungen, um es zu zeigen! Es genügt zu beachten, dass die Korrelationskoeffizienten ortsinvariant sind ( QED) . Interpretiere ich die Frage falsch?
whuber
1
@whuber Mit allem Respekt und ohne Beleidigung für irgendjemanden gemeint, aber ich befürchte, dass Sie den Wissensstand des OP "falsch interpretieren". Andernfalls wäre die Frage nicht gestellt worden.
Alecos Papadopoulos
4
Ich möchte Sie daher ermutigen, darüber nachzudenken, ob und wie eine Antwort, die sich stark auf mathematische Gleichungen stützt, für die Ansprache von Postern geeignet ist, die anscheinend elementare Darstellungen grundlegender Konzepte verlangen. Dies ist eine subtile Angelegenheit, da dies manchmal genau der richtige Ansatz ist. Darüber hinaus kann es eine Geschmackssache sein, inwieweit man Mathematik einsetzt und wie man die mathematischen Ideen erklärt. Aber IMHO ist diese Art der Antwort nur dann wirksam, wenn die Mathematik klar ist und sich konsequent auf eine wesentliche Idee konzentriert.
Whuber