Hat jemand einen Beweis dafür, dass die Kovarianz zwischen zwei Variablen immer das gleiche Vorzeichen wie Spearmans Rho hat, vorausgesetzt, dass beide nicht Null sind , oder eine Erklärung / ein Gegenbeispiel, um zu zeigen, warum dies nicht der Fall ist?
Ich spreche von den "theoretischen" Größen der "Bevölkerung", nicht von ihren Stichprobengegenstücken. Für zwei Zufallsvariablen mit Verteilungsfunktionen und mit allen benötigten Momenten, Co-Momenten usw. vorhanden,
Ich weiß, dass wenn positiv oder negativ ( ) sind, dies tatsächlich gilt,
... wieder, wenn beide nicht Null sind. Aber was ist, wenn nicht hergestellt werden kann oder nicht gilt?
Was ich schließlich suche, ist ein Beweis dafür, dass wenn eine zunehmende monotone Transformation von , dann . Ich weiß, dass dies sehr intuitiv und sogar "selbstverständlich" erscheint, aber ich konnte nirgendwo einen solchen Beweis finden, und ich habe es auch nicht geschafft, ihn selbst zu beweisen. Genauer gesagt möchte ich zeigen, dass beide , wenn sie nicht Null sind, keine entgegengesetzten Vorzeichen haben können.
Da Spearmans Rho für monotone Transformationen unveränderlich ist, haben wir , so dass ein Weg, das Ergebnis des "gleichen Zeichens" für die Kovarianzen zu beweisen, darin besteht, beweisen, dass die Kovarianz immer das gleiche Zeichen hat wie Spearmans Rho, daher diese Frage.
Ich habe einen alten schönen Ausdruck für die Kovarianz aufgrund von W. Hoeffding gefunden, der die Definitionen und "sehr nahe" bringt , aber ich konnte die allgemeine Aussage nicht beweisen, ohne Quadrantenabhängigkeit anzunehmen.
Wenn jemand etwas direkt auf dem "gewünschten Vorzeichen" (gewünschtes) Ergebnis für die Kovarianzen hat, wäre dies natürlich ebenso hilfreich.
UPDATE
Ich habe diese Frage gefunden , die verwandt, aber nicht identisch ist. Wie bereits erwähnt, ändert es meine Frage wie folgt: "Angenommen, beide Maße sind nicht Null. Können sie entgegengesetzte Vorzeichen haben?"
quelle
Antworten:
Es gibt viele Gegenbeispiele. Aber lassen Sie uns die zugrunde liegende Frage ansprechen:
Das ist falsch.
Das erste Gegenbeispiel ist die diskrete Gleichverteilung auf den Punkten hier dargestellt durch Zeichnen dieser sieben Punkte als rote Kreise im linken Feld:F (xi,yi) (1,8.1),(2,9.1),(3,10.1),(4,11.1),(5,12.1),(6,13.1),(7,0.1),
Betrachten Sie die Familie der Box-Cox-Transformationen
wobei die Konstante gewählt wird , die Werte von machen vergleichbar mit denen von (beispielsweise durch Setzen zu sein , die Leistung des geometrischen Mittels des ) und wird machen die Identität. Diese sind alle monoton; Ein Beispiel ist fürC hp(yi) y C p−1 yi 1 h1 p=2 im rechten Bereich. Ihre Auswirkungen auf die Kovarianz sind im mittleren Feld dargestellt. Es zeigt eine Änderung von negativer Kovarianz (aufgrund des äußeren Punktes unten links) zu positiver Kovarianz (weil die Transformation den Punkt nur ein wenig weniger äußerlich macht und seinen negativen Effekt auf die ansonsten starke positive Kovarianz aller anderen Daten verringert). .
Um genau zu sein, können Sie dies insbesondere berechnen
Geben von und Die Punkte sind in der linken Tafel als hohle blaue Dreiecke dargestellt.Cov(xi,yi)=−7/3<0 Cov(xi,h(yi,2))=0.39217>0. (xi,h(yi,2))
Das zweite Gegenbeispiel ist eine fortlaufende Version des ersten. Es sei eine kontinuierliche Verteilung, die aufFür jede reelle Zahl definieren(U,V) [−1,1]×[−1,1]. ϵ
Vorausgesetzt, hat eine kontinuierliche Verteilung (siehe Ist die Summe einer kontinuierlichen Zufallsvariablen und einer gemischten Zufallsvariablen kontinuierlich? ). Vorausgesetzt die Unterstützung von im ersten Quadranten (in beiden Variablen streng positiv), was bedeutet, dass die Box-Cox-Transformationen auf angewendet werden können Sie können die Berechnungen durchführen, um zu bestätigen, dass die Kovarianz von eine kontinuierliche Funktion vonErgo zeigt das erste Gegenbeispiel für ausreichend kleines die Kovarianz vonϵ≠0, (Xϵ,Yϵ) |ϵ|<1/10, (Xϵ,Yϵ) Yϵ. (Xϵ,Yϵ) ϵ. ϵ, (Xϵ,Yϵ) ist negativ, während das von positiv ist, QED.(Xϵ,h2(Yϵ))
quelle
Ich sage, sie können entgegengesetzte Vorzeichen haben.
Schauen wir uns die folgende Simulation an.
Wir können die simulierten Daten jedoch als diskrete Population betrachten.
Das "ecdf" (empirische CDF) bringt R dazu, die Populations-CDF dieser diskreten Variablen zu erstellen. Ich denke, wir arbeiten auf Bevölkerungsebene und dies ist ein Gegenbeispiel.
quelle
Um den Wert dieses Threads zu erhöhen, werde ich darlegen, warum Quadrantenabhängigkeit impliziert, dass
a) Kovarianz das gleiche Vorzeichen wie Spearmans Rho hat, wenn beide nicht Null sind.
B) Das Vorzeichen der Kovarianz wird nicht durch streng zunehmende monotone Transformationen beeinflusst, wenn es bestehen bleibt ungleich Null.
Ich werde es für kontinuierliche Verteilungen mit Dichten zeigen, aber dies ist keine kritische Bedingung.
Sei , zwei Zufallsvariablen mit gemeinsamer Verteilungsfunktion , Randverteilungsfunktionen und Randdichte- / Wahrscheinlichkeitsmassenfunktionen . Dann haben wirX Y FXY(x,y) FX(x),FY(y) fX(x),fY(y)
Beachten Sie, dass die entscheidende Bedingung das Qualifikationsmerkmal "für alle " ist.(x,y)
Nun lautet die "schöne Kovarianzformel von Hoeffding"
wobei die gemeinsame Unterstützung ist. Auf der anderen Seite kann Spearmans Rho ausgedrückt werden alsSXY
Diejenigen, die sich daran erinnern, dass verstehen, warum die Existenz von Dichten nicht kritisch ist. Aber es ist klarstellend: Verdichten von wirdF(x)=f(x)dx [FXY(x,y)−FX(x)FY(y)]≡QD(x,y)
Wir sehen, dass die Kovarianz die Größen über der Gelenkstütze "ungewichtet" "summiert", während Spearmans Rho sie summiert, gewichtet mit dem Produkt der Dichten, (was immer nicht ist) -Negativ). Wenn die Quadrantenabhängigkeit gilt, "summieren" wir in beiden Maßen entweder nur nicht negative Dinge oder nur nicht positive Dinge.QD(x,y) fx(x)fy(y)
Damit
a) Unter hat Covarianz das gleiche Vorzeichen wie Spearmans Rho, wenn beide nicht Null sind:QD
Betrachten Sie außerdem eine streng zunehmende monotone Transformation von , . Spearmans 'Rho ist unter einer solchen Transformation also unveränderlichY h(Y)
Unter Quadrantenabhängigkeit haben wir wieder, wenn beide Maße nicht Null sind,
Verknüpfungszeichengleichungen erhalten wir dann
Wie in den anderen Antworten impliziert, ist das kontraintuitive Ergebnis hier, dass die Quadrantenabhängigkeit nicht fallengelassen werden kann: Wenn dies nicht zutrifft, können wir nicht garantieren, dass eine streng zunehmende Transformation einer Variablen das Vorzeichen der Kovarianz bewahrt. Daher sind "ziemlich logische" informelle Argumente wie "da, wenn dazu neigt, ebenso wie zuzunehmen , folgt, dass wenn positiv mit kovariiert, es auch mit positiv koväriert " falsch ist - "es folgt "nur wenn gilt.Y h(Y) X Y h(Y) QD
Formal kann man dies sehen, indem man und dies beobachtetZ=h(Y),h′(y)>0
Wenn nicht gilt, bedeutet dies, dass einige positiv und andere negativ sind. Dann kann die Tatsache, dass beispielsweise allein ist, nicht garantieren, dass auch ist, da wir hier den vorherigen Integranden mit , das zwar streng positiv ist, aber keine Konstante ist, und es daher vorkommen kann, dass die negativen überproportional gewichtet werden als die positiven, was insgesamt zu einem negativen Wert führt. Zumindest von diesem Weg aus ist die Eigenschaft der Quadrantenabhängigkeit wesentlich.QD QD(x,y) Cov(X,Y)>0 Cov(X,Z)>0 h′(y) QD(x,y)
quelle