Verallgemeinerung des Korrelationsbegriffs für

7

Die Pearson-Korrelation wird über Varianz und Kovarianz definiert und funktioniert daher nicht, wenn sie auf stabile Verteilungen mit angewendet wird . Gibt es eine Möglichkeit, den Begriff der Korrelation mit solchen Verteilungen zu verallgemeinern, z. B. durch irgendeine Form der Renormierung?αα2

Beispiel:

ρgeneralised(X,Y):=limkρ(Xk,Yk)

wobei Xk:=min(max(X,k),k) und Yk ähnlich.

quant_dev
quelle
Vielleicht wäre auch die (Populationsversion) eines Rangkorrelationsmaßes eine Idee.
Michael M
Können Sie nachweisen, dass diese Grenze besteht?
StasK
@ MichaelM Wie Spearman Rho oder Kendall Tau?
quant_dev
@StasK Ich weiß nicht - ich habe diese Frage gestellt, um zu sehen, ob jemand bereits die harte Arbeit geleistet hat ;-)
quant_dev
Ja. Kendalls Tau misst die Wahrscheinlichkeit eines konkordanten Paares abzüglich der Wahrscheinlichkeit eines nicht übereinstimmenden Paares. Die Spearman-Rangkorrelation kann auch als gemeinsame Verteilung ausgedrückt werden.
Michael M

Antworten:

3

Ich habe etwas gefunden, das nützlich sein könnte. Eine Alternative zur herkömmlichen Korrelation für stabile Verteilungen mit ist der vorzeichenbehaftete symmetrische Kovariationskoeffizient.αα>1

Definition. Sei ein bivariater symmetrischer stabiler Zufallsvektor mit . Der vorzeichenbehaftete symmetrische Kovariationskoeffizient zwischen und ist die Größe:(X1,X2)αα>1X1X2

scov(X1,X2)=κ(X1,X2)|[X1,X2]α[X2,X1]α||X1||αα||X2||αα|12,

wo

  • [X1,X2]α=S2s1s2α1Γ(ds) , wobei das sprektale Maß des Zufallsvektors ist ;Γ(X1,X2)

  • ||X1||α=([X1,X1]α)1α ;

  • κ(X1,X2)=sign([X1,X2]α)ifsign([X1,X2]α)=sign([X2,X1]α) ;

  • κ(X1,X2)=1ifsign([X1,X2]α)=sign([X2,X1]α) .

Der folgende Satz zeigt, dass der vorzeichenbehaftete symmetrische Kovariationskoeffizient wünschenswerte Eigenschaften aufweist, ebenso wie der gewöhnliche Korrelationskoeffizient eines bivariaten Gaußschen Zufallsvektors.

Vorschlag. Sei ein bivariater symmetrischer stabiler Zufallsvektor mit . Der vorzeichenbehaftete symmetrische Kovariationskoeffizient hat die folgenden Eigenschaften:(X1,X2)αα>1

  1. 1scov(X1,X2)1
  2. Wenn unabhängig sind, dann ist ;X1,X2scov(X1,X2)=0
  3. |scov(X1,X2)|=1 genau dann, wenn für einige ;X2=λX1λR,λ0
  4. für fällt mit dem üblichen Korrelationskoeffizienten zusammen.α=2scov(X1,X2)

Weitere Einzelheiten finden Sie unter: Schätzung und Vergleich des vorzeichenbehafteten symmetrischen Kovariationskoeffizienten und des verallgemeinerten Assoziationsparameters für die alphastabile Abhängigkeit von Bernédy Kodia und Bernard Garel URL: https://hal.archives-ouvertes.fr/hal-00951885/document

stochazesthai
quelle
1
Können Sie die URL für diese Referenz hinzufügen?
StasK
Ist bi-linear? scov
quant_dev
... Entschuldigung, dumme Frage. Natürlich wird es nicht sein. Aber es sieht so aus, als ob es der Pearson-Korrelation am nächsten kommt.
quant_dev
2

Ich fand diese Idee in dem Buch Gilchrist: "Statistische Modellierung mit Quantilfunktionen"; Dies basiert auf Medianwerten:

Der Komiker (nicht lachen) von und wird definiert durch wobei der Median von ist . Dann müsste man dies durch einige Variabilitätsmaße standardisieren, dieses Buch gibt MedAD als Stichprobenmedian der Abweichungen vom Median an. Wie gut das für die stabile Verteilung funktioniert, weiß ich nicht; Sie könnten es durch Simulation untersuchen.XY

coMED(X,Y)=M[(XM(X))(YM(Y))]
M(X)Xdi

Antwort auf eine zusätzliche Frage in den Kommentaren: "Glaubst du, Comedian ist bilinear wie Kovarianz?": Erstens erfüllt der Median selbst (vorausgesetzt, dass wir im geraden Fall verwenden der mittlere Median, der Median von als wobei die Reihenfolge bezeichnet Statistiken). Dies liegt daran, dass eine lineare Transformation der Daten die Reihenfolge nicht ändert ( ) oder die Reihenfolge umkehrt ( ). Es ist der letzte Fall, der die Verwendung des mittleren Medians erzwingt! Dies reicht jedoch nicht aus, um zu schließen, dass der Median linear ist. Wir würden benötigen.M(aX+b)=aM(X)+bnX1,X2,X3,X4X(2)+X(3)2X(i)ax+ba>0a<0M(X+Y)=M(X)+M(Y)und das ist offensichtlich falsch . Ohne die Linearität des Medians selbst ist die Bilinearität des Komikers zu viel verlangt. Das kann nicht wahr sein.

kjetil b halvorsen
quelle
1
Interessant! Ich werde es versuchen.
quant_dev
Für Vorschläge für Simulationen abgelehnt. Stabile Verteilungen sind nicht besonders anfällig für gute Simulationen - jede Stichprobe weist eine Varianz auf ... im Gegensatz zu dem, was Ihr Lehrbuch sagt, dass dies nicht der Fall ist.
StasK
@StasK: OK, aber haben Sie eine Referenz für "Stabile Verteilungen sind nicht besonders anfällig für gute Simulationen", würde mich interessieren.
kjetil b halvorsen
Das ist mein Bauchgefühl. Untersuchen Sie WAS durch Simulation? In meinen Simulationen, wie ein Schätzverfahren funktioniert, das ich untersuche, habe ich einen bekannten Populationsparameter, ich simuliere aus einer Verteilung, die diesen Parameter irgendwo hat, ich schätze mein Modell, spüle, wiederhole, berechne die Verzerrung, Stabilität der Standardfehler, der mittlere quadratische Fehler und die Abdeckung der Konfidenzintervalle. Ich weiß nicht, was ich tun soll, wenn die Verteilung nicht genügend Momente hat. Vielleicht bin ich es nur.
StasK
@StasK: OK, aber wenn keine Momente existieren, können wir immer noch Quantile wie den Median und den IQR usw. verwenden.
kjetil b halvorsen