Ich plane eine Simulationsstudie, in der ich die Leistung mehrerer robuster Korrelationstechniken mit unterschiedlichen Verteilungen (verzerrt, mit Ausreißern usw.) vergleiche. Mit robust meine ich den Idealfall, robust gegen a) verzerrte Verteilungen, b) Ausreißer und c) schwere Schwänze zu sein.
Zusammen mit der Pearson-Korrelation als Grundlinie wollte ich folgende robustere Maßnahmen einbeziehen:
- Spearman's
- Prozentuale Biegekorrelation (Wilcox, 1994, [1])
- Minimales Volumenellipsoid, minimale Kovarianzdeterminante (
cov.mve
/cov.mcd
mit dercor=TRUE
Option) - Wahrscheinlich die wonorisierte Korrelation
Natürlich gibt es viel mehr Möglichkeiten (besonders, wenn Sie auch robuste Regressionstechniken einbeziehen), aber ich möchte mich auf die meist verwendeten / meist vielversprechenden Ansätze beschränken.
Jetzt habe ich drei Fragen (zögern Sie nicht, nur einzelne zu beantworten):
- Gibt es andere robuste Korrelationsmethoden, die ich einbeziehen könnte / sollte?
- Welche robusten Korrelationstechniken werden in Ihrem Bereich tatsächlich verwendet? (Apropos psychologische Forschung: Außer Spearman's ich noch nie eine zuverlässige Korrelationstechnik außerhalb eines Fachartikels gesehen. Bootstrapping wird immer beliebter, andere zuverlässige Statistiken gibt es jedoch bislang so gut wie nicht.)
- Gibt es bereits systematische Vergleiche von bekannten Mehrfachkorrelationstechniken?
Sie können auch die Liste der oben angegebenen Methoden kommentieren.
[1] Wilcox, RR (1994). Der prozentuale Biegekorrelationskoeffizient. Psychometrika , 59, 601 & ndash; 616.
quelle
Kendalls Tau wird in der Copula-Theorie sehr häufig verwendet, wahrscheinlich, weil es für archimedische Copulas eine sehr natürliche Sache ist, dies in Betracht zu ziehen. Diagramme des kumulativen Kendall-Tau wurden von Genest und Rivest eingeführt, um ein Modell unter Familien bivariater Copulas auszuwählen.
Link zum Artikel von Genest Rivest (1993)
quelle
Einige robuste Korrelationsmaße sind:
Rangkorrelationskoeffizient nach Spearman
Signum (Blomqvist) Korrelationskoeffizient
Kendalls Tau
Bradleys absoluter Korrelationskoeffizient
Shevlyakov-Korrelationskoeffizient
Verweise:
• Blomqvist, N. (1950) "Über ein Maß der Abhängigkeit zwischen zwei Zufallsvariablen", Annals of Mathematical Statistics, 21 (4): 593-600. Bradley, C. (1985) "The Absolute Correlation", The Mathematical Gazette, 69 (447): 12-17. • Shevlyakov, GL (1997) „Über die robuste Schätzung eines Korrelationskoeffizienten“, Journal of Mathematical Sciences, 83 (3): 434-438. • Spearman, C. (1904) "Der Beweis und die Messung der Assoziation zwischen zwei Dingen", American Journal of Psychology, 15: 88-93.
quelle
Biweight Midcorrelation implementiert in R (sehr schnell) via WGCNA und in Python (nicht so schnell) via Astropie . Das ist meine Anlaufstelle für Netzwerkanalysen.
Für spärliche Kompositionsdaten gibt es auch SparCC und FastSpar
quelle