Ich bin gerade (vage) mit Brownian / Distanz-Kovarianz / Korrelation bekannt geworden . Es scheint in vielen nichtlinearen Situationen besonders nützlich zu sein, wenn auf Abhängigkeit getestet wird. Es scheint jedoch nicht sehr häufig verwendet zu werden, obwohl Kovarianz / Korrelation häufig für nichtlineare / chaotische Daten verwendet wird.
Das lässt mich denken, dass die Distanz-Kovarianz einige Nachteile haben könnte. Also, was sind sie und warum verwendet nicht jeder immer Distanz-Kovarianz?
correlation
covariance
distance-covariance
naught101
quelle
quelle
Antworten:
Ich habe versucht, einige Anmerkungen zur Distanz-Kovarianz zu sammeln, die auf meinen Eindrücken beim Lesen der unten aufgeführten Referenzen beruhen. Ich betrachte mich jedoch nicht als Experte für dieses Thema. Kommentare, Korrekturen, Vorschläge usw. sind willkommen.
Die Anmerkungen sind (stark) auf mögliche Nachteile ausgerichtet, wie in der ursprünglichen Frage gefordert .
Die möglichen Nachteile sind meines Erachtens folgende:
Um es noch einmal zu wiederholen, diese Antwort ist wahrscheinlich ziemlich negativ. Aber das ist nicht die Absicht. Es gibt einige sehr schöne und interessante Ideen im Zusammenhang mit der Distanz-Kovarianz, und die relative Neuheit eröffnet auch Forschungsmöglichkeiten für ein umfassenderes Verständnis.
Referenzen :
quelle
Ich könnte etwas vermissen, aber nur eine Quantifizierung der nichtlinearen Abhängigkeit zwischen zwei Variablen scheint sich nicht auszahlen zu lassen. Es wird Ihnen nicht die Form der Beziehung sagen. Es gibt Ihnen keine Möglichkeit, eine Variable von der anderen vorherzusagen. Analog dazu verwendet man bei der explorativen Datenanalyse manchmal eine Lösskurve (lokal gewichtete Streudiagramme) als ersten Schritt, um festzustellen, ob die Daten am besten mit einer geraden, quadratischen, kubischen usw. Linie modelliert werden können an sich ist kein sehr nützliches Vorhersagewerkzeug. Es ist nur eine erste Annäherung auf dem Weg zu einer praktikablen Gleichung zur Beschreibung einer bivariaten Form. Diese Gleichung kann im Gegensatz zum Löss (oder dem Distanz-Kovarianz-Ergebnis) die Grundlage eines Bestätigungsmodells bilden.
quelle