Wir hören immer von diesem Datenvektor im Vergleich zu diesem anderen Datenvektor, der unabhängig voneinander oder nicht korreliert usw. ist, und obwohl es in Bezug auf diese beiden Konzepte leicht zu verstehen ist, möchte ich sie mit Beispielen aus der Realität verknüpfen. Leben, und auch Wege finden, um diese Beziehung zu messen.
Unter diesem Gesichtspunkt suche ich nach Beispielen für zwei Signale, die aus den folgenden Kombinationen bestehen: (Ich beginne mit einigen):
Zwei Signale, die unabhängig UND (notwendigerweise) unkorreliert sind:
- Das Geräusch eines Automotors (nennen Sie es ) und Ihre Stimme ( ), während Sie sprechen.
- Eine Aufzeichnung der täglichen Luftfeuchtigkeit ( ) und des Dow-Jones-Index ( ).
F1) Wie würden Sie messen / beweisen, dass sie mit diesen beiden Vektoren unabhängig sind? Wir wissen, dass Unabhängigkeit bedeutet, dass das Produkt ihrer PDFs gleich ihrem gemeinsamen PDF ist, und das ist großartig, aber wie kann man mit diesen beiden Vektoren ihre Unabhängigkeit beweisen?
- Zwei Signale, die NICHT unabhängig, aber immer noch unkorreliert sind:
F2) Ich kann mir hier keine Beispiele vorstellen ... was wären einige Beispiele? Ich weiß, dass wir die Korrelation messen können, indem wir die Kreuzkorrelation zweier solcher Vektoren verwenden, aber wie würden wir beweisen, dass sie auch NICHT unabhängig sind?
- Zwei Signale, die korreliert sind:
- Ein Vektor, der die Stimme einer Opernsängerin in der Haupthalle misst, , während jemand ihre Stimme von irgendwo im Gebäude aufzeichnet, etwa im Proberaum ( ).
- Wenn Sie kontinuierlich Ihre Herzfrequenz in Ihrem Auto messen ( ) und auch die Intensität der blauen Lichter messen würden, die auf Ihre Heckscheibe treffen ( ) ... Ich vermute, dass diese sehr korrelieren würden. . :-)
Q3) Bezogen auf q2, aber reicht es im Fall der Messung der Kreuzkorrelation von diesem empirischen Standpunkt aus, das Skalarprodukt dieser Vektoren zu betrachten (da dies der Wert an der Spitze ihrer Kreuzkorrelation ist)? Warum interessieren uns andere Werte in der Cross-Corr-Funktion?
Nochmals vielen Dank, je mehr Beispiele, desto besser für den Aufbau der Intuition!
quelle
Antworten:
Ein paar Elemente ... (Ich weiß, dass dies nicht erschöpfend ist, eine vollständigere Antwort sollte wahrscheinlich Momente erwähnen)
Q1
Um zu überprüfen, ob zwei Verteilungen unabhängig sind, müssen Sie messen, wie ähnlich ihre gemeinsame Verteilung dem Produkt ihrer Randverteilung p ( x ) × p ( y ) ist . Zu diesem Zweck können Sie einen beliebigen Abstand zwischen den Verteilungen verwenden. Wenn Sie die Kullback-Leibler-Divergenz verwenden, um diese Verteilungen zu vergleichen, berücksichtigen Sie die Menge:p(x,y) p(x)×p(y)
Und Sie werden ... die gegenseitigen Informationen erkannt haben! Je niedriger dieser Wert ist, desto unabhängiger sind die Variablen.
Um diese Größe aus Ihren Beobachtungen zu berechnen, können Sie entweder die Dichten , p ( y ) , p ( x , y ) aus Ihren Daten mit einem Kernel-Dichteschätzer abschätzen und eine numerische Integration in einem feinen Gitter durchführen ; oder quantifizieren Sie einfach Ihre Daten in N Bins und verwenden Sie den Ausdruck der gegenseitigen Informationen für diskrete Verteilungen.p(x) p(y) p(x,y) N
Q2
Auf der Wikipedia-Seite zur statistischen Unabhängigkeit und Korrelation:
Mit Ausnahme des letzten Beispiels haben diese 2D-Verteilungen nicht korrelierte (diagonale Kovarianzmatrix), jedoch keine unabhängigen Randverteilungen p ( x ) und p ( y ) .p(x,y) p(x) p(y)
Q3
In der Tat gibt es Situationen, in denen Sie sich alle Werte der Kreuzkorrelationsfunktionen ansehen können. Sie entstehen beispielsweise bei der Audiosignalverarbeitung. Stellen Sie sich zwei Mikrofone vor, die dieselbe Quelle erfassen, aber einen Abstand von einigen Metern haben. Die Kreuzkorrelation der beiden Signale hat eine starke Spitze bei der Verzögerung, die dem Abstand zwischen den Mikrofonen geteilt durch die Schallgeschwindigkeit entspricht. Wenn Sie sich nur die Kreuzkorrelation bei Verzögerung 0 ansehen, werden Sie nicht sehen, dass ein Signal eine zeitversetzte Version des anderen ist!
quelle
Zu schließen, ob zwei Signale unabhängig sind, ist sehr schwierig (bei endlichen Beobachtungen), ohne dass Vorkenntnisse / Annahmen vorliegen.
Beispiel :
quelle