Die Inter-Market-Analyse ist eine Methode zur Modellierung des Marktverhaltens durch Auffinden von Beziehungen zwischen verschiedenen Märkten. Häufig wird eine Korrelation zwischen zwei Märkten berechnet, z. B. S & P 500 und 30-jährigen US-Treasuries. Diese Berechnungen basieren zumeist auf Preisdaten, was für jedermann offensichtlich ist, dass sie nicht zur Definition von stationären Zeitreihen passen.
Abgesehen von möglichen Lösungen (stattdessen Rückgaben verwenden) ist die Berechnung der Korrelation, deren Daten nicht stationär sind, sogar eine gültige statistische Berechnung?
Würden Sie sagen, dass eine solche Korrelationsberechnung etwas unzuverlässig oder einfach nur Unsinn ist?
correlation
stationarity
Milktrader
quelle
quelle
Antworten:
Die Korrelation misst die lineare Beziehung. Im informellen Kontext bedeutet Beziehung etwas Stabiles. Wenn wir die Probenkorrelation für stationäre Variablen berechnen und die Anzahl der verfügbaren Datenpunkte erhöhen, tendiert diese Probenkorrelation zur wahren Korrelation.
Es kann gezeigt werden, dass bei Preisen, bei denen es sich in der Regel um Zufallsbewegungen handelt, die Stichprobenkorrelation eher zu Zufallsvariablen tendiert. Dies bedeutet, dass das Ergebnis immer unterschiedlich ist, egal wie viele Daten wir haben.
Anmerkung Ich habe versucht, mathematische Intuition ohne Mathematik auszudrücken. Aus mathematischer Sicht ist die Erklärung sehr klar: Stichprobenmomente von stationären Prozessen konvergieren mit hoher Wahrscheinlichkeit zu Konstanten. Beispielmomente von Zufallsläufen konvergieren zu Integralen der Brownschen Bewegung, die Zufallsvariablen sind. Da die Beziehung normalerweise als Zahl und nicht als Zufallsvariable ausgedrückt wird, wird der Grund für die Nichtberechnung der Korrelation für nicht stationäre Variablen offensichtlich.
Update Da wir an der Korrelation zweier Variablen interessiert sind, nehmen wir zunächst an, dass sie aus dem stationären Prozess . Stationarität impliziert, dass E Z t und c o v ( Z t , Z t - h ) nicht von t abhängen . Also KorrelationZt= ( Xt, Yt) EZt c o v ( Zt, Zt - h) t
hängt auch nicht von , da alle Größen in der Formel aus der Matrix c o v ( Z t ) stammen , die nicht von t abhängt . Also die Berechnung der Probenkorrelationt c o v ( Zt) t
macht Sinn, da wir begründete Hoffnung haben könnendassProbe Korrelation abschätzen wirdρ=corr(Xt,Yt). Es stellt sich herausdass diese Hoffnung nicht unbegründet ist, da für stationäre Prozesse erfüllen bestimmte Bedingungen wir diese haben& rgr;→
Nehmen wir nun an, dass nicht stationär ist. Dann c o r r ( X t , Y t ) kann davon abhängen , t . Wenn wir also eine Stichprobe der Größe T beobachten, müssen wir möglicherweise T verschiedene Korrelationen ρ t abschätzen . Dies ist natürlich nicht möglich, daher können wir im besten Fall nur einige Funktionen von ρ t abschätzen, wie den Mittelwert oder die Varianz. Aber das Ergebnis kann nicht sinnvoll interpretiert werden.Zt c o r r ( Xt, Yt) t T T ρt ρt
Lassen Sie uns nun untersuchen, was mit der Korrelation des wahrscheinlich am häufigsten untersuchten instationären Prozess-Random-Walks geschieht. Wir nennen Prozess eine Zufallsbewegung, wenn Z t = Σ t s = 1 ( U t , V t ) , wobei C t = ( U t , V t ) ist ein stationärer Vorgang. Der Einfachheit halber sei E C t = 0 . DannZt= ( Xt, Yt) Zt=∑ts=1(Ut,Vt) Ct=(Ut,Vt) ECt=0
Zur weiteren Vereinfachung sei angenommen, dass ein weißes Rauschen ist. Dies bedeutet, dass alle Korrelationen E ( C t C t + h ) für h > 0 Null sind . Man beachte , dass dies nicht einschränkt c o r r ( U t , V t ) auf Null zurück .Ct=(Ut,Vt) E(CtCt+h) h>0 corr(Ut,Vt)
Dann
So weit so gut, obwohl der Prozess nicht stationär ist, ist die Korrelation sinnvoll, obwohl wir dieselben restriktiven Annahmen treffen mussten.
Um nun zu sehen, was mit der Stichprobenkorrelation geschieht, müssen wir die folgende Tatsache über Zufallsbewegungen verwenden, die als funktionaler zentraler Grenzwertsatz bezeichnet wird:
inVerteilung, wobeis∈[0,1]undWs=(W1s,W2s)ist eine bivariateBrownsche Bewegung(zweidimensionaler Wiener-Prozess). Der Einfachheit halber Definition einführen
Again for simplicity let us define sample correlation as
Let us start with the variances. We have
This goes to infinity asT increases, so we hit the first problem, sample variance does not converge. On the other hand continuous mapping theorem in conjunction with functional central limit theorem gives us
Similarly we get
So finally for sample correlation of our random walk we get
So although correlation is well defined, sample correlation does not converge towards it, as in stationary process case. Instead it converges to a certain random variable.
quelle
LetW be a discrete random walk. Pick a positive number h . Define the processes P and V by P(0)=1 , P(t+1)=−P(t) if V(t)>h , and otherwise P(t+1)=P(t) ; and V(t)=P(t)W(t) . In other words, V starts out identical to W but every time V rises above h , it switches signs (otherwise emulating W in all respects).
(In this figure (forh=5 ) W is blue and V is red. There are four switches in sign.)
In effect, over short periods of timeV tends to be either perfectly correlated with W or perfectly anticorrelated with it; however, using a correlation function to describe the relationship between V and W wouldn't be useful (a word that perhaps more aptly captures the problem than "unreliable" or "nonsense").
Mathematica code to produce the figure:
quelle