Kann angesichts der Kointegrationsteststatistik von Schlussfolgerung über die Kointegration von ?

Man erkennt , dass im allgemeinen Statistik, die Kointegration Tests gezeigt werden . Ich glaube, dass dies für alle Kointegrationstests gilt, daher ist der jeweils verwendete Test möglicherweise irrelevant. $A, B \ne B,A$

Ich habe jedoch festgestellt, dass die beiden Teststatistiken im Allgemeinen "nahe" liegen: Die beiden Teststatistiken befinden sich auf demselben Konfidenzniveau.

Beachten Sie, dass in meiner Arbeit die übliche Methode zum Testen der Kointegration darin besteht, eine Einheitswurzel in der linearen Kombination der beiden Reihen (AKA-Restreihen) zu testen. Im Allgemeinen werde ich dazu den ADF-Test verwenden und die resultierende Teststatistik mit den Konfidenzniveaus vergleichen, die erforderlich sind, um die Nullhypothese abzulehnen.

Meine Fragen:

Gibt es formale Dinge, die über den Vergleich von mit ? $coint(A,B)$ $coint(B,A)$
Gibt es einen zwingenden technischen Grund, eine variable Ausrichtung der anderen vorzuziehen?
Werden die Antworten auf 1 oder 2 speziell für den Kointegrationstest verwendet? Wenn ja, gibt es etwas besonders Relevantes für die oben beschriebene Kointegrationstestmethode?

Vielen Dank.

BEARBEITEN:

Hier ist ein Beispiel, wie angefordert. Ich benutze Python für die meisten meiner statistischen Arbeiten.

Die ADF-Teststatistik für die erste lineare Kombination (AKA-Restreihe) ist -35.9199966497und -35.7190914946für die zweite lineare Kombination.

Offensichtlich ist dies ein ziemlich extremes Beispiel, aber es gibt viele andere.

Reihenfolge der Diagramme in der Grafik:

Restserie 1
Streudiagramm mit der Linie der besten Anpassung, (x, y) Ausrichtung.
Restserie 2
Streudiagramm mit der Linie der besten Anpassung, (y, x) Ausrichtung.
Grafik der beiden Rohkurven.

Hoffentlich klärt das die Dinge auf.

time-series cointegration d0rmLife
quelle

Auf welchen Kointegrationstest beziehen Sie sich? Es gibt viele von ihnen.

Richard Hardy

@RichardHardy Ich habe die meiste Erfahrung mit ADF, aber ich verstehe, dass kein Kointegrationstest kommutativ ist.

d0rmLife

ADF ist kein Kointegrationstest, obwohl es die zweite Stufe des Engle-Granger-Kointegrationstests darstellt. Meinten Sie das?

Richard Hardy

Meine Erfahrung darüber, was im Kontext der Kointegration impliziert ist oder nicht, ist ganz anders, und daher kann es nur helfen, explizit zu sein. Ihre Ausarbeitung ist noch unvollständig; Denken Sie daran, dass sich die im ADF-Test verwendeten kritischen Werte im Allgemeinen von den im Engle-Granger-Test verwendeten kritischen Werten unterscheiden, wenn ich mich nicht irre. Machen Sie es deshalb besser klar. Warum ist das für die Frage relevant? Weil Sie sagen, ich habe festgestellt, dass die beiden Teststatistiken im Allgemeinen "nahe" liegen, ohne klar zu machen, über welche Teststatistiken Sie sprechen. Deshalb habe ich gefragt.

Richard Hardy

Können Sie bitte ein Beispiel zeigen, bei dem sich die Ergebnisse beim Tauschen unterscheiden (A, B)?

Glen_b -Rate State Monica

Antworten:

Für die Integration von zwei Zeitreihen und sind zwei Bedingungen erfüllt: $X_t$ $Y_t$

$X_t$ und müssen -Prozesse sein, dh und müssen stationäre Prozesse sein (in einem schwachen Sinne, dh stationäre Kovarianz). $Y_t$ $I(1)$ $\Delta X_t$ $\Delta Y_t$
Es gibt eine Reihe von Koeffizienten so dass die Zeitreihe ein stationärer Prozess ist. Der Vektor wird als Kointegrationsvektor bezeichnet. $\alpha,\beta\in \mathbb{R}$ $Z_t=\alpha X_t+\beta Y_t$ $(\alpha,\beta)$

Da die Stationarität für die Verschiebung und Skalierung unveränderlich ist, folgt unmittelbar, dass die Koeffizienten und nicht eindeutig definiert sind, sondern bis zur multiplikativen Konstante eindeutig sind. $\alpha$ $\beta$

Cointegrationstests gibt es in zwei Varianten:

Tests auf Regressionsreste von auf . $Y_t$ $X_t$
Tests zum Matrixrang in einer Vektorfehlerkorrekturdarstellung von . $(Y_t,X_t)$

Beide Sorten beruhen auf bestimmten theoretischen Ergebnissen, nämlich:

OLS von auf liefert eine konsistente Schätzung des Kointegrationsvektors $Y_t$ $X_t$
Granger-Repräsentationssatz.

Die OP-Frage bezieht sich auf die erste Vielzahl von Tests. In diesen Tests haben wir die Wahl: Schätzen Sie die Regression oder auf . Natürlich ergeben diese beiden Regressionen zwei verschiedene Kointegrationsvektoren: und . Aufgrund des oben erwähnten theoretischen Ergebnisses müssen die Wahrscheinlichkeitsgrenzen von und gleich sein, da der Kointegrationsvektor bis zu einer Konstanten eindeutig ist. $Y_t=a_1+b_1 X_t+u_t$ $X_t=a_2+b_2 Y_t+v_t$ $Y_t$ $(-\hat b_1, 1)$ $(1, -\hat b_2)$ $-\hat b_1$ $-1/\hat b_2$

Aufgrund der algebraischen Eigenschaften von OLS sind die und nicht identisch, obwohl sie aus theoretischer Sicht beide gleich und , dh sie sollten mit der multiplikativen Konstante identisch sein. Wenn die Serie und kointegriert werden dann ist eine stationäre Reihe, so da und ungefähre können wir testen , ob sie stationär sind. $\hat u_t$ $\hat v_t$ $\frac{1}{\beta}Z_t$ $\frac{1}{\alpha}Z_t$ $X_t$ $Y_t$ $Z_t$ $\hat u_t$ $\hat v_t$ $Z_t$

Auf diese Weise werden die ersten verschiedenen Kointegrationstests durchgeführt. Da sich und unterscheiden, unterscheiden sich auch alle Tests. Aus theoretischer Sicht ist jeder Unterschied einfach eine endliche Stichprobenverschiebung, die asymptotisch verschwinden sollte. $\hat u_t$ $\hat v_t$

Wenn der Unterschied zwischen den Stationaritätstests für die Serien und statistisch signifikant ist, ist dies ein Hinweis darauf, dass die Serien nicht integriert sind oder die Annahmen der Stationaritätstests nicht erfüllt sind. $\hat u_t$ $\hat v_t$

Wenn wir den ADF-Test als Stationaritätstest für Residuen verwenden, wäre es meiner Meinung nach möglich, eine asymptotische Verteilung der Differenz zwischen den ADF-Statistiken für und . Ob es irgendeinen praktischen Wert hätte, weiß ich nicht. $\hat u_t$ $\hat v_t$

Um die Antworten auf die drei Fragen zusammenzufassen, sind folgende:

Siehe oben.
Nein.
Die asymptotische Verteilung der Differenz der Tests würde vom Test abhängen. Ihre Methodik ist in Ordnung. Wenn Zeitreihen integriert sind, sollten beide Statistiken dies anzeigen. Wenn keine Integration erfolgt, lehnen entweder beide Statistiken die Stationarität ab oder eine von ihnen. In beiden Fällen sollten Sie die Nullhypothese der Kointegration ablehnen. Wie beim Testen auf Unit Root sollten Sie sich vor Zeittrends, Änderungspunkten und all den anderen Dingen schützen, die das Testen von Unit Root ziemlich schwierig machen.

mpiktas
quelle

Wenn der Unterschied zwischen den Stationaritätstests für die Serien und statistisch signifikant ist, ist dies ein Hinweis darauf, dass die Serien nicht integriert sind $\hat u_t$ $\hat v_t$ : Sie, dass es einen direkten Zusammenhang zwischen dem (empirischen) Unterschied in der Stationarität von gibt und und Vorhandensein / Fehlen einer Kointegration? (Ich sehe es nicht.) Was ich denken würde ist, wenn ich die Null ohne Kointegration mit aber nicht dann: (1) wenn ich konservativ bin, werde ich "keine Kointegration" nicht ablehnen; (2) Wenn ich aggressiv bin, lehne ich "keine Kointegration" ab.

{\hat{u}}_{t}

$\hat u_t$

{\hat{v}}_{t}

$\hat v_t$

{\hat{u}}_{t}

$\hat u_t$

{\hat{v}}_{t}

$\hat v_t$

Richard Hardy

Nein, das glaube ich nicht. Wie gesagt, es wäre möglich, die asymptotische Verteilung der Unterschiede zwischen den Statistiken abzuleiten oder allgemein die theoretischen Eigenschaften dieser Unterschiede zu untersuchen. Ich würde wetten, dass entweder beide Stationaritätstests die Stationarität ablehnen oder beide sie akzeptieren. Was ich damit sagen wollte, ist, dass wenn Sie etwas sehen, das nicht intuitiv ist, dh unterschiedliche Schlussfolgerungen von Stationaritätstests, wenn sie theoretisch gleich sein sollten, dies ein Hinweis auf etwas ist, das nicht richtig ist, dh ich habe den konservativen Ansatz befürwortet.

mpiktas

OK, ich stimme dem zu - abgesehen davon, dass Sie vorgeschlagen haben, die Nullhypothese abzulehnen, die ich eher aggressiv als konservativ halte.

Richard Hardy

Die beliebteste Antwort der Statistik ist also anscheinend richtig für diese Frage: "es kommt darauf an".

Es kann eine gute Vermutung über die Ähnlichkeit der Kointegrationsteststatistiken eindeutiger Ordnungen von Eingabevariablen angestellt werden, da die Zeitreihenvektoren geringe und ähnliche Varianzen aufweisen.

Dies ergibt sich aus der Berechnung der Kointegrationsteststatistik: Wenn die Varianzen der eingegebenen Zeitreihenvektoren niedrig und ähnlich sind, sind die Kointegrationskoeffizienten ähnlich (dh ungefähr skalare Vielfache voneinander), was zum Residuum führt Reihen sind ungefähr skalare Vielfache voneinander. Ähnliche Restreihen implizieren ähnliche Kointegrationsteststatistiken. Wenn die Varianzen jedoch groß oder unähnlich sind, gibt es keine implizite Garantie dafür, dass die Restreihen sogar annähernd skalare Vielfache voneinander sind, was wiederum die Statistik des Kointegrationstests variabel macht.

Formal:

Betrachten Sie das einfache Regressionsmodell, mit dem der Kointegrationskoeffizient für bivariate Fälle ermittelt wird.

Regressieren von x auf y:

{\hat{β}}_{x y} = \frac{C o v [x, y]}{σ_{x}^{2}}

$\hat{\beta}_{xy} = {Cov[x,y] \over \sigma_x^2 }$

Regressieren von y auf x:

{\hat{β}}_{y x} = \frac{C o v [y, x]}{σ_{y}^{2}}

$\hat{\beta}_{yx} = {Cov[y,x] \over \sigma_y^2 }$

Offensichtlich ist . $Cov[x,y] = Cov[y,x]$

Aber im Allgemeinen . $\sigma^2_x \neq \sigma^2_y$

Somit ist kein skalares Vielfaches von . $\hat{\beta}_{xy}$ $\hat{\beta}_{yx}$

Die linearen Kombinationen (AKA-Restreihen), die zum Testen einer Einheitswurzel zur Bestimmung der Wahrscheinlichkeit der Kointegration verwendet werden, sind also keine skalaren Vielfachen voneinander:

x_{t} - γ^{1} y_{t} = ϵ_{t}^{1}

$x_t - \gamma^1 y_t = \epsilon_t^1$

y_{t} - γ^{2} x_{t} = ϵ_{t}^{2}

$y_t - \gamma^2 x_t = \epsilon_t^2$

Beachten Sie daher, dass , also im Allgemeinen für einige Skalare . $\gamma = \hat{\beta}$ $\gamma^1 \neq a*\gamma^2$ $a$

Dies zeigt zwei Fakten zur Kointegration:

Die variable Reihenfolge beim Testen auf Kointegration ist aufgrund der Varianz der einzelnen Zeitreihenvektoren von Bedeutung. Dies beeinflusst die Beziehung zwischen den Kointegrationskoeffizienten der verschiedenen variablen Orientierungen aufgrund der Berechnung des Kointegrationskoeffizienten.
Die Restreihen können einander "ähnlich" sein oder nicht: Die Ähnlichkeit hängt von den Varianzen der einzelnen Zeitreihenvektoren ab.

Diese Tatsachen implizieren, dass die durch eindeutige variable Ordnungen gebildeten Restreihen nicht nur unterschiedlich sind, sondern wahrscheinlich keine skalaren Vielfachen voneinander sind.

Also, welche Bestellung soll ich wählen? Das hängt von der Anwendung ab.

Warum erscheinen einige Restreihen, die aus derselben Datenreihe generiert wurden, aber unterschiedliche Ordnungen, ähnlich, während andere so unterschiedlich erscheinen? Dies liegt an der Varianz der einzelnen Zeitreihenvektoren. Wenn die Zeitreihenvektoren eine ähnliche Varianz aufweisen (wie dies sicherlich beim Vergleich ähnlicher Zeitreihendaten möglich ist), können die Restreihen wie Vielfache voneinander erscheinen, wobei ein Skalarwert ist. Dies ist der Fall, wenn die Varianz der Zeitreihenvektoren sowohl gering als auch ähnlich ist, was zu ähnlichen Fehlertermen in den linearen Kombinationen führt. $-1 * \alpha$ $\alpha$

Wenn also die Zeitreihenvektoren, die auf Kointegration getestet werden, geringe und ähnliche Varianzen aufweisen, kann man richtig annehmen, dass die Kointegrationsteststatistik ein ähnliches Konfidenzniveau aufweist. Im Allgemeinen ist es wahrscheinlich am besten, beide Orientierungen zu testen oder zumindest die Varianzen der Zeitreihenvektoren zu berücksichtigen, es sei denn, es gibt einen vorherrschenden Grund, eine Orientierung zu bevorzugen.

d0rmLife
quelle

Ist Ihnen bewusst, dass das Konzept der Kointegration für mehrere Zeitreihen gilt und nicht nur auf zwei beschränkt ist? Ist Ihnen auch bewusst, dass der De-facto-Standard für Kointegrationstests das Johansen-Verfahren ist, bei dem keine Asymmetrieprobleme auftreten?

mpiktas

Da die Definition der Kointegration keine Asymmetrie zulässt, ist jedes Testverfahren, das unterschiedliche Ergebnisse liefert, standardmäßig falsch. In Ihrem Fall (der übrigens als Engle-Granger-Verfahren bezeichnet wird und nicht der einzige Kointegrationstest ist!) Wenn Sie aufgrund der Bestellung widersprüchliche Ergebnisse erhalten, bedeutet dies, dass Ihre Serien die Annahmen des Tests nicht erfüllen.

mpiktas

@mpiktas 1) Ja, ich bin mir bewusst, weshalb ich "... für bivariate Fälle" sagte. 2) Ich stimme Ihrem Anspruch auf Standardität nicht zu. In bestimmten Branchen ist EG 2-Step mit ADF sehr beliebt. Außerdem hat Johansen Probleme mit kleinen Datenmengen, so dass dies sicherlich nicht in allen Fällen ein Standard ist, aber in der Tat für multivariate Fälle sehr beliebt ist. 3) Können Sie eine Referenz angeben, wo und warum die Kointegration keine Asymmetrie zulässt?

d0rmLife

In kleinen Datenmengen hätten Sie auch Probleme mit ADF. Wie klein reden wir? In Bezug auf Asymmetrie lässt die Definition der Kointegration dies nicht zu. Zwei Reihen werden zusammengeführt, wenn sie 1) I (1) 2) ihre lineare Kombination I (0) ist. Wenn also eine Serie in eine andere integriert wird, wird diese Serie per Definition in die erste integriert. Es gibt keinen Raum für Asymmetrie.

mpiktas

@mpiktas würdest du eine Antwort geben?

Glen_b -State Monica