Ist der Durchschnitt der Betas von Y ~ X und X ~ Y gültig?

7

Ich interessiere mich für die Beziehung zwischen zwei Zeitreihenvariablen: und . Die beiden Variablen sind miteinander verwandt, und aus der Theorie ist nicht ersichtlich, welche die andere verursacht. Y.X.

Angesichts dessen habe ich keinen guten Grund, die lineare Regression gegenüber vorzuziehen . Y.=α+βX.X.=κ+γY.

Offensichtlich gibt es eine Beziehung zwischen und , obwohl ich mich an genügend Statistiken erinnere, um zu verstehen, dass nicht wahr ist. Oder ist es vielleicht gar nicht so nah? Ich bin ein bisschen dunstig.βγβ=1/.γ

Das Problem ist zu entscheiden, wie viel von man gegen halten soll .X.Y.

Ich denke darüber nach, den Durchschnitt von und als Absicherungsverhältnis zu verwenden. β1/.γ

Ist der Durchschnitt von und ein sinnvolles Konzept?β1/.γ

Und als sekundäre Frage (vielleicht sollte dies ein anderer Beitrag sein), wie kann man angemessen damit umgehen, dass die beiden Variablen miteinander in Beziehung stehen - was bedeutet, dass es wirklich keine unabhängige und abhängige Variable gibt?

Ricardo
quelle
1
Das Problem ist nicht die Kausalität, sondern die Messfehler (es ist nur so, dass häufig die abhängige Variable Y diejenige mit dem großen Messfehler ist, was "Y = a + B x + Fehler" zum allgemeinen Ausdruck macht). Haben Sie eine Vorstellung davon? die Fehler bei der Messung von X und Y.
Sextus Empiricus
1
Die genauen Werte von und finden Sie in meiner Antwort auf den Effekt des Umschaltens von Antworten und erklärenden Variablen ... , und wie Sie vermuten, ist nicht der Kehrwert von und der Mittelung von und ist nicht der richtige Weg. Eine bildliche Ansicht dessen, was und minimieren, ist in Elvis 'Antwort auf dieselbe Frage enthalten, und er führt eine Regression der "kleinsten Rechtecke" ein, die Sie vielleicht wollen .....βγβγβ1/.γβγ
Dilip Sarwate
3
Sie befinden sich im idealen Szenario, in dem die Wahl der Technik einen direkten, physikalisch messbaren Einfluss hat. Sie können einfach den Absicherungsfehler außerhalb der Stichprobe für jede Schätzung messen und vergleichen. Außerdem wird eine optimale Absicherung in der Regel besser mit einem VECM-Modell abgewickelt (siehe z. B. Gatarek & Johansen, 2014, Optimale Absicherung mit dem autoregressiven Modell des kointegrierten Vektors ), bei dem Y nicht als Funktion von X modelliert werden muss oder umgekehrt .
Chris Haug
1
Möglicherweise möchten Sie den geometrischen Mittelwert als Möglichkeit betrachten (wenn beide negativ sind, können Sie die negative Quadratwurzel ziehen). Dann schauen Sie sich , das sehr ähnlich sein sollteβγsysx
Henry
1
@ricardo Beachten Sie, dass ich einen Out-of-Sample- Fehler angegeben habe, also nicht die (In-Sample-) Anpassung des Modells. Und es ist durchaus möglich, dass sich das optimale Absicherungsverhältnis im Laufe der Zeit ändert (insbesondere wenn die Beziehung nicht linear ist). Dies ändert nichts an der Tatsache, dass die Ermittlung der besten Absicherungsstrategie am direktesten durch Backtesting des Modells und Beobachtung erfolgen kann die Ergebnisse.
Chris Haug

Antworten:

11

Um die Verbindung zwischen beiden Darstellungen zu sehen, nehmen Sie einen bivariaten Normalenvektor: mit den Bedingungen und Das bedeutet das

(X.1X.2)N.((μ1μ2),(σ12ρσ1σ2ρσ1σ2σ22))
X.1X.2=x2N.(μ1+ρσ1σ2(x2- -μ2),(1- -ρ2)σ12)
X.2X.1=x1N.(μ2+ρσ2σ1(x1- -μ1),(1- -ρ2)σ22)
X.1=(μ1- -ρσ1σ2μ2)α+ρσ1σ2βX.2+1- -ρ2σ1ϵ1
und was bedeutet, dass (a) nicht und (b) Die Verbindung zwischen den beiden Regressionen hängt von der gemeinsamen Verteilung von .
X.2=(μ2- -ρσ2σ1μ1)κ+ρσ2σ1γX.1+1- -ρ2σ2ϵ2
γ1/.β(X.1,X.2)

Xi'an
quelle
Wie würde ich entscheiden, ob der Durchschnitt der beiden Betas ein besseres Maß für die Sicherungsquote ist als der eine oder andere?
Ricardo
4
Ich habe keine Ahnung.
Xi'an
@ricardo Indem Sie den Absicherungsfehler außerhalb der Stichprobe unter jeder Schätzung messen, versuchen Sie letztendlich, ihn zu minimieren.
Chris Haug
3

Aus einem Kommentar konvertiert .....

Die genauen Werte von und finden Sie in meiner Antwort auf den Effekt des Wechsels von Antworten und erklärenden Variablen in einer einfachen linearen Regression , und wie Sie vermuten, ist nicht der Kehrwert von und der Mittelwertbildung von und (oder die Mittelung von und ) ist nicht der richtige Weg. Eine bildliche Ansicht dessen, was und minimieren, ist in Elvis 'Antwort enthaltenβγβγβγβ1/.γβγAuf dieselbe Frage und in der Antwort führt er eine Regression der "kleinsten Rechtecke" ein, nach der Sie möglicherweise suchen. Die Kommentare nach Elvis 'Antwort sollten nicht vernachlässigt werden. Sie beziehen diese Regression der "kleinsten Rechtecke" auf andere, zuvor untersuchte Techniken. Beachten Sie insbesondere, dass Moderator chl darauf hinweist, dass diese Methode von Interesse ist, wenn nicht klar ist, welche die Prädiktorvariable und welche die Antwortvariable ist.

Dilip Sarwate
quelle
3

β undγ

Wie Xi'an in seiner Antwort feststellte β und γ sind miteinander verbunden, indem sie sich auf die bedingten Mittel beziehen X.|Y. und Y.|X.(die sich wiederum auf eine einzelne gemeinsame Verteilung beziehen ) diese sind nicht symmetrisch in dem Sinne, dassβ1/.γ. Dies ist auch nicht der Fall, wenn Sie das Wahre "kennen" würdenσ und ρanstatt Schätzungen zu verwenden. Du hast

β=ρX.Y.σY.σX.
und
γ=ρX.Y.σX.σY.

oder man könnte sagen

βγ=ρX.Y.21

Siehe auch einfache lineare Regression auf Wikipedia zur Berechnung derβ und γ.

Es ist dieser Korrelationsterm, der die Symmetrie irgendwie stört. Wenn dieβ und γ wäre einfach das Verhältnis der Standardabweichung σY./.σX. und σX./.σY.dann wären sie tatsächlich umgekehrt. DasρX.Y.Begriff kann als Änderung einer Art Regression zum Mittelwert angesehen werden .

  • Mit perfekter Korrelation ρX.Y.=1 dann können Sie vollständig vorhersagen X. beyogen auf Y.oder umgekehrt. Die Pisten sind gleich
    βγ=1
  • Aber mit weniger als perfekter Korrelation, ρX.Y.<1können Sie diese perfekten Vorhersagen nicht treffen, und der bedingte Mittelwert liegt im Vergleich zu einer einfachen Skalierung durch etwas näher am bedingungslosen Mittelwert σY./.σX. oder σX./.σY.. Die Steigungen der Regressionslinien sind weniger steil. Die Steigungen werden nicht miteinander in Beziehung gesetzt, und ihr Produkt wird kleiner als eins sein
    βγ<1

Ist eine Regressionsgerade die richtige Methode?

Sie fragen sich vielleicht, ob Sie diese bedingten Wahrscheinlichkeiten und Regressionslinien benötigen, um Ihre Verhältnisse von zu bestimmen X. und Y.. Mir ist unklar, wie Sie eine Regressionslinie bei der Berechnung eines optimalen Verhältnisses verwenden möchten.

Im Folgenden finden Sie eine alternative Methode zur Berechnung des Verhältnisses. Diese Methode hat Symmetrie (dh wenn Sie X und Y wechseln, erhalten Sie das gleiche Verhältnis).


Alternative

Sagen wir, die Renditen von Anleihen X. und Y. werden nach einer multivariaten Normalverteilung verteilt mit Korrelation ρX.Y. und Standardabweichungen σX. und σY. dann die Rendite einer Absicherung, die die Summe von ist X. und Y. wird normal verteilt:

H.=αX.+(1- -α)Y.N.(μH.,σH.2)

wurden 0α1 und mit

μH.=αμX.+(1- -α)μY.σH.2=α2σX.2+(1- -α)2σY.2+2α(1- -α)ρX.Y.σX.σY.=α2(σX.2+σY.2- -2ρX.Y.σX.σY.)+α(- -2σY.2+2ρX.Y.σX.σY.)+σY.2

Das Maximum des Mittelwerts μH. wird bei ... sein

α=0 oder α=1
oder nicht vorhanden, wenn μX.=μY..

Das Minimum der Varianz σH.2 wird bei ... sein

α=1- -σX.2- -ρX.Y.σX.σY.σX.2+σY.2- -2ρX.Y.σX.σY.=σY.2- -ρX.Y.σX.σY.σX.2+σY.2- -2ρX.Y.σX.σY.

Das Optimum liegt irgendwo zwischen diesen beiden Extremen und hängt davon ab, wie Sie Verluste und Gewinne vergleichen möchten

Beachten Sie, dass jetzt eine Symmetrie zwischen besteht α und 1- -α. Es spielt keine Rolle, ob Sie die Absicherung verwendenH.=α1X.+(1- -α1)Y. oder die Hecke H.=α2Y.+(1- -α2)X.. Sie erhalten die gleichen Verhältnisse in Bezug aufα1=1- -α2.

Minimaler Varianzfall und Beziehung zu Hauptkomponenten

Im Fall der minimalen Varianz (hier müssen Sie eigentlich keine multivariate Normalverteilung annehmen) erhalten Sie das folgende Absicherungsverhältnis als optimal

α1- -α=veinr(Y.)- -cÖv(X.,Y.)veinr(X.)- -cÖv(X.,Y.)
was in Form der Regressionskoeffizienten ausgedrückt werden kann β=cÖv(X.,Y.)/.veinr(X.) und γ=cÖv(X.,Y.)/.veinr(Y.) und ist wie folgt
α1- -α=1- -β1- -γ

In einer Situation mit mehr als zwei Variablen / Aktien / Anleihen können Sie dies auf die letzte (kleinste Eigenwert-) Hauptkomponente verallgemeinern.


Varianten

Das Modell kann verbessert werden, indem andere Verteilungen als die multivariate Normalverteilung verwendet werden. Sie können die Zeit auch in ein komplexeres Modell integrieren, um zukünftige Werte / Verteilungen für das Paar besser vorhersagen zu könnenX.,Y..


Dies ist eine Vereinfachung, aber sie dient dem Zweck zu erklären, wie man die Analyse durchführen kann und sollte, um ein optimales Verhältnis ohne Regressionslinie zu finden.

Sextus Empiricus
quelle
1
Es tut mir leid, aber als Physiker weiß ich zu wenig über die Sprache (Long, Short, Bestände usw.) in Bezug auf Aktien, Anleihen und Finanzen. Wenn Sie es in einer einfacheren Sprache ausdrücken könnten, könnte ich es vielleicht verstehen und damit arbeiten. Meine Antwort ist nur ein sehr einfacher Ausdruck, der sich der Details und Möglichkeiten des Ausdrucks von Absicherungen und Aktien nicht bewusst ist, aber das Grundprinzip zeigt, wie Sie von der Verwendung einer Regressionslinie wegkommen können (gehen Sie zurück zu den ersten Prinzipien, drücken Sie die aus Gewinnmodell, das im Mittelpunkt steht, anstatt Regressionslinien zu verwenden, deren Relevanz nicht direkt klar ist).
Sextus Empiricus
Ich denke ich verstehe. Das Problem ist, dass 1 / ρ_ {XY} \ ne p_ {XY}.ichndeed,p_ {XY} $ ändert sich oft ganz und gar, wenn wir die Umkehrung nehmen. Ihre Alternative kommt dem Fall nahe, über den ich nachdenke, aber ich möchte eines überprüfen: Erlaubt dies nicht negative Beteiligungen? Wenn ich Ihre Terminologie übernehme, hätte ich eine Einheit, die die Bindung X hält, und eine negative, die Y hält. Sagen Sie lange eine Einheit der Bindung X und kurz (sagen wir) 1,2 Einheiten der Bindung Y ... aber es könnten 0,2 Einheiten oder 5 sein Einheiten, abhängig von der Mathematik.
Ricardo
long bedeutet, dass ich 1% auf eine Anleihe mache, wenn der Preis um ~ 1% steigt; Kurz bedeutet, dass ich ~ 1% bei einer Anleihe verliere, wenn der Preis um ~ 1% steigt. Die Idee ist also, dass ich eine Einheit einer Anleihe lang bin (also profitiere ich von einer Wertsteigerung) und ein Teil der anderen Anleihe kurz bin (also verliere ich von einer Wertsteigerung).
Ricardo
"Das Problem ist zu entscheiden, wie viel von X man gegen Y halten soll." Mein Problem dabei ist, dass es keine Erklärung / Modell / Ausdruck gibt, wie Sie sich dafür entscheiden. Wie definieren Sie Verluste und Gewinne und wie sehr schätzen Sie sie?
Sextus Empiricus
Sind mit Kurz- und Langlaufkosten Kosten verbunden? Ich stelle mir vor, dass Sie einen bestimmten Betrag investieren müssen, und dies begrenzt, wie viel Sie in diesen Anleihen Short / Long sein können. Basierend auf Ihren Vorkenntnissen können Sie dann die Verteilung der Verluste / Gewinne für jede Kombination auf dieser Grenze schätzen / bestimmen. Basierend auf einer Funktion, die bestimmt, wie Sie Verluste und Gewinne bewerten (dies drückt aus, warum / wie Sie sich absichern), können Sie schließlich entscheiden, welche Kombination Sie wählen möchten.
Sextus Empiricus
1

Vielleicht könnte der Ansatz der "Granger-Kausalität" helfen. Dies würde Ihnen helfen, zu beurteilen, ob X ein guter Prädiktor für Y ist oder ob X besser für Y ist. Mit anderen Worten, es zeigt Ihnen, ob Beta oder Gamma ernst zu nehmen sind. Wenn Sie sich mit Zeitreihendaten befassen, erfahren Sie auch, wie viel von der Geschichte von X für die Vorhersage von Y zählt (oder umgekehrt).

Wikipedia gibt eine einfache Erklärung: Eine Zeitreihe X wird als Granger-Ursache Y bezeichnet, wenn sie gezeigt werden kann, normalerweise durch eine Reihe von t-Tests und F-Tests an verzögerten Werten von X (und mit verzögerten Werten von Y ebenfalls eingeschlossen). , dass diese X-Werte statistisch signifikante Informationen über zukünftige Werte von Y liefern.

Was Sie tun, ist Folgendes:

  • Regression X (t-1) und Y (t-1) auf Y (t)
  • Regression X (t-1), X (t-2), Y (t-1), Y (t-2) auf Y (t)
  • Regression X (t-1), X (t-2), X (t-3), Y (t-1), Y (t-2), Y (t-3) auf Y (t)

Fahren Sie fort, unabhängig von der Länge des Verlaufs. Überprüfen Sie die Signifikanz der F-Statistik für jede Regression. Machen Sie dasselbe in umgekehrter Reihenfolge (also regressieren Sie jetzt die vergangenen Werte von X und Y auf X (t)) und sehen Sie, welche Regressionen signifikante F-Werte haben.

Ein sehr einfaches Beispiel mit R-Code finden Sie hier . Die Granger-Kausalität wurde kritisiert, weil sie (in einigen Fällen) die Kausalität nicht tatsächlich feststellte. Es scheint jedoch, dass es bei Ihrer Anwendung wirklich um "prädiktive Kausalität" geht, und genau dafür ist der Granger-Kausalitätsansatz gedacht.

Der Punkt ist, dass der Ansatz Ihnen sagt, ob X Y vorhersagt oder ob Y X vorhersagt (so dass Sie nicht länger versucht wären, die beiden Regressionskoeffizienten künstlich - und falsch - zusammenzusetzen) und Ihnen eine bessere Vorhersage gibt (wie Sie wird wissen, wie viel Geschichte von X und Y Sie wissen müssen, um Y) vorherzusagen, was für Absicherungszwecke nützlich ist, richtig?

Steve G. Jones
quelle
Ich habe einen starken theoretischen Grund zu der Annahme, dass beides keine wirkliche Ursache ist und dass selbst wenn man eine Ursache wird, dies im Laufe der Zeit nicht wahr bleiben würde. Ich denke also nicht, dass Granger Causailty in diesem Fall die Antwort ist. Ich habe die Antwort auf jeden Fall positiv bewertet, da sie nützlich ist - insb. der R-Code.
Ricardo
Deshalb erwähne ich ausdrücklich, dass "die Granger-Kausalität dafür kritisiert wurde, dass sie (in einigen Fällen) keine tatsächliche Kausalität festgestellt hat". Es scheint mir, dass es bei Ihrer Frage eher darum geht, "prädiktive Kausalität" zu etablieren, wofür die Granger-Kausalität gedacht ist. Darüber hinaus verwendet Grangers Ansatz die Informationen in Ihren Zeitreihendaten, die nicht verschwendet werden dürfen, wenn Sie sie haben. Natürlich können (sollten?) Sie die Auswirkungen im Laufe der Zeit neu abschätzen. Ich gehe davon aus, dass die Granger-Effekte stabiler sind als Querschnitts-OLS (Sie können dies vorher anhand historischer Daten testen). HTH
Steve G. Jones