Ist der Durchschnitt der Betas von Y ~ X und X ~ Y gültig?

7

Ich interessiere mich für die Beziehung zwischen zwei Zeitreihenvariablen: und . Die beiden Variablen sind miteinander verwandt, und aus der Theorie ist nicht ersichtlich, welche die andere verursacht. $Y$ $X$

Angesichts dessen habe ich keinen guten Grund, die lineare Regression gegenüber vorzuziehen . $Y = \alpha + \beta X$ $X = \kappa + \gamma Y$

Offensichtlich gibt es eine Beziehung zwischen und , obwohl ich mich an genügend Statistiken erinnere, um zu verstehen, dass nicht wahr ist. Oder ist es vielleicht gar nicht so nah? Ich bin ein bisschen dunstig. $\beta$ $\gamma$ $\beta = 1/ \gamma$

Das Problem ist zu entscheiden, wie viel von man gegen halten soll . $X$ $Y$

Ich denke darüber nach, den Durchschnitt von und als Absicherungsverhältnis zu verwenden. $\beta$ $1/ \gamma$

Ist der Durchschnitt von und ein sinnvolles Konzept? $\beta$ $1/ \gamma$

Und als sekundäre Frage (vielleicht sollte dies ein anderer Beitrag sein), wie kann man angemessen damit umgehen, dass die beiden Variablen miteinander in Beziehung stehen - was bedeutet, dass es wirklich keine unabhängige und abhängige Variable gibt?

regression regression-coefficients Ricardo
quelle

1

Das Problem ist nicht die Kausalität, sondern die Messfehler (es ist nur so, dass häufig die abhängige Variable Y diejenige mit dem großen Messfehler ist, was "Y = a + B x + Fehler" zum allgemeinen Ausdruck macht). Haben Sie eine Vorstellung davon? die Fehler bei der Messung von X und Y.

Sextus Empiricus

1

Die genauen Werte von und finden Sie in meiner Antwort auf den Effekt des Umschaltens von Antworten und erklärenden Variablen ... , und wie Sie vermuten, ist nicht der Kehrwert von und der Mittelung von und ist nicht der richtige Weg. Eine bildliche Ansicht dessen, was und minimieren, ist in Elvis 'Antwort auf dieselbe Frage enthalten, und er führt eine Regression der "kleinsten Rechtecke" ein, die Sie vielleicht wollen .....

β

$\beta$

γ

$\gamma$

β

$\beta$

γ

$\gamma$

β

$\beta$

1 / γ

$1/\gamma$

β

$\beta$

γ

$\gamma$

Dilip Sarwate

3

Sie befinden sich im idealen Szenario, in dem die Wahl der Technik einen direkten, physikalisch messbaren Einfluss hat. Sie können einfach den Absicherungsfehler außerhalb der Stichprobe für jede Schätzung messen und vergleichen. Außerdem wird eine optimale Absicherung in der Regel besser mit einem VECM-Modell abgewickelt (siehe z. B. Gatarek & Johansen, 2014, Optimale Absicherung mit dem autoregressiven Modell des kointegrierten Vektors ), bei dem Y nicht als Funktion von X modelliert werden muss oder umgekehrt .

Chris Haug

1

Möglicherweise möchten Sie den geometrischen Mittelwert als Möglichkeit betrachten (wenn beide negativ sind, können Sie die negative Quadratwurzel ziehen). Dann schauen Sie sich , das sehr ähnlich sein sollte

\sqrt{\frac{β}{γ}}

$\sqrt{\dfrac{\beta}{\gamma}}$

\frac{s_{y}}{s_{x}}

$\dfrac{s_y}{s_x}$

Henry

1

@ricardo Beachten Sie, dass ich einen Out-of-Sample- Fehler angegeben habe, also nicht die (In-Sample-) Anpassung des Modells. Und es ist durchaus möglich, dass sich das optimale Absicherungsverhältnis im Laufe der Zeit ändert (insbesondere wenn die Beziehung nicht linear ist). Dies ändert nichts an der Tatsache, dass die Ermittlung der besten Absicherungsstrategie am direktesten durch Backtesting des Modells und Beobachtung erfolgen kann die Ergebnisse.

Chris Haug

11

Um die Verbindung zwischen beiden Darstellungen zu sehen, nehmen Sie einen bivariaten Normalenvektor: mit den Bedingungen und Das bedeutet das

(\begin{matrix} {X.}_{1} \\ {X.}_{2} \end{matrix}) \sim N. ((\begin{matrix} μ_{1} \\ μ_{2} \end{matrix}), (\begin{matrix} σ_{1}^{2} & ρ σ_{1} σ_{2} \\ ρ σ_{1} σ_{2} & σ_{2}^{2} \end{matrix}))

$\begin{pmatrix} X_1 \\ X_2 \end{pmatrix} \sim \mathcal{N} \left( \begin{pmatrix} \mu_1 \\ \mu_2 \end{pmatrix} , \begin{pmatrix} \sigma^2_1 & \rho \sigma_1 \sigma_2 \\ \rho \sigma_1 \sigma_2 & \sigma^2_2 \end{pmatrix} \right)$

{X.}_{1} ∣ {X.}_{2} = x_{2} \sim N. (μ_{1} + ρ \frac{σ_{1}}{σ_{2}} (x_{2} - - μ_{2}), (1 - - ρ^{2}) σ_{1}^{2})

$X_1 \mid X_2=x_2 \sim \mathcal{N} \left( \mu_1 + \rho \frac{\sigma_1}{\sigma_2}(x_2 - \mu_2),(1-\rho^2)\sigma^2_1 \right)$

{X.}_{2} ∣ {X.}_{1} = x_{1} \sim N. (μ_{2} + ρ \frac{σ_{2}}{σ_{1}} (x_{1} - - μ_{1}), (1 - - ρ^{2}) σ_{2}^{2})

$X_2 \mid X_1=x_1 \sim \mathcal{N} \left( \mu_2 + \rho \frac{\sigma_2}{\sigma_1}(x_1 - \mu_1),(1-\rho^2)\sigma^2_2 \right)$

{X.}_{1} = \underset{α}{\underset{⏟}{(μ_{1} - - ρ \frac{σ_{1}}{σ_{2}} μ_{2})}} + \underset{β}{\underset{⏟}{ρ \frac{σ_{1}}{σ_{2}}}} {X.}_{2} + \sqrt{1 - - ρ^{2}} σ_{1} ϵ_{1}

$X_1=\underbrace{\left(\mu_1-\rho \frac{\sigma_1}{\sigma_2}\mu_2\right)}_\alpha+\underbrace{\rho \frac{\sigma_1}{\sigma_2}}_\beta X_2+\sqrt{1-\rho^2}\sigma_1\epsilon_1$ und was bedeutet, dass (a) nicht und (b) Die Verbindung zwischen den beiden Regressionen hängt von der gemeinsamen Verteilung von .

{X.}_{2} = \underset{κ}{\underset{⏟}{(μ_{2} - - ρ \frac{σ_{2}}{σ_{1}} μ_{1})}} + \underset{γ}{\underset{⏟}{ρ \frac{σ_{2}}{σ_{1}}}} {X.}_{1} + \sqrt{1 - - ρ^{2}} σ_{2} ϵ_{2}

$X_2=\underbrace{\left(\mu_2-\rho \frac{\sigma_2}{\sigma_1}\mu_1\right)}_\kappa+\underbrace{\rho \frac{\sigma_2}{\sigma_1}}_\gamma X_1+\sqrt{1-\rho^2}\sigma_2\epsilon_2$

γ

$\gamma$

1 / β

$1/\beta$

(X_{1}, X_{2})

$(X_1,X_2)$

Xi'an
quelle

Wie würde ich entscheiden, ob der Durchschnitt der beiden Betas ein besseres Maß für die Sicherungsquote ist als der eine oder andere?

Ricardo

4

Ich habe keine Ahnung.

Xi'an

@ricardo Indem Sie den Absicherungsfehler außerhalb der Stichprobe unter jeder Schätzung messen, versuchen Sie letztendlich, ihn zu minimieren.

Chris Haug

3

Aus einem Kommentar konvertiert .....

Die genauen Werte von und finden Sie in meiner Antwort auf den Effekt des Wechsels von Antworten und erklärenden Variablen in einer einfachen linearen Regression , und wie Sie vermuten, ist nicht der Kehrwert von und der Mittelwertbildung von und (oder die Mittelung von und ) ist nicht der richtige Weg. Eine bildliche Ansicht dessen, was und minimieren, ist in Elvis 'Antwort enthalten $\beta$ $\gamma$ $\beta$ $\gamma$ $\beta$ $\gamma$ $\beta$ $1/\gamma$ $\beta$ $\gamma$ Auf dieselbe Frage und in der Antwort führt er eine Regression der "kleinsten Rechtecke" ein, nach der Sie möglicherweise suchen. Die Kommentare nach Elvis 'Antwort sollten nicht vernachlässigt werden. Sie beziehen diese Regression der "kleinsten Rechtecke" auf andere, zuvor untersuchte Techniken. Beachten Sie insbesondere, dass Moderator chl darauf hinweist, dass diese Methode von Interesse ist, wenn nicht klar ist, welche die Prädiktorvariable und welche die Antwortvariable ist.

Dilip Sarwate
quelle

3

$\beta$ und $\gamma$

Wie Xi'an in seiner Antwort feststellte $\beta$ und $\gamma$ sind miteinander verbunden, indem sie sich auf die bedingten Mittel beziehen $X|Y$ und $Y|X$ (die sich wiederum auf eine einzelne gemeinsame Verteilung beziehen ) diese sind nicht symmetrisch in dem Sinne, dass $\beta \neq 1/\gamma$ . Dies ist auch nicht der Fall, wenn Sie das Wahre "kennen" würden $\sigma$ und $\rho$ anstatt Schätzungen zu verwenden. Du hast

β = ρ_{X. Y.} \frac{σ_{Y.}}{σ_{X.}}

$\beta = \rho_{XY} \frac{\sigma_Y}{\sigma_X}$ und

γ = ρ_{X. Y.} \frac{σ_{X.}}{σ_{Y.}}

$\gamma = \rho_{XY} \frac{\sigma_X}{\sigma_Y}$

oder man könnte sagen

β γ = ρ_{X. Y.}^{2} \leq 1

$\beta \gamma = \rho_{XY}^2 \leq 1$

Siehe auch einfache lineare Regression auf Wikipedia zur Berechnung der $\beta$ und $\gamma$ .

Es ist dieser Korrelationsterm, der die Symmetrie irgendwie stört. Wenn die $\beta$ und $\gamma$ wäre einfach das Verhältnis der Standardabweichung $\sigma_Y/\sigma_X$ und $\sigma_X/\sigma_Y$ dann wären sie tatsächlich umgekehrt. Das $\rho_{XY}$ Begriff kann als Änderung einer Art Regression zum Mittelwert angesehen werden .

Mit perfekter Korrelation $\rho_{XY} = 1$ dann können Sie vollständig vorhersagen $X$ beyogen auf $Y$ oder umgekehrt. Die Pisten sind gleich $β γ = 1$ $\beta \gamma = 1$
Aber mit weniger als perfekter Korrelation, $\rho_{XY} < 1$ können Sie diese perfekten Vorhersagen nicht treffen, und der bedingte Mittelwert liegt im Vergleich zu einer einfachen Skalierung durch etwas näher am bedingungslosen Mittelwert $\sigma_Y/\sigma_X$ oder $\sigma_X/\sigma_Y$ . Die Steigungen der Regressionslinien sind weniger steil. Die Steigungen werden nicht miteinander in Beziehung gesetzt, und ihr Produkt wird kleiner als eins sein $β γ < 1$ $\beta \gamma < 1$

Ist eine Regressionsgerade die richtige Methode?

Sie fragen sich vielleicht, ob Sie diese bedingten Wahrscheinlichkeiten und Regressionslinien benötigen, um Ihre Verhältnisse von zu bestimmen $X$ und $Y$ . Mir ist unklar, wie Sie eine Regressionslinie bei der Berechnung eines optimalen Verhältnisses verwenden möchten.

Im Folgenden finden Sie eine alternative Methode zur Berechnung des Verhältnisses. Diese Methode hat Symmetrie (dh wenn Sie X und Y wechseln, erhalten Sie das gleiche Verhältnis).

Alternative

Sagen wir, die Renditen von Anleihen $X$ und $Y$ werden nach einer multivariaten Normalverteilung verteilt $^\dagger$ mit Korrelation $\rho_{XY}$ und Standardabweichungen $\sigma_X$ und $\sigma_Y$ dann die Rendite einer Absicherung, die die Summe von ist $X$ und $Y$ wird normal verteilt:

H. = α X. + (1 - - α) Y. \sim N. (μ_{H.}, σ_{H.}^{2})

$H = \alpha X + (1-\alpha) Y \sim N(\mu_H,\sigma_H^2)$

wurden $0 \leq \alpha \leq 1$ und mit

\begin{array}{rcl} μ_{H.} & = & α μ_{X.} + (1 - - α) μ_{Y.} \\ σ_{H.}^{2} & = & α^{2} σ_{X.}^{2} + (1 - - α)^{2} σ_{Y.}^{2} + 2 α (1 - - α) ρ_{X. Y.} σ_{X.} σ_{Y.} \\ = & α^{2} (σ_{X.}^{2} + σ_{Y.}^{2} - - 2 ρ_{X. Y.} σ_{X.} σ_{Y.}) + α (- - 2 σ_{Y.}^{2} + 2 ρ_{X. Y.} σ_{X.} σ_{Y.}) + σ_{Y.}^{2} \end{array}

$\begin{array}{rcl} \mu_H &=& \alpha \mu_X+(1-\alpha) \mu_Y \\ \sigma_H^2 &=& \alpha^2 \sigma_X^2 + (1-\alpha)^2 \sigma_Y^2 + 2 \alpha (1-\alpha) \rho_{XY} \sigma_X \sigma_Y \\ & =& \alpha^2(\sigma_X^2+\sigma_Y^2 -2 \rho_{XY} \sigma_X\sigma_Y) + \alpha (-2 \sigma_Y^2+2\rho_{XY}\sigma_X\sigma_Y) +\sigma_Y^2 \end{array}$

Das Maximum des Mittelwerts $\mu_H$ wird bei ... sein

α = 0 oder α = 1

$\alpha = 0 \text{ or } \alpha=1$ oder nicht vorhanden, wenn

μ_{X} = μ_{Y}

$\mu_X=\mu_Y$ .

Das Minimum der Varianz $\sigma_H^2$ wird bei ... sein

α = 1 - - \frac{σ_{X.}^{2} - - ρ_{X. Y.} σ_{X.} σ_{Y.}}{σ_{X.}^{2} + σ_{Y.}^{2} - - 2 ρ_{X. Y.} σ_{X.} σ_{Y.}} = \frac{σ_{Y.}^{2} - - ρ_{X. Y.} σ_{X.} σ_{Y.}}{σ_{X.}^{2} + σ_{Y.}^{2} - - 2 ρ_{X. Y.} σ_{X.} σ_{Y.}}

$\alpha = 1 - \frac{\sigma_X^2 -\rho_{XY}\sigma_X\sigma_Y}{\sigma_X^2 +\sigma_Y^2 -2 \rho_{XY} \sigma_X\sigma_Y} = \frac{\sigma_Y^2-\rho_{XY}\sigma_X\sigma_Y}{\sigma_X^2+\sigma_Y^2 -2 \rho_{XY} \sigma_X\sigma_Y}$

Das Optimum liegt irgendwo zwischen diesen beiden Extremen und hängt davon ab, wie Sie Verluste und Gewinne vergleichen möchten

Beachten Sie, dass jetzt eine Symmetrie zwischen besteht $\alpha$ und $1-\alpha$ . Es spielt keine Rolle, ob Sie die Absicherung verwenden $H=\alpha_1 X+(1-\alpha_1)Y$ oder die Hecke $H=\alpha_2 Y + (1-\alpha_2) X$ . Sie erhalten die gleichen Verhältnisse in Bezug auf $\alpha_1 = 1-\alpha_2$ .

Minimaler Varianzfall und Beziehung zu Hauptkomponenten

Im Fall der minimalen Varianz (hier müssen Sie eigentlich keine multivariate Normalverteilung annehmen) erhalten Sie das folgende Absicherungsverhältnis als optimal

\frac{α}{1 - - α} = \frac{v ein r (Y.) - - c Ö v (X., Y.)}{v ein r (X.) - - c Ö v (X., Y.)}

$\frac{\alpha}{1-\alpha} = \frac{var(Y) - cov(X,Y)}{var(X)-cov(X,Y)}$ was in Form der Regressionskoeffizienten ausgedrückt werden kann

β = c o v (X, Y) / v a r (X)

$\beta = cov(X,Y)/var(X)$ und

γ = c o v (X, Y) / v a r (Y)

$\gamma = cov(X,Y)/var(Y)$ und ist wie folgt

\frac{α}{1 - - α} = \frac{1 - - β}{1 - - γ}

$\frac{\alpha}{1-\alpha} = \frac{1-\beta}{1-\gamma}$

In einer Situation mit mehr als zwei Variablen / Aktien / Anleihen können Sie dies auf die letzte (kleinste Eigenwert-) Hauptkomponente verallgemeinern.

Varianten

Das Modell kann verbessert werden, indem andere Verteilungen als die multivariate Normalverteilung verwendet werden. Sie können die Zeit auch in ein komplexeres Modell integrieren, um zukünftige Werte / Verteilungen für das Paar besser vorhersagen zu können $X,Y$ .

^{$\dagger$ Dies ist eine Vereinfachung, aber sie dient dem Zweck zu erklären, wie man die Analyse durchführen kann und sollte, um ein optimales Verhältnis ohne Regressionslinie zu finden.}

Sextus Empiricus
quelle

1

Es tut mir leid, aber als Physiker weiß ich zu wenig über die Sprache (Long, Short, Bestände usw.) in Bezug auf Aktien, Anleihen und Finanzen. Wenn Sie es in einer einfacheren Sprache ausdrücken könnten, könnte ich es vielleicht verstehen und damit arbeiten. Meine Antwort ist nur ein sehr einfacher Ausdruck, der sich der Details und Möglichkeiten des Ausdrucks von Absicherungen und Aktien nicht bewusst ist, aber das Grundprinzip zeigt, wie Sie von der Verwendung einer Regressionslinie wegkommen können (gehen Sie zurück zu den ersten Prinzipien, drücken Sie die aus Gewinnmodell, das im Mittelpunkt steht, anstatt Regressionslinien zu verwenden, deren Relevanz nicht direkt klar ist).

Sextus Empiricus

Ich denke ich verstehe. Das Problem ist, dass 1 / ρ_ {XY} \ ne p_ {XY}

. i n d e e d,

$. indeed,$ p_ {XY} $ ändert sich oft ganz und gar, wenn wir die Umkehrung nehmen. Ihre Alternative kommt dem Fall nahe, über den ich nachdenke, aber ich möchte eines überprüfen: Erlaubt dies nicht negative Beteiligungen? Wenn ich Ihre Terminologie übernehme, hätte ich eine Einheit, die die Bindung X hält, und eine negative, die Y hält. Sagen Sie lange eine Einheit der Bindung X und kurz (sagen wir) 1,2 Einheiten der Bindung Y ... aber es könnten 0,2 Einheiten oder 5 sein Einheiten, abhängig von der Mathematik.

Ricardo

long bedeutet, dass ich 1% auf eine Anleihe mache, wenn der Preis um ~ 1% steigt; Kurz bedeutet, dass ich ~ 1% bei einer Anleihe verliere, wenn der Preis um ~ 1% steigt. Die Idee ist also, dass ich eine Einheit einer Anleihe lang bin (also profitiere ich von einer Wertsteigerung) und ein Teil der anderen Anleihe kurz bin (also verliere ich von einer Wertsteigerung).

Ricardo

"Das Problem ist zu entscheiden, wie viel von X man gegen Y halten soll." Mein Problem dabei ist, dass es keine Erklärung / Modell / Ausdruck gibt, wie Sie sich dafür entscheiden. Wie definieren Sie Verluste und Gewinne und wie sehr schätzen Sie sie?

Sextus Empiricus

Sind mit Kurz- und Langlaufkosten Kosten verbunden? Ich stelle mir vor, dass Sie einen bestimmten Betrag investieren müssen, und dies begrenzt, wie viel Sie in diesen Anleihen Short / Long sein können. Basierend auf Ihren Vorkenntnissen können Sie dann die Verteilung der Verluste / Gewinne für jede Kombination auf dieser Grenze schätzen / bestimmen. Basierend auf einer Funktion, die bestimmt, wie Sie Verluste und Gewinne bewerten (dies drückt aus, warum / wie Sie sich absichern), können Sie schließlich entscheiden, welche Kombination Sie wählen möchten.

Sextus Empiricus

1

Vielleicht könnte der Ansatz der "Granger-Kausalität" helfen. Dies würde Ihnen helfen, zu beurteilen, ob X ein guter Prädiktor für Y ist oder ob X besser für Y ist. Mit anderen Worten, es zeigt Ihnen, ob Beta oder Gamma ernst zu nehmen sind. Wenn Sie sich mit Zeitreihendaten befassen, erfahren Sie auch, wie viel von der Geschichte von X für die Vorhersage von Y zählt (oder umgekehrt).

Wikipedia gibt eine einfache Erklärung: Eine Zeitreihe X wird als Granger-Ursache Y bezeichnet, wenn sie gezeigt werden kann, normalerweise durch eine Reihe von t-Tests und F-Tests an verzögerten Werten von X (und mit verzögerten Werten von Y ebenfalls eingeschlossen). , dass diese X-Werte statistisch signifikante Informationen über zukünftige Werte von Y liefern.

Was Sie tun, ist Folgendes:

Regression X (t-1) und Y (t-1) auf Y (t)
Regression X (t-1), X (t-2), Y (t-1), Y (t-2) auf Y (t)
Regression X (t-1), X (t-2), X (t-3), Y (t-1), Y (t-2), Y (t-3) auf Y (t)

Fahren Sie fort, unabhängig von der Länge des Verlaufs. Überprüfen Sie die Signifikanz der F-Statistik für jede Regression. Machen Sie dasselbe in umgekehrter Reihenfolge (also regressieren Sie jetzt die vergangenen Werte von X und Y auf X (t)) und sehen Sie, welche Regressionen signifikante F-Werte haben.

Ein sehr einfaches Beispiel mit R-Code finden Sie hier . Die Granger-Kausalität wurde kritisiert, weil sie (in einigen Fällen) die Kausalität nicht tatsächlich feststellte. Es scheint jedoch, dass es bei Ihrer Anwendung wirklich um "prädiktive Kausalität" geht, und genau dafür ist der Granger-Kausalitätsansatz gedacht.

Der Punkt ist, dass der Ansatz Ihnen sagt, ob X Y vorhersagt oder ob Y X vorhersagt (so dass Sie nicht länger versucht wären, die beiden Regressionskoeffizienten künstlich - und falsch - zusammenzusetzen) und Ihnen eine bessere Vorhersage gibt (wie Sie wird wissen, wie viel Geschichte von X und Y Sie wissen müssen, um Y) vorherzusagen, was für Absicherungszwecke nützlich ist, richtig?

Steve G. Jones
quelle

Ich habe einen starken theoretischen Grund zu der Annahme, dass beides keine wirkliche Ursache ist und dass selbst wenn man eine Ursache wird, dies im Laufe der Zeit nicht wahr bleiben würde. Ich denke also nicht, dass Granger Causailty in diesem Fall die Antwort ist. Ich habe die Antwort auf jeden Fall positiv bewertet, da sie nützlich ist - insb. der R-Code.

Ricardo

Deshalb erwähne ich ausdrücklich, dass "die Granger-Kausalität dafür kritisiert wurde, dass sie (in einigen Fällen) keine tatsächliche Kausalität festgestellt hat". Es scheint mir, dass es bei Ihrer Frage eher darum geht, "prädiktive Kausalität" zu etablieren, wofür die Granger-Kausalität gedacht ist. Darüber hinaus verwendet Grangers Ansatz die Informationen in Ihren Zeitreihendaten, die nicht verschwendet werden dürfen, wenn Sie sie haben. Natürlich können (sollten?) Sie die Auswirkungen im Laufe der Zeit neu abschätzen. Ich gehe davon aus, dass die Granger-Effekte stabiler sind als Querschnitts-OLS (Sie können dies vorher anhand historischer Daten testen). HTH

Steve G. Jones

Ist der Durchschnitt der Betas von Y ~ X und X ~ Y gültig?

Antworten:

ββ\beta undγγ\gamma

Ist eine Regressionsgerade die richtige Methode?

Alternative

Minimaler Varianzfall und Beziehung zu Hauptkomponenten

Varianten

$\beta$ und $\gamma$