Bayesianische Regression mit Singular - Ist der Posterior gut definiert?

SE-Community, ich hoffe, einige Einblicke in das folgende Problem zu bekommen. Bei einem einfachen linearen Regressionsmodell ist Unter einer Gaußschen Wahrscheinlichkeitsfunktion mit homoskedastischen Fehlertermen nimmt die bedingte Verteilung der abhängigen Variablen die Form Ich weise ein bedingtes (nicht informatives) Konjugat vor und waren . Es ist ein Standardergebnis, dass die marginale posteriore Verteilung von multivariat ist mit

Y = X β + ϵ, where Y \in R^{T}, X \in R^{T \times N} .

$Y=X\beta+\epsilon\text{ , where } Y\in\mathbb{R}^T,X\in\mathbb{R}^{T \times N}.$

Y | β, h \sim N (X β, h^{- 1} I) .

$Y|\beta,h \sim N(X\beta,h^{-1}I).$

β

$\beta$

h

$h$

β | h \sim N (0, c I), h \sim G (s^{- 2}, v)

$\beta|h \sim N(0,cI), h\sim G(s^{-2},v)$

c \to \infty, v \to 0

$c\rightarrow\infty, v\rightarrow0$

β

$\beta$

β | D \sim t_{N} (\hat{β}, \hat{Σ}, T) .

$\beta|D\sim t_N (\hat{\beta},\hat{\Sigma},T).$ Was passiert, wenn singulär ist? In der Standardregression würde ich mich für die verallgemeinerte Moore-Penrose-Pseudoinverse anstatt . In diesem Fall wäre jedoch auch die posteriore Varianz singulär, und ich bezweifle, dass die Verteilung noch gut definiert ist. Ist das richtig?

(X^{'} X)

$(X'X)$

(X^{'} X)^{+}

$(X'X)^+$

(X^{'} X)^{- 1}

$(X'X)^{-1}$

\hat{Σ} := c (X^{'} X)^{- 1}

$\hat{\Sigma}:=c(X'X)^{-1}$

t

$t$

Und noch weiter ablenkend für mich: Angenommen, ich interessiere mich nicht wirklich für die posteriore Verteilung von sondern nur für eine lineare Kombination wobei , und . Ich könnte aus dieser Distribution eine Stichprobe ziehen, obwohl ihre Konstruktion auf etwas basiert, das nicht wirklich definiert ist (die Distribution von ). Gibt es eine Möglichkeit, damit umzugehen? Oder gibt es einen wesentlichen Fehler in meiner Frage, der meinen ganzen Punkt überflüssig macht? $\beta$ $z:=A\beta$ $A\in\mathbb{R}^{N-1 \times N}$ $|A\hat{\Sigma}A'|\neq 0$ $\beta$

regression bayesian variance posterior singular muffin1974
quelle

Im besten Fall liefern nicht informative Prioritäten hilfreiche Ergebnisse, wenn die Daten Modellparameter eindeutig identifizieren. Diese Beobachtung ist im Grunde der Grund, warum wir eine Gratregression und ihre Verwandten haben, anstatt uns ausschließlich auf OLS zu verlassen. Wenn die Daten jedoch nicht ausreichend informativ sind, wird normalerweise entweder die regulierte Regressionsroute (Grat usw.) oder die vollständig Bayes-Route gewählt. Definieren Sie auf der vollständigen Bayes-Route einfach die richtigen, informativen vorherigen Verteilungen über Ihre Daten, und das Problem kann behoben werden.

Sycorax sagt Reinstate Monica

Vielen Dank für Ihre bisherigen Kommentare! Ich verstehe, dass der hintere Teil von nicht richtig definiert ist. Verursacht dies jedoch wirklich Probleme für die Zufallsvariable die zumindest theoretisch gut definiert ist?

β

$\beta$

z

$z$

Muffin1974

Gut. Was mich verwirrt ist, dass der hintere Teil von plausibel erscheint, obwohl der Weg zu einer Lösung überhaupt nicht zufriedenstellend ist. Ich suche derzeit nach einer Möglichkeit, die Regressionsgleichung neu zu schreiben, da ich optimistisch bin, dass es möglich ist, direkte Regressionsparameter anstatt Zeit mit der Suche nach verschwenden . Obwohl dies in meinem speziellen Fall möglich erscheint, bleibt mir immer noch die Frage, was es bedeutet, wenn ein "schlechtes" Modell in einem funktionierenden Modell verschachtelt ist ...

z

$z$

z

$z$

β

$\beta$

muffin1974

Das Hauptproblem bei Ihrer Frage ist, dass sich Grenzwerte nicht direkt auf Kennzahlen und Wahrscheinlichkeitsverteilungen erstrecken. Mit Maßnahmen sind viele verschiedene Arten der Konvergenz verbunden.

Betrachtet man also das Konjugat und lässt und auf gehen bzw. hat keine richtige oder eindeutige mathematische Bedeutung.

β | h \sim N (0, c I), h \sim G (s^{- 2}, ν)

$\beta|h \sim \mathcal{N}(0,cI), h\sim \mathcal{G}(s^{-2},\nu)$

ν

$\nu$

c

$c$

0

$0$

\infty

$\infty$

Wenn Sie nun den falschen vorherigen ist keine posteriore Verteilung mit der Wahrscheinlichkeit da der potenzielle Posterior nicht in abhängig von . Es gibt auch kein weil die Umkehrung nicht existiert und keine genau definierte Verteilung in .

π (β, h) \propto \frac{1}{h}

$\pi(\beta,h)\propto\frac{1}{h}$

L (β, h | X, y) = \exp {- h (y - X β)^{T} (y - X β) / 2} h^{T / 2}

$L(\beta,h|X,y)=\exp\{-h(y-X\beta)^\text{T}(y-X\beta)/2\}h^{T/2}$

β

$\beta$

h

$h$

\hat{Σ} = (X^{T} X)^{- 1}

$\hat{\Sigma}=(X^\text{T}X)^{-1}$

A β

$A\beta$

Xi'an
quelle

Bayesianische Regression mit Singular - Ist der Posterior gut definiert?

Antworten: