Ich muss gestehen, dass ich in keiner meiner Klassen, Studenten oder Absolventen, von diesem Begriff gehört habe.
Was bedeutet es für eine logistische Regression, Bayesianisch zu sein? Ich suche nach einer Erklärung mit einem Übergang von der regulären Logistik zur Bayes'schen Logistik, ähnlich der folgenden:
Dies ist die Gleichung im linearen Regressionsmodell: .
Dies ist die Gleichung im logistischen Regressionsmodell: . Dies geschieht, wenn y kategorisch ist.
Was wir getan haben, ist in \ ln (\ frac {E (y)} {1-E (y)}) zu ändern .ln ( E ( y ))
Was wird nun mit dem logistischen Regressionsmodell in der Bayes'schen logistischen Regression gemacht? Ich vermute, das hat nichts mit der Gleichung zu tun.
Diese Buchvorschau scheint zu definieren, aber ich verstehe nicht wirklich. Was ist das alles vorher, Wahrscheinlichkeitszeug? Was ist ? Darf jemand bitte diesen Teil des Buches oder das Bayes'sche Logit-Modell auf andere Weise erklären?
Hinweis: Dies wurde bereits gefragt, aber meiner Meinung nach nicht sehr gut beantwortet.
Antworten:
Die logistische Regression kann als lineare Kombination beschrieben werden
das wird durch die Verknüpfungsfunktion :g
Dabei ist die Link-Funktion eine Logit- Funktion
Dabei nimmt nur Werte in und inverse Logit-Funktionen transformieren die Linearkombination in diesen Bereich. Hier endet die klassische logistische Regression.{ 0 , 1 } ηY {0,1} η
Wenn Sie sich jedoch daran erinnern, dass für Variablen ist, die nur Werte in annehmen , kann als . In diesem Fall könnte die Ausgabe der Logit-Funktion als bedingte Wahrscheinlichkeit des "Erfolgs" angesehen werden, dh . Die Bernoulli-Verteilung ist eine Verteilung, die die Wahrscheinlichkeit der Beobachtung eines binären Ergebnisses mit einem Parameter beschreibt, sodass wir als beschreiben können{ 0 , 1 } E ( Y | X , β ) P ( Y = 1 | X , β ) P ( Y = 1 | X , β ) p Y.E(Y)=P(Y=1) {0,1} E(Y|X,β) P(Y=1|X,β) P(Y=1|X,β) p Y
Bei der logistischen Regression suchen wir nach einigen Parametern , die zusammen mit unabhängigen Variablen eine lineare Kombination . In der klassischen Regression ist (wir nehmen an, dass die Verknüpfungsfunktion eine Identitätsfunktion ist). Um jedoch zu modellieren , das Werte in annimmt, müssen wir so transformieren, dass es passt im Bereich .X η E ( Y | X , β ) = η Y { 0 , 1 } η [ 0 , 1 ]β X η E(Y|X,β)=η Y {0,1} η [0,1]
Um die logistische Regression auf Bayes'sche Weise abzuschätzen, nehmen Sie einige Prioritäten für Parameter wie bei der linearen Regression (siehe Kruschke et al., 2012 ) und transformieren die lineare Kombination mit der logit-Funktion , um ihre Ausgabe als zu verwenden Parameter der Bernoulli-Verteilung, der Ihre Variable beschreibt. Also, ja, Sie verwenden die Gleichung und die Logit-Link-Funktion tatsächlich auf die gleiche Weise wie im frequenzistischen Fall, und der Rest funktioniert (z. B. Auswahl von Prioritäten) wie bei der Schätzung der linearen Regression auf Bayes'sche Weise. η p Y.βi η p Y
Der einfache Ansatz für die Auswahl von Prioritäten besteht darin, Normalverteilungen (Sie können aber auch andere Verteilungen verwenden, z. B. oder Laplace-Verteilung für ein robusteres Modell) für mit den Parametern und , die voreingestellt oder verwendet werden von hierarchischen Prioritäten . Mit der Modelldefinition können Sie jetzt Software wie JAGS verwenden , um eine Markov-Ketten-Monte-Carlo- Simulation durchzuführen und das Modell zu schätzen. Im Folgenden wird ich JAGS Code für einfaches logistisches Modell Post (Check hier für weitere Beispiele).β i μ i σ 2 it βi μi σ2i
Wie Sie sehen können, wird der Code direkt in die Modelldefinition übersetzt. Die Software zeichnet einige Werte aus normalen Prioritäten für
a
undb
verwendet diese Werte dann zur Schätzungp
und schließlich die Wahrscheinlichkeitsfunktion, um zu bewerten, wie wahrscheinlich Ihre Daten bei diesen Parametern sind (dies ist, wenn Sie den Bayes-Satz verwenden, siehe hier für detailliertere Beschreibung).Das grundlegende logistische Regressionsmodell kann erweitert werden, um die Abhängigkeit zwischen den Prädiktoren mithilfe eines hierarchischen Modells (einschließlich Hyperprioren ) zu modellieren . In diesem Fall können Sie aus der multivariaten Normalverteilung ziehen , wodurch wir Informationen über die Kovarianz zwischen unabhängigen Variablen können Σβi Σ
... aber das geht ins Detail, also lasst uns gleich hier aufhören.
Der "Bayes'sche" Teil hier ist die Auswahl von Prioritäten unter Verwendung des Bayes-Theorems und die Definition des Modells in probabilistischen Begriffen. Hier finden Sie die Definition des "Bayes'schen Modells" und hier eine allgemeine Einführung in den Bayes'schen Ansatz . Sie können auch feststellen, dass das Definieren von Modellen mit diesem Ansatz ziemlich einfach und flexibel ist.
Kruschke, JK, Aguinis, H. & Joo, H. (2012). Es ist an der Zeit: Bayesianische Methoden zur Datenanalyse in den Organisationswissenschaften. Organizational Research Methods, 15 (4), 722 & ndash; 752.
Gelman, A., Jakulin, A., Pittau, GM und Su, Y.-S. (2008). Eine schwach informative Standard-Vorverteilung für logistische und andere Regressionsmodelle. The Annals of Applied Statistics, 2 (4), 1360–1383.
quelle
Das macht es Bayesianisch. Das generative Modell für die Daten ist dasselbe. Der Unterschied besteht darin, dass eine Bayes'sche Analyse eine vorherige Verteilung für interessierende Parameter auswählt und eine hintere Verteilung berechnet oder approximiert , auf der alle Schlussfolgerungen basieren. Die Bayes-Regel bezieht die beiden: Der hintere Teil ist proportional zu den Wahrscheinlichkeitszeiten vor.
Einige frequentistische Modelle können mit einem Bayes'schen Gegenstück mit einem bestimmten Prior verwandt sein, obwohl ich nicht sicher bin, was in diesem Fall entspricht.
quelle