Für ein Bayes'sches logistisches Regressionsproblem habe ich eine posteriore prädiktive Verteilung erstellt. Ich nehme eine Stichprobe aus der Vorhersageverteilung und erhalte für jede meiner Beobachtungen Tausende von Stichproben von (0,1). Die Visualisierung der Anpassungsgüte ist weniger als interessant, zum Beispiel:
Dieses Diagramm zeigt die 10 000 Proben + den beobachteten Bezugspunkt (ganz links kann man eine rote Linie erkennen: Ja, das ist die Beobachtung). Das Problem ist, dass diese Darstellung kaum informativ ist und ich 23 davon habe, eine für jeden Datenpunkt.
Gibt es eine bessere Möglichkeit, die 23 Datenpunkte und die hinteren Proben zu visualisieren?
Ein weiterer Versuch:
Ein weiterer Versuch basiert auf dem Papier hier
bayesian
data-visualization
classification
goodness-of-fit
binary-data
Cam.Davidson.Pilon
quelle
quelle
Antworten:
Ich habe das Gefühl, dass Sie nicht alle Waren für Ihre Situation aufgeben, aber angesichts dessen, was wir vor uns haben, können wir die Nützlichkeit eines einfachen Punktdiagramms zur Anzeige der Informationen in Betracht ziehen .
Die einzige wirkliche Sache, die hier nicht zu finden ist (das sind vielleicht keine Standardverhalten), sind:
Das Sortieren ist der wahre Kicker für solche Punktdiagramme. Das Sortieren nach Proportionswerten hilft dabei, hohe Restbeobachtungen leicht aufzudecken. Ein System, in dem Sie leicht nach Werten sortieren können, die entweder im Plot oder in den externen Merkmalen der Fälle enthalten sind, ist der beste Weg, um das Beste für Ihr Geld zu bekommen.
Dieser Rat gilt auch für kontinuierliche Beobachtungen. Sie können die Punkte entsprechend dem negativen oder positiven Residuum färben / formen und den Punkt dann entsprechend dem absoluten (oder quadratischen) Residuum dimensionieren. Dies ist hier jedoch aufgrund der Einfachheit der beobachteten Werte IMO nicht erforderlich.
quelle
Die übliche Methode zur Visualisierung der Anpassung eines Bayes'schen logistischen Regressionsmodells mit einem Prädiktor besteht darin, die Vorhersageverteilung zusammen mit den entsprechenden Proportionen zu zeichnen. (Bitte lassen Sie mich wissen, wenn ich Ihre Frage verstanden habe)
Ein Beispiel mit dem beliebten Bliss-Datensatz.
Code unten in R:
quelle
ni = 23
undno = 7
und jede der 23 Personen eine andere habendose
. Sie können jedoch ein ähnliches Diagramm für die OP-Daten erstellen (Punkte werden entweder auf 0 oder 1 auf der Y-Achse platziert, und Sie zeichnen die Funktion). Einige Beispiele für ähnliche Diagramme zur logistischen Regression finden Sie in den Referenzen, die ich zu dieser Antwort gebe .Ich antworte auf eine Anfrage nach alternativen grafischen Techniken, die zeigen, wie gut simulierte Fehlerereignisse mit beobachteten Fehlerereignissen übereinstimmen. Die Frage stellte sich in "Probabilistische Programmierung und Bayes'sche Methoden für Hacker", die hier zu finden sind . Hier ist mein grafischer Ansatz:
Code hier gefunden .
quelle