Als Teil der Reproduktion eines Modells, das ich teilweise in dieser Frage zum Stapelüberlauf beschrieben habe, möchte ich eine grafische Darstellung einer posterioren Verteilung erhalten. Das (räumliche) Modell beschreibt den Verkaufspreis einiger Immobilien als Bernoulli-Verteilung, je nachdem, ob die Immobilie teuer (1) oder billig (0) ist. In Gleichungen:
p i ∼ logit - 1 ( b 0 + b 1 LivingArea / 1000 + b 2 Alter + w ( s ) ) w ( s ) ∼ MVN ( 0 , Σ )
wobei das binäre Ergebnis 1 oder 0 ist, die Wahrscheinlichkeit ist, billig oder teuer zu sein, eine räumliche Zufallsvariable ist, wobei seine Position darstellt . All dies für jedes da der Datensatz 70 Eigenschaften enthält. ist eine Kovarianzmatrix, die auf der geografischen Position der Datenpunkte basiert. Wenn Sie neugierig auf dieses Modell sind, finden Sie den Datensatz hier . p i w ( s ) s i = { 1 , . . . , 70 } Σ
Das Diagramm, das ich erhalten möchte, ist das folgende Konturdiagramm:
Die Figur wird als "Bilddiagramm der hinteren Mittelfläche des latenten Prozesses , binäres räumliches Modell" beschrieben. Das Buch sagt auch Folgendes:
Abbildung 5.8 zeigt das Bilddiagramm mit überlagerten Konturlinien für die hintere mittlere Oberfläche des latenten -Prozesses.
Der Datensatz enthält jedoch nur 70 Punktepaare. Ich nehme an, um ein Konturdiagramm zu erstellen, muss ich in 70 * 70 Punkten schätzen . Meine Frage lautet also: Wie produziere ich diese hintere mittlere Oberfläche? Bisher habe ich Stichproben von posterioren Verteilungen für alle beteiligten Parameter (unter Verwendung von PyMC) und ich weiß, dass ich an einem neuen Punkt unter Verwendung der posterioren prädiktiven Verteilung vorhersagen kann. Ich weiß jedoch nicht, wie ich Werte an einem neuen Punkt vorhersagen soll . Vielleicht irre ich mich und die Handlung wurde nicht durch Vorhersage, sondern durch Interpolation konstruiert.
UPDATE :
Erstens ist dies der Median der posterioren Verteilung von an jeder Stelle, an der es eine Eigenschaft gibt. Dies basiert auf dem MCMC-Trace für .
Und dies ist die Interpolation (mit einem Konturdiagramm) unter Verwendung einer radialen Basisfunktion:
(Wenn Sie an dem Code interessiert sind, lassen Sie es mich wissen.)
Wie Sie sehen können, gibt es signifikante Unterschiede in den Darstellungen. Einige Fragen:
Wie kann ich wissen, ob diese Unterschiede durch das Interpolationsverfahren erklärt werden?
Vielleicht gibt es wichtige Variationen in der posterioren Verteilung von , die ich berechnet und die im Buch gezeigt habe. Wie viel Variation ist zwischen MCMC-Simulationen akzeptabel? Sogar meine eigenen Parameter ändern sich je nach verwendetem Sampling etwas (Metropolis, Metropolis Adaptive.)
Gibt es ein Bayes'sches Verfahren, um Punkte vorherzusagen , um ein Konturdiagramm zu erzeugen, wie ich es mit der radialen Basisfunktion getan habe?
quelle
Antworten:
Es ist sehr wahrscheinlich, dass der Autor einen Gaußschen Prozess verwendet hat, um die Interpolation zu erzeugen. Ich denke, das ist wahr, weil eine Übung in dem Buch ein sehr ähnliches Problem wie dieses beschreibt und eine Handlung erfordert, die auf einem Gaußschen Prozess basiert.
Ich habe es versucht und ich denke, dass die resultierende Handlung Merkmale mit der hinteren mittleren Oberfläche der ursprünglichen Frage teilt. Dies ist der Median der posterioren Verteilung von wie oben (es ist etwas anders, weil ich eine andere MCMC-Simulation durchgeführt habe):w ( s )
Und dies ist die Interpolation basierend auf einem Gaußschen Prozess:
Wie Sie sehen können, macht die Interpolationsmethode einen großen Unterschied.
quelle