Ich zögere tatsächlich, dies zu fragen, weil ich befürchte, dass ich auf andere Fragen oder Wikipedia zu Gibbs-Stichproben verwiesen werde, aber ich habe nicht das Gefühl, dass sie beschreiben, was zur Hand ist.
Bei einer bedingten Wahrscheinlichkeit :
Und eine bedingte Wahrscheinlichkeit :
Wir können die gemeinsame Wahrscheinlichkeit eindeutig ermitteln :
Denn obwohl wir Unbekannte haben, haben wir mehr ( 4 ∗ 2 + 3 ) lineare Gleichungen:
Ebenso gut wie:
Es ist schnell gelöst durch ,2. Nämlich durch Gleichsetzen von2mit2. Dies ergibtb0= und der Rest folgt.
Nun gehen wir zum kontinuierlichen Fall. Es ist vorstellbar, zu Intervallen zu gehen und die obige Struktur in Kontakt zu halten (mit mehr Gleichungen als Unbekannten). Was passiert jedoch, wenn wir zu (Punkt-) Instanzen von Zufallsvariablen gehen? Wie erfolgt die Probenahme?
iterativ zu ? Wie wird entsprechend der Bedingung a 0 + a 1 + a 2 + a 3 = 1 beispielsweise ∫ X ∫ Y p ( x , y ) d y d x = 1 sichergestellt ? Ebenso mit ∫ Y p ( y | x ) d y = 1. Können wir die Einschränkungen aufschreiben und Gibbs-Stichproben aus ersten Prinzipien ableiten?
Ich bin also nicht daran interessiert, wie Gibbs-Sampling durchgeführt wird, was einfach ist, aber ich bin daran interessiert, wie man es ableitet und vorzugsweise beweist, dass es funktioniert (wahrscheinlich unter bestimmten Bedingungen).