Ich lese das GPML-Buch und in Kapitel 2 (Seite 15) erfahren Sie, wie Sie mit dem Gaußschen Prozess (GP) eine Regression durchführen, aber es fällt mir schwer, herauszufinden, wie es funktioniert.
Bei der Bayes'schen Inferenz für parametrische Modelle wählen wir zuerst einen Prior für die Modellparameter , dh p ( θ ) ; zweitens berechnen wir unter Berücksichtigung der Trainingsdaten D die Wahrscheinlichkeit p ( D | θ ) ; und schließlich haben wir den hinteren Teil von θ als p ( θ | D ) , der in der Vorhersageverteilung p ( y ∗ | x ∗ , D ) = ∫ p ( y ∗) verwendet wird , und das Obige tun wir in der Bayes'schen Inferenz für parametrische Modelle, richtig?
Nun, wie in dem Buch gesagt, ist GP nicht parametrisch, und soweit ich es verstehe , haben wir nach Angabe der mittleren Funktion und der Kovarianzfunktion k ( x , x ′ ) einen GP über der Funktion f , f ∼ G P ( m , k ) , und dies ist der Prior von f . Jetzt habe ich einen rauschfreien Trainingsdatensatz D = { ( x 1 , f 1 )
Das ist jedoch nicht das, was das Buch tut! Ich meine, nach Angabe des vorherigen berechnet es nicht die Wahrscheinlichkeit und den posterioren Wert, sondern geht einfach direkt zur prädiktiven Vorhersage über.
Frage:
1) Warum nicht die Wahrscheinlichkeit und den posterioren Wert berechnen? Nur weil GP nicht parametrisch ist, machen wir das nicht?
quelle
Antworten:
Das Buch verwendet die Bayes'sche Modellmittelung, die für parametrische Modelle oder jede andere Bayes'sche Methode gleich ist, vorausgesetzt, Sie haben einen posterioren Wert über Ihren Parametern.
Es muss nicht "geräuschlos" sein. Siehe spätere Seiten.
Siehe hierzu: https://people.cs.umass.edu/~wallach/talks/gp_intro.pdf
Ich glaube, auf Seite 17 haben wir die vorherige und später die Wahrscheinlichkeit. Ich glaube, wenn Sie die Ableitungen schreiben und den posterioren Wert finden und dann für die Vorhersage über den posterioren Wert mitteln (wie in der Gewichtsraumansicht), ergeben sich die gleichen Gleichungen wie auf Seite 19 für Mittelwert und Kovarianz.
quelle