Ich lese diesen Papiervorabdruck und habe Schwierigkeiten, die Gleichungen für die Gaußsche Prozessregression abzuleiten. Sie verwenden die Einstellung und Notation von Rasmussen & Williams . Somit wird additives, mittleres, stationäres und normalverteiltes Rauschen mit Varianz angenommen:
Für wird ein GP vor dem Mittelwert Null angenommen , was bedeutet, dass , ist ein Gaußscher Vektor mit Mittelwert 0 und Kovarianzmatrix∀ d ∈ N f = { f ( x 1 ) , … , f ( x d ) }
Von nun an gehen wir davon aus, dass Hyperparameter bekannt sind. Dann ist Gleichung (4) des Papiers offensichtlich:
Hier kommen die Zweifel:
Gleichung (5):
E [ y | f ] = f ≠ 0 f , aber ich denke denn wenn ich auf konditioniere , dann wobei ein konstanter Vektor ist und nur zufällig ist. Richtig?
Wie auch immer, es ist Gleichung (6), die für mich dunkler ist:
Das ist nicht die übliche Form des Bayes-Theorems. Der Satz von Bayes wäre
Ich verstehe irgendwie, warum die beiden Gleichungen gleich sind: Intuitiv hängt der Antwortvektor nur vom entsprechenden latenten Vektor , also abhängig von oder von sollte zur gleichen Verteilung führen. Dies ist jedoch eine Intuition, kein Beweis! Kannst du mir helfen zu zeigen warum?
quelle