Gaußscher Prozess: Eigenschaften der Funktionsnäherung

16

Ich lerne etwas über den Gaußschen Prozess und habe nur Kleinigkeiten gehört. Würde mich sehr über Kommentare und Antworten freuen.

Stimmt es, dass eine Gaußsche Prozessfunktionsnäherung für jeden Datensatz an den Datenpunkten null oder einen vernachlässigbaren Anpassungsfehler ergibt? An anderer Stelle hörte ich auch, dass der Gauß-Prozess besonders gut für verrauschte Daten geeignet ist. Dies scheint im Widerspruch zu dem geringen Anpassungsfehler für beobachtete Daten zu stehen.

Außerdem scheint es weiter von den Datenpunkten entfernt mehr Unsicherheit zu geben (größere Kovarianz). Wenn ja, verhält es sich wie lokale Modelle (RBF usw.)?

Gibt es schließlich eine universelle Approximationseigenschaft?

oalah
quelle

Antworten:

17

Angenommen Datenabtastwert ist . Nehmen wir auch an, dass wir eine Kovarianzfunktion k ( x 1 , x 2 ) und einen für einen Gussschen Prozess angegebenen Mittelwert von Null haben. Die Verteilung für einen neuen Punkt x ist Gaußsch mit dem Mittelwert m ( x ) = k K - 1 yD=(X,y)={xich,yich=y(xich)}ich=1Nk(x1,x2)x

m(x)=kK-1y
V(x)=k(x,x)-kK-1kT.
k={k(x,x1),,k(x,xN)}K={k(xich,xj)}ich,j=1N
m(X)=KK-1y=y.
K+σichK
m(X)=K(K+σich)-1yy.
Außerdem macht die Regularisierung das Problem rechenstabiler.

Auswahl der Rauschvarianz σwir können wählen, ob wir interpolieren wollen (σ=0) oder wir wollen mit verrauschten Beobachtungen umgehen (σ ist groß).

Die Gaußsche Prozessregression ist auch eine lokale Methode, da die Varianz der Vorhersagen mit dem Abstand zum Lernmuster zunimmt, wir jedoch die geeignete Kovarianzfunktion auswählen können kund mit komplexeren Problemen umgehen, als mit RBF. Eine weitere schöne Eigenschaft ist die geringe Anzahl von Parametern. Normalerweise ist es gleichÖ(n), wo n ist die Datendimension.

Alexey Zaytsev
quelle