Ich habe diese Verwirrung in Bezug auf die Vorteile von Gaußschen Prozessen. Ich meine, es mit einer einfachen linearen Regression zu vergleichen, bei der wir definiert haben, dass die lineare Funktion die Daten modelliert.
In Gaußschen Prozessen definieren wir jedoch die Verteilung der Funktionen, dh wir definieren nicht speziell, dass die Funktion linear sein soll. Wir können einen Prior über der Funktion definieren, der der Gaußsche Prior ist, der Merkmale wie die Glätte der Funktion und alles definiert.
Wir müssen also nicht explizit definieren, wie das Modell aussehen soll. Ich habe jedoch Fragen. Wir haben eine marginale Wahrscheinlichkeit und können damit die Kovarianzfunktionsparameter des Gaußschen Prior einstellen. Dies ähnelt also der Definition der Art der Funktion, die es sein sollte, nicht wahr?
Es läuft darauf hinaus, die Parameter zu definieren, obwohl es sich bei GP um Hyperparameter handelt. Zum Beispiel in diesem Artikel . Sie haben definiert, dass die mittlere Funktion des Hausarztes so etwas wie ist
Das Modell / die Funktion ist also definitiv definiert, nicht wahr? Was ist der Unterschied bei der Definition der linearen Funktion wie im LR?
Ich habe einfach nicht verstanden, was der Vorteil von GP ist
quelle
Für mich ist der größte Vorteil von Gaußschen Prozessen die inhärente Fähigkeit, die Unsicherheit des Modells zu modellieren. Dies ist unglaublich nützlich, da ich angesichts des erwarteten Werts einer Funktion und der entsprechenden Varianz eine Metrik (dh eine Erfassungsfunktion ) definieren kann, die mir sagen kann, z. B. was der Punkt , an dem ich meine zugrunde liegende Funktion at bewerten sollte führen zum höchsten (erwartungsgemäßen) Wert von . Dies bildet die Grundlage der Bayes'schen Optimierung .x f f(x)
Sie kennen wahrscheinlich den Kompromiss zwischen Exploration und Exploitation . Wir wollen ein für eine Funktion (deren Auswertung oft teuer ist) und müssen daher sparsam darüber sein, welches wir zur Auswertung von auswählen . Wir werden uns wahrscheinlich Orte in der Nähe der Punkte ansehen wollen, an denen wir wissen, dass die Funktion einen hohen Wert hat (Ausnutzung), oder an den Punkten, an denen wir keine Ahnung vom Wert der Funktion haben (Erkundung). Gaußsche Prozesse geben uns die notwendigen Informationen, um eine Entscheidung bezüglich der nächsten Bewertung zu treffen: Mittelwert und Kovarianzmatrix (Unsicherheit), wodurch beispielsweise teure Black-Box-Funktionen optimiert werden können.max f x f μ Σ
quelle