TLDR: Haben Dünnplatten-Regressionssplines eine probabilistische / Bayes'sche Interpretation?
Bei gegebenen Eingabe-Ausgabe-Paaren ist ; Ich möchte eine Funktion wie folgt schätzen: wobei eine Kernfunktion ist und ein Merkmalsvektor der Größe . Die Koeffizienten und können durch Lösen von wobei Die Zeilen von \ Phi sind gegeben durch
und, mit einigem Missbrauch Notation, die -te Eintrag der Kernmatrix ist . Dies ergibt
Unter der Annahme, dass eine positive bestimmte Kernelfunktion ist, kann diese Lösung als bester linearer unverzerrter Prädiktor für das folgende Bayes'sche Modell angesehen werden:
Dabei bezeichnet und einen Gaußschen Prozess. Siehe zum Beispiel https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2665800/
Meine Frage lautet wie folgt. Angenommen, ich lasse und , dh dünne Plattenverzahnung Regression. Nun ist keine positive semidefinite Funktion und die obige Interpretation funktioniert nicht. Hat das obige Modell und seine Lösung noch eine probabilistische Interpretation, da für den Fall das positiv semidefinit ist?
Antworten:
Das Modell der Frage sei geschrieben als wobei ein nicht beobachteter GP mit dem Index und ein normaler Rauschbegriff mit ist Varianz . Der GP wird normalerweise als zentriert, stationär und nicht deterministisch angenommen. Beachten Sie, dass der Begriff als (deterministischer) GP mit Kernel wobei h(x)x∈Rdεiσ2ϕ(x)⊤βϕ(x)⊤B.
Hier sind zwei Beispiele für IRF für . Betrachten Sie zunächst einen Wiener-Prozess dessen Anfangsbedingung durch eine diffuse Anfangsbedingung ersetzt wird: ist normal mit einer unendlichen Varianz. Sobald ein Wert bekannt ist, kann der IRF ebenso wie der Wiener GP vorhergesagt werden. Zweitens betrachten wir einen integrierten Wiener-Prozess , der durch die Gleichung wobei ist ein Wiener-Prozess. Um einen GP zu erhalten, benötigen wir jetzt zwei skalare Parameter: zwei Werte und fürζ ( x ) ζ ( 0 ) = 0 ζ ( 0 ) ζ ( x ) d 2 ζ ( x ) / d x 2 = d W ( x ) / d x W ( x ) ζ ( x ) ζ ( x ' ) x ≠ x ' ζ ( x )d=1 ζ(x) ζ(0)=0 ζ(0) ζ(x)
Betrachten Sie für eine allgemeine Dimension einen linearen Raum von Funktionen, die in . Wir nennen ein Inkrement relativ zu eine endliche Sammlung von Positionen und reellen Gewichten so dass Betrachten Sie als Nullraum unserer Beispiele. Für das erste Beispiel können wir zB mit und beliebig und nehmenF R d F s x i ∈ R d s ν i s ∑ i = 1d F Rd F s xi∈Rd s νi F s = 2 × 1 × 2 [ 1 ,
Die Berechnung der Vorhersage des IRF ist nahezu dieselbe wie in der Frage, wobei durch , aber mit dem jetzt eine Basis von . Die zusätzliche Einschränkung muss im Optimierungsproblem hinzugefügt werden, wodurch das gewährt wird . Wir können bei Bedarf noch weitere Basisfunktionen hinzufügen, die nicht in sind. Dies hat den Effekt, dass dem IRF ein deterministischer GP hinzugefügt wird, z. B. g( x ,k(x,x′) ϕ i ( x ) F Φ ⊤ α= 0 α ⊤ K α≥0 F ψ( x ) ⊤ γζ( x )g(x,x′) ϕi(x) F Φ⊤α=0 α⊤Kα≥0 F ψ(x)⊤γ ζ(x) in (2).
Der Dünnplatten-Spline hängt von einer ganzen Zahl so dass , der Raum Polynome mit geringem Grad enthält, wobei die Dimension von und abhängt . Es kann gezeigt werden, dass, wenn die folgende Funktion für dann definiert ein bedingt positives wrt . Die Konstruktion bezieht sich auf einen Differentialoperatorm > 2 d F p ( m ) m d E ( r ) r ≥ 0 E ( r ) : = { ( - 1 ) m + 1 + d / 2m m>2d F p(m) m d E(r) r≥0 g(x,
Cressie N- Statistik für räumliche Daten . Wiley 1993.
Mardia KV, Kent JT, Goodall CR und Little JA. Kriging und Splines mit abgeleiteten Informationen. Biometrika (1996), 83,1, S. 207-221.
Wahba G Spline-Modelle für Beobachtungsdaten . SIAM 1990.
Wang, Y Glättung von Splines, Methoden und Anwendungen . Chapman and Hall, 2011.
quelle