Die Vor- und Nachteile der Glättung Spline

11

Ich habe eine allgemeine Frage. Kürzlich habe ich gerade Basiserweiterung und Regularisierung gelernt. Es gibt verschiedene interessante Techniken, darunter: kubischer Spline, natürlicher Spline, B-Spline und Glättungs-Spline .

Die Frage ist, was sind die Vor- und Nachteile (falls vorhanden) beim Glätten von Spline im Vergleich zu dem "typischen" kubischen und natürlichen Spline, bei dem Benutzer die Knoten auswählen müssen?

Nun, im Allgemeinen ist es dumm, die Leute nur zu fragen, welche Methode ohne den Kontext der wirklichen Probleme besser ist. Daher frage ich aufgrund Ihrer Erfahrungen nur, welches besser ist.

Einer der Vorteile, die ich sehen kann, ist: Glätten der Spline-Technik vermeiden Sie die Auswahl der Knoten.

penpen926
quelle

Antworten:

7

Die Terminologie von Splines kann verwirrend sein (zumindest finde ich das so), da genau das, was Menschen meinen, wenn sie beispielsweise "kubischen Spline" verwenden, von der Art des kubischen Splines abhängt. Wir können zum Beispiel sowohl kubische Glättungssplines als auch kubische (bestrafte) Regressionssplines haben.

Was ich unten skizziere, stammt aus den Abschnitten 5.1.2 und 5.2 von Wood (2017).

Ein interpolierender Spline würde beispielsweise g ( x i ) = y i setzen, wenn er die Beobachtungen y i über eine Funktion interpoliert, die aus Abschnitten kubischer Polynome besteht, die so verbunden sind, dass der Spline zur zweiten Ableitung stetig ist.g(xi)g(xi)=yiyi

Ein kubischer Glättungs-Spline zielt darauf ab, die Anpassung an die Daten auszugleichen und eine glatte Funktion zu erzeugen. Ziel ist es nicht, die Daten zu interpolieren, die beim Interpolieren von Splines entstehen. Anstatt , fungiert ein kubischer Glättungsspline als n freie Parameter, die geschätzt werden müssen, um sie zu minimieren (Wood, 2017).g(xi)=yin

ich=1n{yich- -G(xich)}}2+λG''(x)2dx

Dabei ist der erste Teil ein Maß für die Anpassung an die Daten, während der zweite Teil eine Strafe gegen die Wackeligkeit darstellt (das Integral summiert die quadratische zweite Ableitung des Splines als Maß für die Krümmung oder Wackeligkeit, wie schnell die Kurve ist wechselnde Steigung). Wir können uns Wackeligkeit als Komplexität vorstellen, daher beinhaltet die Funktion eine Strafe gegen übermäßig komplexe Glättungen.

Es kann gezeigt werden, dass ein kubischer Glättungsspline aller möglichen Funktionen f die Funktionen ist, die das obige Kriterium minimieren (ein Beweis wird in Wood, 2017, Abschnitt 5.1.2, S. 198 gegeben).G(x)f

xichyichnλn

Dies ist das Hauptnegativ bei der Glättung von Splines. Sie müssen so viele Parameter schätzen, wie Sie Daten haben, und dennoch ist die Auswirkung vieler dieser Parameter im Allgemeinen gering, da zu komplexe (wackelige) Anpassungen erforderlich sind.

Dies auszugleichen ist die Tatsache, dass die Wahl der Knoten im Glättungsspline berücksichtigt wird, da es keine Wahl gibt.

Wenn wir zur Einstellung für den bestraften Regressions-Spline übergehen, haben wir nun die Wahl, wo die Knoten platziert werden sollen, aber wir können wählen, wie viele Knoten verwendet werden sollen. Wie können wir entscheiden, ob dies ein nützlicher Kompromiss ist, dass es vorteilhaft ist, den Spline mit einer reduzierten Anzahl von Knoten zu versehen, selbst wenn wir entscheiden müssen, wie viele und wo sie platziert werden sollen?

xichknλn um nahezu die optimale Leistung zu erzielen, die durch das Glätten von Splines dargestellt wird (zusammengefasst aus Wood 2017).

k- -1xxxxx

x1ich,x2ichx1x2

Verweise

Wood, SN 2016. P-Splines mit auf Derivaten basierenden Strafen und Tensorproduktglättung ungleichmäßig verteilter Daten. Stat. Comput. 1–5. doi: 10.1007 / s11222-016-9666-x ( Open Access )

Wood, SN 2017. Verallgemeinerte additive Modelle: Eine Einführung mit R, Second Edition, CRC Press.

Gavin Simpson
quelle
Eine Folgefrage zur Aussage "Ein Glättungs-Spline hat 𝑛 freie Parameter; es gibt so viele Parameter wie Daten". Was ist, wenn ich zwei Variablen im additiven Modell habe, f (x1) und f (x2), beide glätten Splines. Bedeutet dies, dass die Anzahl der zu schätzenden Parameter 2n beträgt?
vtshen
x1x2