Die Definition natürlicher kubischer Splines für die Regression

15

Ich lerne etwas über Splines aus dem Buch "Die Elemente des statistischen Lernens, Data Mining, Inferenz und Vorhersage" von Hastie et al. Ich habe auf Seite 145 festgestellt, dass natürliche kubische Splines jenseits der Grenzknoten linear sind. Es gibt Knoten, in den Splines und das Folgende wird über einen solchen Spline im Buch angegeben.Kξ1,ξ2,...ξKBildbeschreibung hier eingeben

Frage 1: Wie werden 4 Freiheitsgrade freigesetzt? Ich verstehe diesen Teil nicht.

Frage 2 : In der Definition von wenn dann ist . Was versucht der Autor in dieser Formel zu tun? Wie können Sie sicherstellen, dass die Splines über die Begrenzungsknoten hinaus linear sind?dk(X)k=KdK(X)=00

Durin
quelle

Antworten:

16
  1. Beginnen wir mit der Betrachtung gewöhnlicher kubischer Splines. Sie sind kubisch zwischen jedem Knotenpaar und kubisch außerhalb der Grenzknoten. Wir beginnen mit 4df für die erste Kubikzahl (links vom ersten Randknoten), und jeder Knoten fügt einen neuen Parameter hinzu (da die Kontinuität von kubischen Splines und Ableitungen und zweiten Ableitungen drei Nebenbedingungen hinzufügt, sodass ein freier Parameter übrig bleibt) Parameter für K Knoten.K+4K

    Ein natürlicher kubischer Spline ist an beiden Enden linear. Dies beschränkt den kubischen und den quadratischen Teil auf 0, wobei jeder den df um 1 reduziert. Das sind 2 df an jedem der beiden Enden der Kurve, wodurch auf K reduziert wird .K+4K

    Stellen Sie sich vor, Sie entscheiden, dass Sie eine bestimmte Anzahl von Freiheitsgraden (z . B. ) für Ihre nicht parametrische Kurvenschätzung ausgeben können . Da das Auferlegen eines natürlichen Splines 4 Freiheitsgrade weniger beansprucht als ein gewöhnlicher kubischer Spline (bei gleicher Knotenanzahl), können Sie mit diesen p- Parametern 4 weitere Knoten (und damit 4 weitere Parameter) zum Modellieren der Kurve zwischen den Grenzknoten verwenden .pp

  2. Man beachte , daß die Definition für für die ist k = 1 , 2 , . . . , K - 2 (da es insgesamt K Basisfunktionen gibt). Die letzte Basisfunktion in dieser Liste ist also N K = d K - 2 - d K - 1 . So höchst k für Definitionen der benötigten d k für k = K - 1Nk+2k=1,2,...,K2KNK=dK2dK1kdkk=K1. (Das heißt, wir müssen nicht versuchen, herauszufinden, was ein tun könnte, da wir es nicht verwenden.)dK

Glen_b - Setzen Sie Monica wieder ein
quelle
3

2ξ1,ξ2],ξ1[]ξ1,ξ2[]ξ2,+[|I|=3|I|1=2 Knoten).

Für (gewöhnliche) kubische Splines

4|I|=12

1(X<ξ1)  ;  1(X<ξ1)X  ;  1(X<ξ1)X2  ;  1(X<ξ1)X3  ;
1(ξ1X<ξ2)  ;  1(ξ1X<ξ2)X  ;  1(ξ1X<ξ2)X2  ;  1(ξ1X<ξ2)X3  ;
1(ξ2X)  ;  1(ξ2X)X  ;  1(ξ2X)X2  ;  1(ξ2X)X3.

Crr=2(r+1)×(|I|1)=3×(|I|1)=6

126=6

Für natürliche kubische Splines

"Ein natürlicher kubischer Spline fügt zusätzliche Einschränkungen hinzu, nämlich, dass die Funktion über die Begrenzungsknoten hinaus linear ist."

4|I|4=12442

1(X<ξ1)  ;  1(X<ξ1)X  ;  
1(ξ1X<ξ2)  ;  1(ξ1X<ξ2)X  ;  1(ξ1X<ξ2)X2  ;  1(ξ1X<ξ2)X3  ;
1(ξ2X)  ;  1(ξ2X)X.

3×(|I|1)=6

86=2

ahstat
quelle