Kontext : Ich möchte eine Linie in einem Streudiagramm zeichnen, die nicht parametrisch erscheint, daher verwende ich geom_smooth()
in ggplot
in R
. Es gibt automatisch geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use 'method = x' to change the smoothing method.
GAM-Stände für verallgemeinerte additive Modelle zurück und verwendet einen kubischen Spline.
Sind die folgenden Wahrnehmungen richtig?
Löss schätzt die Antwort auf bestimmte Werte.
Splines sind Approximationen, die unterschiedliche stückweise Funktionen verbinden, die zu den Daten passen (die das verallgemeinerte additive Modell bilden), und kubische Splines sind der hier verwendete spezifische Spline-Typ.
Wann sollten Splines verwendet werden, wann sollte LOESS verwendet werden?
quelle
gam
Funktion um die aus dem Paket handeltgam
, werden sowohl Splines als auch lokale Polynomglättung ausgeführt. LOESS ist eine spezielle Implementierung der lokalen Polynomglättung, bei der zusätzliche Elemente hinzugefügt werden (z. B. das Herabgewichten großer Residuen).Antworten:
Am wichtigsten ist die Anzahl der effektiven Freiheitsgrade, die Sie für jeden Ansatz festlegen. Für nichtparametrische Glätter wie Löß wird dies durch die Bandbreite gesteuert, während für Regressionssplines die df offensichtlicher sind und ein df für jeden hinzugefügten Knoten ausgegeben wird. Sowohl Löß und Splines sind Abschätzen Beziehungen zwischen und . Splines sind allgemeiner in dem Sinne, dass sie in einer größeren Vielfalt von Kontexten verwendet werden können.X Y.
quelle