Ich bin daran interessiert, eine Alternative zur Polynominterpolation zu lernen (und zu implementieren).
Es fällt mir jedoch schwer, eine gute Beschreibung zu finden, wie diese Methoden funktionieren, in welcher Beziehung sie zueinander stehen und wie sie miteinander verglichen werden.
Ich würde mich über Ihre Beiträge zu den Vor- / Nachteilen / Bedingungen freuen, unter denen diese Methoden oder Alternativen nützlich wären, aber einige gute Verweise auf Texte, Folien oder Podcasts würden ausreichen.
interpolation
splines
David LeBauer
quelle
quelle
Antworten:
Die grundlegende OLS-Regression ist eine sehr gute Technik zum Anpassen einer Funktion an einen Datensatz. Eine einfache Regression passt jedoch nur auf eine gerade Linie, die für den gesamten möglichen Bereich von konstant ist . Dies ist für eine bestimmte Situation möglicherweise nicht angemessen. Beispielsweise weisen Daten manchmal eine krummlinige Beziehung auf. Dies kann durch Regression von auf eine Transformation von , . Verschiedene Transformationen sind möglich. In Situationen , in denen die Beziehung zwischen und ist monoton , sondern verjüngt sich kontinuierlich aus, ein TransformationsprotokollX Y X f(X) X Y kann verwendet werden. Eine andere beliebte Wahl ist die Verwendung eines Polynoms, bei dem neue Terme durch Erhöhen von auf eine Reihe von Potenzen (z. B. , usw.) gebildet werden. Diese Strategie ist einfach zu implementieren, und Sie können die Anpassung so interpretieren, dass sie angibt, wie viele Biegungen in Ihren Daten vorhanden sind (wobei die Anzahl der Biegungen der höchsten benötigten Leistung minus 1 entspricht). X X2 X3
Regressionen, die auf dem Logarithmus oder einem Exponenten der Kovariate basieren, passen jedoch nur dann optimal, wenn dies die genaue Natur der wahren Beziehung ist. Man kann sich durchaus vorstellen, dass es eine krummlinige Beziehung zwischen und , die sich von den Möglichkeiten unterscheidet, die diese Transformationen bieten. Damit kommen wir zu zwei weiteren Strategien. Der erste Ansatz ist Löss , eine Reihe gewichteter linearer Regressionen, die über ein sich bewegendes Fenster berechnet werden. Dieser Ansatz ist älter und besser für die explorative Datenanalyse geeignet .X Y
Der andere Ansatz ist die Verwendung von Splines. Im einfachsten Fall ist ein Spline ein neuer Begriff, der nur für einen Teil des Bereichs von . Beispielsweise kann Bereich von 0 bis 1 liegen, und der Spline-Term kann nur im Bereich von 0,7 bis 1 liegen. In diesem Fall ist 0,7 der Knoten . Ein einfacher linearer Spline-Term würde folgendermaßen berechnet: und werden Sie Ihrem Modell zusätzlich zum ursprünglichen hinzufügenX X
Die einfachste Einführung in diese Themen, die ich kenne, ist:
quelle
Cosma Shalizis Online-Notizen zu seiner Vorlesung Fortgeschrittene Datenanalyse aus elementarer Sicht sind zu diesem Thema ziemlich gut, wenn man Dinge aus einer Perspektive betrachtet, in der Interpolation und Regression zwei Ansätze für dasselbe Problem sind. Ich möchte Ihre Aufmerksamkeit besonders auf die Kapitel über Glättungsmethoden und Splines lenken .
quelle