Gibt es jemals einen Grund, bei der Anpassung von Regressionen keine orthogonalen Polynome zu verwenden?

13

Im Allgemeinen frage ich mich, ob es immer besser ist, keine orthogonalen Polynome zu verwenden, wenn eine Regression mit Variablen höherer Ordnung angepasst wird. Insbesondere frage ich mich mit der Verwendung von R:

Wenn poly()mit raw = FALSEdie gleichen angepassten Werte liefert wie poly()mit raw = TRUEund polymit raw = FALSEeinige der Probleme löst, die mit Polynomregressionen verbunden sind, sollte poly()mit dann raw = FALSE immer für die Anpassung von Polynomregressionen verwendet werden? Unter welchen Umständen wäre es besser, nicht zu verwenden poly()?

user2374133
quelle

Antworten:

16

Schon mal einen Grund? Sicher; wahrscheinlich mehrere.

Stellen Sie sich zum Beispiel vor, wo ich an den Werten der Rohkoeffizienten interessiert bin (um sie beispielsweise mit hypothetischen Werten zu vergleichen), und Kollinearität ist kein besonderes Problem. Es ist so ziemlich derselbe Grund, warum ich in der gewöhnlichen linearen Regression (die das lineare orthogonale Polynom ist) oft kein Zentrum meine.

Es sind keine Dinge, mit denen Sie nicht über orthogonale Polynome umgehen können. Es ist mehr eine Frage der Bequemlichkeit, aber Bequemlichkeit ist ein großer Grund, warum ich viele Dinge tue.

Das heißt, ich neige in vielen Fällen zu orthogonalen Polynomen, während ich Polynome anpasse, da sie einige eindeutige Vorteile haben.

Glen_b - Setzen Sie Monica wieder ein
quelle
ist es möglich, die aus einer orthogonalen Polynomregression resultierenden Koeffizienten mit hypothetischen Werten zu vergleichen?
user2374133
2
Ja. Sie können sie beispielsweise aus den "rohen" Polynomen in die implizierten Koeffizienten und Standardfehler zurücktransformieren.
Glen_b
2
Meistens ist das Umwandeln von der orthogonalen Polynombasis in die Monombasis ein schlecht konditionierter Prozess (für hohe Grade; eine Umwandlung in einen niedrigen Grad ist nicht schlecht). Wenn man sich also a priori für die Koeffizienten der Monombasis interessiert, sind alle Die numerische Stabilität, die Sie durch die Verwendung der orthogonalen Polynome erhalten haben, wird bei der Konvertierung aus dem Fenster geworfen. Daher können Sie zu Beginn auch Monome verwenden. Vorbehalt natürlich.
JM ist kein Statistiker
1
@JM Danke, das ist ein hervorragender Punkt. Glücklicherweise ist es heutzutage in statistischen Anwendungen sehr selten, mehr als ein Polynom niedriger Ordnung zu passen (mein üblicher Rat ist, dass man sich verschiedene Ansätze ansehen sollte, wenn es keinen starken theoretischen Grund gibt, über Grad drei oder vier hinauszugehen) Dies hängt von den jeweiligen Umständen ab, kann jedoch für bestimmte Situationen geeignet sein (z. B. Splines).
Glen_b -Reinstate Monica
13

Denn wenn Ihr Modell R verlässt, wenn es erwachsen wird, müssen Sie daran denken, seine Zentrierungs- und Normalisierungskonstanten zu packen, und dann muss es sie die ganze Zeit schleppen. Stellen Sie sich vor, Sie stoßen eines Tages darauf, fest in SQL programmiert, und der Schrecken, zu bemerken, dass es sie verlegt hat!

Scortchi - Wiedereinsetzung von Monica
quelle