Verwendung von Kreisprädiktoren in der linearen Regression

19

Ich versuche, ein Modell unter Verwendung von Winddaten (0, 359) und Tageszeit (0, 23) anzupassen, befürchte jedoch, dass sie schlecht in eine lineare Regression passen, da sie selbst keine linearen Parameter sind. Ich möchte sie mit Python transformieren. Ich habe einige Erwähnungen gesehen, wie man einen Vektormittelwert berechnet, indem man die Sünde und den Lattich der Grade nimmt, zumindest im Windfall, aber nicht viel.

Gibt es eine Python-Bibliothek oder eine relevante Methode, die hilfreich sein könnte?

compguy24
quelle
1
Vielen Dank, dass Sie dies als Frage gestellt haben. Beachten Sie, dass die Abfrage von Code oder Bibliotheken nicht zum Thema gehört (der Großteil Ihrer Frage ist sicherlich themenbezogen), sodass dieser Aspekt möglicherweise von den Antworten hier abgedeckt wird.
gung - Reinstate Monica
Was ist hier die Antwortvariable (Ergebnis, abhängige Variable)? Sind Windrichtung und Tageszeit beide Prädiktoren?
Nick Cox
@NickCox Ja, sowohl die Windrichtung als auch die Tageszeit sind Prädiktoren. Das Ergebnis ist ein ganzzahliger Wert, der die Partikelkonzentration (Luftverschmutzung) darstellt. Es gibt auch andere Prädiktoren, einschließlich Temperatur, Luftfeuchtigkeit usw., aber ich glaube, diese müssen nicht transformiert werden.
compguy24
1
Ich habe mir erlaubt, den Titel zu bearbeiten. Der vorherige Titel "Lineare Gradverteilung um einen Kreis" hat die Frage aus meiner Sicht überhaupt nicht erfasst.
Nick Cox

Antworten:

23

Die Windrichtung (hier in Grad gemessen, vermutlich als Kompassrichtung im Uhrzeigersinn von Norden) ist eine kreisförmige Variable. Der Test ist, dass der konventionelle Anfang der Skala derselbe ist wie das Ende, dh . Wenn es als Prädiktor behandelt wird, ist es wahrscheinlich am besten auf Sinus und Cosinus abgebildet. Unabhängig von Ihrer Software ist es wahrscheinlich, dass Winkel im Bogenmaß gemessen werden, sodass die Konvertierung in etwa gleichwertig ist0=360

Sünde(π Richtung/180),cos(π Richtung/180)

2π=360

Sünde(π Zeit/12),cos(π Zeit/12)

oder

Sünde(π(Zeit+0,5)/12),cos(π(Zeit+0,5)/12)

je nachdem wie genau die zeit erfasst wurde oder interpretiert werden soll.

Manchmal ist die Natur oder die Gesellschaft zuvorkommend und die Abhängigkeit von der kreisförmigen Variablen nimmt die Form einer Richtung an, die für die Reaktion optimal ist, und die entgegengesetzte Richtung (der halbe Kreis ist entfernt) ist pessimal. In diesem Fall kann ein einzelner Sinus- und Cosinus-Ausdruck ausreichen. Für kompliziertere Muster benötigen Sie möglicherweise andere Begriffe. Für viel mehr ins Detail ein Tutorial auf dieser Technik von Kreis-, Fourier, periodisch, trigonometrischer Regression fand sich hier , mit wiederum weiteren Referenzen. Die gute Nachricht ist, dass einmal erstellte Sinus- und Cosinus-Terme nur zusätzliche Prädiktoren für Ihre Regression sind.

Es gibt eine große Literatur zur Zirkelstatistik, die selbst als Teil der Richtungsstatistik angesehen wird. Seltsamerweise wird diese Technik häufig nicht erwähnt, da der Schwerpunkt in dieser Literatur üblicherweise auf zirkulären Antwortvariablen liegt. Das Zusammenfassen von zirkulären Variablen mit ihren Vektormitteln ist eine beschreibende Standardmethode, für die Regression jedoch nicht erforderlich oder direkt hilfreich.

Einige Details zur Terminologie Windrichtung und Tageszeit sind statistisch gesehen Variablen, keine Parameter, unabhängig von der Verwendung in Ihrem Fachgebiet.

yXββX[-1,1]

Zufälliger Kommentar Für eine Antwortvariable wie die Partikelkonzentration würde ich erwarten, ein verallgemeinertes lineares Modell mit logarithmischer Verknüpfung zu verwenden, um positive Vorhersagen zu gewährleisten.

Nick Cox
quelle