Multiple Regression in der Richtungs- / Zirkularstatistik?

9

Ich versuche, ein Vorhersagemodell für eine winkelabhängige Variable (auf zu entwickeln, indem ich mehrere unabhängige Messungen - auch Winkelvariablen auf - als Prädiktoren verwende. Jeder Prädiktor ist signifikant, aber nicht extrem stark mit der abhängigen Variablen korreliert. Wie kann ich die Prädiktoren kombinieren, um ein Vorhersagemodell für die abhängige Variable zu bestimmen, das in gewissem Sinne optimal ist? Und wie kann ich die stärksten Prädiktoren genau identifizieren?[ 0 , 2 π ][0,2π]])[0,2π]]

Für Variablen in euklidischen Räumen würde ich eine multiple Regressions- (oder ähnliche) und Hauptkomponentenanalyse verwenden. Die Periodizität aller Variablen, die mit diesen Ansätzen in Konflikt geraten, z. B. 0,02, muss jedoch stark mit 6,26 korrelieren, nicht jedoch mit 3,14. Wie werden "die üblichen" Verfahren auf Richtungs- / Zirkelstatistiken verallgemeinert? Alle Einsichten oder Verweise auf nützliche Referenzen wären nützlich. (Die Texte von N. Fisher und Mardia & Jupp sind mir bereits bekannt, ich habe jedoch keinen praktischen Zugang zu diesen.)

user44436
quelle

Antworten:

5

In dem Buch, das ich habe, heißt es, dass erst kürzlich einige Artikel begonnen haben, die multivariate Regression zu untersuchen, bei der eine oder mehrere Variablen zirkulär sind. Ich habe sie nicht selbst überprüft, aber relevante Quellen scheinen zu sein:

Bhattacharya, S. und SenGupta, A. (2009). Bayesianische Analyse semiparametrischer linear-kreisförmiger Modelle. Journal of Agricultural, Biological and Environmental Statistics , 14, 33-65.

Lund, U. (1999). Regression der geringsten kreisförmigen Entfernung für Richtungsdaten. Journal of Applied Statistics , 26, 723-733

Lund, U. (2002). Baumbasierte Regression oder eine zirkuläre Antwort. Mitteilungen in der Statistik - Theorie und Methoden , 31, 1549-1560.

Qin, X., Zhang, J.-S. und Yan, X.-D. (2011). Ein nichtparametrisches zirkular-lineares multivariates Regressionsmodell mit einer Faustregel für die Bandbreitenauswahl. Computer und Mathematik mit Anwendungen , 62, 3048-3055.


Für den Fall, dass Sie für eine zirkuläre Antwort nur einen einzigen zirkulären Regressor haben (was meines Erachtens bei Ihnen nicht der Fall ist, aber möglicherweise auch separate Regressionen von Interesse wären), gibt es eine Möglichkeit, das Modell zu schätzen. [1] empfehlen die Anpassung eines allgemeinen linearen Modells

cos(Θj)=γ0c+k=1m(γckccos(kψj)+γskcSünde(kψj))+ε1j,
Sünde(Θj)=γ0s+k=1m(γckscos(kψj)+γsksSünde(kψj))+ε2j.

Das Gute ist, dass dieses Modell mit der Funktion lm.circular aus dem Rundschreiben der R-Bibliothek geschätzt werden kann .

[1] Jammalamadaka, SR und SenGupta, A. (2001). Themen in der Kreisstatistik . World Scientific, Singapur.

Julius Vainora
quelle
1

Sie können sich diese Artikel ansehen, die sich mit multipler Regression befassen, wenn die abhängige Variable kreisförmig oder sphärisch ist. Der Ansatz basiert auf der projizierten Normalverteilung.

Hernandez-Stumpfhauser, Daniel, F. Jay Breidt und Mark J. van der Woerd. "Die allgemein projizierte Normalverteilung beliebiger Dimensionen: Modellierung und Bayes'sche Inferenz." Bayesian Analysis 12.1 (2017): 113 & ndash; 133.

Wang, Fangpo und Alan E. Gelfand. "Richtungsdatenanalyse unter der allgemein projizierten Normalverteilung." Statistical Methodology 10.1 (2013): 113-127

Nuñez-Antonio, Gabriel, Eduardo Gutiérrez-Peña und Gabriel Escarela. "Ein Bayes'sches Regressionsmodell für zirkuläre Daten basierend auf der projizierten Normalverteilung." Statistical Modeling 11.3 (2011): 185-201.

Presnell, Brett, Scott P. Morrison und Ramon C. Littell. "Projizierte multivariate lineare Modelle für Richtungsdaten." Journal of the American Statistical Association 93.443 (1998): 1068 & ndash; 1077.

Dieser letzte war der erste, der diesen projizierten normalen Ansatz verwendete

user160744
quelle