Testen der Nichtlinearität in der logistischen Regression (oder anderen Formen der Regression)

13

Eine der Voraussetzungen für eine logistische Regression ist die Linearität des Logits. Sobald ich mein Modell zum Laufen gebracht habe, teste ich es mit dem Box-Tidwell-Test auf Nichtlinearität. Einer meiner kontinuierlichen Prädiktoren (X) wurde positiv auf Nichtlinearität getestet. Was soll ich als nächstes tun?

Da dies einen Verstoß gegen die Annahmen darstellt, soll ich den Prädiktor (X) entfernen oder die nichtlineare Transformation (X * X) einbeziehen. Oder die Variable in eine kategoriale umwandeln? Wenn Sie eine Referenz haben, können Sie mich auch darauf hinweisen?

tosonb1
quelle

Antworten:

5

Es kann angebracht sein, eine nichtlineare Transformation von x einzuschließen , aber wahrscheinlich nicht einfach x × x , dh x 2 . Ich glaube, Sie können dies als nützliche Referenz für die Bestimmung der zu verwendenden Transformation ansehen:

GEP Box und Paul W. Tidwell (1962). Transformation der unabhängigen Variablen. Technometrics Volume 4 Number 4, pages 531-550.http://www.jstor.org/stable/1266288

Einige halten die Box-Tidwell Familie von Transformationen zu mehr allgemeiner als für die Interpretierbarkeit und Kargheit oft angemessen ist. Patrick Royston und Doug Altman haben in einer einflussreichen Arbeit von 1994 den Begriff fraktionale Polynome für Box-Tidwell-Transformationen mit einfachen rationalen Potenzen eingeführt:

P. Royston und DG Altman (1994). Regression unter Verwendung fraktioneller Polynome kontinuierlicher Kovariaten: sparsame parametrische Modellierung. Angewandte Statistik Band 43: Seiten 429–467. http://www.jstor.org/stable/2986270

Insbesondere Patrick Royston hat weiter daran gearbeitet und sowohl Artikel als auch Software veröffentlicht, was in einem Buch mit Willi Sauerbrei gipfelte:

P. Royston und W. Sauerbrei (2008). Multivariable Modellbildung: Ein pragmatischer Ansatz zur Regressionsanalyse basierend auf fraktionellen Polynomen zur Modellierung kontinuierlicher Variablen . Chichester, Großbritannien: Wiley. ISBN 978-0-470-02842-1

ein Stop
quelle
4

Vergessen Sie nicht, nach Interaktionen zwischen X und anderen unabhängigen Variablen zu suchen. Unmodellierte Interaktionen können dazu führen, dass X nicht linear wirkt, wenn es einfach nicht additiv ist.

Conjugateprior
quelle
Guter Punkt. Ich bin nur auf das Gegenteil gestoßen: Die Annahme, dass ein Effekt linear ist, wenn er nicht ist, kann zu falschen statistischen Beweisen für multiplikative Interaktionsterme führen.
am
1
@onestop, hast du einen Hinweis dazu? Ich glaube es, aber ich habe Probleme, genau herauszufinden, warum das passieren würde.
Makro