Vergleich logistischer Regressionskoeffizienten modellübergreifend?

11

Ich habe ein Logit-Modell entwickelt, das auf sechs verschiedene Sätze von Querschnittsdaten angewendet werden kann. Ich versuche herauszufinden, ob sich die inhaltliche Wirkung einer bestimmten unabhängigen Variablen (IV) auf die abhängige Variable (DV) ändert, die zu unterschiedlichen Zeiten und im Laufe der Zeit nach anderen Erklärungen sucht.

Meine Fragen sind:

Wie bewerte ich die Zunahme / Abnahme der Größe in der Assoziation zwischen IV und DV?
Kann ich einfach die verschiedenen Größen (Größen) der Koeffizienten in den Modellen betrachten oder muss ich einen anderen Prozess durchlaufen?
Wenn ich etwas anderes tun muss, was ist es und kann es getan werden / wie mache ich es in SPSS?

Auch innerhalb eines einzelnen Modells,
Kann ich die relative Größe unabhängiger Variablen basierend auf nicht standardisierten Bewertungen vergleichen, wenn alle mit 0-1 codiert sind, oder muss ich sie in standardisierte Bewertungen konvertieren?
Gibt es Probleme mit standardisierten Scores?

logistic spss Ejs
quelle

2

Dieser Artikel könnte von Interesse sein, dx.doi.org/10.1093/esr/jcp006 . Anscheinend ist der Vergleich von Effekten zwischen Logistikmodellen erheblich komplizierter als im Fall OLS!

Andy W

13

Ich werde mich hauptsächlich auf Ihre ersten drei Fragen konzentrieren. Die kurzen Antworten lauten: (1) Sie müssen die Wirkung der IV auf den DV für jeden Zeitraum vergleichen, aber (2) nur ein Vergleich der Größen kann zu falschen Schlussfolgerungen führen, und (3) es gibt jedoch viele Möglichkeiten, dies zu tun Kein Konsens darüber, welcher richtig ist.

Im Folgenden beschreibe ich, warum Sie Koeffizientengrößen nicht einfach vergleichen und auf einige Lösungen hinweisen können, an die bisher gedacht wurde.

Laut Allison (1999) werden logistische Regressionskoeffizienten im Gegensatz zu OLS von einer nicht beobachteten Heterogenität beeinflusst, selbst wenn diese Heterogenität nicht mit der interessierenden Variablen zusammenhängt.

Wenn Sie eine logistische Regression wie folgt anpassen:

(1)

\ln ((\frac{1}{1 - - p_{ich}}) = β_{0} + β_{1} x_{1 ich}

$\ln\bigg(\frac{1}{1-p_i}\bigg) = \beta_{0} + \beta_{1}x_{1i}$

Sie passen tatsächlich eine Gleichung an, die den Wert einer latenten Variablen vorhersagt , die die zugrunde liegende Neigung jeder Beobachtung darstellt, den Wert in der binär abhängigen Variablen anzunehmen. Was passiert, wenn über einem bestimmten Schwellenwert liegt? Die Gleichung dafür lautet (Williams, 2009): $y^*$ $1$ $y^*$

(2)

y^{*} = α_{0} + α_{1} x_{1 ich} + σ ε

$y^* =\alpha_{0} + \alpha_{1}x_{1i} + \sigma \varepsilon$

Es wird angenommen, dass der Begriff ; von den anderen Begriffen unabhängig ist und einer logistischen Verteilung folgt - oder einer Normalverteilung im Fall von Probit und einer logistischen Verteilung im Fall von komplementärem Log-Log und einer Cauchy-Verteilung im Fall von Cauchit . $\varepsilon$

Nach Williams (2009) stehen die Koeffizienten in Gleichung 2 in Beziehung zu den Koeffizienten in Gleichung 1 durch: $\alpha$ $\beta$

(3)

β_{j} = \frac{α_{j}}{σ} j = 1, . . ., J. .

$\beta_{j} = \frac{\alpha_{j}}{\sigma}\;\;j=1,...,J.$

In den Gleichungen 2 und 3 ist der Skalierungsfaktor der nicht beobachteten Variation, und wir können sehen, dass die Größe der geschätzten Koeffizienten von abhängt , was nicht beobachtet wird. Auf dieser Grundlage behaupten Allison (1999), Williams (2009) und Mood (2009) unter anderem, dass Sie Koeffizienten zwischen logistischen Modellen, die für verschiedene Gruppen, Länder oder Zeiträume geschätzt wurden, nicht naiv vergleichen können. $\sigma$ $\beta$ $\sigma$

Dies liegt daran, dass Vergleiche zu falschen Schlussfolgerungen führen können, wenn die nicht beobachteten Unterschiede zwischen Gruppen, Ländern oder Zeiträumen unterschiedlich sind. Beide Vergleiche mit unterschiedlichen Modellen und Interaktionstermen innerhalb desselben Modells leiden unter diesem Problem. Dies gilt neben logit auch für die Cousins probit, clog-log, cauchit und im weiteren Sinne für diskrete Zeitrisikomodelle, die mit diesen Link-Funktionen geschätzt werden. Bestellte Logit-Modelle sind ebenfalls davon betroffen.

Williams (2009) argumentiert, dass die Lösung darin besteht, die unbeobachtete Variation durch ein heterogenes Auswahlmodell (auch bekannt als Location-Scale-Modell) zu modellieren, und stellt ein dafür erforderliches Stata-Add-On bereit oglm (Williams 2010). In R können heterogene Auswahlmodelle an die hetglm()Funktion des glmxPakets angepasst werden, das über CRAN verfügbar ist. Beide Programme sind sehr einfach zu bedienen. Schließlich erwähnt Williams (2009) die PLUMRoutine von SPSS zum Anpassen dieser Modelle, aber ich habe sie nie verwendet und kann nicht sagen, wie einfach sie zu verwenden ist.

Es gibt jedoch mindestens ein Arbeitspapier, aus dem hervorgeht, dass Vergleiche mit heterogenen Auswahlmodellen noch verzerrter sein können, wenn die Varianzgleichung falsch angegeben ist oder ein Messfehler vorliegt.

Mood (2010) listet andere Lösungen auf, bei denen die Varianz nicht modelliert wird, sondern Vergleiche vorhergesagter Wahrscheinlichkeitsänderungen verwendet werden.

Anscheinend ist es ein Problem, das nicht geklärt ist, und ich sehe oft Beiträge auf Konferenzen meines Fachgebiets (Soziologie), die unterschiedliche Lösungen dafür finden. Ich würde Ihnen raten, sich anzusehen, was die Leute in Ihrem Bereich tun, und dann zu entscheiden, wie Sie damit umgehen sollen.

Verweise

Allison, PD (1999). Vergleich von Logit- und Probit-Koeffizienten über Gruppen hinweg. Sociological Methods & Research, 28 (2), 186–208.
Mood, C. (2010). Logistische Regression: Warum wir nicht tun können, was wir zu tun glauben und was wir dagegen tun können. European Sociological Review, 26 (1), 67–82.
Williams, R. (2009). Verwenden heterogener Auswahlmodelle zum Vergleichen von Logit- und Probit-Koeffizienten über Gruppen hinweg. Sociological Methods & Research, 37 (4), 531–559.
Williams, R. (2010). Anpassung heterogener Auswahlmodelle mit oglm. The Stata Journal, 10 (4), 540–567.

Kenji
quelle

Ich versuche, die Williams (2009) -Lösung in R zu implementieren, und es scheint, dass die neuen Versionen des glmx-Pakets nicht mehr die Funktion hetprob () haben. Wollten Sie nur prüfen, ob Sie dafür Alternativen kennen?

AliCivil

1

Ich habe glmx eine Weile nicht mehr benutzt und wusste nicht, dass es sich geändert hat. Jetzt ist es über CRAN verfügbar, und die für hereroskedastische Probit verwendete Funktion heißt anscheinend hetglm (). Ich werde diese Antwort aktualisieren, um dies später wiederzugeben (hier geht es um die Schlafenszeit). Ich hoffe, dass dies vorerst hilft.

Kenji

3

Gibt es Änderungen zwischen Datensätzen? Ich kann das beantworten, ohne die Daten zu sehen! Ja. Es gibt. Wie gross sind sie? Das ist der Schlüssel. Für mich ist der Weg zu sehen, indem ich schaue. Sie haben Quotenverhältnisse für jede unabhängige Variable für jeden Datensatz - unterscheiden sie sich in einer Weise, die Menschen interessant finden würden? Nun ist es wahr, dass jeder einen Standardfehler hat und so weiter, und es gibt wahrscheinlich Möglichkeiten zu sehen, ob sie sich statistisch signifikant voneinander unterscheiden, aber ist das wirklich eine interessante Frage? Wenn dies der Fall ist, besteht eine Möglichkeit, es einfach mit Software zu testen, darin, alle Studien zu kombinieren und "Studie" als weitere unabhängige Variable einzuschließen. Sie können dann sogar Interaktionen testen, wenn Sie möchten. Ob Sie dies tun möchten, hängt von Ihren inhaltlichen Fragen ab.

Beim Vergleich von Variablen innerhalb eines Modells besteht das Hauptproblem bei standardisierten Scores darin, dass sie für Ihre bestimmte Stichprobe standardisiert sind. Die Parameterschätzungen usw. beziehen sich dann auf Standardabweichungen der Variablen in Ihrer speziellen Stichprobe. Selbst wenn Ihre Stichprobe wirklich eine Zufallsstichprobe aus einer bestimmten Population ist, weist sie (geringfügig) andere Standardabweichungen von anderen Zufallsstichproben auf. Das macht die Dinge verwirrend.

Das andere Problem ist, was die Frage der "relativen Größe" überhaupt bedeutet. Wenn Ihre IVs gut verstandene Dinge sind, können Sie die OPs über Bereiche hinweg vergleichen, die etwas bedeuten.

Peter Flom - Monica wieder einsetzen
quelle

Das ist nützlich, danke Peter. Der Grund, warum ich die erste Frage gestellt habe, ist, dass ich genau das gesehen habe - Vergleiche von Koeffizienten zwischen Modellen innerhalb einer Stichprobe und Vergleiche zwischen Modellen aus verschiedenen Stichproben - in referierten Arbeiten. Ich hatte nicht das Gefühl, dass es der richtige Ansatz war, und offensichtlich habe ich Recht. Kann ich in Bezug auf die technischen Details nicht einfach ein Modell für alle sechs Stichproben und einen Interaktionsterm zwischen dem zu vergleichenden Schlüsselprädiktor und einer Variablen, die jede Stichprobe angibt (die einen anderen Zeitraum darstellt), schätzen? Hast du das gesagt?

Benötige

Hallo @ejs. Sie müssten "sample" genauso codieren wie jede andere kategoriale Variable - Dummy-Codierung oder Effektcodierung oder was auch immer.

Peter Flom - Monica wieder einsetzen

In Bezug auf Interaktionen ... ja, es kann schwierig sein, sie zu interpretieren. Ich mag einen grafischen Ansatz, um zu zeigen, was sie bedeuten.

Peter Flom - Monica wieder einsetzen

3

Guilherme ist hier auf dem Geld. Während die anderen Antworten nützlich sind, beachten Sie bitte, dass sich die logistische Regression (und alle nichtlinearen Regressionen wie Poisson) grundlegend von der linearen Regression unterscheidet. Es kann schwerwiegende Probleme mit dem Logit-Skalierungsfaktor geben, wenn dieselbe Analyse für sechs verschiedene Datensätze ausgeführt und diese Analyse dann für den kombinierten Datensatz ausgeführt wird. Änderungen der Koeffizienten haben möglicherweise nichts mit bedeutenden Unterschieden zu tun (auch wenn sie statistisch signifikant oder inhaltlich wichtig sind). Sie könnten alles mit unbeobachteter Heterogenität zwischen den Proben zu tun haben. Das muss man unbedingt testen. Viele (wenn nicht die meisten) Forscher in den Bereichen Sozial- und Politikwissenschaft ignorieren dies. Guilherme gibt die wegweisenden Artikel dazu, die ich jedem empfehlen kann. Peters Vorschläge sind praktisch, Durch einfaches Codieren einer Dummy-Variablen für die Stichprobe, aus der die Daten stammen, wird diese Heterogenität des Skalierungsfaktors jedoch nicht berücksichtigt. Sie können dies in linearer Regression tun, und die Heterogenität sollte Ihre Koeffizienten nicht beeinflussen, aber hier kann es sein.

Ein weiterer Aspekt für den Effekt einer unbeobachteten Heterogenität, die nur bei logit vs. linearer Regression auftritt, ist der Effekt verschiedener Regressoren in jedem Datensatz. Wenn Sie nicht dieselben Variablen haben oder wahrscheinlich unterschiedlich gemessen werden, haben Sie eine Form der ausgelassenen Variablenverzerrung. Anders als bei der linearen Regression kann eine ausgelassene Variable, die orthogonal zu Ihrem Schlüsselregressor ist, Ihre Schätzung immer noch beeinflussen. Wie Cramer es ausdrückt:

$\hat β$ $\hat β$

Cramer weist auch darauf hin, dass die Koeffizientenschätzungen nach unten verzerrt sind, wenn eine Variable weggelassen wird, die partiellen Ableitungen jedoch nicht. Dies ist ziemlich kompliziert und Sie sollten den Artikel lesen, um eine klarere Erklärung zu erhalten. Der allgemeine Punkt ist, dass Sie nicht ausschließlich die Log-Quoten oder Quotenverhältnisse betrachten. Berücksichtigen Sie vorhergesagte Wahrscheinlichkeiten und Ableitungen. Weitere Informationen finden Sie im Befehl margin in Stata. JD Long hat ein Papier, das hier ins Detail geht.

Schließlich gibt es eine Reihe von Artikeln, für die Sie bei Google Interaktionsbegriffe in Logit-Modellen diskutieren können. Mein Verständnis war, dass der Logit-Koeffizient für eine Interaktion als Richtwert dient, aber nicht endgültig ist, insbesondere wenn Sie die Koeffizienten lieber als potenzierte Quotenverhältnisse betrachten möchten. Das Betrachten der vorhergesagten Wahrscheinlichkeiten und des durchschnittlichen Randeffekts ist besser (siehe auch die Dokumentation zum Befehl margin von Stata für die Protokollierung, auch wenn Sie SPSS verwenden, ist dies dennoch hilfreich).

Ich bin mit SPSS nicht vertraut genug, um zu wissen, wie dieses Paket mit diesen Problemen umgehen kann, aber ich sage Folgendes: Wenn Sie sich mit tieferen statistischen Problemen wie diesen befassen, ist dies ein Hinweis darauf, dass es Zeit für Sie ist, zu einem weiteren zu wechseln flexibles, anspruchsvolles Paket wie Stata oder R.

robin.datadrivers
quelle

+1 für die Empfehlung von Randeffekten und für die Empfehlung, nach R. zu ziehen

Kenji

1

Ein weiteres nützliches Werkzeug ist der standardisierte Regressionskoeffizient oder zumindest eine grobe Pseudoversion. Sie können eine solche Version erhalten, indem Sie Ihren erhaltenen Koeffizienten mit der Standardabweichung des Prädiktors multiplizieren. (Es gibt andere Versionen und einige Debatten über die beste, z. B. siehe Menard 2002, Applied Logistic Regression Analysis ( Google-Bücher )). Auf diese Weise können Sie die Stärke des Effekts in verschiedenen Studien beurteilen.

rolando2
quelle

Vergleich logistischer Regressionskoeffizienten modellübergreifend?

Antworten: