Welche Interpretation haben die Parameter eines verallgemeinerten linearen Modells mit Effektcodierung?

9
library(lme4)
    out <- glmer(cbind(incidence, size - incidence)
                 ~ period
                 + (1 | herd),
                 data = cbpp,
                 family = binomial,
                 contrasts = list(period = "contr.sum"))

summary(out)
Fixed effects:
            Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.32337    0.22129 -10.499  < 2e-16 ***
period1      0.92498    0.18330   5.046 4.51e-07 ***
period2     -0.06698    0.22845  -0.293    0.769
period3     -0.20326    0.24193  -0.840    0.401

Ich war nie in einer Situation, in der ich ein verallgemeinertes lineares Modell mit Effektcodierung ( contr.sumfür RBenutzer) anpassen musste . Kann ich die gleiche Interpretation wie im Fall des linearen Modells anwenden? In einem normalen linearen Modell wäre der Schnittpunkt den großen Mittelwert und die s (Parameter für , , und die Effekte , dh wie die Faktorstufen von dem Gesamtmittelwert abweichen.βperiod1period2period3period4 = (Intercept) - period1 - period2 - period3

Hier ist, wie ich denke, die analoge Interpretation für verallgemeinerte lineare Modelle. (Ich werde alle Parameter potenzieren und verwandeln damit die Log-Odds (-ratios) zu Quoten (-ratios)) . Der Schnittpunkt wäre dann die Gesamt Chancen auf Erfolg gegen Ausfall ( hier an der klassischen Binomialterminologie festhalten) und die s die Log-Odds-Verhältnisse . Und wir erhalten die Chancen, indem wir beispielsweise und dann : . Ist der wirklich die Gesamt- / Mittelquote und die sexp((Intercept))βperiod1(Intercept)+period1exp((Intercept)+period1)(Intercept)βQuotenverhältnisse ?

lord.garbage
quelle

Antworten:

3

Bei der Effektcodierung ist der Achsenabschnitt in der Zusammenfassungstabelle (out) das durchschnittliche Logit (Log-Odds oder das Log-of-Odds-Verhältnis) über alle vier Perioden in Ihrem Fall, und jeder der anderen Effekte ist die Logit-Differenz der entsprechender Zeitraum relativ zum durchschnittlichen Logit.

Sie können Ihre Interpretation leicht überprüfen, indem Sie Ihre aktuellen Ergebnisse mit einer anderen Codierungsmethode vergleichen, z. B. Dummy-Codierung Ihrer Daten:

out2 <- glmer(cbind(incidence, size - incidence)
                 ~ period
                 + (1 | herd),
                 data = cbpp,
                 family = binomial,
                 contrasts = list(period = "contr.treatment"))

summary(out2)
Bluepole
quelle
1
Ich würde argumentieren, dass der Achsenabschnitt kein Quotenverhältnis ist , sondern die durchschnittlichen Quoten und nur die Koeffizienten ( 's) Quotenverhältnisse sind . Der gibt Ihnen die durchschnittlichen Quoten (nach dem Potenzieren) und wenn Sie das Log-Odds-Verhältnis von zB zu den Log-Quoten von und diese Summe dann Sie haben die Chancen für . Ich denke, dass es wichtig ist, Quotenverhältnisse und Quoten wirklich auseinander zu halten . Ersteres ist ein Verhältnis zwischen den Gewinnchancen. Letzteres ist die Wahrscheinlichkeit von Erfolg und Misserfolg (in einem Binomialmodell).(Intercept) period1 (Intercept) period1β(Intercept)period1(Intercept)period1
lord.garbage
Pet deinen Kommentar, ich habe meine Antwort ein wenig bearbeitet. Sehen Sie, ob es jetzt besser ist.
Bluepole