Wie interpretiere ich den Intercept-Term in einem GLM?

20

Ich verwende R und habe meine Daten mit GLM mit Binomial Link analysiert.

Ich möchte wissen, was die Bedeutung des Abschnitts in der Ausgabetabelle ist. Der Achsenabschnitt für eines meiner Modelle unterscheidet sich erheblich, die Variable jedoch nicht. Was bedeutet das?

Was ist der Schnittpunkt? Ich weiß nicht, ob ich mich nur verwirre, aber nachdem ich im Internet gesucht habe, gibt es nichts zu sagen, es ist dies, beachte es ... oder nicht.

Bitte helfen Sie, ein sehr frustrierter Student


glm(formula = attacked_excluding_app ~ treatment, family = binomial, 
    data = data)
Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-2.3548   0.3593   0.3593   0.3593   0.3593  
Coefficients:
                         Estimate Std. Error z value Pr(>|z|)   
(Intercept)                 2.708      1.033   2.622  0.00874 **
treatmentshiny_non-shiny    0.000      1.461   0.000  1.00000

(Dispersion parameter for binomial family taken to be 1)
Null deviance: 14.963  on 31  degrees of freedom
Residual deviance: 14.963  on 30  degrees of freedom
(15 observations deleted due to missingness)
AIC: 18.963
Number of Fisher Scoring iterations: 5
Samuel Waldron
quelle
1
Was ist die Verknüpfungsfunktion, die Sie in glm angeben?
Tomas
5
Der Achsenabschnitt ist der vorhergesagte Wert der abhängigen Variablen, wenn alle unabhängigen Variablen 0 sind. Ohne weitere Informationen zu Ihrem Modell kann ich nicht sagen, ob dies in Ihrem Fall sinnvoll ist.
Peter Flom - Reinstate Monica

Antworten:

21

Der Achsenabschnitt ist der Achsenabschnitt im linearen Teil der GLM-Gleichung. Ihr Modell für den Mittelwert lautet also , wobei g Ihre Verknüpfungsfunktion und X β Ihr lineares Modell ist. Dieses lineare Modell enthält einen "Abfangbegriff", dh:E[Y]=g1(Xβ)gXβ

Xβ=c+X1β1+X2β2+

In Ihrem Fall ist der Achsenabschnitt deutlich ungleich Null, die Variable jedoch nicht

Xβ=c0

Weil Ihre Verknüpfungsfunktion dann binomisch ist

g(μ)=ln(μ1μ)

Mit nur dem Intercept-Term lautet Ihr angepasstes Modell für den Mittelwert:

E[Y]=11+ec

Sie können sehen, dass wenn ist, dies einfach einer 50: 50-Chance entspricht, Y = 1 oder 0 zu erhalten, dh E [ Y ] = 1c=0E[Y]=11+1=0,5

Ihr Ergebnis besagt also, dass Sie das Ergebnis nicht vorhersagen können, aber eine Klasse (1 oder 0) ist wahrscheinlicher als die andere.

Corone
quelle
2
Du hast mich erschreckt bei E [Y] = .... :). Vielen Dank für die Antwort, ich verstehe (irgendwie), was Sie sagen. Sie sagten, dass der Schnittpunkt Sig ist. nicht Null, aber die var. ist nicht, es ist p = 1,00 !? Wie wirken sich die Variablen p-Wert auf das aus, was ich über das Ergebnis sagen kann?
Samuel Waldron
2
Wenn der p-Wert einer Variablen nicht klein ist, wird diese Variable normalerweise nicht in das Modell aufgenommen. In Ihrem Fall wird die Variable nicht einmal auf einen Wert ungleich Null geschätzt, daher der p-Wert von 1,00. Grundsätzlich besteht kein Zusammenhang zwischen "Behandlung" und "attacked_excluding_app". Das Fehlen einer Beziehung ist hier so perfekt, dass es fast verdächtig ist, obwohl Sie einen kleinen Datensatz haben. Es könnte sich lohnen, Ihre Daten zu visualisieren und zu prüfen, ob dies sinnvoll ist.
Corone
2
+1 für Antwort (und Hinweis im Kommentar, dass etwas Ungewöhnliches im Datensatz passiert), obwohl ich mit dem Öffnen Ihres Kommentars nicht einverstanden bin Modell." Dies ist nicht unbedingt so - oft möchte man die Größe einer Beziehung angeben, auch wenn sie nicht "signifikant" ist (und mehr noch, wenn Sie daran interessiert waren, eine Beziehung zu modellieren, ist dies ein Null-Ergebnis Immer noch wichtig zu berichten.)
James Stanley
1
@James - sehr guter Punkt, man sollte immer angeben, welche Variablen Sie getestet haben - ich hätte klarer sein sollen, ich meinte nur, dass man diese Variable normalerweise nicht einbezieht, wenn man versucht, das Modell zur Erstellung einer Vorhersage zu verwenden (da dies normalerweise eine Überanpassung bedeutet) ).
Corone
@Corone - Ich interessiere mich besonders für Ihre Kommentare zu variablem Ein-
rolando2
5

Es sieht für mich so aus, als ob es ein Problem mit den Daten geben könnte. Es ist merkwürdig, dass die Parameterschätzung für den Koeffizienten 0,000 betragen würde. Es sieht so aus, als ob sowohl Ihre DV als auch Ihre IV dichotom sind und dass die Proportionen Ihrer DV mit Ihrer IV überhaupt nicht variieren. Ist das richtig?

Der Schnittpunkt ist, wie ich in meinem Kommentar bemerkt habe (und wie die Antwort von @corone impliziert), der Wert des DV, wenn die IV 0 ist. Wie wurde Ihre IV codiert? Die Tatsache, dass der Schätzwert für den Koeffizienten 0,000 beträgt, impliziert jedoch, dass die IV keinen Unterschied macht.

log(p1p)

Peter Flom - Wiedereinsetzung von Monica
quelle
Hallo Leute, nochmals vielen Dank für die Kommentare. Die Datenpunkte sind nahezu identisch. Ich melde es in einem Bericht und muss es trotzdem hervorheben. Aus diesem Grund sehen die Ergebnisse merkwürdig aus. Mit diesen Daten (GLM) und anderen Datensätzen in meinen Berichten (GLMM) laufe ich definitiv (# TEAM2x2x2x2), bevor ich laufen kann. Ich glaube, mein Hauptproblem besteht darin, zu wissen, was ich melden muss. Mache ich einen Hinweis auf die Statistiken für den Abfang oder für die IV? Unten ist mein (hoffentlich mehr Standard) GLMM wieder mit Binomial Link.
Samuel Waldron
Verallgemeinerte lineare Mischmodellanpassung nach der Laplace-Näherungsformel: Angegriffen ~ Behandlung + Versuch + Behandlung * Versuch + (1 | Vogel) Daten: Daten AIC BIC logLik Abweichung 139,6 153,8 -64,78 129,6 Zufällige Effekte: Gruppen Name Varianz Std.Dev. Bird (Intercept) 0.87795 0.93699 Anzahl der Beobachtungen: 128, Gruppen: Bird, 32
Samuel Waldron
Behobene Effekte: Geschätzte Std. Fehler z-Wert Pr (> | z |) (Abschnitt) 3.19504 0.90446 3.533 .000412 *** Treatmentshiny_non-shiny 0.02617 1.26964 0.021 .983558 Versuch -1.53880 0.36705 -4.192 2.76e-05 *** Behandlung: Versuch 0.16909 0.49501 0.342 .732655 --- Signif. Codes: 0 " 0,001 " 0,01 "0,05". 0,1 '' 1 Korrelation fester Effekte: (Intr) Trtm_- Versuch Trtmntshn_- -0,712 Versuch -0,895 0,638 Trtmnts _-: T 0,664 -0,896 -0,742
Samuel Waldron
3

In Ihrem Fall ist der Achsenabschnitt der Mittelwert von attacked_excluding_app, berechnet für alle Daten, unabhängig davon treatment. Der Signifikanztest in der Koeffiziententabelle prüft, ob er sich signifikant von Null unterscheidet. Ob dies relevant ist, hängt davon ab, ob Sie a priori Grund haben, zu erwarten, dass es Null ist oder nicht.

Stellen Sie sich zum Beispiel vor, Sie hätten ein Medikament und ein Placebo auf ihre Wirkung auf den Blutdruck getestet. Für jedes Subjekt erfassen Sie die Änderung seines Blutdrucks durch Berechnung (Druck nach der Behandlung - Druck vor der Behandlung) und behandeln dies als abhängige Variable in Ihrer Analyse. Sie stellen dann fest, dass die Wirkung der Behandlung (Arzneimittel vs. Placebo) nicht signifikant ist, der Abschnitt jedoch signifikant> 0 ist - dies würde Ihnen sagen, dass der Blutdruck Ihrer Probanden im Durchschnitt zwischen den beiden Messzeiten angestiegen ist. Dies könnte interessant sein und weitere Untersuchungen erfordern.

Freya Harrison
quelle