Übersetzen Sie Rs glm-Befehl in mathematische Notation

8

Ich habe das folgende verallgemeinerte lineare Modell. Das Objekt glmDVwird als Anteil der Erfolge an den Gesamtversuchen modelliert. Die Objekte x_isind kontinuierliche Variablen.

Wie sieht das in der mathematischen Notation aus?

winp.glm = glm(glmDV ~ x1 + x2 + x3 + x4 + x5 + x6 + x7, 
               data=myData, family=binomial("logit"))
user2205916
quelle
1
Beachten Sie, dass Sie ein Argument w / ? Glm verwenden sollten , wenn Ihre Antwort ein Anteil anstelle einer Reihe von 0s & 1s ist (was ich anhand Ihrer Beschreibung zusammengetragen habe) , wobei die Gewichte die Anzahl der Gesamtversuche sind für jede Beobachtung. weights
Gung - Reinstate Monica

Antworten:

11

Für eine binäre logistische Regression, den üblichen Anwendungsfall für das binomische GLM mit einem Logit-Link, modellieren Sie die Wahrscheinlichkeit, dass Ihre abhängige Variable ein "Erfolg" (oder "Ja") ist, der üblicherweise als codiert wird . Die Art und Weise, wie Sie dies tun, besteht darin, die Protokollquoten zu modellieren. Anstatt den Mittelwert der Antwort wie in OLS zu modellieren, modellieren Sie die Änderung der Protokollquoten:1

Pr(y=1)=θ=logit1(β0+β1x1+β2x2+...+β7x7)

Wobei und .logit-1(x)=exp(x)logit(x)=log(x1x)logit1(x)=exp(x)1+exp(x)

Eine gründlichere, sehr verständliche Erklärung hierfür findet sich in Agresti, Eine Einführung in die kategoriale Datenanalyse.

Zu Ihrer speziellen Frage geben Sie jedoch an, dass Sie den Anteil der Erfolge modellieren . Dies ist eigentlich nicht das, wofür ein Binomial-GLM verwendet wird. Was Sie jedoch wirklich suchen, ist das, was ein Binomial-GLM tut und in R immer noch möglich ist. Es erfordert nur eine geringfügige Änderung Ihrer Arbeit. In dem Fall, dass Sie eine endliche Anzahl von Versuchen haben, die Erfolge haben können, können Sie immer noch dasselbe Modell verwenden, das die Dichte Da Ihre Werte durch das experimentelle Design festgelegt sind und Ihre beobachteten Erfolge sind, führen Sie eine Inferenz auf den Parameter durchy { 0 ... n }ny{0...n}

Pr(y)(ny)θy(1θ)ny
nyθ auf die gleiche Weise wie der typischere binäre Antwortfall (oben), in dem auf 1 festgelegt ist, nimmt mit der Wahrscheinlichkeit den Wert 1 an und ist eine Funktion Ihrer Parameter. Für den Fall des Logit-Links modellieren wir dann , hauptsächlich weil dieses transformierte auf der gesamten realen Linie existiert und nicht auf dem Einheitsintervall . (Andere wünschenswerte Eigenschaften der Logit-Verknüpfung sind in Agresti beschrieben, einschließlich der Gültigkeit der Koeffizienten, selbst in Einstellungen, in denen nicht zufällige Stichproben wie Fall-Kontroll-Designs verwendet werden. Dies ist beispielsweise bei Probit-Verknüpfungsfunktionen nicht der Fall.)nyθθ
logit(θ)=β0+β1x1+...+βixi
θ

Erstellen Sie in Bezug auf R einfach ein Objekt (das Sie bezeichnen glmDV), das eine zweispaltige Matrix ist, wobei die erste Spalte die Anzahl der Erfolge und die zweite die Gesamtzahl der Fehler . Der Rest der Aussage bleibt gleich!yny

Sycorax sagt Reinstate Monica
quelle
Diese Kreuzvalidierung war sehr hilfreich. Ich werde Agresti in der Bibliothek auschecken. Danke für deine Hilfe.
user2205916
@Sycorax oder @ user2205916, insbesondere wie übergeben Sie die "2-Spalten-Matrix" mit der Anzahl der Erfolge und Misserfolge an R und wie nutzt R dies? Ich bin mit der Verwendung von vertraut glmund akzeptiere meines Wissens nur eine Antwortvariable mit einer Spalte, nicht zwei Spalten. Bitte korrigieren Sie mich, wenn ich falsch liege, und zitieren Sie nach Möglichkeit relevante Unterlagen. Vielen Dank!
Clarpaul
@clarpaul stat.ethz.ch/R-manual/R-patched/library/stats/html/glm.html Erster Absatz von "Details" in der glmDokumentation. Eine gute Möglichkeit, die Funktionsweise von R-Funktionen kennenzulernen, besteht darin, den Funktionsnamen bei Google einzugeben. Dadurch wird normalerweise die entsprechende Dokumentation angezeigt. Sie können auch ?glmeine R-Konsole
eingeben
@Sycorax, danke, dass du das für mich nachgeschlagen hast. Ich habe es gestern in die Praxis umgesetzt und es schien zu funktionieren!
Clarpaul