Ich habe das folgende verallgemeinerte lineare Modell. Das Objekt glmDV
wird als Anteil der Erfolge an den Gesamtversuchen modelliert. Die Objekte x_i
sind kontinuierliche Variablen.
Wie sieht das in der mathematischen Notation aus?
winp.glm = glm(glmDV ~ x1 + x2 + x3 + x4 + x5 + x6 + x7,
data=myData, family=binomial("logit"))
r
generalized-linear-model
logit
notation
user2205916
quelle
quelle
0
s &1
s ist (was ich anhand Ihrer Beschreibung zusammengetragen habe) , wobei die Gewichte die Anzahl der Gesamtversuche sind für jede Beobachtung.weights
Antworten:
Für eine binäre logistische Regression, den üblichen Anwendungsfall für das binomische GLM mit einem Logit-Link, modellieren Sie die Wahrscheinlichkeit, dass Ihre abhängige Variable ein "Erfolg" (oder "Ja") ist, der üblicherweise als codiert wird . Die Art und Weise, wie Sie dies tun, besteht darin, die Protokollquoten zu modellieren. Anstatt den Mittelwert der Antwort wie in OLS zu modellieren, modellieren Sie die Änderung der Protokollquoten:1
Wobei und .logit-1(x)=exp(x)logit(x)=log(x1−x) logit−1(x)=exp(x)1+exp(x)
Eine gründlichere, sehr verständliche Erklärung hierfür findet sich in Agresti, Eine Einführung in die kategoriale Datenanalyse.
Zu Ihrer speziellen Frage geben Sie jedoch an, dass Sie den Anteil der Erfolge modellieren . Dies ist eigentlich nicht das, wofür ein Binomial-GLM verwendet wird. Was Sie jedoch wirklich suchen, ist das, was ein Binomial-GLM tut und in R immer noch möglich ist. Es erfordert nur eine geringfügige Änderung Ihrer Arbeit. In dem Fall, dass Sie eine endliche Anzahl von Versuchen haben, die Erfolge haben können, können Sie immer noch dasselbe Modell verwenden, das die Dichte Da Ihre Werte durch das experimentelle Design festgelegt sind und Ihre beobachteten Erfolge sind, führen Sie eine Inferenz auf den Parameter durchy ∈ { 0 ... n }n y∈{0...n}
Erstellen Sie in Bezug auf R einfach ein Objekt (das Sie bezeichneny n−y
glmDV
), das eine zweispaltige Matrix ist, wobei die erste Spalte die Anzahl der Erfolge und die zweite die Gesamtzahl der Fehler . Der Rest der Aussage bleibt gleich!quelle
glm
und akzeptiere meines Wissens nur eine Antwortvariable mit einer Spalte, nicht zwei Spalten. Bitte korrigieren Sie mich, wenn ich falsch liege, und zitieren Sie nach Möglichkeit relevante Unterlagen. Vielen Dank!glm
Dokumentation. Eine gute Möglichkeit, die Funktionsweise von R-Funktionen kennenzulernen, besteht darin, den Funktionsnamen bei Google einzugeben. Dadurch wird normalerweise die entsprechende Dokumentation angezeigt. Sie können auch?glm
eine R-Konsole