Mehrere Beiträge ( hier und hier ) legen nahe, dass die Beta-Regression besser geeignet ist, wenn die abhängige Variable natürlich zwischen 0 und 1 liegt. Meine Frage ist, ob es technisch falsch ist, eine logistische Regression an die proportionale Antwortvariable anzupassen, wenn man die Angemessenheit beiseite lässt. R gibt eine Warnung aus, erzeugt aber dennoch ein Ergebnis.
Es scheint mir, dass die Wahrscheinlichkeitsfunktion keine gültige Wahrscheinlichkeit ist, wenn die Antwortvariable proportional statt binär ist, aber mathematisch gesehen kann sie immer noch minimiert werden, um eine Lösung zu erhalten. Ich frage mich, welche Verletzung / Fehler, wenn überhaupt, gemacht wird, wenn eine logistische Regression an proportionale Daten angepasst wird.
quelle
Antworten:
Was Sie vorschlagen, wird manchmal als gebrochenes Logit bezeichnet. Es hat sicherlich seine Vorzüge, solange Sie daran denken, robuste Standardfehler zu verwenden. 2010 hielt ich auf dem Treffen der deutschen Stata-Benutzer einen Vortrag, in dem ich unter anderem die Beta-Regression und das fraktionierte Logit verglich. Die Folien finden Sie hier: http://www.maartenbuis.nl/presentations/berlin10.pdf
quelle
weights
Argument anglm
), siehe z. B. hier stats.stackexchange.com/a/26779/28666 . In welcher Beziehung steht "Fractional Logit" mit "robusten Standardfehlern" zu diesem Ansatz? Ist es dasselbe oder nicht?Modelle dieser Art werden häufig als eine Art verallgemeinertes lineares Modell definiert und verwendet. Eine kurze Übersicht finden Sie unter http://www.stata-journal.com/article.html?article=st0147. Das Argument ist, dass das Binom eine vernünftige Familie ist, selbst für kontinuierliche Proportionen, da sich die Varianz auch 0 nähert, wenn sich der Mittelwert nähert entweder 0 oder 1.
Ob bestimmte Programme oder Funktionen in einer bestimmten Software diese unterstützen, ist eine andere Frage. Zu sagen, dass "R eine Warnung auslöst, aber dennoch ein Ergebnis liefert", liefert nur wenige Informationen. Auf welches Paket beziehen Sie sich? Ist es wirklich das einzig relevante Paket? Wie der Artikel, auf den gerade verwiesen wird, zeigt, wird dieses Modell beispielsweise in Stata gut unterstützt.
Dies lässt noch Raum für eine detaillierte Diskussion der relativen Vorzüge eines Logit-Modells für kontinuierliche Proportionen und Beta-Regression.
quelle