Ich habe Schwierigkeiten, einige Ergebnisse zu interpretieren. Ich mache eine hierarchisch verwandte Regression mit ecoreg
. Wenn ich den Code eingebe, erhalte ich eine Ausgabe mit Quotenverhältnissen, Konfidenzverhältnissen und einer 2x maximierten Log-Wahrscheinlichkeit.
Ich verstehe jedoch nicht vollständig, wie die 2x maximierte Protokollwahrscheinlichkeit zu interpretieren ist. Soweit ich weiß, wird die Log-Wahrscheinlichkeit als bequeme Methode zur Berechnung einer Wahrscheinlichkeit verwendet und berechnet den Wert der Parameter basierend auf den Ergebnissen. Aber ich verstehe nicht, ob ein höherer oder niedrigerer Wert besser ist. Ich habe mir mehrere Online-Quellen angesehen, z. B. /programming/2343093/what-is-log-likelihood , aber ich stecke immer noch fest.
Unter dem Ergebnis, das ich erhalte:
Call:
eco(formula = cbind(y, N) ~ deprivation + meanIncome, binary = ~fracSmoke +
soclass, data = dfAggPlus, cross = cross)
Aggregate-level odds ratios:
OR l95 u95
(Intercept) 0.0510475 0.03837276 0.06790878
deprivation 0.9859936 0.88421991 1.09948134
meanIncome 1.0689951 0.95574925 1.19565924
Individual-level odds ratios:
OR l95 u95
fracSmoke 3.124053 2.0761956 4.700765
soclass 1.001050 0.9930815 1.009083
-2 x log-likelihood: 237.4882
Wie sollte ich also einen Wert von 237,4882 im Vergleich zu einem Ergebnis von 206 oder 1083 interpretieren? Hilfe wird sehr geschätzt!
quelle
Antworten:
Um zumindest eine gewisse Bedeutung aus der Wahrscheinlichkeit L herauszuholen, können Sie sich daran erinnern, dass für die feste Stichprobenanzahl N die maximale Log-Wahrscheinlichkeit für ein bestimmtes Verteilungsmodell hauptsächlich von der Skala abhängt. Bei gegebener Varianz hat die Normalverteilung den höchsten Wert. Um einen Einblick zu bekommen, würde ich logL durch N teilen und dann vielleicht auch eine Skalierungskorrektur durchführen. Wenn Ihre Daten besser zu einer gleichmäßigen Verteilung passen, ist es besser, die gleichmäßige Wahrscheinlichkeit als maximale Entropiefunktion für einen bestimmten Bereich als eine Art Referenz zu verwenden. Ein anderer allgemeiner Referenzwert könnte für den kontinuierlichen Fall sein, eine KDE-Anpassung zu verwenden und das L dafür zu berechnen. Was auch immer Sie tun, L ist schwieriger zu interpretieren als z. B. der KS-Wert oder der Effektivfehler.
Wenn Sie ein anderes Modell nehmen und ein höheres L erhalten, bedeutet dies nicht, dass das Modell besser ist, da Sie sich möglicherweise in einer Überanpassungssituation befinden. Verwenden Sie dazu den AIC-Wert. Hier ist niedriger besser, und Sie können wieder eine Normalverteilung als "Referenz" verwenden.
quelle