Protokollwahrscheinlichkeit interpretieren

9

Ich habe Schwierigkeiten, einige Ergebnisse zu interpretieren. Ich mache eine hierarchisch verwandte Regression mit ecoreg. Wenn ich den Code eingebe, erhalte ich eine Ausgabe mit Quotenverhältnissen, Konfidenzverhältnissen und einer 2x maximierten Log-Wahrscheinlichkeit.

Ich verstehe jedoch nicht vollständig, wie die 2x maximierte Protokollwahrscheinlichkeit zu interpretieren ist. Soweit ich weiß, wird die Log-Wahrscheinlichkeit als bequeme Methode zur Berechnung einer Wahrscheinlichkeit verwendet und berechnet den Wert der Parameter basierend auf den Ergebnissen. Aber ich verstehe nicht, ob ein höherer oder niedrigerer Wert besser ist. Ich habe mir mehrere Online-Quellen angesehen, z. B. /programming/2343093/what-is-log-likelihood , aber ich stecke immer noch fest.

Unter dem Ergebnis, das ich erhalte:

Call:
eco(formula = cbind(y, N) ~ deprivation + meanIncome, binary = ~fracSmoke + 
    soclass, data = dfAggPlus, cross = cross)

Aggregate-level odds ratios: 
                   OR        l95        u95
(Intercept) 0.0510475 0.03837276 0.06790878
deprivation 0.9859936 0.88421991 1.09948134
meanIncome  1.0689951 0.95574925 1.19565924

Individual-level odds ratios:
                OR       l95      u95
fracSmoke 3.124053 2.0761956 4.700765
soclass   1.001050 0.9930815 1.009083

-2 x log-likelihood:  237.4882 

Wie sollte ich also einen Wert von 237,4882 im Vergleich zu einem Ergebnis von 206 oder 1083 interpretieren? Hilfe wird sehr geschätzt!

Keiser
quelle
Was genau ist für Sie unklar?
Tim
Nun, ich möchte verstehen, ob eine höhere Log-Wahrscheinlichkeit bedeutet, dass das Ergebnis zuverlässiger oder beispielsweise weniger zuverlässig ist. Außerdem möchte ich wissen, wie ich die Unterschiede zwischen mehreren Ergebnissen interpretieren soll (z. B. 206 237 oder 1083)
Keiser
Ich habe Ihre Frage als Duplikat einer anderen, allgemeineren Frage markiert, in der gefragt wird, was die maximale Wahrscheinlichkeitsschätzung ist - überprüfen Sie sie.
Tim
Es scheint, dass es als Abweichung verwendet wird. Siehe < en.wikipedia.org/wiki/Deviance_information_criterion >
pglpm

Antworten:

0

Um zumindest eine gewisse Bedeutung aus der Wahrscheinlichkeit L herauszuholen, können Sie sich daran erinnern, dass für die feste Stichprobenanzahl N die maximale Log-Wahrscheinlichkeit für ein bestimmtes Verteilungsmodell hauptsächlich von der Skala abhängt. Bei gegebener Varianz hat die Normalverteilung den höchsten Wert. Um einen Einblick zu bekommen, würde ich logL durch N teilen und dann vielleicht auch eine Skalierungskorrektur durchführen. Wenn Ihre Daten besser zu einer gleichmäßigen Verteilung passen, ist es besser, die gleichmäßige Wahrscheinlichkeit als maximale Entropiefunktion für einen bestimmten Bereich als eine Art Referenz zu verwenden. Ein anderer allgemeiner Referenzwert könnte für den kontinuierlichen Fall sein, eine KDE-Anpassung zu verwenden und das L dafür zu berechnen. Was auch immer Sie tun, L ist schwieriger zu interpretieren als z. B. der KS-Wert oder der Effektivfehler.
Wenn Sie ein anderes Modell nehmen und ein höheres L erhalten, bedeutet dies nicht, dass das Modell besser ist, da Sie sich möglicherweise in einer Überanpassungssituation befinden. Verwenden Sie dazu den AIC-Wert. Hier ist niedriger besser, und Sie können wieder eine Normalverteilung als "Referenz" verwenden.

user32038
quelle