Ich habe an mehreren Stellen gehört / gesehen, dass Sie den Datensatz in etwas normalverteiltes transformieren können, indem Sie den Logarithmus jeder Stichprobe nehmen, das Konfidenzintervall für die transformierten Daten berechnen und das Konfidenzintervall mit der inversen Operation zurücktransformieren (Erhöhen Sie z. B. 10 um die Potenz der unteren bzw. oberen Schranke für ).
Ich bin jedoch ein bisschen misstrauisch gegenüber dieser Methode, einfach weil sie für den Mittelwert selbst nicht funktioniert:
Was ist der richtige Weg, um dies zu tun? Wenn es für den Mittelwert selbst nicht funktioniert, wie kann es möglicherweise für das Konfidenzintervall für den Mittelwert funktionieren?
confidence-interval
mean
lognormal
Vegard
quelle
quelle
Antworten:
Es gibt verschiedene Möglichkeiten, Konfidenzintervalle für den Mittelwert einer logarithmischen Normalverteilung zu berechnen. Ich werde zwei Methoden vorstellen: Bootstrap und Profile Likelihood. Ich werde auch eine Diskussion über Jeffreys vorlegen.
Bootstrap
Für die MLE
In diesem Fall wird der MLE von( μ , σ) für eine Probe ( x1, . . . , xn) ist ,
Dann wird der MLE des Mittelwert δ = exp ( μ + σ 2 / 2 ) . Durch Resampling wir erhalten können Bootstrap - Probe von δ und diese verwenden, können wir berechnen mehr Bootstrap - Konfidenzintervall. Die folgenden Codes zeigen, wie Sie diese erhalten.δ^=exp(μ^+σ^2/2) δ^
R
Für den Stichprobenmittelwert
Betrachtet man nun den Schätzerδ~=x¯ anstelle des MLE. Andere Arten von Schätzern könnten ebenfalls in Betracht gezogen werden.
Profil Wahrscheinlichkeit
Zur Definition von Wahrscheinlichkeits- und Profilwahrscheinlichkeitsfunktionen siehe . Unter Verwendung der Invarianz - Eigenschaft der Wahrscheinlichkeit , können wir wie folgt reparameterise(μ,σ)→(δ,σ) , wobei δ=exp(μ+σ2/2) , und dann berechnen numerisch das Profil Wahrscheinlichkeit von δ .
R
In diesem Abschnitt wird ein alternativer Algorithmus zur Berechnung eines Glaubwürdigkeitsintervalls für , der auf Metropolis-Hastings-Stichproben und der Verwendung des Jeffreys-Prior basiertδ vorgestellt basiert.
R
Beachten Sie, dass sie sehr ähnlich sind.
quelle
Sie könnten den Bayes'schen Ansatz mit Jeffreys 'Vorgänger versuchen. Es sollte Glaubwürdigkeitsintervalle mit einer korrekten Eigenschaft zur Häufigkeitsanpassung liefern: Das Konfidenzniveau des Glaubwürdigkeitsintervalls liegt nahe an seinem Glaubwürdigkeitsniveau.
quelle
Sie haben recht - das ist die Formel für den geometrischen Mittelwert, nicht für den arithmetischen Mittelwert. Das arithmetische Mittel ist ein Parameter aus der Normalverteilung und für logarithmische Normaldaten oft wenig aussagekräftig. Der geometrische Mittelwert ist der entsprechende Parameter aus der Lognormalverteilung, wenn Sie eine zentrale Tendenz für Ihre Daten deutlicher ausdrücken möchten.
Und Sie würden in der Tat die CIs über den geometrischen Mittelwert berechnen, indem Sie die Logarithmen der Daten nehmen, den Mittelwert und die CIs wie gewohnt berechnen und rücktransformieren. Sie haben Recht, dass Sie Ihre Verteilungen nicht wirklich mischen möchten, indem Sie die CIs für den geometrischen Mittelwert um den arithmetischen Mittelwert legen ... ja!
quelle