Kann ich die Parameter einer logarithmischen Normalverteilung aus dem Stichprobenmittelwert und dem Median ermitteln?

8

Ich habe die Mittel- und Medianwerte für eine Stichprobe aus einer logarithmischen Normalverteilung. Beachten Sie, dass dies nicht der Mittelwert und der Median der Protokolle der Variablen ist, obwohl ich natürlich die Protokolle des Mittelwerts und des Medians berechnen kann. Gibt es aus diesen Informationen eine geschlossene Lösung für μ und σ? Wenn es nur eine numerische Lösung gibt, können Sie mir sagen, wie ich sie finden kann, idealerweise mit R?

Ich nehme zur Kenntnis , dass diese Frage μ und σ aus der Probe Mittelwert und die Varianz, beantwortet wurde hier für die Ableitung: Wie schätzen wir die Parameter eine Lognormalverteilung aus der Probe Mittelwert und die Varianz jedoch, ich habe nicht die Stichprobenvarianz, nur Mittelwert und Median.

Wenn es keine geschlossene oder einfache numerische Lösung gibt, würde ich gerne wissen, ob die Verwendung der Protokolle des Stichprobenmittelwerts und -medians oder einer Transformation davon eine vernünftige Antwort für eine große Stichprobe (in Hunderten von Millionen) liefert ).

andrewH
quelle

Antworten:

10

Es kommt eher darauf an, was du mit "bekommen" meinst. Im Allgemeinen können Sie keine Populationsmengen aus Stichprobeninformationen erhalten. Sie können jedoch häufig Schätzungen erhalten, obwohl die Schätzungen in diesem Fall möglicherweise nicht sehr gut sind.

Wenn Sie sie haben, können Sie die Parameter leicht aus dem Populationsmittelwert und dem Median berechnen . Wenn der Populationsmedian und der Populationsmittelwert ist, dann ist und .m=exp(μ+1m~=exp(μ)μ=log( ˜ m )m=exp(μ+12σ2)μ=Log(m~)σ2=2Log(mm~)=2(Log(m)- -Log(m~))

Sie könnten in ähnlicher Weise versuchen, den Stichprobenmittelwert und den Stichprobenmedian in einer Art Schätzer für die Populationsmengen zu verwenden.

Wenn die einzigen Dinge, die Sie haben, der Stichprobenmittelwert und der Median eines logarithmischen Normalwerts ( bzw. ) sind, können Sie zumindest die offensichtliche Strategie anwenden, Populationsmengen durch Stichprobenmengen * zu ersetzen und die Methode von zu kombinieren Momente und Methode der Quantile ... und .x¯x~μ^=Log(x~)σ^2=2Log(x¯x~)=2(Log(x¯)- -Log(x~))

Ich glaube, diese Schätzer werden konsistent sein. Bei kleinen Stichproben sind diese jedoch mit Sicherheit voreingenommen und möglicherweise nicht sehr effizient, aber ohne umfangreiche Analyse haben Sie möglicherweise keine große Auswahl.

In Wirklichkeit wissen Sie natürlich nicht wirklich, dass Ihre Daten aus einer logarithmischen Normalverteilung stammen - das ist so ziemlich eine Vermutung. In der Praxis kann dies jedoch eine durchaus brauchbare Annahme sein.

Im Idealfall würde man die gemeinsame Verteilung des Stichprobenmittelwerts und des Medians aus einem Lognormal berechnen und dann versuchen, die Wahrscheinlichkeit über die Parameter dieser bivariaten Verteilung zu maximieren. das sollte so gut wie möglich gehen, aber das ist eher ein anständiges Forschungsproblem (es lohnt sich ein Papier, wenn es noch nicht gemacht wurde) als eine Frage von ein paar Absätzen der Antwort.

Man könnte einige Simulationsuntersuchungen zu den Eigenschaften der gemeinsamen Verteilung von Stichprobenmittelwert und Median durchführen. Nehmen wir zum Beispiel an, dass die Verteilung des Verhältnisses von Mittelwert zu Median skalierungsfrei sein sollte - eine Funktion nur von . Selbst wenn wir es nicht algebraisch berechnen können, können wir uns ansehen, wie sich das Verhältnis (zum Beispiel) verhält, wenn sich ändert. Man könnte dann in der Lage sein, das zu wählen, das die Wahrscheinlichkeit, das beobachtete Verhältnis zu erhalten, ungefähr maximiert ( könnte auf verschiedene Arten geschätzt werden, das offensichtliche - das Protokoll des Medians, wie bereits erwähnt - jedoch nicht schrecklich sein).σσσμ


* Warnung: Es ist durchaus möglich, dass der Stichprobenmedian den Stichprobenmittelwert überschreitet. In diesem Fall ist der oben vorgeschlagene einfache Schätzer keine Hilfe, da er darauf beruht, dass der Mittelwert über dem Median liegt (er gibt eine negative Schätzung für einen positiven Parameter).

Glen_b -Reinstate Monica
quelle