Wie passt man ein ungefähres PDF (dh: Dichteschätzung) unter Verwendung der ersten k (empirischen) Momente an?

11

Ich habe eine Situation, in der ich (die ersten) Momente eines Datensatzes schätzen kann und daraus eine Schätzung der Dichtefunktion erstellen möchte.k

Ich bin bereits auf die Pearson-Distribution gestoßen , habe jedoch festgestellt, dass sie nur auf den ersten vier Momenten beruht (mit einigen Einschränkungen hinsichtlich der möglichen Kombinationen von Momenten).

Ich verstehe auch, dass eine endliche Menge von Momenten nicht ausreicht, um eine bestimmte Verteilung zu "bestimmen", wenn nicht mehr Annahmen verwendet werden. Ich möchte jedoch immer noch eine allgemeinere Klasse von Distributionen (außer der Pearson-Distributionsfamilie). Bei anderen Fragen konnte ich keine solche Verteilung finden (siehe: hier , hier , hier , hier , hier und hier ).

Gibt es eine ("einfache") verallgemeinerte Verteilungsfamilie, die für jede Menge von Momenten definiert werden kann? (Vielleicht eine Reihe von Transformationen, die eine Standardnormalverteilung annehmen und transformieren können, bis sie mit allen Momenten bestätigt sind.)kkk

(Es ist mir egal, ob wir annehmen, dass die anderen Momente 0 sind oder nicht)k+1

Vielen Dank.

ps: Ich würde mich über ein erweitertes Beispiel freuen. Vorzugsweise mit einem R-Code-Beispiel.

Tal Galili
quelle
2
Die ersten Momente definieren die ersten k Ableitungen der charakteristischen Funktion bei Null: E [ X k ] = ( - i ) k ϕ ( k ) X ( 0 ) . Sie kennen also die ersten k Terme der Taylor-Expansion der charakteristischen Funktion um Null. Möglicherweise können Sie dann die Inversionssätze verwenden, um die Dichte abzuleiten. kkE.[X.k]]=(- -ich)kϕX.(k)(0)k
Stephan Kolassa
Danke @StephanKolassa - gibt es eine Chance für eine erweiterte Antwort / ein R-Code-Beispiel?
Tal Galili
2
en.wikipedia.org/wiki/Maximum_entropy_probability_distribution schlägt eine allgemeine Methode vor.
whuber
Lieber @whuber, könnten Sie bitte ein R-Code-Beispiel vorschlagen? (Geht das auch mit der Antwort von Wolfies?)
Tal Galili
Dies ist ein völlig anderer Ansatz als diese Antwort.
whuber

Antworten:

11

Methode 1: Pearson-Systeme höherer Ordnung

Das Pearson-System wird konventionell als die Familie der Lösungen der Differentialgleichung angesehen:p(x)

dp(x)dx=- -(ein+x)c0+c1x+c2x2p(x)

(ein,c0,c1,c2)

c0+c1x+c2x2p(x)

dp(x)dx=- -(ein+x)c0+c1x+c2x2+c3x3p(x)

was die Lösung ergibt:

Geben Sie hier die Bildbeschreibung ein

Ich habe dies vor einiger Zeit zum Spaß gelöst (mit dem gleichen Gedankengang wie das OP): Die Ableitung und Lösung finden Sie in Kapitel 5 unseres Buches; Bei Interesse steht hier ein kostenloser Download zur Verfügung:

http://www.mathstatica.com/book/bookcontents.html

Beachten Sie, dass die Pearson-Familie zweiter Ordnung (quadratisch) in Form der ersten 4 Momente ausgedrückt werden kann, während die Pearson-Familie dritter Ordnung (kubisch) die ersten 6 Momente benötigt.

Methode 2: Gram-Charlier-Erweiterungen

kth

Bevölkerungsmomente oder Beispielmomente?

Für das Pearson-System: Wenn die Momente der Bevölkerung bekannt sind, sollte die Verwendung höherer Momente eindeutig zu einer besseren Anpassung führen. Wenn es sich bei den beobachteten Daten jedoch um eine Zufallsstichprobe aus der Population handelt, besteht ein Kompromiss: Ein Polynom höherer Ordnung impliziert, dass Momente höherer Ordnung erforderlich sind, und die Schätzungen des letzteren können unzuverlässig sein (hohe Varianz aufweisen). es sei denn, die Stichprobengröße ist "groß". Mit anderen Worten, bei gegebenen Probendaten kann die Anpassung mit höheren Momenten "instabil" werden und zu schlechteren Ergebnissen führen. Gleiches gilt für Gram-Charlier-Erweiterungen: Das Hinzufügen eines zusätzlichen Begriffs kann tatsächlich zu einer schlechteren Anpassung führen, sodass einige Sorgfalt erforderlich ist.

Wölfe
quelle
Liebe @wolfies - danke für deine Antwort! Wenn ich Sie richtig verstehe, entsprechen die Gram-Charlier-Erweiterungen eher dem, wonach ich suche (obwohl die allgemeinere Pearson-Verteilung interessant zu wissen ist). Ich habe mir Ihr Buch angesehen (Kapitel 5, ab Seite 175) und festgestellt, dass Sie dort tatsächlich eine detaillierte Beschreibung geben (mit auch Erwähnungen zum Umgang mit geschätzten Momenten, was mein Fall ist). Das einzige ist, dass ich Ihren Code nicht verwenden kann (da ich ein R-Benutzer bin). Vielen Dank für Ihre Antwort (und auch für Ihr Buch, das im Allgemeinen beeindruckend und interessant erscheint)
Tal Galili
2
Ich habe
Tal Galili