Kerndichteschätzung für asymmetrische Verteilungen

10

Sei Beobachtungen, die aus einer unbekannten (aber sicherlich asymmetrischen) Wahrscheinlichkeitsverteilung stammen.{x1,,xN.}}

Ich mag die Wahrscheinlichkeitsverteilung finden , indem Sie den KDE - Ansatz: f ( x ) = 1 Ich habe jedoch versucht, einen Gaußschen Kernel zu verwenden, der jedoch eine schlechte Leistung erbrachte, da er symmetrisch ist. So habe ich gesehen, dass einige Arbeiten über die Gamma- und Beta-Kernel veröffentlicht wurden, obwohl ich nicht verstand, wie ich mit ihnen umgehen sollte.

f^(x)=1N.hich=1N.K.(x- -xichh)

Meine Frage ist: Wie gehe ich mit diesem asymmetrischen Fall um, wenn die Unterstützung der zugrunde liegenden Verteilung nicht im Intervall ?[0,1]]

Eleanore
quelle
4
Bei Dichten, die nahezu lognormal sind (was in bestimmten Anwendungen häufig vorkommt), transformiere ich einfach (indem ich Protokolle nehme) und mache dann KDE und transformiere dann das KDE zurück (Sie müssen sich beim Transformieren an den Jacobi erinnern die Schätzung zurück). In diesem Fall funktioniert es ganz gut.
Glen_b -State Monica
@Glen_b Haben Sie eine Referenz oder ein Material, in dem diese Methode beschrieben wird? (Berechnung der KDE bei einer Transformation der ursprünglichen Variablen und anschließende Transformation der KDE zurück)
Boscovich
Nicht, dass ich wüsste - ich bin sicher, dass sie existieren, da es eine eher triviale Idee ist und leicht umgesetzt werden kann. Es ist die Art von Dingen, von denen ich erwarten würde, dass ein Statistik-Student sie ableiten kann. In der Praxis funktioniert es sehr gut.
Glen_b -State Monica
@glen_b danke. Wenn ich es also in einem technischen Bericht / einer Veröffentlichung verwenden würde, wäre es Ihrer Meinung nach in Ordnung, keine Referenzen anzugeben?
Boscovich
1
@guy Es ist sicherlich möglich, Probleme zu haben, insbesondere bei einigen Transformationen und einigen Arten von Daten. Die Situationen, in denen ich es verwendet habe, sind in der Regel ziemlich lognormal, und dort ist die Änderung der Bandbreite, die Sie als Problem ansehen, genau das, was benötigt wird. Es ist viel besser als KDE bei den Rohdaten. Nach der Beschreibung des OP klang es ziemlich ähnlich, aber es ist nicht so, als hätte ich vorgeschlagen, dass es ein Allheilmittel ist .
Glen_b -State Monica

Antworten:

5

Erstens kann KDE mit symmetrischen Kerneln auch sehr gut funktionieren, wenn Ihre Daten asymmetrisch sind. Andernfalls wäre es in der Praxis eigentlich völlig nutzlos.

Log(x)

Hat aufgehört - Anony-Mousse
quelle
Wenn Sie auf skalieren log(x), müssen Sie auch einen Jacobian berücksichtigen?
DilithiumMatrix
0

Hmm. Möglicherweise möchten Sie eine Kernelbreite, die sich in Abhängigkeit vom Standort ändert.

Wenn ich mir das Problem in eCDF anschaue, könnte ich versuchen, eine numerische Steigung der CDF in Beziehung zur Kernelgröße zu setzen.

Ich denke, wenn Sie eine Koordinatentransformation durchführen möchten, müssen Sie eine ziemlich gute Vorstellung von den Start- und Endpunkten haben. Wenn Sie die Zielverteilung so gut kennen, benötigen Sie die Kernel-Näherung nicht.

EngrStudent
quelle
1
Ich könnte sehr leicht wissen, dass meine Wohnmobile nicht negativ sind, aber immer noch eine KDE wollen.
Kerl