Auswahl einer Bandbreite für Kernel-Dichteschätzer

29

Für univariate Kerneldichteschätzer (KDE) verwende ich die Silverman-Regel zur Berechnung von :h

0.9min(sd,IQR/1.34)×n0.2

Was sind die Standardregeln für multivariates KDE (unter der Annahme eines normalen Kernels)?

csgillespie
quelle

Antworten:

20

Für ein univariates KDE ist es besser, etwas anderes als Silvermans Regel zu verwenden, die auf einer normalen Annäherung basiert. Ein ausgezeichneter Ansatz ist die Sheather-Jones-Methode, die leicht in R implementiert werden kann. beispielsweise,

plot(density(precip, bw="SJ"))

Die Situation für multivariates KDE ist nicht so gut untersucht, und die Tools sind nicht so ausgereift. Anstelle einer Bandbreite benötigen Sie eine Bandbreitenmatrix. Um das Problem zu vereinfachen, nehmen die meisten Menschen eine Diagonalmatrix an, obwohl dies möglicherweise nicht zu den besten Ergebnissen führt. Das ks-Paket in R bietet einige sehr nützliche Tools, darunter das Ermöglichen einer Matrix mit voller Bandbreite (nicht unbedingt diagonal).

Rob Hyndman
quelle
3

Für eine Schätzung der Dichte eines univariaten Kernels kann die Bandbreite durch eine normale Referenzregel oder eine Kreuzvalidierungsmethode oder einen Plug-In-Ansatz geschätzt werden.

Für die Schätzung der multivariaten Kerneldichte kann ein Bayes'sches Bandbreitenauswahlverfahren verwendet werden, siehe Zhang, X., ML King und RJ Hyndman (2006), Bayes'scher Ansatz zur Bandbreitenauswahl für die Schätzung der multivariaten Kerneldichte, Computational Statistics and Data Analysis, 3009-3031

Gabriel
quelle