Es gibt verschiedene Verwendungszwecke: Schätzung der Kerndichte Kernel-Trick Kernel-Glättung Bitte erläutern Sie, was der "Kernel" in ihnen im Klartext in Ihren eigenen Worten
Kernel-Glättungstechniken wie die Kernel-Dichteschätzung (KDE) und die Nadaraya-Watson-Kernel-Regression schätzen Funktionen durch lokale Interpolation aus Datenpunkten. Nicht zu verwechseln mit [Kernel-Trick] für die Kernel, die zB in SVMs verwendet werden.
Es gibt verschiedene Verwendungszwecke: Schätzung der Kerndichte Kernel-Trick Kernel-Glättung Bitte erläutern Sie, was der "Kernel" in ihnen im Klartext in Ihren eigenen Worten
plot(density(rexp(100)) Offensichtlich steht die gesamte Dichte links von Null für eine Verzerrung. Ich möchte einige Daten für Nicht-Statistiker zusammenfassen und Fragen dazu vermeiden, warum nicht-negative Daten eine Dichte links von Null aufweisen. Die Diagramme dienen der
Für univariate Kerneldichteschätzer (KDE) verwende ich die Silverman-Regel zur Berechnung von :hhh 0.9min(sd,IQR/1.34)×n−0.20.9min(sd,IQR/1.34)×n−0.2\begin{equation} 0.9 \min(sd, IQR/1.34)\times n^{-0.2} \end{equation} Was sind die Standardregeln für multivariates KDE (unter der Annahme eines...
Ich versuche, die Schätzung der Kerneldichte besser zu verstehen. Verwendung der Definition aus Wikipedia: https://en.wikipedia.org/wiki/Kernel_density_estimation#Definition fh^(x)=1n∑ni=1Kh(x−xi)=1nh∑ni=1K(x−xih)fh^(x)=1n∑i=1nKh(x−xi)=1nh∑i=1nK(x−xih) \hat{f_h}(x) = \frac{1}{n}\sum_{i=1}^n K_h...
Die Schätzung der Parzen-Fensterdichte wird als beschrieben p(x)=1n∑i=1n1h2ϕ(xi−xh)p(x)=1n∑i=1n1h2ϕ(xi−xh) p(x)=\frac{1}{n}\sum_{i=1}^{n} \frac{1}{h^2} \phi \left(\frac{x_i - x}{h} \right) wobei nnn die Anzahl der Elemente im Vektor ist, ein Vektor ist, eine Wahrscheinlichkeitsdichte von , die...
Nach der Durchführung der Hauptkomponentenanalyse (PCA) möchte ich einen neuen Vektor auf den PCA-Raum projizieren (dh seine Koordinaten im PCA-Koordinatensystem finden). Ich habe PCA in R-Sprache mit berechnet prcomp. Jetzt sollte ich meinen Vektor mit der PCA-Rotationsmatrix multiplizieren...
Diese Frage wird an anderer Stelle diskutiert . Variable Kernel werden häufig in der lokalen Regression verwendet. Zum Beispiel ist Löss weit verbreitet und eignet sich gut als Regressionsglätter. Es basiert auf einem Kernel mit variabler Breite, der sich an die Datensparsität...
Ich habe (zum Beispiel hier ) gelesen, dass der Epanechnikov-Kernel zumindest im theoretischen Sinne optimal ist, wenn man eine Kerneldichteschätzung durchführt. Wenn dies zutrifft, warum wird der Gaußsche Kern dann so häufig als Standardkern oder in vielen Fällen als einziger Kern in Bibliotheken...
Ich versuche, die ' Dichte' -Funktion in R zu verwenden, um Kernel-Dichteschätzungen durchzuführen. Ich habe einige Schwierigkeiten, die Ergebnisse zu interpretieren und verschiedene Datensätze zu vergleichen, da die Fläche unter der Kurve nicht unbedingt 1 zu sein scheint. Für jede...
Permutationstests (auch Randomisierungstest, Re-Randomisierungstest oder exakter Test genannt) sind sehr nützlich und nützlich, wenn die zum Beispiel erforderliche Annahme einer Normalverteilung t-testnicht erfüllt ist und wenn die Transformation der Werte durch Rangfolge der Werte erfolgt Ein...
Ich habe eine Stichprobe von 100 Punkten, die kontinuierlich und eindimensional sind. Ich habe seine nicht-parametrische Dichte mit Hilfe von Kernel-Methoden geschätzt. Wie kann ich Zufallsstichproben aus dieser geschätzten Verteilung
Kann jemand im Klartext erklären, worin der Unterschied zwischen den Daumenregeln von Scott und Silverman für die Bandbreitenauswahl besteht? Insbesondere wenn ein besser als die anderen? Hängt es mit der zugrunde liegenden Distribution zusammen? Anzahl von Beispielen? PS Ich beziehe mich auf den...
Ich muss die Dichtefunktion basierend auf einer Reihe von Beobachtungen mit dem Kernel-Dichteschätzer abschätzen. Basierend auf den gleichen Beobachtungen muss ich auch die erste und die zweite Ableitung der Dichte unter Verwendung der Ableitungen des Kerndichteschätzers schätzen. Die Bandbreite...
Ich suche nach einer Methode zur Berechnung der Überlappungsfläche zwischen zwei Kerndichteschätzungen in R als Maß für die Ähnlichkeit zwischen zwei Stichproben. Um dies zu verdeutlichen, müsste ich im folgenden Beispiel die Fläche des violett überlappenden Bereichs quantifizieren:...
Wie ist die langfristige Varianz im Bereich der Zeitreihenanalyse definiert? Ich verstehe, dass es für den Fall verwendet wird, dass die Daten eine Korrelationsstruktur aufweisen. Unser stochastischer Prozess wäre also keine Familie von X1,X2…X1,X2…X_1, X_2 \dots iid Zufallsvariablen, sondern nur...
Nachdem ich ein wenig knappe Mathematik durchlaufen habe, denke ich, dass ich eine leichte Intuition für die Schätzung der Kerneldichte habe. Mir ist aber auch bewusst, dass die Schätzung der multivariaten Dichte für mehr als drei Variablen im Hinblick auf die statistischen Eigenschaften ihrer...
Ich verwende Bayes, um ein Clustering-Problem zu lösen. Nach einigen Berechnungen muss ich das Verhältnis zweier Wahrscheinlichkeiten ermitteln: P(A)/P(B)P(A)/P(B)P(A)/P(B) um . Diese Wahrscheinlichkeiten werden durch die Integration von zwei verschiedenen multivariaten 2D-KDEs erhalten, wie in...
Ich komme von dieser Frage, falls jemand der Spur folgen möchte. Grundsätzlich habe ich einen Datensatz ΩΩ\Omega bestehend aus NNN Objekten, an die an jedem Objekt eine bestimmte Anzahl von Messwerten angehängt ist (in diesem Fall
Bei der Visualisierung eindimensionaler Daten wird häufig die Kernel Density Estimation-Technik verwendet, um falsch gewählte Behälterbreiten zu berücksichtigen. Gibt es eine Standardmethode zum Einbeziehen dieser Informationen, wenn mein eindimensionaler Datensatz Messunsicherheiten...
Ich habe mir gerade eine nette (nicht unbedingt gute) Methode ausgedacht, um eindimensionale Dichteschätzungen zu erstellen, und meine Frage lautet: Hat diese Dichteschätzmethode einen Namen? Wenn nicht, handelt es sich um einen Sonderfall einer anderen Methode in der Literatur? Hier ist die...