Ich möchte eine Quadratzählungsanalyse für mehrere Punktprozesse (oder einen markierten Punktprozess) durchführen, um dann einige Techniken zur Reduzierung der Dimensionalität anzuwenden.
Die Marken sind nicht identisch verteilt, dh einige Marken erscheinen ziemlich oft und andere sind ziemlich selten. Daher kann ich meinen 2D-Raum nicht einfach in ein reguläres Raster unterteilen, da die häufigeren Markierungen die weniger häufigen "überwältigen" und ihr Erscheinungsbild maskieren.
Daher habe ich versucht, mein Raster so aufzubauen, dass jede Zelle höchstens N Punkte enthält (dazu teile ich jede Zelle rekursiv in vier kleinere (und gleich große) Zellen auf, bis keine Zelle mehr als N Punkte enthält es).
Was halten Sie von dieser "Normalisierung"? Gibt es einen Standardweg, um solche Dinge zu tun?
Antworten:
Ich habe die Quadratanalyse nur für reguläre Gitter verwendet. Es war hilfreich in Bezug auf den Zweck, die Streuung von Stichprobendaten mit einem bekannten Verfahren zu vergleichen, z. B. zufällig. Daher hat ein reguläres Raster gut funktioniert.
Bei der von Ihnen entwickelten und beschriebenen Methode handelt es sich nicht um eine Quadratzählung. Beispielsweise besteht bei der Methode des gleitenden Durchschnitts eine Option darin, die Anzahl der Nachbarn für den Prozess zu zählen, dh die Mittelwertbildung, die einfach durch Suchen innerhalb eines Kreises (in 2D) oder einer Kugel (in 3D) erfolgt. Ihre Methode sieht ähnlich aus, wenn die ausgewählten Beispiele etwas anders verwendet werden.
quelle