Ich habe ein Raster mit positiven ganzzahligen Werten erhalten. Diese Zahlen stellen eine Intensität dar, die der Glaubensstärke einer Person entsprechen sollte, die diesen Gitterplatz einnimmt (ein höherer Wert zeigt einen höheren Glauben an). Eine Person hat im Allgemeinen Einfluss auf mehrere Gitterzellen.
Ich glaube, dass das Intensitätsmuster "Gauß'sch" aussehen sollte, da es einen zentralen Ort mit hoher Intensität geben wird und sich die Intensitäten dann radial in alle Richtungen verjüngen. Insbesondere möchte ich die Werte so modellieren, dass sie von einem "skalierten Gaußschen" mit einem Parameter für die Varianz und einem anderen für den Skalierungsfaktor stammen.
Es gibt zwei komplizierende Faktoren:
- Die Abwesenheit einer Person entspricht aufgrund von Hintergrundgeräuschen und anderen Effekten nicht einem Nullwert, die Werte sollten jedoch kleiner sein. Sie können jedoch unregelmäßig sein, und in erster Näherung kann es schwierig sein, sie als einfaches Gaußsches Rauschen zu modellieren.
- Der Intensitätsbereich kann variieren. In einem Fall können die Werte zwischen 1 und 10 und in einem anderen Fall zwischen 1 und 100 liegen.
Ich suche nach einer geeigneten Parameterschätzungsstrategie oder nach Hinweisen auf relevante Literatur. Hinweise, warum ich dieses Problem insgesamt falsch angehe, wäre ebenfalls willkommen :). Ich habe über Kriging und Gaußsche Prozesse gelesen, aber das scheint eine sehr schwere Maschinerie für mein Problem zu sein.
quelle
Antworten:
Sie können dieses Modul der Pysal- Python-Bibliothek für die unten beschriebenen Methoden zur Analyse räumlicher Daten verwenden.
Ihre Beschreibung, wie die Einstellung jeder Person durch die Einstellungen der sie umgebenden Personen beeinflusst wird, kann durch ein räumliches autoregressives Modell (SAR) dargestellt werden (siehe auch meine einfache SAR-Erklärung aus dieser SE-Antwort 2 ). Der einfachste Ansatz besteht darin, andere Faktoren zu ignorieren und die Stärke des Einflusses, den die umgebenden Menschen auf die Einstellungen des anderen haben, mithilfe der I- Statistik von Moran abzuschätzen .
Wenn Sie die Bedeutung anderer Faktoren bewerten möchten, während Sie die Stärke des Einflusses der umgebenden Menschen abschätzen, eine komplexere Aufgabe, können Sie die Parameter einer Regression abschätzen: . Siehe die Dokumentehier. (Methoden zur Schätzung dieser Art von Regression stammen aus dem Bereich der räumlichen Ökonometrie und können viel komplexer werden als die von mir angegebene Referenz.)y=bx+rhoWy+e
Ihre Herausforderung besteht darin, eine räumliche Gewichtsmatrix ( ) zu erstellen . Ich denke, jedes Element w i j der Matrix sollte 1 oder 0 sein, je nachdem, ob die PersonW wij i j
Um eine intuitive Vorstellung von dem Problem zu bekommen, zeige ich unten, wie ein räumlicher autoregressiver Datenerzeugungsprozess (DGP) ein Wertemuster erzeugt. Für die 2 Gitter simulierter Werte repräsentieren die weißen Blöcke hohe Werte und die dunklen Blöcke niedrige Werte.
Im ersten Gitter unten wurden die Gitterwerte durch einen normalverteilten Zufallsprozess (oder Gaußschen) erzeugt, wobeirho
Im nächsten Gitter unten wurden die Gitterwerte durch einen räumlichen autoregressiven Prozess erzeugt, wobeirho auf etwas Hoches eingestellt wurde, z. B. 0,8.
quelle
Hier ist eine einfache Idee, die funktionieren könnte. Wie ich in den Kommentaren gesagt habe, wenn Sie ein Gitter mit Intensitäten haben, warum nicht die Dichte der bivariaten Verteilung anpassen?
Hier ist das Beispieldiagramm, um meinen Standpunkt zu veranschaulichen:
Jeder Gitterpunkt mit wird als Quadrat angezeigt und entsprechend der Intensität gefärbt. Dem Diagramm ist das Konturdiagramm des bivariaten Normaldichtediagramms überlagert. Wie Sie sehen können, dehnen sich die Konturlinien in Richtung abnehmender Intensität aus. Das Zentrum wird durch den Mittelwert der bivariaten Normalen und die Streuung der Intensität gemäß der Kovarianzmatrix gesteuert.
Um die Schätzungen des Mittelwerts und der Kovarianzmatrix zu erhalten, kann eine einfache numerische Optimierung verwendet werden. Vergleichen Sie die Intensitäten mit den Werten der Dichtefunktion, wobei Sie den Mittelwert und die Kovarianzmatrix als Parameter verwenden. Minimieren Sie, um die Schätzungen zu erhalten.
Dies ist natürlich streng genommen keine statistische Schätzung, aber es gibt Ihnen zumindest eine Vorstellung davon, wie Sie weiter vorgehen müssen.
Hier ist der Code zum Reproduzieren des Diagramms:
quelle
quelle