Ich habe einen Datensatz, der aus 247 Mückenfallen besteht, die an festen Positionen platziert und 23 Wochen lang wöchentlich entnommen werden. Im gleichen Zeitraum habe ich auch Daten zur Inzidenz von Dengue-Erkrankungen (indiziert an die Heimatadresse). Ich würde gerne sehen, ob es eine räumliche und räumlich-zeitliche Korrelation zwischen der Mückenfangrate an jedem Fallenort und der Inzidenz von Dengue-Fällen gibt. Ich habe bereits Global Morans I und Local Morans I in R und SaTScan Multivariate Raum-Zeit-Permutation ausprobiert. Nichts davon scheint mir zu geben, was ich will. Schaue ich am richtigen Ort und mache es einfach falsch oder gibt es bessere Analysen, die ich durchführen kann?
Vielen Dank für den Rat !! Am besten Amy Green
data
r
spatial-statistics
statistics
Amy Green
quelle
quelle
Antworten:
Ich denke, Sie versuchen, die Wirksamkeit des Einfangens bei der Reduzierung der Dengue-Kontraktionshäufigkeit abzuschätzen. Vielleicht möchten Sie einen Blick auf Raum-Zeit-Interaktionstests werfen.
PySAL verfügt über eine Reihe von Implementierungen in seinem Modul räumliche_Dynamik.
quelle
Sind die Moskitodaten, zählt? oder an welche Art von Variablen erinnern Sie sich an diese Fallen? Ich habe eine Studie gesehen, in der MaxEnt verwendet wird, um Leishmanie in Mexiko für die nächsten 20 Jahre vorherzusagen, wobei nur das Vorhandensein der Krankheitsherde als Daten verwendet wird. Ich denke nicht, dass es sehr vertrauenswürdig ist, aber es ist ein Ausgangspunkt und es gab viele Entwicklungen. Was suchen Sie nach einer Art Kriging, mit dem Sie die räumliche Variabilität Ihrer Variablen verstehen können? Sie könnten sogar einige Simulationen ausführen, wenn Sie Modelle erhalten, die gut passen. Ich bin mir ziemlich sicher, dass es Kriging-Techniken gibt, die in einem räumlich-zeitlichen Kontext funktionieren, aber ich habe sie nie verwendet. Eine schnelle Google-Suche sollte einige Referenzen werfen. 23 Wochen sind nicht viele Datenpunkte für die Zeitreihenanalyse, aber Sie können es ausprobieren, Mit dem R-Paket bfast können Sie abrupte Unterbrechungen im Verhalten einer Zeitreihe erkennen. Vielleicht können Sie diese Anomalien erkennen und sie mit Dengue-Ausbrüchen verknüpfen. Ich denke, Sie müssen eine bessere Beschreibung Ihres Problems und der gewünschten Studienergebnisse erstellen.
quelle
Schwer zu sagen, ohne Ihre Daten zu sehen und eine explorative Analyse durchzuführen. Einige weitere Details zu Hypothese, Stichprobenentwurf und tatsächlich gesammelten Daten wären zu begrüßen. Wenn Sie Fragen zur statistischen Methodik stellen, ist es wichtig, dass Sie die Hypothese angeben, die Sie testen. Dies kann statistische Methoden bestimmen und ohne es zu wissen, schießen wir im Dunkeln.
Es ist auch überhaupt nicht klar, was das Problem mit den angegebenen Statistiken im Zusammenhang mit "nicht geben, was ich will" ist. Ich weiß nicht, was Sie mit einer univariaten Autokorrelationsstatistik erwartet haben, die auf eine bivariate räumliche Korrelation hinweist. Die Familie der SCAN-Statistiken ist sehr variabel, da viele definierte Verteilungen verfügbar sind. Welche Verteilung (Modell) haben Sie in SaTScan definiert und haben Sie tatsächlich eine Hypothese und Daten, die für eine Punktmusteranalyse geeignet sind? Im Allgemeinen ist eine gerasterte, systematische Probe für eine Punktmusteranalyse nicht geeignet.
Eine Korrelation wäre vom inferentiellen Standpunkt aus sehr einschränkend, und es scheint, dass hier ein Regressionstypmodus angebracht ist. Auf den ersten Blick würde ich denken, dass ein Modell mit gemischten Effekten mit einem AR-I-Term für die Zeit und einem Autokorrelationsterm für die räumlichen Zufallseffekte Ihren Anforderungen entspricht. Auf diese Weise können Sie die zeitliche Variation partitionieren und den Einfluss der Autokorrelation auf die verbleibenden Fehler- und ID-Annahmen normalisieren. Eine andere Option, wenn die Daten dies unterstützen, wäre ein Poisson-Punkt-Prozessmodell in einem MCMC-Framework. Wenn als hierarchisches Modell angegeben, können Sie die Zeit als Prior definieren. Mit einem Kernel-Regressionsansatz können Sie mehrere Hypothesen räumlicher Diffusionsprozesse testen oder einen quadratischen Diffusionsterm definieren. Diese Art von Modell wird üblicherweise in der räumlichen Epidemiologie verwendet, um die Ausbreitungsrate zu erreichen.
Es ist leicht, sich mit räumlichen statistischen Ansätzen darin zu verlieren, "Ihre Daten gegen die Wand zu werfen". Wenn Ihr Beispieldesign jedoch nicht dazu gedacht ist, räumliche Prozesse zu erfassen, und Sie eine gut formulierte Frage zum räumlichen Effekt haben, kann dies eine vergebliche Übung sein.
Aufgrund der einfachen Verfügbarkeit von Methoden werden häufig verwendete Methoden häufig übersehen. Es gibt Regressionsmodelle, die leicht mit räumlichen Daten umgehen können (räumliche und bedingte autoregressive, räumliche Regression, polynomielle Regression, Modelle mit gemischten Effekten, kanonische Regression, Kernel-Regression, semi-parametrische und nicht parametrische Regressionen, ...) und wenn Sie dies beabsichtigen Inferenz diese sollten in Bezug auf Ihre Hypothese untersucht werden.
quelle