Ich arbeite mit einer explorativen räumlichen Analyse in R unter Verwendung des spdep-Pakets.
Ich stieß auf eine Option zum Anpassen der p- Werte lokaler Indikatoren der räumlichen Assoziation (LISA), die mithilfe der localmoran
Funktion berechnet wurden . Laut den Dokumenten richtet es sich an:
... Wahrscheinlichkeitswertanpassung für mehrere Tests.
Weiter in den Dokumenten von habe p.adjustSP
ich gelesen, dass die verfügbaren Optionen sind:
Die Anpassungsmethoden umfassen die Bonferroni-Korrektur ("Bonferroni"), bei der die p-Werte mit der Anzahl der Vergleiche multipliziert werden. Vier weniger konservative Korrekturen sind auch von Holm (1979) ("holm"), Hochberg (1988) ("hochberg"), Hommel (1988) ("hommel") und Benjamini & Hochberg (1995) enthalten. ('"fdr"'). Eine Pass-Through-Option ("keine") ist ebenfalls enthalten.
Die ersten vier Methoden dienen dazu, die familienbezogene Fehlerrate genau zu steuern. Es scheint keinen Grund zu geben, die unveränderte Bonferroni-Korrektur zu verwenden, da sie von der Holm-Methode dominiert wird, die auch unter willkürlichen Annahmen gültig ist.
Die Methoden von Hochberg und Hommel sind gültig, wenn die Hypothesentests unabhängig sind oder wenn sie nicht negativ assoziiert sind (Sarkar, 1998; Sarkar und Chang, 1997). Hommels Methode ist leistungsfähiger als die von Hochberg, aber der Unterschied ist normalerweise gering und die Hochberg-p-Werte sind schneller zu berechnen.
Die Methoden "BH" (auch bekannt als "fdr") und "BY" von Benjamini, Hochberg und Yekutieli steuern die Rate falscher Entdeckungen, den erwarteten Anteil falscher Entdeckungen unter den zurückgewiesenen Hypothesen. Die Rate falscher Entdeckungen ist eine weniger strenge Bedingung als die familienbezogene Fehlerrate, daher sind diese Methoden leistungsfähiger als die anderen.
Einige Fragen, die auftauchten:
- In einfachen Worten - was ist der Zweck dieser Anpassung?
- Ist es notwendig, solche Korrekturen zu verwenden?
- Wenn ja - wie können Sie aus den verfügbaren Optionen auswählen?
Antworten:
Kurz gesagt, das Problem, mit dem Sie konfrontiert sind, wird als Testen mehrerer Hypothesen bezeichnet . Es entsteht, wenn Sie, wie der Name schon sagt, viele Hypothesen gleichzeitig testen.
Angenommen, Sie haben eine bestimmte Wahrscheinlichkeit, die Nullhypothese (falsch positiv) für einen Test falsch abzulehnen, z. B. 5%. Wenn Sie die Anzahl der zu testenden Datensätze erhöhen (in diesem Fall jeden der Sätze, in denen Sie die lokale Moran-Statistik anwenden), steigt die Wahrscheinlichkeit, in einem Datensatz ein falsches Positiv zu beobachten, unabhängig von der Tatsache, dass die Wahrscheinlichkeit der Beobachtung besteht Ein falsches Positiv für einen einzelnen Datensatz ist dasselbe.
Es gibt viele mögliche "Korrekturen", die Sie gefunden haben, um dieses Problem zu beheben. Wenn Sie wirklich eine lokale Statistik benötigen, können Sie dieser nicht ausweichen. Andernfalls können Sie die globale Statistik als einzelne Hypothese verwenden.
quelle