Ich habe zwei stark verzerrte Stichproben und versuche, mithilfe von Bootstrapping ihre Mittelwerte mithilfe der t-Statistik zu vergleichen.
Wie ist die richtige Vorgehensweise dafür?
Der Prozess, den ich benutze
Ich bin besorgt über die Angemessenheit der Verwendung des Standardfehlers der ursprünglichen / beobachteten Daten im letzten Schritt, wenn ich weiß, dass dies nicht normal verteilt ist.
Hier sind meine Schritte:
- Bootstrap - Zufallsstichprobe mit Ersatz (N = 1000)
- Berechnen Sie die t-Statistik für jeden Bootstrap, um eine t-Verteilung zu erstellen:
- Schätzen Sie die t-Konfidenzintervalle, indem Sie und Perzentile der t-Verteilung erhalten1 - α / 2
Erhalten Sie Konfidenzintervalle über:
C I U = ( ¯ X 1 - ¯ X 2 ) + T _ C I U . S E o r i g i n a l
wobei- Prüfen Sie, wo die Konfidenzintervalle liegen, um festzustellen, ob ein signifikanter Mittelwertunterschied vorliegt (dh nicht Null).
Ich habe mir auch die Wilcoxon-Rang-Summe angesehen, aber sie liefert aufgrund der sehr stark verzerrten Verteilung (z. B. das 75. == 95. Perzentil) keine sehr vernünftigen Ergebnisse. Aus diesem Grund möchte ich den Bootstrapped-T-Test weiter untersuchen.
Meine Fragen sind also:
- Ist das eine angemessene Methodik?
- Ist es angemessen, die SE der beobachteten Daten zu verwenden, wenn ich weiß, dass sie stark verzerrt sind?
Mögliches Duplikat: Welche Methode wird bevorzugt, ein Bootstrapping-Test oder ein nichtparametrischer rangbasierter Test?
quelle
Antworten:
Ich würde einfach einen regulären Bootstrap-Test machen:
Mehr dazu lesen Sie in:
Kapitel 4 von AC Davison und DV Hinkley (1997) Bootstrap Methods und ihre Anwendung . Cambridge: Cambridge University Press.
Kapitel 16 von Bradley Efron und Robert J. Tibshirani (1993) Eine Einführung in den Bootstrap . Boca Raton: Chapman & Hall / CRC.
Wikipedia-Eintrag zum Testen von Bootstrap-Hypothesen.
quelle