Kann Bootstrap verwendet werden, um nicht parametrische Tests zu ersetzen?

15

Ich bin ziemlich neu in der Statistik. Das Konzept des Bootstrapings hat mich verwirrt.

Ich weiß, dass die Normalität der Stichprobenverteilung erforderlich ist, um bestimmte Tests wie den T-Test zu verwenden. In Fällen, in denen die Daten nicht normal verteilt sind, würde dies das Problem der Nicht-Normalität umgehen, indem Sie "Bootstrapping" in t-tests in SPSS anfordern. Wenn ja, basiert die in der Ausgabe gemeldete t-Statistik auf der Bootstrapped-Sampling-Verteilung?

Wäre dies ein besserer Test als die Verwendung nicht parametrischer Tests wie Mann-Whitney oder Kruskal-Wallis, wenn ich nicht normale Daten habe? In Situationen, in denen die Daten nicht normal sind und ich Bootstrap verwende, würde ich die t-Statistik nicht melden: richtig?

JC22
quelle

Antworten:

16

Der Bootstrap funktioniert ohne Annahmen wie Normalität, kann jedoch sehr variabel sein, wenn die Stichprobengröße klein und die Grundgesamtheit nicht normal ist. So kann es im Sinne der getroffenen Annahmen besser sein, aber es ist nicht in jeder Hinsicht besser.

Die Bootstrap-Beispiele mit Ersatz, Permutationstests ohne Ersatz. Der Mann-Whitney-Test und andere nichtparametrische Tests sind eigentlich Sonderfälle des Permutationstests. Eigentlich bevorzuge ich hier den Permutationstest, weil Sie eine aussagekräftige Teststatistik angeben können.

Die Entscheidung, welcher Test verwendet werden soll, sollte auf der zu beantwortenden Frage und dem Wissen über die Wissenschaft, die zu den Daten führt, beruhen. Der zentrale Grenzwertsatz sagt uns, dass wir mit t-Tests immer noch sehr gute Näherungen erhalten können, auch wenn die Population nicht normal ist. Wie gut die Annäherungen sind, hängt von der Form der Populationsverteilung (nicht der Stichprobe) und der Stichprobengröße ab. Es gibt viele Fälle, in denen ein t-Test für kleinere Stichproben immer noch sinnvoll ist (und einige Fälle, in denen er für sehr große Stichproben nicht gut genug ist).

Greg Snow
quelle
Danke das ist hilfreich. Wenn ich also Bootstrapping verwende, würde ich nur den p-Wert und das CI ohne Teststatistik melden. Ist das richtig?
JC22
(+1) Hätten Sie zufällig eine Referenz oder einen Link zu Mann-Whitney- und Permutationstests? Das ist sehr interessant, aber für mich nicht offensichtlich!
Gala
4
@ JC22 Sie sollten eine Teststatistik melden (unabhängig davon, welche Statistik Sie booten). Ein auf einem Mittelwert basierender Bootstrap-Test unterscheidet sich beispielsweise von einem auf einem getrimmten Mittelwert basierenden Test.
Glen_b
2
@ GaëlLaurans Ein Beispiel für die Generierung der exakten (Permutations-) Verteilung der Wilcoxon-Rang-Summen-Teststatistik (entspricht Mann-Whitney) und der Kruskal-Wallis-Teststatistik finden Sie in dieser Antwort .
Karakal
2
@ GaëlLaurans: Unterschiedliche Ergebnisse des Wilcoxon-Mann-Whitney-Tests aus unterschiedlichen Statistikpaketen Reinhard Bergmann, John Ludbrook und Will PJM Spooren Journal: The American StatisticianVolume 54, Ausgabe 1, Februar 2000, Seiten 72-77
Greg Snow