Grundlegendes zur Ausgabe eines in R ausgeführten Bootstraps (tsboot, MannKendall)

11

Ich habe eine Frage zur Interpretation des tsboot-Aufrufs in R. Ich habe die Dokumentation sowohl des Kendall- als auch des Boot-Pakets überprüft, bin aber nicht schlauer als zuvor.

Wenn ich einen Bootstrap ausführe, z. B. anhand des Beispiels im Kendall-Paket, wobei die Teststatistik Kendalls Tau ist:

library(Kendall)
# Annual precipitation entire Great Lakes
# The Mann-Kendall trend test confirms the upward trend.
data(PrecipGL)
MannKendall(PrecipGL)

was den Aufwärtstrend bestätigt:

tau = 0.265, 2-sided pvalue =0.00029206

Das Beispiel verwendet dann weiterhin einen Block-Bootstrap:

#
#Use block bootstrap 
library(boot)
data(PrecipGL)
MKtau<-function(z) MannKendall(z)$tau
tsboot(PrecipGL, MKtau, R=500, l=5, sim="fixed")

Ich erhalte folgendes Ergebnis:

BLOCK BOOTSTRAP FOR TIME SERIES
Fixed Block Length of 5 
Call:
tsboot(tseries = PrecipGL, statistic = MKtau, R = 500, l = 5, 
sim = "fixed")


Bootstrap Statistics :
 original     bias    std. error
t1* 0.2645801 -0.2670514  0.09270585

Wenn ich das richtig verstehe, ist das "t1 * original" das ursprüngliche MKtau, die "Vorspannung" ist der Mittelwert des MKtau aus der R = 500-Bootstrap-Zeitreihe und der "Standardfehler" ist die Standardabweichung des MKtaus von die 500 Proben.

Ich habe Probleme zu verstehen, was dies bedeutet - dies sagt mir im Grunde, dass alle 500 MKTaus niedriger als das Original sind und dass das Original t1 * im Bereich von 3 sd des Bootstrap-MKtaus liegt. Ergo ist es deutlich anders?

Oder würde ich sagen, dass der MKtau für den Datensatz 0,26 plus / minus Standardfehler ist?

Es tut mir leid für die lange Frage, aber ich bin ein Statistik-Neuling und lerne durch Selbststudium, da mir jemand fehlt, mit dem ich dieses wahrscheinlich wirklich einfache Problem hin und her hüpfen kann.

Maria
quelle
6
In der Ausgabe biasist einfach die Differenz zwischen dem Mittelwert der 500 gespeicherten Bootstrap-Beispiele und der ursprünglichen Schätzung. Dies std. errorist die Standardabweichung der 500 Bootstrap-Beispiele und eine Schätzung des Standardfehlers. Die Ausgabe zeigt an, dass Ihre ursprüngliche Schätzung höher ist als der Mittelwert der 500 Bootstrap-Schätzungen (daher sind nicht alle Bootstrap-MKtaus niedriger). Der Bootstrap wird häufig verwendet, um Standardfehler / Konfidenzintervalle zu berechnen, ohne Annahmen über die Verteilung zu treffen. Verwenden Sie die boot.ciFunktion, um die Konfidenzintervalle zu berechnen.
COOLSerdash
@COOLSerdash, danke dafür! Wenn meine ursprüngliche Statistik 3 sd höher ist als der Mittelwert der Bootstrap-Statistik, kann ich dann direkt auf etwas schließen (sagen wir: Statistik ist bei 0,99 signifikant)? Ich habe auch das verwendet boot.ci, um die Konfidenzintervalle zu berechnen, und wieder liegt die ursprünglich berechnete Statistik außerhalb dieser Intervalle.
Maria
Nein, Sie vergleichen die Bootstrap-Statistik nicht mit der ursprünglichen Statistik mit einem Hypothesentest. Ich würde nur die Bootstrap-Standardfehler- und Konfidenzintervalle in Ihrem Fall verwenden / melden.
COOLSerdash

Antworten:

3

Nachdem ich auf dieselbe Frage gestoßen bin und sie mit einem kontrollierten Datensatz untersucht habe - Modell y = ax + b mit N (0, sig) -Fehlern -, stelle ich fest, dass das Kendall-Paket möglicherweise nicht wie angekündigt funktioniert. Das x in meinem Fall war 1:100und y = x mit sig = 100 (Varianz des Fehlerterms).

Die Regression sieht gut aus, ebenso wie Kendalls Tau. Hier gibt es keine andere Autokorrelation als die durch das lineare Modell induzierte. Das Ausführen des Kendall-Tests wie angekündigt mit Blocklängen von 1, 3, 5 und 10 ergibt sehr große Bias-Werte und boot.cimeldet keinen Trend.

Anschließend habe ich den Bootstrap der Daten mit diesen Blocklängen von Hand codiert, und mit meiner Kontrollserie erhalte ich vernünftige Ergebnisse hinsichtlich des Mittelwerts der Bootstrap-Beispiele und ihrer Verteilung. Daher ist es möglich, dass mit dem Paket Kendall in Bezug auf den Block-Bootstrap etwas schief gelaufen ist.

user46157
quelle