Ich habe eine Frage zur Interpretation des tsboot-Aufrufs in R. Ich habe die Dokumentation sowohl des Kendall- als auch des Boot-Pakets überprüft, bin aber nicht schlauer als zuvor.
Wenn ich einen Bootstrap ausführe, z. B. anhand des Beispiels im Kendall-Paket, wobei die Teststatistik Kendalls Tau ist:
library(Kendall)
# Annual precipitation entire Great Lakes
# The Mann-Kendall trend test confirms the upward trend.
data(PrecipGL)
MannKendall(PrecipGL)
was den Aufwärtstrend bestätigt:
tau = 0.265, 2-sided pvalue =0.00029206
Das Beispiel verwendet dann weiterhin einen Block-Bootstrap:
#
#Use block bootstrap
library(boot)
data(PrecipGL)
MKtau<-function(z) MannKendall(z)$tau
tsboot(PrecipGL, MKtau, R=500, l=5, sim="fixed")
Ich erhalte folgendes Ergebnis:
BLOCK BOOTSTRAP FOR TIME SERIES
Fixed Block Length of 5
Call:
tsboot(tseries = PrecipGL, statistic = MKtau, R = 500, l = 5,
sim = "fixed")
Bootstrap Statistics :
original bias std. error
t1* 0.2645801 -0.2670514 0.09270585
Wenn ich das richtig verstehe, ist das "t1 * original" das ursprüngliche MKtau, die "Vorspannung" ist der Mittelwert des MKtau aus der R = 500-Bootstrap-Zeitreihe und der "Standardfehler" ist die Standardabweichung des MKtaus von die 500 Proben.
Ich habe Probleme zu verstehen, was dies bedeutet - dies sagt mir im Grunde, dass alle 500 MKTaus niedriger als das Original sind und dass das Original t1 * im Bereich von 3 sd des Bootstrap-MKtaus liegt. Ergo ist es deutlich anders?
Oder würde ich sagen, dass der MKtau für den Datensatz 0,26 plus / minus Standardfehler ist?
Es tut mir leid für die lange Frage, aber ich bin ein Statistik-Neuling und lerne durch Selbststudium, da mir jemand fehlt, mit dem ich dieses wahrscheinlich wirklich einfache Problem hin und her hüpfen kann.
bias
ist einfach die Differenz zwischen dem Mittelwert der 500 gespeicherten Bootstrap-Beispiele und der ursprünglichen Schätzung. Diesstd. error
ist die Standardabweichung der 500 Bootstrap-Beispiele und eine Schätzung des Standardfehlers. Die Ausgabe zeigt an, dass Ihre ursprüngliche Schätzung höher ist als der Mittelwert der 500 Bootstrap-Schätzungen (daher sind nicht alle Bootstrap-MKtaus niedriger). Der Bootstrap wird häufig verwendet, um Standardfehler / Konfidenzintervalle zu berechnen, ohne Annahmen über die Verteilung zu treffen. Verwenden Sie dieboot.ci
Funktion, um die Konfidenzintervalle zu berechnen.boot.ci
, um die Konfidenzintervalle zu berechnen, und wieder liegt die ursprünglich berechnete Statistik außerhalb dieser Intervalle.Antworten:
Nachdem ich auf dieselbe Frage gestoßen bin und sie mit einem kontrollierten Datensatz untersucht habe - Modell y = ax + b mit N (0, sig) -Fehlern -, stelle ich fest, dass das Kendall-Paket möglicherweise nicht wie angekündigt funktioniert. Das x in meinem Fall war
1:100
und y = x mit sig = 100 (Varianz des Fehlerterms).Die Regression sieht gut aus, ebenso wie Kendalls Tau. Hier gibt es keine andere Autokorrelation als die durch das lineare Modell induzierte. Das Ausführen des Kendall-Tests wie angekündigt mit Blocklängen von 1, 3, 5 und 10 ergibt sehr große Bias-Werte und
boot.ci
meldet keinen Trend.Anschließend habe ich den Bootstrap der Daten mit diesen Blocklängen von Hand codiert, und mit meiner Kontrollserie erhalte ich vernünftige Ergebnisse hinsichtlich des Mittelwerts der Bootstrap-Beispiele und ihrer Verteilung. Daher ist es möglich, dass mit dem Paket Kendall in Bezug auf den Block-Bootstrap etwas schief gelaufen ist.
quelle