Abrufen und Interpretieren von Bootstrap-Konfidenzintervallen aus hierarchischen Daten

10

Ich bin daran interessiert, ein Bootstrap-Konfidenzintervall für die Menge X zu erhalten, wenn diese Menge bei jeder von 10 Personen zehnmal gemessen wird.

Ein Ansatz besteht darin, den Mittelwert pro Person zu ermitteln und dann die Mittelwerte zu booten (z. B. die Mittelwerte durch Ersetzen neu abzutasten).

Ein anderer Ansatz besteht darin, bei jeder Iteration des Bootstrapping-Verfahrens Folgendes zu tun: Innerhalb jedes Individuums die 10 Beobachtungen dieses Individuums durch Ersetzen erneut abtasten, dann einen neuen Mittelwert für dieses Individuum berechnen und schließlich einen neuen Gruppenmittelwert berechnen. Bei diesem Ansatz trägt jedes im Originaldatensatz beobachtete Individuum bei jeder Iteration der Bootstrap-Prozedur immer zum Gruppenmittelwert bei.

Schließlich besteht ein dritter Ansatz darin, die beiden oben genannten Ansätze zu kombinieren: Einzelpersonen erneut abtasten und dann innerhalb dieser Personen erneut abtasten. Dieser Ansatz unterscheidet sich vom vorhergehenden Ansatz darin, dass er es derselben Person ermöglicht, bei jeder Iteration einen Multiplikator zum Gruppenmittelwert beizutragen. Da jedoch jeder Beitrag über ein unabhängiges Resampling-Verfahren generiert wird, kann erwartet werden, dass diese Beiträge geringfügig voneinander abweichen.

In der Praxis stelle ich fest, dass diese Ansätze unterschiedliche Schätzungen für das Konfidenzintervall liefern (z. B. mit einem Datensatz finde ich, dass der dritte Ansatz viel größere Konfidenzintervalle liefert als die ersten beiden Ansätze), daher bin ich gespannt, was jeder sein könnte interpretiert, um darzustellen.

Mike Lawrence
quelle

Antworten:

7

Ihr erster Ansatz handelt von einem zwischen S CI. Wenn Sie innerhalb von S messen möchten, ist dies der falsche Ansatz.

Der zweite Ansatz würde ein innerhalb von S CI erzeugen, das nur für diese 10 Personen gelten würde.

Der letzte Ansatz ist der richtige für das innerhalb von S CI. Jegliche Erhöhung des CI ist darauf zurückzuführen, dass Ihr CI repräsentativer für ein CI ist, das auf die Bevölkerung angewendet werden könnte, anstatt auf diese 10 S.

John
quelle
6

Nach Davison und Hinckley ("Bootstrap-Methoden und ihre Anwendung", 1997, Abschnitt 3.8) ist der dritte Algorithmus konservativ. Sie befürworten einen vierten Ansatz: einfach die Probanden neu abtasten.

Andrew Robinson
quelle
1
Interessant, ich muss diese Referenz nachschlagen. Sind Sie sicher, dass Sie "vierten" Ansatz meinen? Der erste Ansatz, den ich aufführe, scheint zu beschreiben, "einfach die Themen neu abzutasten".
Mike Lawrence
1
Ja, aber es beschreibt das Resampling des Subjekts. D & H befürwortet die Neuabtastung der Probanden und die Anpassung des Originalmodells.
Andrew Robinson
2
Vielleicht möchten Sie auch die kürzlich veröffentlichten Artikel sehen: Ren, Shiquan, Lai, Hong, Tong, Wenjing, Aminzadeh, Mostafa, Hou, Xuezhang und Lai, Shenghan (2010) 'Nichtparametrisches Bootstrapping für hierarchische Daten', Journal of Applied Statistics, 37: 9, 1487 - 1498
Andrew Robinson
2
@ Mike: Das erneute Abtasten des gesamten Clsuters ist das, was Umfragestatistiker in ihren Bootstraps tun. Dies ist in der Tat ein anderes Verfahren, das nur dann Ihrem "ersten" Ansatz entspricht, wenn (i) Sie nur den Mittelwert schätzen und (ii) die Daten ungewichtet und ausgewogen sind. Siehe auch citeulike.org/user/ctacmo/article/1334050 , citeulike.org/user/ctacmo/article/1475866 , citeulike.org/user/ctacmo/article/582039 .
StasK