Ich habe ein Überlebensmodell mit Patienten, die in Krankenhäusern verschachtelt sind, das einen Zufallseffekt für die Krankenhäuser beinhaltet. Der zufällige Effekt ist gammaverteilt, und ich versuche, die „Relevanz“ dieses Begriffs auf einer leicht verständlichen Skala darzustellen.
Ich habe die folgenden Referenzen gefunden, die das Median Hazard Ratio verwenden (ein bisschen wie das Median Odds Ratio), und dies berechnet.
Bengtsson T, Dribe M: Historische Methoden 43:15, 2010
Jetzt möchte ich jedoch die mit dieser Schätzung verbundene Unsicherheit mithilfe des Bootstraps melden. Die Daten sind Überlebensdaten, und daher gibt es mehrere Beobachtungen pro Patient und mehrere Patienten pro Krankenhaus. Es scheint offensichtlich, dass ich die Patientenbeobachtungen bei der erneuten Probenahme zusammenfassen muss. Aber ich weiß nicht, ob ich die Krankenhäuser auch gruppieren soll (dh Krankenhäuser neu beproben, anstatt Patienten?
Ich frage mich, ob die Antwort von dem interessierenden Parameter abhängt und ob dies anders wäre, wenn das Ziel eher auf Patientenebene als auf Krankenhausebene relevant wäre.
Ich habe den folgenden Statistikcode aufgelistet, falls dies hilfreich ist.
cap program drop est_mhr
program define est_mhr, rclass
stcox patient_var1 patient_var2 ///
, shared(hospital) ///
noshow
local twoinvtheta2 = 2 / (e(theta)^2)
local mhr = exp(sqrt(2*e(theta))*invF(`twoinvtheta2',`twoinvtheta2',0.75))
return scalar mhr = `mhr'
end
bootstrap r(mhr), reps(50) cluster(hospital): est_mhr
quelle
Die Antwort scheint zu sein, dass der Resampling-Prozess die Struktur der Daten berücksichtigen muss. Hier gibt es eine nette Erklärung (zusammen mit etwas R-Code, um dies zu implementieren).
http://biostat.mc.vanderbilt.edu/wiki/Main/HowToBootstrapCorrelatedData
Dank des Zeigers der UCLA Statistical Consulting Group .
Ich habe eine schnellere (aber weniger flexible) Version des oben verlinkten Code-Snippets geschrieben - suchen Sie hier nach Updates und Details.
quelle