Ich habe einen Datensatz, der ~ 7.500 Blutuntersuchungen von ~ 2.500 Personen enthält. Ich versuche herauszufinden, ob die Variabilität der Blutuntersuchungen mit der Zeit zwischen zwei Tests zunimmt oder abnimmt. Zum Beispiel: Ich ziehe Ihr Blut für den Basistest und ziehe dann sofort eine zweite Probe. Sechs Monate später ziehe ich eine weitere Probe. Man könnte erwarten, dass der Unterschied zwischen dem Basislinien- und dem Sofortwiederholungstest geringer ist als der Unterschied zwischen dem Basislinien- und dem Sechsmonatstest.
Jeder Punkt auf dem Diagramm unten spiegelt den Unterschied zwischen zwei Tests wider. X ist die Anzahl der Tage zwischen zwei Tests; Y ist die Größe der Differenz zwischen den beiden Tests. Wie Sie sehen können, sind die Tests nicht gleichmäßig auf X verteilt - die Studie war eigentlich nicht darauf ausgelegt, diese Frage zu beantworten. Da die Punkte im Mittelwert so stark gestapelt sind, habe ich 95% (blau) und 99% (rot) Quantillinien eingefügt, basierend auf 28-Tage-Fenstern. Diese werden offensichtlich von den extremeren Punkten herumgezogen, aber Sie bekommen die Idee.
Alternativtext http://a.imageshack.us/img175/6595/diffsbydays.png
Mir scheint, dass die Variabilität ziemlich stabil ist. Wenn überhaupt, ist es höher, wenn der Test innerhalb kurzer Zeit wiederholt wird - das ist furchtbar intuitiv. Wie kann ich dies systematisch angehen und dabei zu jedem Zeitpunkt (und in einigen Zeiträumen ohne Tests) unterschiedliche n berücksichtigen? Ihre Ideen werden sehr geschätzt.
Nur als Referenz ist dies die Verteilung der Anzahl der Tage zwischen Test und erneutem Test:
Alternativtext http://a.imageshack.us/img697/6572/testsateachtimepoint.png
quelle
Antworten:
Aus Ihrer Beschreibung kann ich keinen Grund erkennen, den "Basistest" von der sofort gezogenen "zweiten Probe" zu unterscheiden. Es handelt sich lediglich um 2 Basislinienmessungen, und die Varianz (an der Basislinie) kann auf dieser Basis berechnet werden. Es wäre besser, den Mittelwert der beiden Grundlinienmessungen gegen die dritte "sechsmonatige" Stichprobe aufzutragen.
Das Problem ist mit der 6-Monats-Probe. Da zu diesem Zeitpunkt nur eine Stichprobe entnommen wird, gibt es keine Möglichkeit, die "Variabilität" an diesem Punkt abzuschätzen oder die Stichprobenvariation von der (realen) Längsänderung des TB-Messwerts zu trennen.
Wenn wir dies als ein Problem der Längsschnittdatenanalyse betrachten, würden wir wahrscheinlich einen zufälligen Schnittpunkt (Basis-TB) und eine zufällige Steigung (passend zum 6-Monats-TB) wählen. Die Variabilität der Stichproben würde aus den beiden Basislinienmessungen und der Steigung aus der dritten 6-Monats-Messung geschätzt. Wir können die Variabilität nicht auf 6 Monate schätzen, ohne starke Verteilungsannahmen für die Veränderung über diese sechs Monate, z. B. unter der Annahme, dass sich nichts ändert.
quelle