Die Antwort hängt von Ihrem Studiendesign ab (z. B. Querschnitts-Zeitreihen? Kohorten-Zeitreihen, serielle Kohorten-Zeitreihen?). Honaker und King haben einen Ansatz entwickelt, der für Querschnittszeitreihen nützlich ist (möglicherweise nützlich für serielle Kohortenzeitreihen, abhängig von Ihren Annahmen), einschließlich des R- Pakets Amelia II zur Eingabe solcher Daten. Inzwischen ist Spratt & Co. haben einen anderen Ansatz beschrieben, der in einigen Kohorten-Zeitreihendesigns verwendet werden kann, bei Software-Implementierungen jedoch spärlich ist.
Ein Querschnitts-Zeitreihendesign (auch als Panel-Studiendesign bezeichnet) ist ein Design, bei dem eine Population (oder Populationen) wiederholt (z. B. jedes Jahr) unter Verwendung desselben Studienprotokolls (z. B. gleicher Variablen, Instrumente usw.) beprobt wird (werden). ). Wenn die Stichprobenstrategie repräsentativ ist, ergeben diese Daten ein jährliches Bild (eine Messung pro Teilnehmer oder Proband) der Verteilung dieser Variablen für jede Population in der Studie.
Ein Kohorten-Zeitreihendesign (auch bekannt als wiederholtes Kohorten-Studiendesign, Längsschnitt-Studiendesign, manchmal auch als Panel-Studiendesign bezeichnet) ist eines, bei dem einzelne Analyseeinheiten einmal abgetastet und über einen langen Zeitraum verfolgt werden. Die Personen können auf repräsentative Weise aus einer oder mehreren Populationen beprobt werden. Allerdings ist eine repräsentative Kohorte Zeitreihe Probe wird eine zunehmend schlechte Vertreter der geworden Zielpopulation (zumindest in menschlichen Populationen) im Laufe der Zeit, weil der Menschen geboren werden oder Alterung in der Zielpopulation und zu sterben oder davon Alterung aus, entlang mit Einwanderung und Auswanderung.
Ein Querschnitts-Zeitreihendesign (auch bekannt als wiederholtes, multi- und multiples Kohorten- oder Panel-Studiendesign) ist eines, bei dem eine Population wiederholt (z. B. jedes Jahr) unter Verwendung desselben Studienprotokolls beprobt wird (werden) (z. B. dieselben Variablen, Instrumente usw.), mit denen einzelne Analyseeinheiten innerhalb einer Population zu zwei Zeitpunkten während des Zeitraums (z. B. während des Jahres) gemessen werden, um Maßzahlen für die Änderungsrate zu erstellen. Wenn die Stichprobenstrategie repräsentativ ist, ergeben diese Daten ein jährliches Bild der Änderungsraten dieser Variablen für jede Population in der Studie.
Literaturhinweise
Honaker, J. und King, G. (2010). Was über fehlende Werte in Zeitreihenquerschnittsdaten zu tun . American Journal of Political Science , 54 (2): 561–581.
Spratt, M., Carpenter, J., Sterne, JAC, Carlin, JB, Heron, J., Henderson, J. und Tilling, K. (2010). Strategien zur multiplen Imputation in Längsschnittstudien . American Journal of Epidemiology , 172 (4): 478–4876.
Sie können das imputeTS- Paket in R verwenden. Ich glaube, die Daten, an denen Sie arbeiten, sind univariate Zeitreihen. Das imputeTS-Paket ist auf (univariate) Zeitreihenimputation spezialisiert. Es bietet verschiedene Implementierungen von Imputationsalgorithmen. Neben den Imputationsalgorithmen bietet das Paket auch Funktionen zum Zeichnen und Drucken fehlender Datenstatistiken. Nun, ich empfehle Ihnen, sich mit Zustandsraummodellen für fehlende Werte zu befassen. Dieses Paket sollte Ihnen bei Ihrer Analyse helfen.
quelle