Wenn es um longitudinale Daten geht, können wir uns wiederholt auf Daten beziehen, die im Laufe der Zeit von demselben Subjekt / derselben Lerneinheit gesammelt wurden, so dass es Korrelationen für die Beobachtungen innerhalb desselben Subjekts gibt, dh Ähnlichkeit innerhalb des Subjekts.
Wenn wir über Zeitreihendaten sprechen, beziehen wir uns auch auf die Daten, die über eine Reihe von Zeitreihen gesammelt wurden, und sie scheinen der oben erwähnten Längseinstellung sehr ähnlich zu sein.
Ich frage mich, ob jemand eine klare Klärung zwischen diesen beiden Begriffen liefern kann. Wie ist die Beziehung und worin bestehen die Unterschiede?
time-series
terminology
panel-data
fragend
quelle
quelle
Antworten:
Ich bezweifle, dass es strenge, formale Definitionen gibt, über die sich eine Vielzahl von Datenanalysten einig sind.
In der Regel jedoch Zeitreihen eine einzelne Lerneinheit zu verstehen, die über einen sehr langen Zeitraum in regelmäßigen Abständen beobachtet wird. Ein prototypisches Beispiel wäre das jährliche BIP-Wachstum eines Landes über Jahrzehnte oder sogar über hundert Jahre. Für einen Analysten, der für ein privates Unternehmen arbeitet, sind dies möglicherweise monatliche Umsatzerlöse über die gesamte Lebensdauer des Unternehmens. Da es so viele Beobachtungen gibt, werden die Daten sehr detailliert analysiert und nach Faktoren wie der Saisonabhängigkeit über verschiedene Zeiträume gesucht (z. B. monatlich: mehr Umsatz zu Beginn eines Monats, kurz nachdem die Leute bezahlt wurden; jährlich: mehr Umsatz im November und Dezember, wenn die Leute für die Weihnachtszeit einkaufen) und möglicherweise das Regime wechselt. Prognosen sind oft sehr wichtig, wie @StephanKolassa feststellt.
Längsschnitt bezieht sich normalerweise auf weniger Messungen über eine größere Anzahl von Lerneinheiten. Ein prototypisches Beispiel könnte eine Arzneimittelstudie sein, bei der Hunderte von Patienten zu Studienbeginn (vor der Behandlung) und monatlich für die nächsten 3 Monate gemessen werden. Mit nur 4 Beobachtungen jeder Einheit in diesem Beispiel ist es nicht möglich, die Arten von Merkmalen zu ermitteln, an denen Zeitreihenanalysten interessiert sind. Andererseits kann bei Patienten, die vermutlich in Behandlungs- und Kontrollarme randomisiert sind, die Kausalität einmal abgeleitet werden Die Nichtunabhängigkeit wurde behoben. Wie dies nahelegt, wird die Nichtunabhängigkeit oft eher als störend denn als das Hauptmerkmal des Interesses angesehen.
quelle
Es gibt ungefähr drei Arten von Datensätzen:
quelle
Diese beiden Begriffe hängen möglicherweise nicht so zusammen, wie es das OP annimmt - ich glaube also nicht, dass es sich um konkurrierende Analysemodi handelt.
Stattdessen beschreibt die Zeitreihenanalyse eine Reihe von Techniken auf niedrigerer Ebene, die nützlich sein können, um Daten in einer Längsschnittstudie zu analysieren.
Das Untersuchungsobjekt in der Zeitreihenanalyse ist ein zeitabhängiges Signal.
Die meisten Techniken zum Analysieren und Modellieren / Vorhersagen dieser zeitabhängigen Signale basieren auf der Voraussetzung, dass diese Signale in verschiedene Komponenten zerlegbar sind. Die zwei wichtigsten sind:
zyklische Komponenten (z. B. täglich, wöchentlich, monatlich, saisonal); und
Trend
Mit anderen Worten basiert die Zeitreihenanalyse auf der Ausnutzung der zyklischen Natur eines zeitabhängigen Signals, um ein zugrunde liegendes Signal zu extrahieren.
quelle
Zur Vereinfachung gehe ich von einer Untersuchung einzelner Personen aus, das Gleiche gilt jedoch für jede Analyseeinheit. Es ist nicht kompliziert, Zeitreihen sind Daten, die über einen bestimmten Zeitraum hinweg gesammelt werden und in der Regel dieselbe Messung aus einer entsprechenden Grundgesamtheit in separaten Zeitintervallen implizieren - oder kontinuierlich gesammelt, aber in bestimmten Zeitintervallen analysiert werden.
Längsschnittdaten haben einen viel breiteren Anwendungsbereich. Die entsprechende Grundgesamtheit wird durch die identische Grundgesamtheit ersetzt, sodass einzelne Daten im Laufe der Zeit gepaart oder zusammengefügt werden können. Längsschnittdaten können je nach Ziel der Studie wiederholte Messungen sein oder nicht. Wenn longitudinale Daten wie eine Zeitreihe aussehen, messen wir das Gleiche über die Zeit. Der große Unterschied besteht darin, dass wir in einer Zeitreihe die Gesamtänderung der Messung über die Zeit (oder nach Gruppen) messen können, während Sie in einer Längsschnittanalyse tatsächlich die Änderung auf individueller Ebene messen. Sie haben also ein viel größeres Analysepotential und die Messung der Änderung ist fehlerfrei, wenn es sich um eine Stichprobe handelt, sodass eine Längsschnittstudie präziser und aussagekräftiger sein kann.
quelle