Was sind die Unterschiede zwischen den Begriffen "Zeitreihenanalyse" und "Längsschnittdatenanalyse"?

17

Wenn es um longitudinale Daten geht, können wir uns wiederholt auf Daten beziehen, die im Laufe der Zeit von demselben Subjekt / derselben Lerneinheit gesammelt wurden, so dass es Korrelationen für die Beobachtungen innerhalb desselben Subjekts gibt, dh Ähnlichkeit innerhalb des Subjekts.

Wenn wir über Zeitreihendaten sprechen, beziehen wir uns auch auf die Daten, die über eine Reihe von Zeitreihen gesammelt wurden, und sie scheinen der oben erwähnten Längseinstellung sehr ähnlich zu sein.

Ich frage mich, ob jemand eine klare Klärung zwischen diesen beiden Begriffen liefern kann. Wie ist die Beziehung und worin bestehen die Unterschiede?

fragend
quelle
1
Dies könnte sich in eine Umfrage verwandeln ... Ich habe an beiden Arten von Daten gearbeitet, und ein wesentlicher Unterschied scheint darin zu bestehen, dass Längsschnittdaten häufig in Kausalanalysen verwendet werden, um die Auswirkungen von Interventionen oder Behandlungen zu verstehen, während häufig Zeitreihen verwendet werden in der Vorhersage . Natürlich ist der Unterschied nicht eindeutig (Sie müssen die zugrunde liegenden Treiber verstehen, um Prognosen zu erstellen, und IMO haben Sie die Treiber nur verstanden, wenn Sie eine gute Prognose erstellen können). Aber Menschen, die Signale in Zeitreihen erkennen, interessieren sich oft nicht so sehr für Prognosen, weshalb sie meine Unterscheidung wahrscheinlich ablehnen.
S. Kolassa - Wiedereinsetzung von Monica am
Danke für deine Kommentare. Aber ich denke, der Begriff "kausal" mag hier nicht angebracht sein, eher sollte der Begriff "Assoziation" besser sein? In Bezug auf den Zweck der Datenanalyse halte ich Ihre Kommentare für sinnvoll. Aber können wir die Längsschnittdaten nicht für Prognosen verwenden? Da es sich auch um eine Art Zeitreihendaten handelt.
Askming
1
Sie haben einen Punkt in Bezug auf "kausale" vs. "Assoziation", und natürlich können Längsschnittdaten zur Vorhersage herangezogen werden - es ist nur so, dass ich die beiden Konzepte nicht oft zusammen sehe. Prognostiker sprechen normalerweise über Zeitreihen. Abgesehen davon könnte ich es nicht besser ausdrücken als @gung.
S. Kolassa - Wiedereinsetzung von Monica am
3
Einer der möglichen typischen (nicht definierten) Unterschiede besteht darin, dass Sie in Zeitreihen die Zeit als abhängig vom t - 1 - Zustand modellieren . Dies ist ein Verschleppungseffekt . In der longitudinalen Zeitanalyse betrachten Sie Zeit normalerweise als permanenten , evolutionären Hintergrundfaktor. tt1
ttnphns

Antworten:

19

Ich bezweifle, dass es strenge, formale Definitionen gibt, über die sich eine Vielzahl von Datenanalysten einig sind.

In der Regel jedoch Zeitreihen eine einzelne Lerneinheit zu verstehen, die über einen sehr langen Zeitraum in regelmäßigen Abständen beobachtet wird. Ein prototypisches Beispiel wäre das jährliche BIP-Wachstum eines Landes über Jahrzehnte oder sogar über hundert Jahre. Für einen Analysten, der für ein privates Unternehmen arbeitet, sind dies möglicherweise monatliche Umsatzerlöse über die gesamte Lebensdauer des Unternehmens. Da es so viele Beobachtungen gibt, werden die Daten sehr detailliert analysiert und nach Faktoren wie der Saisonabhängigkeit über verschiedene Zeiträume gesucht (z. B. monatlich: mehr Umsatz zu Beginn eines Monats, kurz nachdem die Leute bezahlt wurden; jährlich: mehr Umsatz im November und Dezember, wenn die Leute für die Weihnachtszeit einkaufen) und möglicherweise das Regime wechselt. Prognosen sind oft sehr wichtig, wie @StephanKolassa feststellt.

Längsschnitt bezieht sich normalerweise auf weniger Messungen über eine größere Anzahl von Lerneinheiten. Ein prototypisches Beispiel könnte eine Arzneimittelstudie sein, bei der Hunderte von Patienten zu Studienbeginn (vor der Behandlung) und monatlich für die nächsten 3 Monate gemessen werden. Mit nur 4 Beobachtungen jeder Einheit in diesem Beispiel ist es nicht möglich, die Arten von Merkmalen zu ermitteln, an denen Zeitreihenanalysten interessiert sind. Andererseits kann bei Patienten, die vermutlich in Behandlungs- und Kontrollarme randomisiert sind, die Kausalität einmal abgeleitet werden Die Nichtunabhängigkeit wurde behoben. Wie dies nahelegt, wird die Nichtunabhängigkeit oft eher als störend denn als das Hauptmerkmal des Interesses angesehen.

gung - Wiedereinsetzung von Monica
quelle
8

Es gibt ungefähr drei Arten von Datensätzen:

  • Querschnitt: verschiedene Fächer gleichzeitig; Stellen Sie es sich als eine Zeile mit vielen Spalten vor, die verschiedenen Themen entsprechen.
  • Zeitreihen: das gleiche Thema zu verschiedenen Zeiten; Stellen Sie es sich als eine Spalte mit Zeilen vor, die verschiedenen Zeitpunkten entsprechen.
  • Panel (longitudinal): viele Themen zu unterschiedlichen Zeiten, Sie haben das gleiche Thema zu unterschiedlichen Zeiten und Sie haben viele Themen zur gleichen Zeit; Stellen Sie sich das als eine Tabelle vor, in der Zeilen Zeitpunkte und Spalten Themen sind.
Aksakal
quelle
2
Basierend auf Ihren Kommentaren scheint es sich bei den Längsschnittdaten um mehrere Zeitreihendaten zu handeln, die von verschiedenen Subjekten gesammelt wurden.
Askming
1
Im Allgemeinen können Sie die Daten der einzelnen Probanden als Zeitreihen anzeigen. In der Praxis haben Längsschnittdaten jedoch oft nur sehr wenige Zeitpunkte für jedes Subjekt. Sie nennen die Zeitpunkte Wellen . Beispielsweise könnte es sich um eine medizinische Studie handeln, bei der jeder Patient in monatlichen Abständen 4 bis 5 Beobachtungen durchführt und im Laufe der Jahre Hunderte von Patienten. Auf diese Weise sind Paneldatensätze oft unausgewogen (denken Sie an eine sehr spärliche Tabelle), sodass Längsschnittstudien ihre eigenen bevorzugten Methoden haben, um damit umzugehen.
Aksakal
Dies ist in Anbetracht der Frage hilfreich, aber es gibt viele andere Arten von Datensätzen, die nicht unter eine dieser Überschriften fallen. Sie scheinen jedoch für die Frage nicht relevant zu sein, und der Versuch, alle möglichen Arten von Datensätzen zu klassifizieren, wäre hier vergeblich. Beispiele: Beliebiger Datensatz, bei dem die Grundstruktur subject x subject ist; Jeder Datensatz, der nicht zweidimensional ist.
Nick Cox
@ NickCox, stimmt, aber ich bin in der Ökonometrie, und diese drei sind diejenigen mit entwickelten Theorien und meist in unserem Bereich verwendet
Aksakal
2
Sie zweifeln nicht daran, aber nichts in dieser Frage verpflichtet oder fördert einen eng ökonometrischen Standpunkt, noch wurde Ihre spezifische Perspektive explizit dargelegt.
Nick Cox
3

Diese beiden Begriffe hängen möglicherweise nicht so zusammen, wie es das OP annimmt - ich glaube also nicht, dass es sich um konkurrierende Analysemodi handelt.

Stattdessen beschreibt die Zeitreihenanalyse eine Reihe von Techniken auf niedrigerer Ebene, die nützlich sein können, um Daten in einer Längsschnittstudie zu analysieren.

Das Untersuchungsobjekt in der Zeitreihenanalyse ist ein zeitabhängiges Signal.

Die meisten Techniken zum Analysieren und Modellieren / Vorhersagen dieser zeitabhängigen Signale basieren auf der Voraussetzung, dass diese Signale in verschiedene Komponenten zerlegbar sind. Die zwei wichtigsten sind:

  • zyklische Komponenten (z. B. täglich, wöchentlich, monatlich, saisonal); und

  • Trend

Mit anderen Worten basiert die Zeitreihenanalyse auf der Ausnutzung der zyklischen Natur eines zeitabhängigen Signals, um ein zugrunde liegendes Signal zu extrahieren.

doug
quelle
0

Zur Vereinfachung gehe ich von einer Untersuchung einzelner Personen aus, das Gleiche gilt jedoch für jede Analyseeinheit. Es ist nicht kompliziert, Zeitreihen sind Daten, die über einen bestimmten Zeitraum hinweg gesammelt werden und in der Regel dieselbe Messung aus einer entsprechenden Grundgesamtheit in separaten Zeitintervallen implizieren - oder kontinuierlich gesammelt, aber in bestimmten Zeitintervallen analysiert werden.
Längsschnittdaten haben einen viel breiteren Anwendungsbereich. Die entsprechende Grundgesamtheit wird durch die identische Grundgesamtheit ersetzt, sodass einzelne Daten im Laufe der Zeit gepaart oder zusammengefügt werden können. Längsschnittdaten können je nach Ziel der Studie wiederholte Messungen sein oder nicht. Wenn longitudinale Daten wie eine Zeitreihe aussehen, messen wir das Gleiche über die Zeit. Der große Unterschied besteht darin, dass wir in einer Zeitreihe die Gesamtänderung der Messung über die Zeit (oder nach Gruppen) messen können, während Sie in einer Längsschnittanalyse tatsächlich die Änderung auf individueller Ebene messen. Sie haben also ein viel größeres Analysepotential und die Messung der Änderung ist fehlerfrei, wenn es sich um eine Stichprobe handelt, sodass eine Längsschnittstudie präziser und aussagekräftiger sein kann.

dre0303
quelle