Ich arbeite mit einem longitudinalen Paneldatensatz, der alle zwei Jahre die gleichen paar tausend Personen befragt, und ich habe sechs Jahre dieser Daten. Meine abhängige Variable wäre, wie viel Personen für X ausgeben, und es gibt eine Liste von ungefähr 15 unabhängigen Variablen wie Alter, Einkommen usw., die sich darauf auswirken könnten, ob und wie viel Personen für X ausgeben.
Ich könnte für jedes Panel Regressionen durchführen, um zu sehen, ob beispielsweise Menschen mit höherem Einkommen mehr für X ausgeben, aber ich möchte messen können, ob sich die Ausgabemuster von Menschen mit X ändern, wenn sich ihre Umstände ändern (tun dies Personen, die ein A erhalten) zwischen Umfragen mehr für X ausgeben - geben Einzelpersonen mehr für X aus, wenn sie älter werden?) statt nur, ob reichere Einzelpersonen mehr für X ausgeben. Ich habe jedoch keine Ahnung, wie ich vorgehen soll.
Was ich bis jetzt habe, ist, dass ich die Daten zwischen Jahren unterscheiden könnte, so dass ich (zum Beispiel) IncomeChange und SpendingOnX für jedes Jahr usw. habe und alles als Satz von Einträgen kombiniere, aber das misst nicht die individuellen Verhaltensänderungen als viel wie nur die Wirkung von Veränderungen. Sowie:
..... | IncomeChange & alle unabhängigen Vars | dSpendingOnX
... 1 | [2007 bis 2005 für Einzelperson A] .. | [wie viel mehr A im Jahr 2007 ausgegeben]
... 2 | [2009 bis 2007 für Einzelperson A] .. | [wie viel mehr A im Jahr 2009 ausgegeben]
... 3 | [2007 bis 2005 für Einzelperson B] .. | [wie viel mehr B im Jahr 2007 ausgegeben]
... 4 | [2009 bis 2007 für Einzelperson B] .. | [wie viel mehr B im Jahr 2009 ausgegeben]
... 5 | [2011 bis 2009 für Einzelperson A] .. | [wie viel mehr A im Jahr 2011 ausgegeben]
Und so weiter, bis zu 25.000 (für die gleichen 5000 befragten Personen in jedem Jahr, für 5 Jahre, da für das erste Jahr der Befragung keine Differenzierung verfügbar wäre).
Das würde mich sehen lassen, wie sich Änderungen beispielsweise des Einkommens auf Änderungen der Ausgaben im Allgemeinen auswirken, aber ich glaube, dass es Methoden geben würde, die viel aufschlussreicher wären und die ich einfach nicht herausfinden konnte. Muss ich für jede Jahreskombination eine eigene Regression durchführen (eine für 2007 mit unterschiedlichen Variablen seit 2005, eine für 2009 mit unterschiedlichen Variablen seit 2007 usw.)?
Zum Beispiel mit dieser Informationsebene:
UserID | dIncome05to07 | dIncome07to09 | dIncome09to11 | dAusgabe05bis07 | dAusgabe07bis09 | dSpending09to11
A | +1000 | -3000 | +250 | +100 | -200 | +100
B | +2000 | -5000 | +700 | +400 | -100 | +100
... bis zum 5000. Individuum.
Wie kann ich Ergebnisse in folgendem Format finden: "Im Allgemeinen wird sich der Betrag, den Einzelpersonen für X ausgeben, voraussichtlich um +117,42 ändern, wenn sich das Einkommen um +1000 ändert." Oder ist das mit diesem Längspaneldatensatz nicht möglich? Bei 5000 Personen ist es nicht so, dass ich für jede Person oder etwas (meines Wissens nach) einen Dummy hinzufügen oder sie in Untergruppen unterteilen könnte.