Spezifikation der Paneldaten

8

Ich versuche, die beste Spezifikation für meinen Datensatz herauszufinden.

Ich versuche, die Wirksamkeit der Sonderwirtschaftszonen in Polen im Sinne des Wirtschaftswachstums in drei ähnlichen Paneldatenmodellen für erläuterte Variablen zu untersuchen: a) registrierte Arbeitslosenquote b) BIP pro Kopf c) Bruttoanlageinvestitionen pro Kopf . Die Daten beziehen sich auf NUTS3-Unterregionen. Die erklärenden Variablen sind: 0-1 für das Vorhandensein der SWZ in der Subregion im Jahr und einige der wirtschaftlichen Variablen; Jährliche Häufigkeit, Datensatz ist 2004-2012 für 66 Unterregionen.t

Ich habe feste und zufällige Effekte ausprobiert. Im Moment habe ich mich wegen der Bedeutung und der theoretisch korrekten Vorzeichen für FE entschieden. Es gibt jedoch einige Probleme, die mich daran hindern, dies als selbstverständlich zu betrachten:

  1. Wie teste ich auf Autokorrelation und Kreuzkorrelation?

  2. Ich habe keine Ahnung, wie ich die Verteilung des Fehlerbegriffs in Stata testen soll, und sollte ich mich außerdem sehr darum kümmern, wenn er nicht normal verteilt ist?

  3. Wie ich aus der Literatur verstehe, sind Werte des Korrelationskoeffizienten zwischen erklärenden Variablen und dem Fehlerterm nahe -1 oder 1 tatsächlich nicht schlecht; In meinem Fall ist es fast -1, wie Sie sehen können.

  4. Ist ein gemischtes Modell für meinen Datensatz geeignet?

Ich füge das Ergebnis für das Modell zur Erklärung der Arbeitslosenquote bei.

Code:

xtreg  st_bezr sse01 wartosc_sr_trw_per_capita zatr_przem_bud podm_gosp_na_10tys_ludn proc_ludn_wiek_prod ludnosc_na_km2, fe

Fixed-effects (within) regression               Number of obs      =       594
Group variable: id                              Number of groups   =        66

R-sq:  within  = 0.4427                         Obs per group: min =         9
       between = 0.3479                                        avg =       9.0
       overall = 0.2365                                        max =         9

                                                F(6,522)           =     69.10
corr(u_i, Xb)  = -0.9961                        Prob > F           =    0.0000

-------------------------------------------------------------------------------------------
                  st_bezr |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
--------------------------+----------------------------------------------------------------
                    sse01 |  -1.406066   .4631984    -3.04   0.003    -2.316028   -.4961045
wartosc_sr_trw_per_capita |  -.0000963   .0000166    -5.79   0.000    -.0001289   -.0000636
           zatr_przem_bud |  -26.11989   4.992198    -5.23   0.000    -35.92716   -16.31263
  podm_gosp_na_10tys_ludn |  -.0201788   .0030788    -6.55   0.000    -.0262273   -.0141304
      proc_ludn_wiek_prod |  -229.1996   16.92631   -13.54   0.000    -262.4516   -195.9475
           ludnosc_na_km2 |   .0790167   .0120865     6.54   0.000     .0552726    .1027609
                    _cons |   161.9786   10.76989    15.04   0.000      140.821    183.1363
--------------------------+----------------------------------------------------------------
                  sigma_u |  53.986519
                  sigma_e |  2.5446248
                      rho |  .99778327   (fraction of variance due to u_i)
-------------------------------------------------------------------------------------------
F test that all u_i=0:     F(65, 522) =    27.09             Prob > F = 0.0000
charlie9207
quelle

Antworten:

12

Lassen Sie mich für die Stata-Befehle in dieser Antwort Ihre Variablen in einem lokalen
local xlist sse01 wartosc_sr_trw_per_capita zatr_przem_bud podm_gosp_na_10tys_ludn proc_ludn_wiek_prod ludnosc_na_km2
Verzeichnis sammeln: Jetzt können Sie immer alle Variablen mit "xlist" aufrufen.

1) Es gibt zwei Befehle, die Sie nach Ihrer Regression mit festen Effekten verwenden können.

  • xttest2führt einen Breusch-Pagan-LM-Test mit der Nullhypothese ohne Abhängigkeit zwischen den Residuen durch. Dies ist ein Test für die zeitgleiche Korrelation. Wenn Sie die Null nicht ablehnen, hat der Test keine Querschnittsabhängigkeit in Ihren Residuen festgestellt.
  • xttest3führt eine modifizierte Version des Wald-Tests für gruppenweise Heteroskedastizität durch. Die Nullhypothese ist Homoskedastizität.

Sie können beide Befehle installieren, indem Sie ssc instal xttest2und eingeben ssc instal xttest3. Wenn Sie Korrelationen zwischen Ihren Residuen feststellen, können Sie dies mit der robusten Option korrigieren:
xtreg st_bezr 'xlist', fe robust

Um die Autokorrelation zu testen, können Sie einen Lagrange-Multiplikator-Test anwenden über xtserial:
xtserial st_bezr 'xlist'
Die Nullhypothese ist keine serielle Korrelation. Um sowohl die serielle Korrelation als auch die Heteroskedastizität zu korrigieren, können Sie die Cluster-Option mit Ihrer ID-Variablen verwenden:
xtreg st_bezr 'xlist', fe cluster(id)

2) Für den Normalitätstest für die Residuen: Sie können die Residuen predict res, enach Ihrer Regression mit festen Effekten über den Befehl "Vorhersagen" erhalten . Zur Sichtprüfung können Sie verwenden:

  • kdensity res, normal (Zeichnet die Verteilung der Residuen und vergleicht sie mit einer Normalen)
  • pnorm res (zeichnet ein standardisiertes normales Wahrscheinlichkeitsdiagramm)
  • qnorm res (Zeichnet die Quantile der Residuen gegen die Quantile einer Normalverteilung)

Mit pnorm können Sie sehen, ob es in der Mitte der Verteilung eine Nicht-Normalität gibt, und qnorm zeigt Ihnen eine Nicht-Normalität in den Schwänzen. Ein formaler Test kann von erhalten werden swilk res. Die Nullhypothese lautet, dass die Residuen normal verteilt sind. Im Allgemeinen ist Nicht-Normalität kein allzu großes Problem, aber es ist wichtig für die Schlussfolgerung. Sie können dies mit der robusten Option erneut korrigieren.

corr(u_i, Xb) = -0.9961uichX.β

4) Im Allgemeinen ja, aber es hängt davon ab, was Sie schätzen möchten oder wie Sie Ihre Daten behandeln können, dh ob Ihre Variablen Zufallsvariablen sind oder nicht. Hier ist eine hervorragende Erklärung für den Unterschied zwischen gemischten Effekten und Paneldatenmodellen von @mpiktas, die Ihnen sicherlich helfen wird.

Andy
quelle