Ökonometrie: Ist Elastizität bei meiner oder einer anderen Regression sinnvoll?

13

Vor ein paar Monaten habe ich bei dieser Organisation ein Praktikum gemacht. und als weggeschenk beschloss ich, meine letzte woche mit meiner freizeit zu verbringen, um die faktoren zu untersuchen, die die lehrergehälter beeinflussen. Ein Problem, auf das ich bei den Lehrergehältern stieß, war, dass die Verteilung für den gegebenen Staat verzerrt war. Ich hatte viele Beobachtungen, die am unteren Ende des Lohnspektrums lagen. Ich habe versucht, dieses Problem zu lösen, indem ich einen Vergleichslohnindex in meine abhängige Variable (Lehrerlohn) aufgenommen habe, aber die Ergebnisse, die ich gefunden habe, waren für den Umfang meines Projekts völlig veraltet. Ich entschied mich stattdessen, meine abhängige Variable zu protokollieren. Das war schön, denn jetzt hatte mein Lohn eine normale Verteilung und es sah im Histogramm einfach perfekt aus. Als ich anfing, Tests durchzuführen, kam ich an den Punkt, an dem ich eine letzte unabhängige Variable, die Grundsteuererklärung, hatte. Das Problem mit meinen normativen Löhnen zeigte sich auch in meinen Beobachtungen zur Grundsteuererklärung. Ich hatte eine enorme Verschiebung der Zahlen der Grundsteuererklärung zum unteren Ende des Spektrums. Also habe ich diese Variable ebenfalls protokolliert und sie hat den Nullhypothesentest trotzdem bestanden.

Ich bin nicht sicher, ob dies genau richtig ist, aber durch den Vergleich der Änderung einer protokollierten Variablen mit einer anderen protokollierten Variablen erhielt ich die Elastizität. Unter der Annahme, dass dies korrekt ist, zeigt meine Regressionsgleichung (so etwas wie LogWages = B0 + B1 (LogPropertyTaxReturns)) die Elastizität zwischen den beiden Variablen. Ist das aber sinnvoll? Wenn mein Ziel darin bestand, herauszufinden, welche Variable die am meisten betroffenen Lehrergehälter in einem bestimmten Landkreis meines Bundesstaates aufweist, ist es dann hilfreich, die Elastizität zwischen den beiden Variablen zu zeigen? Wir wollen die Landkreise mit den niedrigsten Lehrergehältern erhöhen, um ihren Lebensstandard zu erhöhen, aber ich befürchte, dass ich so weit entfernt von den tatsächlichen Beobachtungen extrapoliert habe, dass meine abschließende Regressionsgleichung bedeutungslos ist.

Bearbeiten: Eine meiner größeren Befürchtungen ist, dass ich ein nichtlineares Modell hätte verwenden sollen, um die Beziehung zu zeigen. Ich bin der Meinung, dass es in gewisser Weise irreführend ist, sowohl die abhängige als auch die unabhängige Variable zu zwingen, bei dieser linearen Regression zusammenzuarbeiten.

econometrics elasticity wages Rosenjcb
quelle

1

Es ist absolut sinnvoll. Schauen Sie sich die Definition der Elastizität an. Grundsätzlich haben Sie Informationen über die Richtung der Beziehung zwischen Löhnen und PropertyTaxReturns. Darüber hinaus haben Sie ein geschätztes Maß für diese Beziehung. Da es sich um Log-Log handelt, ändern sich die Löhne um B1 Prozent pro 1 Prozent Änderung der Grundsteuererklärung. Sie könnten eine Zeitreihenanalyse durchführen, um dies zu bestätigen. Tatsächlich würde es ausreichen, nur die Löhne und die Vermögenssteuererklärung im Laufe der Zeit grafisch darzustellen, um festzustellen, in welchem Verhältnis sie zueinander stehen. Das ist ein grundlegender Weg, der versteckte Variablen und etc. nicht berücksichtigt

Koba

@Koba Danke, dass du so schnell kommentierst. Ist das nicht das Problem, dass sich die Elastizität entlang der Kurve ändert? Mein größtes Bedauern ist, dass ich das Modell möglicherweise gezwungen habe, linear zu sein, wodurch die Elastizität ziemlich stabil wurde. Wenn ich zurückdenke, wäre es vielleicht besser gewesen, ein nichtlineares Modell zu haben, das diesen Versatz widerspiegelt, über den ich gesprochen habe.

Rosenjcb

Es ist nichts Falsches daran, die Variablen mit log, Quadratwurzel, Kehrwerten oder anderen Methoden zu transformieren. Sie zwingen nichts. Mit den Transformationen ermitteln Sie die lineare Beziehung zwischen den Variablen. Manchmal ist es einfach, wenn Sie einfach y = b0 + b1 * x verwenden. Andere Zeitvariablen werden auf kompliziertere Weise linear in Beziehung gesetzt, wie zum Beispiel log (y) = b0 + b1 * (1 / x). Die letzte Funktion liefert möglicherweise eine gute lineare Beziehung, ist jedoch schwerer zu interpretieren. Je weniger Transformation Sie verwenden können, desto besser.

Koba

Die Log-Log-Funktion ist ziemlich einfach log (y) = b0 + b1 * log (x). B1 ist genau die prozentuale Änderung von y pro eine prozentuale Änderung von x in Ihrer Querschnittsanalyse. Wenn Sie diese Daten für einen bestimmten Zeitraum haben, können Sie sie einfach grafisch darstellen, um die Beziehung anzuzeigen.

Koba

Ich habe zuvor Variablen protokolliert und andere Transformationen für meine Regressionsmodelle durchgeführt. Ich war nur besorgt, dass Elastizität einen Anschein von Begegnung erweckte. Rückblickend war das Modell zwar linear, es hatte jedoch nur das Problem, abhängige und unabhängige Variablen mit verzerrten Verteilungen zu haben.

Rosenjcb

12

Die Antwort auf die Frage lautet ja, sie ist in der Tat sinnvoll (zumindest mathematisch gesehen). Wenn Sie die lineare Gleichung schätzen

W = β_{0} + β_{1} P T R,

$W = \beta_0 + \beta_1 PTR,$

dann ist , was bedeutet, dass die marginale Änderung von über . Nun, wenn Sie schätzen $\beta_1=\frac{\partial W }{\partial PTR}$ $\beta_1$ $PTR$ $W$

l Ö G (W) = β_{0} + β_{1} l Ö G (P T R),

$log(W) = \beta_0 + \beta_1 log(PTR),$

dann ist , was genau die Definition von Elastizität ist. $\beta_1=\frac{\partial W}{\partial PTR}\cdot\frac{PTR}{W}$

Im Allgemeinen wirken sich lineare Transformationen nur auf die Interpretation der Koeffizienten aus. Die Gültigkeit der Regression selbst (allgemein ausgedrückt) wird jedoch durch die Annahmen des Modells und die zu analysierenden wirtschaftlichen Phänomene bestimmt.

Han-Tyumi
quelle

8

Wie die Leute in den Kommentaren gesagt haben, wird log-log häufig verwendet. Es läuft auf die Schätzung eines Konstantelastizitätsmodells , das eine in der Ökonomie häufig verwendete funktionale Form ist. Sobald Sie Protokolle nehmen, wird diese . Mehr dazu können Sie hier lesen . $Y = \alpha X^\beta$ $\ln Y = \ln \alpha + \beta \ln X$

Ich denke, Ihre Frage ist, ob die Verwendung dieser funktionalen Form in Ihrem speziellen Modell sinnvoll ist oder nicht. Es ist schwer zu sagen. Wie bei jeder gewöhnlichen linearen Regression nehmen Sie eine funktionale Form an. Sie können es sich zumindest als lineare Approximation vorstellen, die nach der Log-Log-Transformation sinnvoller ist.

jmbejara
quelle

7

$x$ $\alpha$ $\beta$ $F$

Log y_{ich} = α + β Log x_{ich} + \sum_{j = 2}^{S} γ_{j} χ_{j} + λ_{j} χ_{j} Log x_{ich}

$\log y_i = \alpha + \beta \log x_i +\sum_{j=2}^S \gamma_j\chi_j +\lambda_j\chi_j\log x_i$

χ_{j}

$\chi_j$

γ

$\gamma$

λ

$\lambda$

Beachten Sie, dass als Darstellung der "wahren" zugrunde liegenden Entscheidung alle Transformationen, die zu einer linearen Regression führen, falsch sind. In der Tat werden alle Modelle falsch sein. Die Frage ist wirklich: Ist die Statistik, die Sie von diesem Modell erhalten haben, für Ihr Problem nützlich ? Wenn sich Ihre Studie auf die Bestimmung eines zugrunde liegenden Modells konzentriert, ist dies ein Moment, der Ihnen etwas Interessantes über dieses tiefere Modell verrät? Wenn Sie mehr politisch orientiert sind, bringt Sie eine Annäherung mit konstanter Elastizität der Wahrheit nahe, dass weitere Verbesserungen irrelevant sind? Beides sind äußerst schwierig zu beantwortende Fragen als externer Beobachter. Aber wenn die einzige Alternative, über die Sie sich Sorgen machen, die variable Elastizität ist, kann der oben beschriebene Test Ihnen ein wenig beruhigen.

jayk
quelle

4

Die anderen Antworten betrafen die Hauptthemen. Ich möchte auf die "Bearbeitung" des OP in der Frage antworten:

Bearbeiten: Eine meiner größeren Befürchtungen ist, dass ich ein nichtlineares Modell hätte verwenden sollen, um die Beziehung zu zeigen. Ich bin der Meinung, dass es in gewisser Weise irreführend ist, sowohl die abhängige als auch die unabhängige Variable zu zwingen, bei dieser linearen Regression zusammenzuarbeiten.

Wir neigen dazu zu vergessen, dass "Transformieren einer Variablen" zu einer neuen Variablen führt , deren Verhalten sich möglicherweise völlig von dem "ursprünglichen" unterscheidet. Das einfachste Beispiel ist der Vergleich der Graphen einer Variablen und ihres Quadrats.

Wenn Sie also die natürlichen Logarithmen Ihrer Variablen berücksichtigen, untersuchen Sie nicht mehr die Beziehung zwischen ihnen , sondern eine Beziehung zwischen einer Funktion von ihnen.
Es ist ein Glück , dass das mathematische Konzept des „Logarithmus“ kann mit dem Begriff der „Elastizität“ verknüpft werden, die eine Beziehung zwischen prozentualen Veränderungen beschreibt, die etwas , das wir aus ökonomischer Sicht zu verstehen ist , und wir können sinnvoll interpretieren und zu verwenden.

Wenn vernünftigerweise gesagt werden kann, dass die Variablen eine "lineare Beziehung in Logarithmen" aufweisen, bedeutet dies, dass ihre Pegel (dh die tatsächlichen Variablen) eine nicht lineare Beziehung haben:

\ln y \approx ein + b \ln x \Rightarrow y \approx e^{ein} + x^{b}

$\ln y \approx a+b\ln x \Rightarrow y \approx e^a + x^b$

Warum also nicht ein nichtlineares Modell schätzen?
Im (mathematischen) Prinzip gibt es keinen Grund, warum nicht. Einige praktische Fragen sind:

1) Es gibt zu viele Formen nichtlinearer Beziehungen, es gibt nur eine lineare Beziehung (strukturell gesehen). Es handelt sich um "Suchkosten" für die am besten geeignete Spezifikation.

2) Die erhaltene nichtlineare Beziehung hat möglicherweise keine klare wirtschaftliche Erklärung. Warum ist das ein Problem? Weil wir hier nicht "Naturgesetze" aufdecken, die zeitlich und räumlich unverändert sind. Wir nähern uns einem sozialen Phänomen. Eine Annäherung, die im übrigen nur werden präsentiert als eine mathematische Formel, ohne eine wirtschaftliche Argumentation , dass validates und unterstützt es, das Ergebnis sehr dünn machen.

3) Die nichtlineare Schätzung ist hinsichtlich der Mechanik des Schätzalgorithmus weniger stabil.

Alecos Papadopoulos
quelle

3

Ich würde sagen, dass Ihr Modell in diesem Fall nicht aussagekräftig erscheint, wenn Ihr " Ziel darin bestand, herauszufinden, welche Variable die am stärksten betroffenen Lehrergehälter in einem bestimmten Bundesstaat meines Landes enthält ". Sie haben gerade gezeigt, wie die Korrelation zwischen (den Protokollen von) Löhnen und Grundsteuererklärungen ist. Sie sollten mindestens eine multiple Regression verwenden.

Natürlich könnten Sie weitermachen und mit den geeigneten methodischen Instrumenten eine vollwertige, korrekte Identifizierungsstrategie entwickeln, um die Intensität jedes Kausaleffekts abzuschätzen und den größten zu finden ... In Wirklichkeit werden Sie höchstwahrscheinlich nicht in der Lage sein angesichts der Komplexität einer solchen Aufgabe. Es ist nur ein Kontinuum von Verfeinerungen und Sie sind in der Nähe des gröbsten Modells, das zur Erklärung der Löhne verwendet wird, weit entfernt von dem, was ich als annehmbare Annäherung an eine Antwort auf die in Ihrem Ziel implizierte Frage erachte. Sie sollten versuchen, einen Ökonomen hinzuzuziehen.

s_a
quelle

Ökonometrie: Ist Elastizität bei meiner oder einer anderen Regression sinnvoll?

Antworten: