Vor ein paar Monaten habe ich bei dieser Organisation ein Praktikum gemacht. und als weggeschenk beschloss ich, meine letzte woche mit meiner freizeit zu verbringen, um die faktoren zu untersuchen, die die lehrergehälter beeinflussen. Ein Problem, auf das ich bei den Lehrergehältern stieß, war, dass die Verteilung für den gegebenen Staat verzerrt war. Ich hatte viele Beobachtungen, die am unteren Ende des Lohnspektrums lagen. Ich habe versucht, dieses Problem zu lösen, indem ich einen Vergleichslohnindex in meine abhängige Variable (Lehrerlohn) aufgenommen habe, aber die Ergebnisse, die ich gefunden habe, waren für den Umfang meines Projekts völlig veraltet. Ich entschied mich stattdessen, meine abhängige Variable zu protokollieren. Das war schön, denn jetzt hatte mein Lohn eine normale Verteilung und es sah im Histogramm einfach perfekt aus. Als ich anfing, Tests durchzuführen, kam ich an den Punkt, an dem ich eine letzte unabhängige Variable, die Grundsteuererklärung, hatte. Das Problem mit meinen normativen Löhnen zeigte sich auch in meinen Beobachtungen zur Grundsteuererklärung. Ich hatte eine enorme Verschiebung der Zahlen der Grundsteuererklärung zum unteren Ende des Spektrums. Also habe ich diese Variable ebenfalls protokolliert und sie hat den Nullhypothesentest trotzdem bestanden.
Ich bin nicht sicher, ob dies genau richtig ist, aber durch den Vergleich der Änderung einer protokollierten Variablen mit einer anderen protokollierten Variablen erhielt ich die Elastizität. Unter der Annahme, dass dies korrekt ist, zeigt meine Regressionsgleichung (so etwas wie LogWages = B0 + B1 (LogPropertyTaxReturns)) die Elastizität zwischen den beiden Variablen. Ist das aber sinnvoll? Wenn mein Ziel darin bestand, herauszufinden, welche Variable die am meisten betroffenen Lehrergehälter in einem bestimmten Landkreis meines Bundesstaates aufweist, ist es dann hilfreich, die Elastizität zwischen den beiden Variablen zu zeigen? Wir wollen die Landkreise mit den niedrigsten Lehrergehältern erhöhen, um ihren Lebensstandard zu erhöhen, aber ich befürchte, dass ich so weit entfernt von den tatsächlichen Beobachtungen extrapoliert habe, dass meine abschließende Regressionsgleichung bedeutungslos ist.
Bearbeiten: Eine meiner größeren Befürchtungen ist, dass ich ein nichtlineares Modell hätte verwenden sollen, um die Beziehung zu zeigen. Ich bin der Meinung, dass es in gewisser Weise irreführend ist, sowohl die abhängige als auch die unabhängige Variable zu zwingen, bei dieser linearen Regression zusammenzuarbeiten.
quelle
Antworten:
Die Antwort auf die Frage lautet ja, sie ist in der Tat sinnvoll (zumindest mathematisch gesehen). Wenn Sie die lineare Gleichung schätzen
dann ist , was bedeutet, dass die marginale Änderung von über . Nun, wenn Sie schätzenβ1= ∂W∂PTR β1 PTR W
dann ist , was genau die Definition von Elastizität ist.β1=∂W∂PTR⋅ PTRW
Im Allgemeinen wirken sich lineare Transformationen nur auf die Interpretation der Koeffizienten aus. Die Gültigkeit der Regression selbst (allgemein ausgedrückt) wird jedoch durch die Annahmen des Modells und die zu analysierenden wirtschaftlichen Phänomene bestimmt.
quelle
Wie die Leute in den Kommentaren gesagt haben, wird log-log häufig verwendet. Es läuft auf die Schätzung eines Konstantelastizitätsmodells , das eine in der Ökonomie häufig verwendete funktionale Form ist. Sobald Sie Protokolle nehmen, wird diese . Mehr dazu können Sie hier lesen .Y.= α Xβ lnY.= lnα + βlnX
Ich denke, Ihre Frage ist, ob die Verwendung dieser funktionalen Form in Ihrem speziellen Modell sinnvoll ist oder nicht. Es ist schwer zu sagen. Wie bei jeder gewöhnlichen linearen Regression nehmen Sie eine funktionale Form an. Sie können es sich zumindest als lineare Approximation vorstellen, die nach der Log-Log-Transformation sinnvoller ist.
quelle
Beachten Sie, dass als Darstellung der "wahren" zugrunde liegenden Entscheidung alle Transformationen, die zu einer linearen Regression führen, falsch sind. In der Tat werden alle Modelle falsch sein. Die Frage ist wirklich: Ist die Statistik, die Sie von diesem Modell erhalten haben, für Ihr Problem nützlich ? Wenn sich Ihre Studie auf die Bestimmung eines zugrunde liegenden Modells konzentriert, ist dies ein Moment, der Ihnen etwas Interessantes über dieses tiefere Modell verrät? Wenn Sie mehr politisch orientiert sind, bringt Sie eine Annäherung mit konstanter Elastizität der Wahrheit nahe, dass weitere Verbesserungen irrelevant sind? Beides sind äußerst schwierig zu beantwortende Fragen als externer Beobachter. Aber wenn die einzige Alternative, über die Sie sich Sorgen machen, die variable Elastizität ist, kann der oben beschriebene Test Ihnen ein wenig beruhigen.
quelle
Die anderen Antworten betrafen die Hauptthemen. Ich möchte auf die "Bearbeitung" des OP in der Frage antworten:
Wir neigen dazu zu vergessen, dass "Transformieren einer Variablen" zu einer neuen Variablen führt , deren Verhalten sich möglicherweise völlig von dem "ursprünglichen" unterscheidet. Das einfachste Beispiel ist der Vergleich der Graphen einer Variablen und ihres Quadrats.
Wenn Sie also die natürlichen Logarithmen Ihrer Variablen berücksichtigen, untersuchen Sie nicht mehr die Beziehung zwischen ihnen , sondern eine Beziehung zwischen einer Funktion von ihnen.
Es ist ein Glück , dass das mathematische Konzept des „Logarithmus“ kann mit dem Begriff der „Elastizität“ verknüpft werden, die eine Beziehung zwischen prozentualen Veränderungen beschreibt, die etwas , das wir aus ökonomischer Sicht zu verstehen ist , und wir können sinnvoll interpretieren und zu verwenden.
Wenn vernünftigerweise gesagt werden kann, dass die Variablen eine "lineare Beziehung in Logarithmen" aufweisen, bedeutet dies, dass ihre Pegel (dh die tatsächlichen Variablen) eine nicht lineare Beziehung haben:
Warum also nicht ein nichtlineares Modell schätzen?
Im (mathematischen) Prinzip gibt es keinen Grund, warum nicht. Einige praktische Fragen sind:
1) Es gibt zu viele Formen nichtlinearer Beziehungen, es gibt nur eine lineare Beziehung (strukturell gesehen). Es handelt sich um "Suchkosten" für die am besten geeignete Spezifikation.
2) Die erhaltene nichtlineare Beziehung hat möglicherweise keine klare wirtschaftliche Erklärung. Warum ist das ein Problem? Weil wir hier nicht "Naturgesetze" aufdecken, die zeitlich und räumlich unverändert sind. Wir nähern uns einem sozialen Phänomen. Eine Annäherung, die im übrigen nur werden präsentiert als eine mathematische Formel, ohne eine wirtschaftliche Argumentation , dass validates und unterstützt es, das Ergebnis sehr dünn machen.
3) Die nichtlineare Schätzung ist hinsichtlich der Mechanik des Schätzalgorithmus weniger stabil.
quelle
Ich würde sagen, dass Ihr Modell in diesem Fall nicht aussagekräftig erscheint, wenn Ihr " Ziel darin bestand, herauszufinden, welche Variable die am stärksten betroffenen Lehrergehälter in einem bestimmten Bundesstaat meines Landes enthält ". Sie haben gerade gezeigt, wie die Korrelation zwischen (den Protokollen von) Löhnen und Grundsteuererklärungen ist. Sie sollten mindestens eine multiple Regression verwenden.
Natürlich könnten Sie weitermachen und mit den geeigneten methodischen Instrumenten eine vollwertige, korrekte Identifizierungsstrategie entwickeln, um die Intensität jedes Kausaleffekts abzuschätzen und den größten zu finden ... In Wirklichkeit werden Sie höchstwahrscheinlich nicht in der Lage sein angesichts der Komplexität einer solchen Aufgabe. Es ist nur ein Kontinuum von Verfeinerungen und Sie sind in der Nähe des gröbsten Modells, das zur Erklärung der Löhne verwendet wird, weit entfernt von dem, was ich als annehmbare Annäherung an eine Antwort auf die in Ihrem Ziel implizierte Frage erachte. Sie sollten versuchen, einen Ökonomen hinzuzuziehen.
quelle