Dies scheint ein grundlegendes Problem zu sein, aber ich habe gerade festgestellt, dass ich eigentlich nicht weiß, wie man die Gleichheit von Koeffizienten aus zwei verschiedenen Regressionen testet. Kann jemand etwas Licht ins Dunkel bringen?
Nehmen wir formal an, ich habe die folgenden zwei Regressionen ausgeführt: und wobei sich auf die Entwurfsmatrix der Regression und auf den Vektor der Koeffizienten in der Regression bezieht . Beachten Sie, dass und möglicherweise sehr unterschiedlich sind, unterschiedliche Dimensionen usw. Ich bin beispielsweise daran interessiert, ob .y 2 = X 2 β 2 + ε 2 X i i β i i X 1 X 2 β 11 & ne; β 21
Wenn diese aus derselben Regression stammen würden, wäre dies trivial. Aber da sie von verschiedenen stammen, bin ich mir nicht ganz sicher, wie ich das machen soll. Hat jemand eine Idee oder kann mir ein paar Hinweise geben?
Mein Problem im Detail: Meine erste Intuition war es, die Konfidenzintervalle zu betrachten, und wenn sie sich überschneiden, würde ich sagen, dass sie im Wesentlichen gleich sind. Diese Prozedur hat jedoch nicht die richtige Größe des Tests (dh jedes einzelne Konfidenzintervall hat beispielsweise , aber eine gemeinsame Betrachtung hat nicht die gleiche Wahrscheinlichkeit). Meine "zweite" Intuition war es, einen normalen T-Test durchzuführen. Das heißt, nimm
Dabei wird als Wert meiner Nullhypothese verwendet. Dies berücksichtigt jedoch nicht die Schätzungsunsicherheit von , und die Antwort kann von der Reihenfolge der Regressionen abhängen (die ich als 1 und 2 bezeichne). β 21
Meine dritte Idee war, dies wie in einem Standardtest für die Gleichheit zweier Koeffizienten aus derselben Regression zu tun,
Die Komplikation ergibt sich aus der Tatsache, dass beide aus unterschiedlichen Regressionen stammen. Beachten Sie, dass
Dies veranlasste mich, diese Frage hier zu stellen. Dies muss eine Standardprozedur / ein Standardtest sein, aber ich konnte nichts finden, das diesem Problem ausreichend ähnlich war. Wenn mich also jemand auf das richtige Verfahren hinweisen kann, wäre ich sehr dankbar!
quelle
Antworten:
Obwohl dies keine übliche Analyse ist, ist sie wirklich von Interesse. Die akzeptierte Antwort entspricht der Art und Weise, wie Sie Ihre Frage gestellt haben, aber ich werde eine andere einigermaßen akzeptierte Technik bereitstellen, die möglicherweise gleichwertig ist oder nicht (ich überlasse es besseren Köpfen, dies zu kommentieren).
Bei diesem Ansatz wird der folgende Z-Test verwendet:
Wobei der Standardfehler von .βSEβ β
quelle
Lassen Sie mich für Personen mit ähnlichen Fragen einen einfachen Überblick über die Antwort geben.
Dies führt zu einer Varianz-Kovarianz-Matrix, mit der die Gleichheit der beiden Koeffizienten geprüft werden kann.
quelle
expand =2, generate(indicator); generate y = cond(indicator, y2, y1); regress y i.indicator##c.X, vce(cluster id);
Verwendung von gruppierten Standardfehlern erklärt, dass e1 und e2 nach dem Stapeln des Datensatzes nicht für dieselbe Beobachtung unabhängig sind.(Clogg, CC, Petkova, E. & Haritou, A. (1995). Statistische Methoden zum Vergleichen von Regressionskoeffizienten zwischen Modellen. American Journal of Sociology, 100 (5), 1261-1293.) Gibt eine Antwort in dem speziellen Fall von verschachtelten Gleichungen (dh, um die zweite Gleichung zu erhalten, betrachten Sie die erste Gleichung und fügen Sie ein paar erklärende Variablen hinzu) Sie sagen, es ist einfach zu implementieren.
Wenn ich es gut verstehe, kann in diesem speziellen Fall auch ein Haussman-Test implementiert werden. Der Hauptunterschied besteht darin, dass ihr Test die zweite (vollständige) Gleichung als wahr ansieht, während der Haussman-Test die erste Gleichung als wahr ansieht.
Es ist zu beachten, dass Clogg et al. (1995) nicht für Paneldaten geeignet ist. Ihr Test wurde jedoch von (Yan, J., Aseltine Jr, RH, & Harel, O. (2013)) verallgemeinert. Vergleichen von Regressionskoeffizienten zwischen verschachtelten linearen Modellen für gruppierte Daten mit verallgemeinerten Schätzgleichungen. Journal of Educational and Behavioral Statistics, 38 (2), 172-189.) Mit einem Paket in R: geepack Siehe: https://www.jstor.org/stable/pdf/41999419.pdf?refreqid=excelsior%3Aa0a3b20f2bc68223edb59e3254c234be&seq=1
Und (für das R-Paket): https://cran.r-project.org/web/packages/geepack/index.html
quelle