Was ist der richtige Weg, um auf signifikante Unterschiede zwischen Koeffizienten zu testen?

18

Ich hoffe, jemand kann mir dabei helfen, einen Punkt der Verwirrung auszuräumen. Angenommen, ich möchte testen, ob sich zwei Regressionskoeffizientensätze signifikant voneinander unterscheiden, und zwar mit folgendem Aufbau:

  • mit 5 unabhängigen Variablen.yich=α+βxich+ϵich
  • 2 Gruppen mit ungefähr gleichen Größen (obwohl dies variieren kann)n1,n2
  • Tausende von ähnlichen Regressionen werden gleichzeitig durchgeführt, daher muss eine Art Mehrfachhypothesenkorrektur durchgeführt werden.

Ein Ansatz, der mir vorgeschlagen wurde, ist die Verwendung eines Z-Tests:

Z=b1-b2(SEb12+SEb22)

Ein anderer Vorschlag, den ich auf dieser Tafel gesehen habe, ist die Einführung einer Dummy-Variablen zum Gruppieren und Neuschreiben des Modells als:

; i , wobei g die Gruppierungsvariable ist, codiert als 0, 1.yich=α+βxich+δ(xichGich)+ϵichG

Meine Frage ist, wie unterscheiden sich diese beiden Ansätze (z. B. unterschiedliche Annahmen, Flexibilität)? Ist einer angemessener als der andere? Ich vermute, das ist ziemlich einfach, aber jede Klarstellung wäre sehr dankbar.

Kassen
quelle
Ich glaube, die Antworten und Kommentare auf eine ähnliche Frage können einige der von Ihnen gewünschten Klarstellungen liefern.
Whuber
Vielen Dank, whuber. Diese Antwort war mir vertraut. Aus der Diskussion unter der akzeptierten Antwort (und Ihren Kommentaren dort) ergab sich der Eindruck, dass der Vergleich der Koeffizienten von 2 getrennten Anpassungen nicht angemessen war. Wird ein Z-Test auf die Koeffizienten aus den separaten Anpassungen angewendet, oder ist die Dummy-Variablencodierung einfach einfacher und liefert eine gleichwertige Antwort?
Cashoes
1
Bitte lesen Sie den letzten Absatz meiner Antwort ("Die Hauptbeschränkung ..."). Der Z-Test ist gültig unter der Annahme, dass groß sind (andernfalls wird er beim Test verwendet) und dass die geschätzten Standardabweichungen S E b i nicht zu unterschiedlich sind. Kein Ansatz ist am besten, wenn sich die Standardabweichungen stark unterscheiden (ungefähr mehr als ein Verhältnis von 3: 1). nichSEbich
whuber

Antworten:

13

Die beiden Ansätze unterscheiden sich.

s1s2

s=(n1-p)s12+(n2-p)s22)n1+n2-2p.

p6

b1b2b

SE(b)=s(SE(b1)/s1)2+(SE(b2)/s2)2.

s

Die kombinierte Regression geht davon aus, dass die Varianzen der Residuen in beiden getrennten Regressionen im Wesentlichen gleich sind. Ist dies nicht der Fall, ist der Z-Test auch nicht gut (es sei denn, die Stichproben sind groß): Sie würden einen CABF-Test oder einen Welch-Satterthwaite-T-Test verwenden.

whuber
quelle
9

Der direkteste Weg, um den Koeffizientenunterschied zwischen zwei Gruppen zu testen, besteht darin, einen Interaktionsterm in Ihre Regression einzubeziehen. Dies ist fast das, was Sie in Ihrer Frage beschreiben. Das Modell, das Sie ausführen würden, ist das folgende:

yich=α+βxich+γGich+δ(xich×Gich)+εich

tH0:δ=0Gich=0

yich=α+βxich+εich

Gich=1

yich=(α+γ)+(β+δ)xich+εich

δ

Matt Blackwell
quelle
Vielen Dank für die Korrektur des Modells (Ich glaube, meine Version oben erzwingt einfach, dass der Achsenabschnitt in beiden Gruppen gleich ist ...). Genauer gesagt, wäre dies dann gleichbedeutend mit dem Z-Test, den ich oben gepostet habe?
Cashoes
Wenn man testen wollte, ob ein Effekt zwischen mehr als zwei Gruppen unterschiedlich ist, würde eine ANOVA das Modell mit dem in dieser Antwort gezeigten vergleichen, y i = α + β x i + γ g i + δ ( x iyich=α+βxich+γGich+εichyich=α+βxich+γGich+δ(xich×Gich)+εich
@ matt-blackwell ist dies konzeptionell dasselbe wie die Schichtung des Modells durch jeden Wert von g? (dh, b wäre der Koeffizient von x, wenn g = 0 und Beta + Delta, wenn g = 1) Obwohl ich zu schätzen weiß, dass die Schichtung keinen statistischen Vergleich zulässt.
Bobmcpop