OLS in Bezug auf Mittelwerte und Stichprobengröße

8

Gegeben ein Modell:

y=β0+β1f+u

Wobei Dummy = 1 ist, wenn weiblich, und 0 andernfalls, ist y Höhe in cm. Die Stichprobengröße beträgt insgesamt n_ {weiblich} = n_ {männlich} = 100 \ rightarrow 200 . Weiter \ bar {y} _ {männlich} = 175 und \ bar {y} _ {weiblich} = 165 . Berechnen Sie die Schätzungen der Parameter.f=10nfemale=nmale=100200y¯male=175y¯female=165

Mein Versuch:

Verwenden Sie die bekannte Formel:

β^=(XX)1Xy
Ich erhalte:
[200100100100]1[170200165200]

Zuerst die Elemente in (XX)1 , da X nur ein Haufen von einem ist, enthält die Stichprobe 100 Frauen und insgesamt 200 Männer und Frauen. Für Xy ist das erste Element der "große Mittelwert" von 170, und das zweite ist nur der Stichprobenmittelwert der Körpergröße für Frauen. Beide sind um 200 skaliert, da ich nicht "verkleinert" habe (XX)1 .

Ist das richtig? Ich frage, weil die Lösung (beim Multiplizieren) zu einigen (sehr) ungeraden Zahlen führt.

Repmat
quelle

Antworten:

7

Der Ansatz ist korrekt, aber es gibt einen kleinen numerischen Fehler: Es gibt nur Frauen, nicht . Die mittleren Höhen für Männer und Frauen können über in Summen umgerechnet werden100200

Sum of male heights=100×175

und

Sum of female heights=100×165.

Daher ist die Summe aller Höhen

Sum of all heights=100×175+100×165=200×170,

wie in der Frage angegeben. Folglich sind die Normalgleichungen

(200100100100)(β^0β^1)=(200170100165)

( nicht auf der rechten Seite), mit Lösung165200

(β^0,β^1)=(175,10).
whuber
quelle
Was für ein dummer Fehler ...
Repmat
1
Ich würde es nicht albern nennen. Es ist eine natürliche Sache zu tun. Ich musste ein paar Minuten auf die Frage starren, bevor das Problem offensichtlich wurde ....
whuber
1

Ich bin ziemlich verwirrt. Was bedeutet bedeuten? Sind das Residuen? Wenn ja, dannu

XX =[200100100100]

schon seit

X=yβ=[y1β1y2β1...ynfβ1ynf+1β1ynf+2β1...ynnf+nmβ1y1β2y2β2...ynfβ2ynf+1β2ynf+2β2...ynnf+nmβ2]T

=

[11...111...100...011...1]T

Einige Gedanken:

In Anbetracht Ihrer Gleichung sollte IMHO 175 und = -10 sein. Für den männlichen und weiblichen Teil erhalten Sie also:β1β2

fm=175(+)10×0+u=175+u

ff=175(+)10×1+u=165+u

Da kannst du verwenden

β=(XX)1XTy

mit der Moore-Penrose Pseudoinverse nach suchen .β

((XX)1XT)+β=((XX)1XT)+[17510]=y

Jetzt enthält :y

y[165f1165f2...165f100175m1175m2...175m100]T

Ich hoffe es hilft!

nali
quelle
5
Während Statistiker normalerweise unter dem Namen Error für den nicht erläuterten Teil des Modells verwenden, sprechen Ökonomen häufig von Error, (vorübergehenden) Schocks oder Störungen. Es ist nur eine übliche Notation. ϵu
Mugen
1
@nali, kannst du dem vielleicht etwas hinzufügen? Angesichts Ihrer Zahlen ist die Lösung des Systems nicht sinnvoll. Und ja, du bist der Rest.
Repmat
@Repmat: Ich habe einige Gedanken aktualisiert, die ich ursprünglich hatte. Ich hoffe es hilft.
Nali
@Repmat: Vielleicht hast du mich missverstanden. X '* y ist nicht [170 82.5] ^ T
nali