Identifizierung des Parameterproblems

8

Ich kämpfe immer darum, das wahre Wesen der Identifikation in der Ökonometrie zu erreichen. Ich weiß, dass wir angeben, dass ein Parameter (z. B. ) identifiziert werden kann, wenn wir durch einfaches Betrachten seiner (gemeinsamen) Verteilung auf den Wert des Parameters schließen können. In einem einfachen Fall von , wobei , können wir , dass b_1 identifiziert wird, wenn wir wissen, dass seine Varianz Var (\ hat {b})> 0 ist . Was aber, wenn E [u | X] = a ist, wobei a ein unbekannter Parameter ist? Können a und b_1 identifiziert werden? y=b1X+UE[u]=0,E[u| x]=0b1Var( b )>0E[u| X]=aaab1θ^y=b1X+uE[u]=0,E[u|x]=0b1Var(b^)>0E[u|X]=aaab1

Wenn ich das Modell auf Y=b0+b1X+b2XD=u wobei D{0,1} und E[u|X,D]=0 , um zu zeigen, dass b1,b2,b3 identifiziert sind, tun Sie dies Ich muss nur noch einmal betonen, dass die Varianz für alle drei Parameter größer als Null ist.

Ich schätze die Hilfe bei der Klärung meiner Gedanken bezüglich der Identifizierung.

CharlesM
quelle
Mir wurde gesagt, dass ich für das Modell mit der Dummy-Variablen einfach zeigen muss, dass [XX]1 existiert ... was bedeutet, dass die Determinanten dieser Matrix nicht gleich 0 sind. Richtig?
CharlesM
Ich habe auch eine Frage zu Mathe-Austausch und nichts gepostet ...
CharlesM
Hilft das oder nur mehr von dem, was Sie bereits wissen? UChicago Kursnotizen
Kirk

Antworten:

3

Definieren wir zunächst die folgenden Objekte: In einem statistischen Modell , das zum Modellieren von als Funktion von , gibt es Parameter, die mit vector . Diese Parameter dürfen innerhalb des Parameterraums variieren . Wir sind nicht an der Schätzung all dieser Parameter interessiert , sondern nur an einer bestimmten Teilmenge, beispielsweise in der Parameter, die wir als und die innerhalb des Parameterraums variieren . In unserem Modell die Variablen und die ParameterY X p θ Θ R p q p θ 0 Θ 0R q M X θ Y MMYXpθΘRpqpθ0Θ0RqMXθ wird nun so abgebildet, dass . Diese Zuordnung wird durch und die Parameter definiert.YM

In dieser Umgebung sagt die Identifizierbarkeit etwas über die Beobachtungsäquivalenz aus . Insbesondere wenn die Parameter für identifizierbar sind, gilt , dass . Mit anderen Worten, es gibt keinen anderen Parametervektor , der angesichts unserer Modellspezifikation den gleichen Datenerzeugungsprozess induzieren würde . Um diese Konzepte besser denkbar zu machen, gebe ich zwei Beispiele. M θ 1θ 0 : θ 1θ 0 , M.θ0Mθ 1 M.θ1Θ0:θ1θ0,M(θ0)=M(θ1)θ1M

Beispiel 1 : Definiere für ; das einfache statistische Modell : und nehme an, dass (also ). Es ist klar, dass, ob oder , immer gilt, dass identifizierbar ist: Der Prozess, der aus hat eine Beziehung zu den Parametern und . FestsetzungX N ( μ , σ 2 I n ) ; ε N ( 0 , σ 2 e I n ) M Y = a + X b + ε ( a , b ) Rθ=(a,b)XN(μ,σ2In);εN(0,σe2In)M

Y=a+Xb+ε
Θ= R 2 θ 0 =(a,b) θ(a,b)R2Θ=R2θ0=(a,b)& thgr; 0 Y X 1 : 1 a b ( a , b ) R.θ0=aθ0YX1:1ab(a,b) ist es nicht möglich, ein zweites Tupel in , das denselben Datengenerierungsprozess beschreibt.R

Beispiel 2 : Definiere für ; das schwierigere statistische Modell : und nehme an, dass und (also ). Während dies für ein identifizierbares statistisches Modell wäre, gilt dies nicht, wenn einer einen anderen Parameter enthält (dh oder ). Warum? Denn für jedes Paar vonX N ( μ , σ 2 I n ) ; ε N ( 0 , σ 2 eθ=(a,b,c)M ' Y = a + X ( bXN(μ,σ2In);εN(0,σe2In)M(a,b)R2cR{0}Θ=R3{(l,m,0)| (l,m)R2}θ0bc(b,c)B:={(x,y)|

Y=a+X(bc)+ε
(a,b)R2cR{0}Θ=R3{(l,m,0)|(l,m)R2}θ0bc(b,c)gibt es unendlich viele andere Paare in der Menge . Die offensichtliche Lösung für das Problem in diesem Fall wäre die Einführung eines neuen Parameters der den Bruch ersetzt, um das Modell zu identifizieren. Aus theoretischen Gründen könnte man sich jedoch für und als separate Parameter interessieren - die Parameter könnten interessierenden Parametern im Sinne einer (ökonomischen) Theorie entsprechen. (ZB könnte "Konsumneigung" und "Vertrauen" sein, und Sie möchten diese beiden Größen möglicherweise aus Ihrem Regressionsmodell abschätzen. Leider wäre dies nicht möglich.)d = b / c b c b cB:={(x,y)|(x/y)=(b/c),(x,y)R2}d=b/cbcbc
Jeremias K.
quelle
1
"Es gibt keinen anderen Parametervektor , der dieselben Daten erzeugen würde" klingt nicht ganz richtig, es sei denn, Sie meinen etwas Ungewöhnliches mit "generieren". Vielleicht muss das klargestellt werden, oder vielleicht muss Ihre Bedeutung des "statistischen Modells" explizit angegeben werden. In den meisten Modellen, einschließlich derjenigen, die Sie in Ihren Abbildungen verwenden, könnte jeder Datensatz durch einen der möglichen Parameter erzeugt worden sein. θ1
whuber
1
@whuber das ist ein guter Punkt. Was ich hätte sagen sollen ist, dass "es nicht ... das würde den gleichen Datenerzeugungsprozess induzieren ". Ich habe das jetzt geändert :)
Jeremias K