Betrachten wir einen Vektor von Parametern , mit den Parameter von Interesse, und ein Störparameter.θ 1 θ 2
Wenn die Wahrscheinlichkeit , dass aus den Daten aufgebaut ist x , die Profil Wahrscheinlichkeit für θ 1 ist definiert als L P ( θ 1 ; x ) = L ( θ 1 , θ 2 ( θ 1 ) ; x ) wobei θ 2 ( θ 1 ) ist das MLE von θ 2für einen festen Wert von .
Maximierung des LikelihoodProfil in Bezug auf & thgr; 1 auf gleiche Schätzung führt θ 1 wie die durch Maximieren der Wahrscheinlichkeitgleichzeitig in Bezugerhalt & thgr; 1 und & thgr; 2 .
Ich denkedie Standardabweichung von & theta; 1 auch aus der zweiten Ableitung des Profils Wahrscheinlichkeit abgeschätzt werden kann.
Die Wahrscheinlichkeit Statistik für H 0 : θ 1 = θ 0 kann bezüglich des Profils Wahrscheinlichkeit geschrieben werden: L R = 2 log ( L P ( θ 1 ; x ).
Es scheint also, dass die Profilwahrscheinlichkeit genau so verwendet werden kann, als wäre es eine echte Wahrscheinlichkeit. Ist es wirklich so? Was sind die Hauptnachteile dieses Ansatzes? Und was ist mit dem 'Gerücht', dass der aus der Profilwahrscheinlichkeit erhaltene Schätzer voreingenommen ist (edit: sogar asymptotisch)?
Antworten:
Die Schätzung von aus der Profilwahrscheinlichkeit ist nur die MLE. Das Maximieren in Bezug auf & thgr ; 2 für jedes mögliche & thgr; 1 und das anschließende Maximieren in Bezug auf & thgr; 1 ist dasselbe wie das gemeinsame Maximieren in Bezug auf ( & thgr; 1 , & thgr ; 2 ) .θ1 θ2 θ1 θ1 (θ1,θ2)
Der Schlüssel Schwäche ist , dass, wenn Sie Ihre Schätzung der SE von Basis θ 1 auf die Krümmung des Profils Wahrscheinlichkeit, Sie sind die Buchführung nicht in vollem Umfang für die Unsicherheit in R 2 .θ^1 θ2
McCullagh und Nelder, Generalized Linear Models, 2. Auflage , haben einen kurzen Abschnitt über die Profilwahrscheinlichkeit (Abschnitt 7.2.4, S. 254-255). Man sagt:
quelle