Diese Frage ist von dieser motiviert . Ich habe zwei Quellen nachgeschlagen und das habe ich gefunden.
A. van der Vaart, Assymptotische Statistik:
Es ist selten möglich, eine Profilwahrscheinlichkeit explizit zu berechnen, aber ihre numerische Auswertung ist oft machbar. Dann kann die Profilwahrscheinlichkeit dazu dienen, die Dimension der Wahrscheinlichkeitsfunktion zu reduzieren. Profilwahrscheinlichkeitsfunktionen werden häufig auf die gleiche Weise wie (gewöhnliche) Wahrscheinlichkeitsfunktionen parametrischer Modelle verwendet. Abgesehen von ihren Punkten maximalen wobei als Schätzer & thgr , die zweite Ableitung bei θ wird als Schätzwert von minus dem Inversen der asymptotischen Kovarianzmatrix e verwendet. Neuere Forschungen scheinen diese Praxis zu bestätigen.
J. Wooldridge, Ökonometrische Analyse von Querschnitts- und Paneldaten (in beiden Ausgaben gleich):
Als Gerät zur Untersuchung asymptotischer Eigenschaften ist die konzentrierte Zielfunktion von begrenztem Wert, da Allgemeinen von ganz W abhängt. In diesem Fall kann die Zielfunktion nicht als Summe unabhängiger, identisch verteilter Summanden geschrieben werden. Eine Einstellung, bei der Gleichung (12.89) eine Summe von iid-Funktionen ist, tritt auf, wenn wir individuelle Effekte aus bestimmten nichtlinearen Paneldatenmodellen herausarbeiten. Darüber hinaus kann die konzentrierte Zielfunktion nützlich sein, um die Äquivalenz scheinbar unterschiedlicher Schätzungsansätze festzustellen.
Wooldridge erörtert das Problem im weiteren Kontext von M-Schätzern, sodass es auch für Maximum-Likelihood-Schätzer gilt.
So erhalten wir zwei unterschiedliche Antworten auf die gleiche Frage. Der Teufel steckt meiner Meinung nach im Detail. Für einige Modelle können wir Hessisch der Profilwahrscheinlichkeit sicher verwenden, für einige Modelle nicht. Gibt es allgemeine Ergebnisse, die Bedingungen angeben, wann wir das tun können (oder nicht)?
Antworten:
Leider ist das momentan so und es ist unwahrscheinlich, dass sich daran etwas ändert.
Die klarste Diskussion, die mir bekannt ist, sind die Regeln der bedingten Folgerung: Gibt es eine universelle Definition von Nicht-Information? B Jørgensen - Statistical Methods & Applications, 1994.
Und für einige der Probleme, die spezifisch für die Behebung von Profilwahrscheinlichkeitsfehlern sind, Stafford, JE (1996). Eine robuste Anpassung der Profilwahrscheinlichkeit, Annals of Statistics, 24, 336-52.
quelle
Eine schnelle Antwort: Dies wird in Kapitel 3 von OE Barndorff-Nielsen & DR Cox: Inferenz und Asymptotik, Chapman & Hall, Seite 90, Gleichung 3.31, besprochen, die sie Patefield zuschreiben. Sie schließen daraus, dass dies für einen skalaren Parameter gültig ist (sie analysieren keine anderen Fälle).
quelle