Ich habe viele Leute gesehen, die die Delta-Methode verwendeten, um die asymptotische Verteilung von zu finden , der Probenkorrelationskoeffizient für bivariate Normaldaten. Diese Verteilung ist gegeben durch
und dies ist ein bekanntes Ergebnis (ich kenne die Z-Transformation, aber es ist in diesem Zusammenhang nicht notwendig). Ich verstehe die Methode, aber ich habe mich gefragt, warum sie etwas Einfacheres nicht tun. Durch die Invarianz der mles der Stichprobenmittelwerte und Varianzen ist es leicht zu zeigen, dass der Stichprobenkorrelationskoeffizient tatsächlich der mle für ist. Da dies nun ein Mle ist, sollte es unter den Regelmäßigkeitsbedingungen der asymptotischen Verteilung des Mle folgen, nämlich
wo ist die Fisher-Information für . Jetzt bleibt nur noch zu finden. Differenzierung des doppelten Logarithmus der bivariaten Normalverteilung in Bezug auf und unter der negativen Erwartung glaube ich, dass man ankommt
was, vorausgesetzt ich habe bei der langwierigen Berechnung keinen Fehler gemacht, sich sehr von der obigen asymptotischen Varianz unterscheidet, zumindest für nicht so kleine . Ich habe sogar einige Simulationen durchgeführt, die zeigen, dass die Delta-Methode in den meisten Fällen weit überlegen ist. Die kleinere asymptotische Varianz entspricht dem, was man von der mle erwarten würde, stellt sich jedoch als sehr schlechte Annäherung heraus.
Es ist nicht unmöglich, dass ich irgendwo einen Fehler gemacht habe, obwohl ich immer wieder nachgesehen habe. Wenn dies nicht der Fall ist, liegt dann ein konzeptioneller Fehler in der obigen Argumentation vor? Ich habe mir einige berühmte Inferenzbücher angesehen und nirgends erwähnen sie die Fisher Information für, was ich auch ziemlich rätselhaft finde.
Ich würde mich über jeden Einblick freuen. Vielen Dank.
Antworten:
Das OP stellte in einem Kommentar klar, dass er die bivariate Standardnormalverteilung untersucht , wobei Mittelwerte und Varianzen entsprechend auf Null und Einheit festgelegt sind.
Dies macht die Verteilung wiederum zu einem Mitglied der gekrümmten Exponentialfamilie und, wie ich in meiner Antwort auf diesen Beitrag gezeigt habe, zum Maximum-Likelihood-Schätzer fürρ in einem solchen Fall entspricht nicht der Probenkorrelationskoeffizient. Insbesondere ist der Probenkorrelationskoeffizient
Bezeichnenρ^ die mle für ρ und ( 1 / n)∑ni =1(x2ich+y2ich) = ( 1 / n )S.2 , um die Summe der Stichprobenvarianzen von zu seinX. und Y. , wir erhalten
Wenn wir die Algebra machen, ist es nicht schwer zu schließen, dass wir erhalten werdenρ^=r~ dann und nur dann, wenn, ( 1 / n )S.2= 2 dh nur dann, wenn es so kommt, dass die Summe der Stichprobenvarianzen gleich der Summe der wahren Varianzen ist. Also im Allgemeinen für endliche Stichproben,
Beide bleiben konsistent, aber dies allein bedeutet nicht, dass die asymptotische Verteilung des Probenkorrelationskoeffizienten die Cramer-Rao-Grenze erreicht, die vom OP gefunden wird. Und das tut es nicht.
quelle