Angenommen, ich beobachte unabhängige Variablenvektoren und und die abhängige Variable . Ich möchte ein Modell der Form : wobei eine positiv differenzierte, doppelt differenzierbare Funktion ist, ein unbekannter Skalierungsparameter ist und eine Gaußsche Zufallsvariable mit einer mittleren Varianz von Null ist (von der angenommen wird, dass sie unabhängig von und ). Dies ist im Wesentlichen der Aufbau von Koenkers Test der Heteroskedastizität (zumindest soweit ich das verstehe).
Ich habe Beobachtungen von und und möchte und schätzen . Ich habe jedoch einige Probleme:
- Ich bin mir nicht sicher, wie ich das Schätzproblem als so etwas wie kleinste Quadrate darstellen soll (ich gehe davon aus, dass es einen bekannten Trick gibt). Meine erste Vermutung wäre so etwas wie
aber ich Ich bin mir nicht sicher, wie ich das numerisch lösen soll (vielleicht reicht eine iterative Quasi-Newton-Methode).
- Angenommen, ich kann das Problem auf vernünftige Weise darstellen und einige Schätzungen finden , möchte ich die Verteilung der Schätzungen kennen, damit ich z. B. Hypothesentests durchführen kann. Ich würde die beiden Koeffizientenvektoren problemlos separat testen, würde aber eine Möglichkeit zum Testen bevorzugen, z. B. für gegebene .
Antworten:
In einem etwas allgemeineren Kontext mit ein dimensionaler Vektor von Beobachtungen (die Antworten oder abhängigen Variablen), eine Matrix von Beobachtungen (Kovariaten oder abhängige Variablen) und die Parameter so, dass dann die Minus-Log-Wahrscheinlichkeit In der Frage des OP ist diagonal zuY n y X n×p x θ=(β1,β2,σ) Y∼N(Xβ1,Σ(β2,σ))
Der letzte Vorschlag spricht mich an, weil er auf Lösungen aufbaut, die ich bereits gut kenne. Darüber hinaus würde ich die erste Iteration sowieso in Betracht ziehen. Das heißt, berechnen Sie zuerst eine anfängliche Schätzung von durch gewöhnliche kleinste Quadrate, wobei Sie die potenzielle Heteroskedastizität ignorieren, und passen Sie dann ein Gamma-Glm an die quadratischen Residuen an, um eine anfängliche Schätzung von nur um zu überprüfen, ob das kompliziertere Modell sinnvoll erscheint. Iterationen, bei denen die Heteroskedastizität in die Lösung der kleinsten Quadrate als Gewichte einbezogen wird, können sich dann gegenüber der Schätzung verbessern.β1 β2 −
In Bezug auf den zweiten Teil der Frage würde ich wahrscheinlich in Betracht ziehen, ein Konfidenzintervall für die lineare Kombination entweder unter Verwendung von Standard-MLE-Asymptotika (Überprüfung mit Simulationen, ob die Asymptotik funktioniert) oder durch Bootstrapping zu berechnen.wT1β1+wT2β2
Edit: Mit Standard-MLE-Asymptotik meine ich unter Verwendung der multivariaten Normalnäherung an die Verteilung der MLE mit Kovarianzmatrix die inverse Fisher-Information. Die Fisher-Information ist per Definition die Kovarianzmatrix des Gradienten von . Dies hängt im Allgemeinen von den Parametern ab. Wenn Sie einen analytischen Ausdruck für diese Menge finden, können Sie versuchen, den MLE anzuschließen. Alternativ können Sie die Fisher-Informationen anhand der beobachteten Fisher-Informationen schätzen , die der Hessische Wert von in der MLE ist. Ihr interessierender Parameter ist eine lineare Kombination der Parameter in den beidenl l β -vektoren, daher können Sie aus der approximierenden multivariaten Normalen des MLE eine normale Approximation der Schätzerverteilung finden, wie hier beschrieben . Dies gibt Ihnen einen ungefähren Standardfehler und Sie können Konfidenzintervalle berechnen. Es ist in vielen (mathematischen) Statistikbüchern gut beschrieben, aber eine einigermaßen zugängliche Präsentation, die ich empfehlen kann, ist In All Likelihood von Yudi Pawitan. Wie auch immer, die formale Ableitung der asymptotischen Theorie ist ziemlich kompliziert und beruht auf einer Reihe von Regelmäßigkeitsbedingungen, und sie liefert nur eine gültige asymptotischeVerteilungen. Im Zweifelsfall würde ich daher immer einige Simulationen mit einem neuen Modell durchführen, um zu überprüfen, ob ich den Ergebnissen für realistische Parameter und Stichprobengrößen vertrauen kann. Ein einfaches, nicht parametrisches Bootstrapping, bei dem Sie die Tripel aus dem beobachteten Datensatz mit Ersetzung kann eine nützliche Alternative sein, wenn das Anpassungsverfahren nicht zu zeitaufwändig ist.(yi,xi,zi)
quelle