Die Dreiheit der Tests mit maximaler Wahrscheinlichkeit: Was tun, wenn widersprüchliche Schlussfolgerungen gezogen werden?

10

Die Tests Wald, Likelihood Ratio und Lagrange Multiplier im Rahmen der Maximum Likelihood Estimation sind asymptotisch äquivalent. Bei kleinen Stichproben weichen sie jedoch tendenziell stark voneinander ab und führen in einigen Fällen zu unterschiedlichen Schlussfolgerungen.

Wie können sie danach eingestuft werden, wie wahrscheinlich es ist, dass sie die Null ablehnen? Was tun, wenn die Tests widersprüchliche Antworten haben? Können Sie einfach die auswählen, die die gewünschte Antwort gibt, oder gibt es eine "Regel" oder "Richtlinie" für das weitere Vorgehen?

hypothesis-testing maximum-likelihood Vivi
quelle

Ist dies vielleicht nur ein Fall, in dem die asymptotischen Annäherungen an die [Null] -Verteilungen einer oder mehrerer der drei Teststatistiken nicht so gut sind? Vielleicht unterscheiden sich die Ergebnisse, weil die tatsächlichen Größen der Tests unterschiedlich sind? Wie groß sind Ihre Stichproben?

Ronaf

5

Ich kenne die Literatur in diesem Bereich nicht gut genug, um eine direkte Antwort zu geben. Es scheint mir jedoch, dass wenn sich die drei Tests unterscheiden, dies ein Hinweis darauf ist, dass Sie weitere Forschung / Datenerfassung benötigen, um Ihre Frage endgültig zu beantworten.

Vielleicht möchten Sie sich auch diese Google Scholar-Suche ansehen

Update als Antwort auf Ihren Kommentar:

Wenn das Sammeln zusätzlicher Daten nicht möglich ist, gibt es eine Problemumgehung. Führen Sie eine Simulation durch, die Ihre Datenstruktur, Stichprobengröße und Ihr vorgeschlagenes Modell widerspiegelt. Sie können die Parameter auf einige vordefinierte Werte einstellen. Schätzen Sie das Modell anhand der generierten Daten und überprüfen Sie dann, welcher der drei Tests Sie auf das richtige Modell hinweist. Eine solche Simulation bietet eine Anleitung, welcher Test für Ihre realen Daten verwendet werden soll. Ist das sinnvoll?

quelle

1

Beziehen Sie sich auf ein bestimmtes Papier? Ich kann mir vorstellen, dass ich eine Antwort auf meine Frage finden könnte, wenn ich viel recherchieren, studieren und lesen würde, aber auch 95% der Fragen, die andere Leute hier stellen ... In einigen Fällen auch, insbesondere mit makroökonomischen Daten (die mein Gebiet sind) ) sind keine Daten mehr zu sammeln. Daten sind knapp (die Anzahl der Beobachtungen, meine ich), und Sie müssen nur damit leben. Es gibt keine Lösung zum Abrufen weiterer Daten. Ich hatte gehofft, jemand hier würde das Thema kennen, aber es scheint nicht so. Vielleicht, sobald die Website für die breite Öffentlichkeit geöffnet ist?

Vivi

Ich vermute, dass die Antwort auf Ihre Frage domänen- / modellspezifisch ist, und bin mir daher nicht sicher, ob ich ein bestimmtes Papier empfehlen kann.

1

Entschuldigung für die späte Antwort. Ich mag Ihren Simulationsvorschlag. Das ist allerdings nicht so einfach. Die Wahrheit ist, was ich in der Praxis sehe, ist, dass Forscher nur den Test durchführen, der rechnerisch einfacher ist oder der ihnen das gewünschte Ergebnis liefert.

Vivi

8

Ich werde keine endgültige Antwort in Bezug auf die Rangfolge der drei geben. Erstellen Sie 95% CIs um Ihre Parameter basierend auf jedem, und wenn sie sich radikal unterscheiden, sollte Ihr erster Schritt darin bestehen, tiefer zu graben. Transformieren Sie Ihre Daten (obwohl der LR unveränderlich ist), regulieren Sie Ihre Wahrscheinlichkeit usw. Zur Not würde ich mich wahrscheinlich für den LR-Test und das zugehörige CI entscheiden. Ein grobes Argument folgt.

Das LR ist unter der Wahl der Parametrisierung invariant (z. B. T versus logit (T)). Die Wald-Statistik geht von einer Normalität von (T - T0) / SE (T) aus. Wenn dies fehlschlägt, ist Ihr CI schlecht. Das Schöne am LR ist, dass Sie keine Transformation f (T) finden müssen, um die Normalität zu erfüllen. Der 95% CI basierend auf T ist der gleiche. Wenn Ihre Wahrscheinlichkeit nicht quadratisch ist, kann der Wald 95% CI, der symmetrisch ist, verrückt sein, da er möglicherweise Werte mit geringerer Wahrscheinlichkeit gegenüber Werten mit höherer Wahrscheinlichkeit bevorzugt.

Eine andere Möglichkeit, über das LR nachzudenken, besteht darin, dass es mehr Informationen aus der Wahrscheinlichkeitsfunktion verwendet. Der Wald basiert auf dem MLE und der Krümmung der Wahrscheinlichkeit bei Null. Die Punktzahl basiert auf der Steigung bei Null und der Krümmung bei Null. Das LR bewertet die Wahrscheinlichkeit unter der Null und die Wahrscheinlichkeit unter der Vereinigung von Null und Alternative und kombiniert die beiden. Wenn Sie gezwungen sind, einen auszuwählen, kann dies für die Auswahl des LR intuitiv zufriedenstellend sein.

Denken Sie daran, dass es andere Gründe gibt, wie z. B. Bequemlichkeit oder Rechenaufwand, sich für Wald oder Score zu entscheiden. Der Wald ist der einfachste und wenn Sie bei einem multivariaten Parameter testen, ob viele einzelne auf 0 gesetzt werden sollen, gibt es bequeme Möglichkeiten, die Wahrscheinlichkeit zu approximieren. Wenn Sie eine Variable aus einem Satz gleichzeitig hinzufügen möchten, möchten Sie möglicherweise nicht die Wahrscheinlichkeit für jedes neue Modell maximieren, und die Implementierung von Score-Tests bietet hier einige Vorteile. Wald und Score werden attraktiv, wenn Ihre Modelle und Ihre Wahrscheinlichkeit unattraktiv werden. (Aber ich glaube nicht, dass Sie dies in Frage gestellt haben, da Sie alle drei zur Verfügung haben ...)

ars
quelle

Die Dreiheit der Tests mit maximaler Wahrscheinlichkeit: Was tun, wenn widersprüchliche Schlussfolgerungen gezogen werden?

Antworten: