Ist es möglich, das übliche MLE-Verfahren auf die Dreiecksverteilung anzuwenden? - Ich versuche es, aber ich scheine bei dem einen oder anderen Schritt in der Mathematik durch die Art und Weise, wie die Verteilung definiert ist, blockiert zu sein. Ich versuche die Tatsache zu nutzen, dass ich die Anzahl der Proben über und unter c kenne (ohne c zu kennen): Diese 2 Zahlen sind cn und (1-c) n, wenn n die Gesamtzahl der Proben ist. Dies scheint jedoch bei der Ableitung nicht zu helfen. Der Moment der Momente gibt einen Schätzer für c ohne viel Problem. Was ist die genaue Art der Behinderung von MLE hier (falls es tatsächlich eine gibt)?
Mehr Details:
Betrachten wir in [ 0 , 1 ] und die auf [ 0 , 1 ] definierte Verteilung durch:
wenn x <cf(x;c)=2(1-x)
wenn c <= x
Nehmen wir aus dieser Verteilung ein iid-Beispiel { x i } aus der Log-Wahrscheinlichkeit von c für dieses Beispiel:
Ich versuche dann, die Tatsache zu nutzen, dass wir angesichts der Form von wissen, dass c n Proben unter das (unbekannte) c fallen und ( 1 - c ) n über c fallen wird . IMHO erlaubt dies, die Summation im Ausdruck der Log-Wahrscheinlichkeit folgendermaßen zu zerlegen:
Aber das Ableiten der Indikatoren scheint auch nicht einfach zu sein, obwohl Dirac-Deltas es ermöglichen könnten, fortzufahren (während wir noch Indikatoren haben, da wir Produkte ableiten müssen).
Also, hier bin ich in MLE blockiert. Irgendeine Idee?
Antworten:
Bestimmt! Obwohl es einige Kuriositäten gibt, mit denen man sich befassen muss, ist es in diesem Fall möglich, MLEs zu berechnen.
Wenn Sie jedoch mit "dem üblichen Verfahren" "Ableitungen der Log-Wahrscheinlichkeit nehmen und auf Null setzen" meinen, dann vielleicht auch nicht.
Haben Sie versucht, die Wahrscheinlichkeit zu zeichnen?
- -
Follow-up nach Klärung der Frage:
Die Frage nach der Wahrscheinlichkeitsfindung war kein müßiger Kommentar, sondern von zentraler Bedeutung für das Thema.
Nein. MLE beinhaltet das Finden des Argmax einer Funktion. Das beinhaltet nur das Finden der Nullen einer Ableitung unter bestimmten Bedingungen ... die hier nicht gelten. Wenn Sie dies schaffen, identifizieren Sie bestenfalls einige lokale Minima .
Schauen Sie sich, wie meine frühere Frage andeutete, die Wahrscheinlichkeit an.
Die grauen Linien markieren die Datenwerte (ich hätte wahrscheinlich eine neue Stichprobe generieren sollen, um eine bessere Trennung der Werte zu erreichen). Die schwarzen Punkte markieren die Wahrscheinlichkeit / Log-Wahrscheinlichkeit dieser Werte.
Hier ist ein Zoom in der Nähe des Maximums der Wahrscheinlichkeit, um mehr Details zu sehen:
Wie Sie der Wahrscheinlichkeit entnehmen können, hat die Wahrscheinlichkeitsfunktion bei vielen Auftragsstatistiken scharfe "Ecken" - Punkte, an denen die Ableitung nicht existiert (was nicht überraschend ist - das ursprüngliche PDF hat eine Ecke und wir nehmen eine Produkt von pdfs). Dies (bei der Auftragsstatistik gibt es Höcker) ist bei der Dreiecksverteilung der Fall, und das Maximum tritt immer bei einer der Auftragsstatistiken auf. (Dass bei der Ordnungsstatistik Höcker auftreten, ist nicht nur bei den Dreiecksverteilungen der Fall. Beispielsweise hat die Laplace-Dichte eine Ecke, und daher hat die Wahrscheinlichkeit für ihr Zentrum bei jeder Ordnungsstatistik eine.)
Wie in meiner Stichprobe tritt das Maximum als Statistik vierter Ordnung auf, 0,3780912
Eine nützliche Referenz ist Kapitel 1 von " Beyond Beta " von Johan van Dorp und Samuel Kotz. Kapitel 1 ist ein kostenloses Beispielkapitel für das Buch - Sie können es hier herunterladen .
Es gibt ein hübsches kleines Papier von Eddie Oliver zu diesem Thema mit der dreieckigen Verteilung, denke ich in American Statistician (das macht im Grunde die gleichen Punkte; ich denke, es war in einer Lehrerecke). Wenn ich es finden kann, gebe ich es als Referenz.
Edit: hier ist es:
EH Oliver (1972), A Maximum Likelihood Oddity,
The American Statistician , Band 26, Ausgabe 3, Juni, S. 43-44
(Publisher- Link )
Wenn Sie es leicht finden können, ist es einen Blick wert, aber dieses Kapitel von Dorp und Kotz behandelt die meisten relevanten Themen, so dass es nicht entscheidend ist.
Um die Frage in den Kommentaren weiterzuverfolgen - selbst wenn Sie eine Möglichkeit finden könnten, die Ecken zu glätten, müssten Sie sich dennoch mit der Tatsache auseinandersetzen, dass Sie mehrere lokale Maxima erhalten können:
Es könnte jedoch möglich sein, Schätzer mit sehr guten Eigenschaften zu finden (besser als die Methode der Momente), die Sie leicht aufschreiben können. Aber ML auf dem Dreieck auf (0,1) ist ein paar Codezeilen.
Wenn es sich um große Datenmengen handelt, kann auch dies behandelt werden, wäre aber eine andere Frage, denke ich. Beispielsweise kann nicht jeder Datenpunkt ein Maximum sein, was die Arbeit reduziert, und es können einige andere Einsparungen erzielt werden.
quelle