Angenommen, Sie haben eine diskrete Zufallsvariable mit Wahrscheinlichkeitsmassenfunktion auf die Unterstützung . Welche Funktion so dass maximiert
Nehmen Sie an, um den Umgang mit Randfällen zu vermeiden .
Verwandte Fragen:
- Ich glaube das das maximiert die obige Erwartung auch maximiert schon seit ist monoton. Ist das korrekt?
- Kann irgendetwas schlagen ?
Für diejenigen, die interessiert sind, ergibt sich diese Frage aus dem CDC Flu Forecasting-Wettbewerb, bei dem sie das Protokoll der Summe der Wahrscheinlichkeiten für den Zielwert und benachbarte Werte als Nutzenfunktion zur Bewertung von Prognosen verwenden.
probability
optimization
expected-value
kullback-leibler
jaradniemi
quelle
quelle
Antworten:
Cooles Problem! Wie die Ableitung von Xi'an zeigt, hängt sie mit der Minimierung der KL-Divergenz von Q zu P. zusammen. Cliff bietet auch einen wichtigen Kontext.
Das Problem kann trivial mit einer Optimierungssoftware gelöst werden, aber ich sehe keine Möglichkeit, eine geschlossene Formel für die allgemeine Lösung zu schreiben. Wenn niemals bindet, gibt es eine intuitive Formel.qi≥0
Mit ziemlicher Sicherheit optimal (obwohl meine Beispieldiagramme am Ende zu sehen sind, könnte es nahe sein). Und ist nicht dasselbe Problem wie . Beachten Sie, dass kein äquivalentes Ziel ist wie . Es ist keine monotone Transformation. Erwartung ist eine Summe und das Protokoll geht in die Summe ein, es ist also keine monotone Transformation der Zielfunktion.q≠p maxE[x] maxE[log(x)] x+y log(x)+log(y)
KKT-Bedingungen (dh notwendige und ausreichende Bedingungen) für eine Lösung:
Definiere und . Das Problem ist:q0=0 qn+1=0
Lagrange: Dies ist ein konvexes Optimierungsproblem, bei dem Slaters Bedingung gilt, daher sind die KKT-Bedingungen notwendig und ausreichende Bedingungen für ein Optimum. Bedingung erster Ordnung:
Komplementäre Schlaffheit: Und natürlich . (Aus meinen Tests geht hervor, dass aber ich verstehe nicht sofort, warum.) und sind Lagrange-Multiplikatoren.
Lösung, wenn niemals bindet.qi≥0
Dann überlegen Sie sich eine Lösung
So schreiben Sie das Problem mit Matrizen:
Sei und Vektoren. Sei eine Tri-Band-Diagonalmatrix von Einsen. Z.B. fürp q A n=5
Problem kann mit mehr Matrixnotation geschrieben werden:
Dies kann numerisch schnell gelöst werden, aber ich sehe keinen Weg zu einer sauberen Lösung in geschlossener Form?
Die Lösung ist gekennzeichnet durch: aber ich sehe nicht, wie schrecklich hilfreich das ist, außer Ihre Optimierungssoftware zu überprüfen.
Code zur Lösung mit CVX und MATLAB
Z.B. Eingänge:
hat Lösung:
Lösung Ich bekomme (blau), wenn ich eine Tonne Mülleimer habe, die im Grunde dem normalen PDF folgen (rot): Ein weiteres willkürlicheres Problem:
Sehr locker, für Sie , aber wenn sich um eine Tonne bewegt, werden einige knifflige Dinge ausgeführt, bei denen die Optimierung versucht, das zu setzen Masse auf 's in der Nähe von Masse, strategisch zwischen ' s mit Masse platzieren.pi−1≈pi≈pi+1 qi≈pi pi qi pi pi
Ein weiterer konzeptioneller Punkt ist, dass die Unsicherheit in Ihrer Prognose Ihre Schätzung von effektiv glättet und ein glatteres eine Lösung , die näher an . (Ich denke das ist richtig.)p p q p
quelle
Da löst was gerade Lösung , um die Lösung für Wenn die Lösung für dieses Gleichungssystem nicht zum Simplex gehört, wird das Argument auf einer Seite des Simplex gefunden .q=p
quelle
Wenn ich das richtig verstehe, denke ich nicht, dass dies eine geschlossene Lösung haben wird. Oder darüber hinaus ist es zumindest eine Spezialisierung eines Problems, das nicht in geschlossener Form vorliegt.
Der Grund, warum ich dies sage, ist, dass es genau die Wahrscheinlichkeit ist, die in der NPMLE für intervallzensierte Daten erscheint, wobei die Spezialisierung darin besteht, dass alle Intervalle die Form . Im Allgemeinen ist der NPMLE der Maximierer der Funktion[X−1,X+1]
Dabei ist die Ereigniszeit für das Subjekt , wobei nur bekannt ist, dass das Ereignis innerhalb des Intervalls aufgetreten ist . Dies entspricht genau Ihrem Problem mit und .ti i [Li,Ri] Li=Xi−1 Ri=Xi+1
Im Allgemeinen ist dies nicht in geschlossener Form. Mindestens ein Sonderfall ist jedoch; die der aktuellen oder wenn alle Intervalle die Form oder .[0,ci] [ci,∞)
Davon abgesehen gibt es viele Algorithmen zur Lösung des NPMLE! Sie können diese unter Verwendung passen
R
‚sicenReg
mit der Paket -ic_np
Funktion (Anmerkung: Ich bin der Autor). Stellen Sie sicher, dass Sie die Option festlegenB = c(1,1)
und erklären, dass die Intervalle geschlossen sind.Es ist zu beachten, dass es nicht der Fall ist, dass die Funktion , die maximiert, auch maximiert . Als triviales Beispiel Angenommen, Dann maximiert und 0 andernfalls , ist aber für .q E[q(X−1)+...] E[log(q(X−1)+...] X1=1,X2=1,X3=10 q(1)=1 E[q(X−1)+...] E[log(q(X−1)+...]
quelle