Ich verwende das Standardinfektionsmodell für einige Daten, mit denen ich arbeite.
Wobei die Anzahl der anfälligen Probanden ist, die Infizierten und die Wiederhergestellten. Ich versuche verschiedene Methoden zur Schätzung der Parameter und .
Für jeden diskreten Zeitraum mit fester Breite kenne ich die Anzahl der Infizierten und die festgelegte Gesamtbevölkerung. Eine der Methoden, die ich zum Schätzen der Parameter verwendet habe, besteht darin, den Anfangszustand in einen Differentialgleichungslöser in R einzuspeisen und mehrere Werte für und durchlaufen, bis sie den mittleren quadratischen Fehler minimiert haben.
Mir wurde gesagt, dass es möglich ist, eine Maximum-Likelihood-Schätzung der Parameter vorzunehmen, aber ich weiß nicht, wie ich damit anfangen soll.
Eine Idee, die mir vorgestellt wurde, bestand darin, eine Normalkurve zu verwenden und die Parameter der Verteilung unter Verwendung der bekannten Maximum-Likelihood-Schätzungen für die Parameter der Normalverteilungen zu schätzen. Mein Problem dabei ist, dass ich es mit der Anzahl der Infizierten (oder sogar dem Anteil der Infizierten) in einer Population zu tun habe, nicht mit irgendetwas, das den notwendigen Annahmen einer Wahrscheinlichkeitsverteilung folgt.
Wenn ich dies tun würde, müsste ich einen anderen Parameter einführen, um die normale Kurve nach oben in Richtung meiner Daten zu verschieben. Damit meine ich, wenn die Normalverteilung ist, würde ich einen anderen Parameter benötigen, so dass
Dabei ist die Anzahl der Infizierten (oder der Anteil spielt keine Rolle) zum Zeitpunkt .
Wenn ich diese Methode anwenden würde, würde ich wahrscheinlich die Parameter und schätzen durch:
- Verwenden Sie die Maximum-Likelihood-Schätzung der normalen (ish) Kurve mit der obigen Methode.
- Verwenden Sie die Schätzung der kleinsten Quadrate wie in dieser Frage , um das Infektionsmodell anstelle der tatsächlichen Daten an die normale Kurve anzupassen.
Ich bin mir nicht sicher, was ich sonst tun soll, daher schätze ich jeden Einblick, den Sie gewähren können, sehr.
Antworten:
Hier ist eine Möglichkeit, bei der das Modell modifiziert wird (1), um explizit probabilistisch zu sein, und (2) um in diskreter Zeit zu erfolgen.
Der folgende Code erklärt das modifizierte Modell, simuliert es und verwendet dann MLE, um die Parameter wiederherzustellen (deren wahrer Wert in diesem Spielzeugbeispiel bekannt ist, da wir die Daten simuliert haben). Achtung: Meine Beta entspricht nicht genau Ihrer Beta - siehe "Geschichte" in den Kommentaren unten.
Lassen Sie mich wissen, wenn etwas nicht selbsterklärend ist.
Haftungsausschluss: Ich habe das SIR-Modell nur einmal kurz in einer College-Klasse vor einigen Jahren studiert. Das Modell, das ich oben simuliere und schätze, ist nicht genau das klassische SIR-Modell mit Differentialgleichung, das Sie in Ihrer Frage angegeben haben. Außerdem habe ich heute ein bisschen Fieber, also überprüfe den Code auf Fehler!
quelle
Diese Folien bieten einen guten ersten Start durch iterative Anpassungen der kleinsten Quadrate. Dies gilt jedoch nur für das SI-Modell.
Dieser Blog behandelt dieses Problem ausführlicher. Dies scheint Ihrem Ansatz ähnlich zu sein. Das Anpassen eines Gaußschen Kernels über nichtlineare kleinste Quadrate könnte ein guter Weg sein, um anfängliche Parameterschätzungen zu erhalten. Dann müssen Sie eine Art Beziehung zwischen den Gaußschen Kernelparametern und den Parametern in Ihrem Modell identifizieren.
quelle