Angenommen, ich arbeite mit dem folgenden Modell
.
Das sind iid Gauß mit dem Mittelwert Null und ich versuche, die besten Anpassungswerte von zu finden .
Nehmen wir zur Verdeutlichung an, dies ist ein Modell für die Gesamtmenge einiger Bakterienarten mit zwei Unterarten, die gemäß dem ersten und zweiten Term auf der RHS zeitlich wachsen, aber wir messen nur die Gesamtpopulation. Hinweis: Dies ist nicht die tatsächliche Einstellung, reicht jedoch für die Frage aus.
Das Modell ist im üblichen Sinne nicht identifizierbar, da ich immer nur tauschen kann und zum Beispiel und erhalten genau die gleiche Dichte / Wahrscheinlichkeit.
Wie zu erwarten ist, habe ich, wenn ich ein MCMC auf diesem Gebiet betreibe, schrecklich breite Posterioren, und jeder nichtlineare Ansatz der kleinsten Quadrate reagiert unglaublich empfindlich auf anfängliche Vermutungen - wir haben ein großes Plateau in der Wahrscheinlichkeitsfunktion.
Ein besseres experimentelles Design ist derzeit keine Option - eine getrennte Messung der Unterarten wäre natürlich die beste Option.
Kann ich mit diesem Problem etwas anfangen oder ist ein besseres experimentelles Design die einzige Option?
Antworten:
Es gibt kein Identifizierbarkeitsproblem, außer in dem trivialen Sinne, dass ein bestimmtes Modell zwei Beschreibungen haben kann. Das eigentliche Problem scheint die Schwierigkeit bei der Anpassung des Modells zu sein - dies liegt jedoch eher an der Parametrisierung der Modelle als an der mangelnden Identifizierbarkeit.
Dieses Problem hat eine ebenso triviale Lösung: Erklären Sie dies ohne Verlust der Allgemeinheitβ≥δ . Wenn Sie wirklich pingelig sein wollen, bestehen Sie auch darauf, dass wennβ=δ , dann α≥γ .
Leider erfordert dies ein Verfahren, um das Modell anzupassen und diese Einschränkungen zu berücksichtigen. Das Einführen einer Einschränkung ist hier jedoch nicht so schlimm, da die Anwendung so ist, dass offensichtlich alle Parameter ohnehin nicht negativ sind: Der Parameterraum hat bereits scharfe Grenzen. Das Einfügen einer weiteren Einschränkung erzwingt keine Änderungen bei der Anpassung des Modells.
Eine bekannte Methode, um eine eingeschränkte Optimierung in eine nicht eingeschränkte umzuwandeln, besteht darin, das Problem neu zu parametrisieren, so dass im neuen Parameterraum die Grenzen ins Unendliche verschoben werden. Hier gibt es viele Möglichkeiten, dies zu erreichen. Eine Überlegung, was die Parameter bedeuten, wird uns leiten. Bestimmtes,ν=α+γ ist das von der Funktion erreichte Maximum
Aus Schätzungen dieser Parameter (die übrigens aufgrund der Mehrdeutigkeit der Winkel nicht "identifizierbar" sindein und d ) können Sie die ursprünglichen als wiederherstellen
Die Eigenschaften der Exponential- und Triggerfunktionen stellen sicher, dass alle Einschränkungen gelten:α > 0 , β≥ δ> 0 , und γ> 0 . (Da Schwimmer mit doppelter Genauigkeit astronomisch klein werden können, gibt es keinen praktischen Unterschied zwischen> und ≥ in diesen Einschränkungen.)
In diesem genau definierten Sinne ist das Modell identifizierbar, obwohl die zur Anpassung verwendeten Parameter nicht identifizierbar sind.
Obwohl man MCMC verwenden könnte, ist es einfacher, einen numerischen Löser wie Newton-Raphson zu verwenden, wenn der Zweck nur darin besteht, die Kurve anzupassen. Der Trick besteht darin , einen guten Startwert zu finden . Das Maximum deryich wäre eine leichte Überschätzung von en ;; Beginnen Sie also vielleicht mitn = log( max (yich) / 2 ) . Sie könnten mit beginnena = π/ 4 Angenommen, jede Komponente leistet einen wesentlichen Beitrag zum Ganzen. Machen Sie einige vernünftige Vermutungen übereb und ed basierend auf erwarteten Zerfallsraten. Zum Beispiel, wenn der Bereich vont ist vernünftig, dann nimm b ein Bruchteil der größten sein t und vielleicht willkürlich auswählen d= π/ 4 ;; Verwenden Sie möglicherweise einen kleineren Startwert. ( Abhängig von diesen Auswahlmöglichkeiten erhalten Sie häufig unterschiedliche Werte für die Parameterschätzungen, die sich jedoch in der Regel nicht wesentlich auf die Funktion auswirkenf selbst .)
In vielen Fällen funktioniert dieser Ansatz auffallend gut. Außer wenn die Varianz der Fehler gleich groß ist wiemaxyich oder größer (wo es ohne eine große Datenmenge schwierig ist, ein Signal überhaupt zu erkennen), funktioniert die Anpassung auch mit winzigen Datenmengen: Alles, was benötigt wird, sind vier.
Beachten Sie, dass unabhängig von der Anpassung des Modells normalerweise große Unsicherheiten bei den Parametern bestehen: Diese Kurvenfamilie ist im Wesentlichen eine winzige Störung der Exponentialfamilie mit zwei Parameternt → A.e- B t . In vielen Fällen also zwei der Parameter (entsprechend der AmplitudeEIN und längste Zerfallsrate B. ) können mit angemessener Genauigkeit identifiziert werden, aber die beiden anderen Parameter, die kleine Abweichungen von dieser Exponentialform widerspiegeln, sind normalerweise sehr unsicher.
Die Abbildung zeigt ein Beispiel für eine herausfordernde Passform. Die zugrunde liegende Kurve ist schwarz dargestellt. Letztendlich erreicht es ein Maximum von4 / 3 , sehr langsam. Nur24 Datenpunkte sind verfügbar und als graue Punkte dargestellt. Die Standardabweichung der Zufallsfehler beträgt1 / 2 ein beträchtlicher Anteil dieses Maximums. Viele der Fehler waren positiv, was dazu führte, dass die angepasste Kurve in Rot etwas höher war. Die beiden Exponentialkomponenten der angepassten Kurve sind als gestrichelte und gepunktete graue Linien dargestellt. Man zeigt einen raschen Anstieg auf eine Schwelle von1 / 3 Zu der Zeit t = 1 ;; das andere spiegelt das andere Exponential wider, das bis zu seiner Schwelle von ansteigt1 . (Sie werden wenig Hoffnung haben, diese scharfe "Schulter" in der Nähe zu reproduzierent = 1 bis du eine hast 1000 Datenpunkte oder mehr: Probieren Sie es aus, indem Sie
n
den folgenden Code variieren .)Ihr Erfolg bei einem bestimmten Problem hängt von der Größe der Fehler ab. der Wertebereich vont die abgetastet werden; wie diese Werte beabstandet sind; wie viele Werte sind verfügbar; und Wahl der Startwerte. Trotzdem scheint dies im Allgemeinen ein nachvollziehbares Problem zu sein, mit Lösungen, die schnell erhalten werden können. Darüber hinaus wird jeder Monteur mit maximaler Wahrscheinlichkeit ähnlich vorgehen, um die Summe der Quadrate der Residuen zu minimieren - und zusätzlich Konfidenzbereiche für die Parameter bereitstellen.
Dies ist der
R
Code, mit dem ich diesen Vorschlag getestet habe. Es gibt die Abbildung wieder und kann leicht geändert werden - ändern Sie die Werte der Variablen am Anfang -, um Daten zu untersuchen, die wie die von Ihnen möglicherweise vorhandenen aussehen.quelle