In der Ökologie verwenden wir häufig die logistische Wachstumsgleichung:
oder
wobei die Tragfähigkeit ist (maximale Dichte erreicht), die Anfangsdichte ist, die Wachstumsrate ist, die Zeit seit dem Anfang ist.N 0 r t
Der Wert von hat eine weiche Obergrenze und eine Untergrenze mit einer starken Untergrenze bei .( N 0 ) 0
Darüber hinaus werden in meinem spezifischen Kontext Messungen von unter Verwendung der optischen Dichte oder Fluoreszenz durchgeführt, die beide theoretische Maxima und damit eine starke Obergrenze aufweisen.
Der Fehler um wird daher wahrscheinlich am besten durch eine begrenzte Verteilung beschrieben.
Bei kleinen Werten von weist die Verteilung wahrscheinlich einen starken positiven Versatz auf, während bei Werten vonN t auf sich K nähern, die Verteilung wahrscheinlich einen starken negativen Versatz aufweist. Die Verteilung hat also wahrscheinlich einen Formparameter, der mit verknüpft werden .
Die Varianz kann auch mit .
Hier ist ein grafisches Beispiel
mit
K<-0.8
r<-1
N0<-0.01
t<-1:10
max<-1
welches in r mit produziert werden kann
library(devtools)
source_url("https://raw.github.com/edielivon/Useful-R-functions/master/Growth%20curves/example%20plot.R")
Was wäre die theoretische Fehlerverteilung um (unter Berücksichtigung sowohl des Modells als auch der bereitgestellten empirischen Informationen)?
Wie hängen die Parameter dieser Verteilung mit dem Wert von oder der Zeit zusammen (wenn Parameter verwendet werden, kann der Modus nicht direkt zugeordnet werdenN t z. B. logis normal)?
Hat diese Verteilung eine in implementierte Dichtefunktion ?
Bisher erkundete Richtungen:
- Unter der Annahme einer Normalität um (führt zu Überschätzungen von K. )
- Logit Normalverteilung um , aber Schwierigkeiten beim Anpassen der Formparameter Alpha und Beta
- Normalverteilung um die Logik von
quelle
Antworten:
Wie Michael Chernick betonte, ist die skalierte Beta-Verteilung hierfür am sinnvollsten. Für alle praktischen Zwecke und in der Erwartung, dass Sie es tun werden NIE tun werdenWenn Sie das Modell perfekt richtig machen, ist es besser, den Mittelwert einfach durch nichtlineare Regression gemäß Ihrer logistischen Wachstumsgleichung zu modellieren und dies mit Standardfehlern abzuschließen, die gegenüber Heteroskedastizität robust sind. Wenn Sie dies in einen Kontext mit maximaler Wahrscheinlichkeit setzen, entsteht ein falsches Gefühl von großer Genauigkeit. Wenn die ökologische Theorie eine Verteilung ergeben würde, sollten Sie diese Verteilung anpassen. Wenn Ihre Theorie nur die Vorhersage für den Mittelwert liefert, sollten Sie sich an diese Interpretation halten und nicht versuchen, mehr als das zu finden, wie eine vollständige Verteilung. (Pearsons Kurvensystem war sicherlich vor 100 Jahren ausgefallen, aber zufällige Prozesse folgen keinen Differentialgleichungen, um die Dichtekurven zu erzeugen, was seine Motivation bei diesen Dichtekurven war - vielmehrNt muss eine Obergrenze haben; Ich würde eher sagen, dass der von Ihren Geräten verursachte Messfehler kritisch wird, wenn der Prozess die Obergrenze für eine einigermaßen genaue Messung erreicht. Wenn Sie die Messung mit dem zugrunde liegenden Prozess verwechseln, sollten Sie dies explizit erkennen, aber ich würde mir vorstellen, dass Sie ein größeres Interesse an dem Prozess haben als an der Beschreibung der Funktionsweise Ihres Geräts. (Der Prozess wird in 10 Jahren dort sein. Möglicherweise werden neue Messgeräte verfügbar, sodass Ihre Arbeit veraltet ist.)
quelle
@whuber ist richtig, dass es keine notwendige Beziehung des strukturellen Teils dieses Modells zur Verteilung der Fehlerterme gibt. Es gibt also keine Antwort auf Ihre Frage zur theoretischen Fehlerverteilung.
Dies bedeutet jedoch nicht, dass es keine gute Frage ist - nur, dass die Antwort weitgehend empirisch sein muss.
Sie scheinen anzunehmen, dass die Zufälligkeit additiv ist. Ich sehe keinen Grund (außer Rechenaufwand) dafür. Gibt es eine Alternative, dass es irgendwo anders im Modell ein zufälliges Element gibt? Siehe zum Beispiel das Folgende, wo Zufälligkeit als Normalverteilung mit dem Mittelwert 1 eingeführt wird, wobei nur die Varianz geschätzt werden muss. Ich habe keinen Grund zu der Annahme, dass dies das Richtige ist, außer dass es plausible Ergebnisse liefert, die mit dem übereinstimmen, was Sie sehen möchten. Ob es praktisch wäre, so etwas als Grundlage für die Schätzung eines Modells zu verwenden, weiß ich nicht.
quelle