Wie berechnet man das 95% -Konfidenzintervall für eine nichtlineare Gleichung?

10

Ich habe eine Gleichung, um das Gewicht von Seekühen aus ihrem Alter in Tagen (Dias, in Portugiesisch) vorherzusagen:

R <- function(a, b, c, dias) c + a*(1 - exp(-b*dias))

Ich habe es in R mit nls () modelliert und diese Grafik erhalten:

Geben Sie hier die Bildbeschreibung ein

Jetzt möchte ich das 95% -Konfidenzintervall berechnen und in der Grafik darstellen. Ich habe die unteren und oberen Grenzen für jede Variable a, b und c wie folgt verwendet:

lower a = a - 1.96*(standard error of a)
higher a = a + 1.96*(standard error of a)
(the same for b and c)

dann zeichne ich eine niedrigere Linie mit niedrigerem a, b, c und eine höhere Linie mit höherem a, b, c. Aber ich bin mir nicht sicher, ob das der richtige Weg ist. Es gibt mir diese Grafik:

Geben Sie hier die Bildbeschreibung ein

Ist das der Weg, oder mache ich es falsch?

Rodrigo
quelle

Antworten:

13
  1. In dieser Qualitätssicherung auf dieser Website wird die Mathematik zum Erstellen von Konfidenzbändern um durch nichtlineare Regression erzeugte Kurven erläutert: Form des Vertrauens und Vorhersageintervalle für nichtlineare Regression

  2. Wenn Sie weiter lesen, es wird helfen , das Vertrauen zu unterscheiden Intervalle für die Parameter von Vertrauen Bänder für die Kurve.

  3. Wenn Sie sich Ihre Grafik ansehen, sieht es so aus, als hätten Sie Daten von vier Tieren, die jeweils an vielen Tagen gemessen werden. Wenn dies der Fall ist, verstößt das gleichzeitige Anpassen aller Daten gegen eine der Regressionsannahmen - dass jeder Datenpunkt unabhängig ist (oder dass jeder Rest einen unabhängigen "Fehler" aufweist). Sie können die Verfolgung jedes Tieres einzeln anpassen oder ein gemischtes Modell verwenden, um alle auf einmal anzupassen.

Harvey Motulsky
quelle
5
+1 Der dritte Punkt ist entscheidend: Jeder Versuch, CIs oder Konfidenzbänder zu berechnen, sofern diese Daten unabhängig sind, führt zu völlig unzureichenden (dh kurzen ) Intervallen. Es könnte dem OP helfen, zu betonen, dass die in der Frage vorgeschlagene Methode definitiv falsch ist: Sie vernachlässigt die (starke) Korrelation zwischen Parameterschätzungen und aggregiert die Konfidenzgrenzen falsch. Das Nettoergebnis sieht tatsächlich vernünftig aus (rein durch Zufall und Glück), aber meiner Meinung nach ist es immer noch nicht konservativ genug.
whuber