Ich habe eine Antwortvariable gemessen
Y1
als Funktion von zwei gemessenen unabhängigen Variablen
X1 and X2
In meinem Forschungsbereich ist es üblich, Y1 in eine andere Antwortvariable umzuwandeln:
Y2 = 10*X1 * ((-1)+1 / Y1)
Dann passend zum folgenden Modell (M1):
Y2 ~ a * X1^b * X2^c + error
um zu schätzen (a, b, c).
Es ist jedoch auch möglich, diese drei Parameter zu schätzen, ohne Y1 in Y2 umzuwandeln, indem dieses äquivalente Modell (M2) verwendet wird (zumindest auf dem Papier äquivalent):
Y1 ~ 10*X1 / (a * X1^b * X2^c + 10*X1) + error
Das Problem ist, dass diese beiden Schätzmethoden (a, b, c) unterschiedliche Schätzungen ergeben. Ich persönlich glaube, dass M2 M1 vorzuziehen ist, da die Berechnung von Y2 aus Y1 und X1 Unsicherheiten aus X1 in die nichtlineare Antwortvariable einführt.
Ich möchte / muss wissen, welches Modell (M1 oder M2) ich verwenden soll und warum.
Danke im Voraus.
PS: Ich habe weder ein reproduzierbares Beispiel noch Grafiken präsentiert, weil ich denke, dass diese Frage ausreichend allgemein und klar ist und sie nicht benötigt. Danke für dein Verständnis.
quelle
Antworten:
Modell 2 ist
während Modell 1 ist
was gelöst werden kann, damit liestY1
Implizit wird angenommen, dass die Fehler oder unabhängig voneinander unabhängig sind, identische Verteilungen aufweisen und auf Null zentriert sind.ε δ
Um die beiden Modelle zu vergleichen , nehmen wir an, dass die Variabilität von wesentlich geringer ist als die Größe von . Wir können dann den Binomialsatz (oder gleichwertig eine Taylor-Reihe) verwenden, um die rechte Seite von Modell 1 (in erster Ordnung in ) als zu approximierenε aXb1Xc2+10X1 ε
Im Vergleich zu Modell 2 sehen wir den Unterschied zwischen ihnen in den Fehlerbegriffen:
Dies sind verschiedene Modelle, denn wenn das identische Verteilungen hat, kann das dies nicht - da sie das um Faktoren skalieren, die von den Variablen und abhängen . Umgekehrt kann das nicht , wenn das identische Verteilungen hat .ε δ ε X1 X2 δ ε
Um zu entscheiden, welche verwendet werden soll (falls vorhanden), benötigen Sie zusätzliche Informationen zur Verteilung der Fehler. Dies kann auf viele Arten erreicht werden, einschließlich
Theoretische Überlegungen. Wenn der Fehler beispielsweise die von und bekannt ist, dass die Variabilität über einen Wertebereich von (ungefähr) konstant ist , ist das Modell 2 eine gute Wahl.Y1 Y1
Analyse wiederholter Messungen.
Überprüfung der diagnostischen Informationen aus jedem Modell (in Bezug auf die mögliche Heteroskedastizität der Residuen).
Die roten Kurven zeigen die korrekten zugrunde liegenden Beziehungen. Die Punkte zeigen simulierte Daten. Ihre vertikalen Abweichungen von den roten Kurven repräsentieren die Fehler. Die Streuung der Fehler in Modell 1 links variiert sichtbar mit den unabhängigen Variablen. Die Dispersion in Modell 2 rechts nicht.
Diese Abbildung zeigt Daten, die mit dem folgendenX2 Y1 X1
R
Code simuliert wurden . Um die Darstellung zu vereinfachen, wurden alle Werte von auf einen konstanten Wert gesetzt, wodurch alle Variationen in nur mit Variationen in . Diese Vereinfachung ändert nichts an der Art der Unterschiede zwischen den beiden Modellen.quelle
Es gibt KEINE äquivalenten Modelle der kleinsten Quadrate. Der Fehler in einem Modell ist eine Transformation des Fehlers im anderen. Welches Modellfehler näher an der Normalverteilung liegt, sollte das bessere Modell sein. Bearbeiten: Weitere Informationen zur Fehlertransformation finden Sie in der Antwort von whuber.
Es gibt noch eine zweite Sache, und das ist die Frage, welche numerische Lösung durch den nichtlinearen Algorithmus der kleinsten Lösung erhalten wird. Die erhaltene Lösung kann von dem Algorithmus abhängen, der zur Lösung verwendet wird, sowie vom Startwert (anfängliche Schätzung) für die zu schätzenden Parameter. Abhängig vom Algorithmus und Startwert ist es möglich, dass der Algorithmus beendet wird, ohne ein lokales Optimum zu finden. Es ist möglich, dass ein lokales Optimum gefunden wird, das nicht das globale Optimum ist.
Sie sollten die global optimale Lösung wünschen. Ob Sie es finden, ist eine andere Sache. Hier hilft es zu wissen, was Sie bei der nichtlinearen Optimierung tun, was die meisten Leute, die nichtlineare kleinste Quadrate ausführen, leider nicht tun.
quelle