Wenn ich theoretische Gründe habe anzunehmen, dass die Daten mit einer ungewöhnlichen Gleichung wie der folgenden übereinstimmen könnten:
Kann ich nach einer Transformation die multiple lineare Regression der gewöhnlichen kleinsten Quadrate verwenden, um die Parameter zu schätzen ? Wenn ja, welche Transformation?
Wenn nicht, gibt es ein spezielles Paket in R (und eine kurze Lektüre), das mir helfen könnte, die Anpassung und die Residuen dieses Modells mit einem typischeren MLR-Modell zu vergleichen?
Vielen Dank.
Beispielcode:
## while I can run "nls," I cannot get $\epsilon$ inside parentheses nor
## can I have four BETAs
var1 <- rnorm(50, 100, 1)
var2 <- rnorm(50, 120, 2)
var3 <- rnorm(50, 500, 5)
## make a model without $\beta_1$ and $\beta_2$ and with $\epsilon_i$ on outside
nls(var3 ~ (a + var1 + var2)^b, start = list(a = 0.12345, b = 0.54321))
Nonlinear regression model
model: var3 ~ (a + var1 + var2)^b
data: parent.frame()
a b
475.5234 0.9497
residual sum-of-squares: 1365
Number of iterations to convergence: 6
Achieved convergence tolerance: 8.332e-08
## FAILS with exponent on left-hand side and $\epsilon$ inside parentheses
nls(var3^(1/b) ~ (a + var1 + var2), start = list(a = 0.12345, b = 0.54321))
Error in eval(expr, envir, enclos) : object 'b' not found
## FAILS with all BETAs
nls(var3 ~ (a + b*var1 + c*var2)^d, start = list(a = 4, b = 1, c = 1, d = 1))
Error in numericDeriv(form[[3L]], names(ind), env) :
Missing value or an infinity produced when evaluating the model
Antworten:
Nein (zumindest nicht mit
nls
)aus seiner DokumentationY.ich| θ,X.ich= f( θ ,X.ich) + ϵ ϵ
nls
Funktionen der Form (und ist die MLE für den Fall, dass iid Normal ist), sodass Ihre Beziehung nicht zur nichtlinearen Klasse der kleinsten Quadrate gehört.Mal sehen, ob wir die Verteilung beschreiben können, der folgen könnte. Let Da ist , dann . Wenn ist, könnten wir zum Beispiel haben, dass nicht zentral .Y. Z.ich=β0+β1x1 i+β2x2 i+ϵich ϵich N.( 0 , 1 ) Z.ich∼ N.(β0+β1x1i+β2x2 i, 1 ) β3= 2 Y.ich χ21
Ja (mit Box-Cox-Transformationen)
Wenn eine Eins-zu-Eins-Transformation ist (dh mindestens ist nicht gerade), haben Sie gerade die Box-Cox-Transformationsfamilie wiederentdeckt: was eindeutig das von Ihnen beschriebene Szenario enthält. Klassischerweise wird durch die Profilwahrscheinlichkeit geschätzt, dh durch Einstecken verschiedener Werte von und Überprüfen des RSS auf die Anpassung der kleinsten Quadrate. Eine Analyse der überarbeiteten Transformationen (1981) scheint einen guten Überblick über die Theorie zu geben. Die Funktion im Paket führt eine solche Schätzung durch. WennY.ich=Z.β3ich β3
boxcox
MASS
quelle
Ich denke, Andrew M hat eine gute Antwort gegeben; Ich möchte nur ein paar verwandte Punkte ansprechen.
Wie Andrew M angibt, können Sie das Modell nicht so ausführen, wie es direkt mit nichtlinearen kleinsten Quadraten ist. Sie können dieses eng verwandte Modell jedoch mit nichtlinearem LS anpassen:
Dies scheint nicht sehr nützlich zu sein, aber es wäre sinnvoll, eine erste Schätzung von zu erhalten, um einen guten Ausgangspunkt für die Optimierung des tatsächlichen Modells zu erhalten (ob direkt oder über Box-Cox).β3
Beachten Sie auch, dass Sie diese Transformation berücksichtigen können , wenn streng positiv ist:Y.
Wiederum ermöglicht eine geringfügige Änderung (Ziehen des Fehlerterms außerhalb der Klammern) eine nichtlineare Anpassung der kleinsten Quadrate. Sie können dann die resultierende Schätzung von , um die Schätzungen zu verbessern. Die einzige Schwierigkeit wäre, wenn Sie auf eine Situation stoßen, in der der angepasste Wert im Protokoll nicht unbedingt positiv ist.β3
[Wenn Sie bereit sind, die Weibull-Regression in Betracht zu ziehen (dh wenn die Ys Weibulls sind, deren Mittelwert von den Xs abhängt), werden Sie möglicherweise feststellen, dass Sie damit etwas Nützliches tun können. Es würde jedoch die Form der Beziehung zu den x ändern. Ein verwandter Ansatz wäre, dass Sie bei einem Wert für eine Transformation in Betracht könntenβ3 Y. (Y.∗=Y.1 /β3 ) und passen Sie ein exponentielles GLM mit Identitätslink an Y.∗ eher als ein Gaußscher. Dies würde wiederum einem Weibull-Modell für entsprechenY. , aber mit den Parametern, die in der von Ihnen vorgeschlagenen Weise eingegeben werden). Dies könnte über ein Raster von erfolgenβ3 Werte, um die Wahrscheinlichkeit dafür zu maximieren.]
quelle