Vergleichen Sie das MLR-Modell mit dem Modell

8

Wenn ich theoretische Gründe habe anzunehmen, dass die Daten mit einer ungewöhnlichen Gleichung wie der folgenden übereinstimmen könnten:

Yi=(β0+β1x1i+β2x2i+ϵi)β3

Kann ich nach einer Transformation die multiple lineare Regression der gewöhnlichen kleinsten Quadrate verwenden, um die Parameter zu schätzen ? Wenn ja, welche Transformation?β0,1,2,3

Wenn nicht, gibt es ein spezielles Paket in R (und eine kurze Lektüre), das mir helfen könnte, die Anpassung und die Residuen dieses Modells mit einem typischeren MLR-Modell zu vergleichen?

Vielen Dank.

Beispielcode:

## while I can run "nls," I cannot get $\epsilon$ inside parentheses nor
## can I have four BETAs

var1 <- rnorm(50, 100, 1)
var2 <- rnorm(50, 120, 2)
var3 <- rnorm(50, 500, 5)

## make a model without $\beta_1$ and $\beta_2$ and with $\epsilon_i$ on outside
nls(var3 ~ (a + var1 + var2)^b, start = list(a = 0.12345, b = 0.54321))

Nonlinear regression model
  model: var3 ~ (a + var1 + var2)^b
  data: parent.frame()
   a        b 
 475.5234   0.9497 
 residual sum-of-squares: 1365

Number of iterations to convergence: 6 
Achieved convergence tolerance: 8.332e-08

## FAILS with exponent on left-hand side and $\epsilon$ inside parentheses
nls(var3^(1/b) ~ (a + var1 + var2), start = list(a = 0.12345, b = 0.54321))
Error in eval(expr, envir, enclos) : object 'b' not found

## FAILS with all BETAs
nls(var3 ~ (a + b*var1 + c*var2)^d, start = list(a = 4, b = 1, c = 1, d = 1))
Error in numericDeriv(form[[3L]], names(ind), env) : 
Missing value or an infinity produced when evaluating the model
jtd
quelle
Ist das Hausaufgabe oder Selbststudium? Wenn ja, fügen Sie bitte das Tag zum Selbststudium hinzu, da wir solche Fragen anders beantworten als Fragen zum Nicht-Selbststudium!
Jbowman
@jbowman: Weder Hausaufgaben noch Selbststudium (Klasse oder Lehrbuch). Dies ist mein eigenes erfundenes Problem. Ich bin weder mit nichtlinearer Regression noch mit Parametern vertraut, die auf einwirken , in der Hoffnung, dass andere in die richtige Richtung zeigen können. Vielen Dank. ϵ
jtd

Antworten:

4

Nein (zumindest nicht mit nls)

aus seiner Dokumentation nlsFunktionen der Form (und ist die MLE für den Fall, dass iid Normal ist), sodass Ihre Beziehung nicht zur nichtlinearen Klasse der kleinsten Quadrate gehört.Yi|θ,Xi=f(θ,Xi)+ϵϵ

Mal sehen, ob wir die Verteilung beschreiben können, der folgen könnte. Let Da ist , dann . Wenn ist, könnten wir zum Beispiel haben, dass nicht zentral .YZi=β0+β1x1i+β2x2i+ϵiϵiN(0,1)ZiN(β0+β1x1i+β2x2i,1)β3=2Yiχ12

Ja (mit Box-Cox-Transformationen)

Wenn eine Eins-zu-Eins-Transformation ist (dh mindestens ist nicht gerade), haben Sie gerade die Box-Cox-Transformationsfamilie wiederentdeckt: was eindeutig das von Ihnen beschriebene Szenario enthält. Klassischerweise wird durch die Profilwahrscheinlichkeit geschätzt, dh durch Einstecken verschiedener Werte von und Überprüfen des RSS auf die Anpassung der kleinsten Quadrate. Eine Analyse der überarbeiteten Transformationen (1981) scheint einen guten Überblick über die Theorie zu geben. Die Funktion im Paket führt eine solche Schätzung durch. WennY.ich=Z.ichβ3β3

Y.(λ)={(λZ.+1)1/.λ,λ>0eZ.,λ=0,
λλboxcoxMASSβ3 ist eher ein interessierender Parameter als ein Ärgernis, das Sie möglicherweise benötigen, um etwas Anspruchsvolleres zu tun.
Andrew M.
quelle
1

Ich denke, Andrew M hat eine gute Antwort gegeben; Ich möchte nur ein paar verwandte Punkte ansprechen.

Wie Andrew M angibt, können Sie das Modell nicht so ausführen, wie es direkt mit nichtlinearen kleinsten Quadraten ist. Sie können dieses eng verwandte Modell jedoch mit nichtlinearem LS anpassen:

Y.ich=(β0+β1x1ich+β2x2ich)β3+ϵich

Dies scheint nicht sehr nützlich zu sein, aber es wäre sinnvoll, eine erste Schätzung von zu erhalten, um einen guten Ausgangspunkt für die Optimierung des tatsächlichen Modells zu erhalten (ob direkt oder über Box-Cox).β3

Beachten Sie auch, dass Sie diese Transformation berücksichtigen können , wenn streng positiv ist:Y.

Log(Y.ich)=β3Log(β0+β1x1ich+β2x2ich+ϵich)

Wiederum ermöglicht eine geringfügige Änderung (Ziehen des Fehlerterms außerhalb der Klammern) eine nichtlineare Anpassung der kleinsten Quadrate. Sie können dann die resultierende Schätzung von , um die Schätzungen zu verbessern. Die einzige Schwierigkeit wäre, wenn Sie auf eine Situation stoßen, in der der angepasste Wert im Protokoll nicht unbedingt positiv ist.β3

[Wenn Sie bereit sind, die Weibull-Regression in Betracht zu ziehen (dh wenn die Ys Weibulls sind, deren Mittelwert von den Xs abhängt), werden Sie möglicherweise feststellen, dass Sie damit etwas Nützliches tun können. Es würde jedoch die Form der Beziehung zu den x ändern. Ein verwandter Ansatz wäre, dass Sie bei einem Wert für eine Transformation in Betracht könntenβ3Y. (Y.=Y.1/.β3) und passen Sie ein exponentielles GLM mit Identitätslink an Y.eher als ein Gaußscher. Dies würde wiederum einem Weibull-Modell für entsprechenY., aber mit den Parametern, die in der von Ihnen vorgeschlagenen Weise eingegeben werden). Dies könnte über ein Raster von erfolgenβ3 Werte, um die Wahrscheinlichkeit dafür zu maximieren.]

Glen_b -State Monica
quelle