Was sind Startwerte in der Funktion glm ()?

12

Was sind Parameter start, etastart, mustartin der GLM () Funktion ? Ich habe in den Dokumenten und im Internet gesucht, aber keine klare Erklärung gefunden, was dies bedeutet.

Es ähnelt den bayesianischen "Anfangswerten" für die Ketten, aber ich bezweifle, dass dies zusammenhängt, da die Funktion glm () in R eine häufig auftretende Statistik ist ...

Neugierig
quelle

Antworten:

10

Es hat nur mit der Schätztechnik zu tun - wie eine Reihe von Schätzungen für die Parameter im Modell erstellt werden. Ein verallgemeinertes lineares Modell wird durch iterativ neu gewichtetes kleinstes Quadrat angepasst. Zunächst wird ein beliebiger Satz von Gewichten ausgewählt (häufig sind alle gleich), und dann werden Schätzungen der Parameter im linearen Prädiktor ausgewählt, die die gewichtete Summe der Quadrate der Residuen minimieren. Diese geschätzten Parameter im linearen Prädiktor werden verwendet, um einen neuen Mittelwertvektor zu schätzen. Daraus wird ein neuer Satz von Gewichten abgeleitet - abhängig davon, welche Familie und Verknüpfungsfunktion verwendet wird, kann die Varianz der Antwort proportional zum Mittelwert der Antwort sein -, sodass die Gewichte umgekehrt proportional zum Mittelwert sind. Dieser neue Satz von Gewichten wird in einer neuen Iteration des gesamten Verfahrens verwendet.

Die drei Argumente für glm (), nach denen Sie gefragt haben, sind nur Möglichkeiten für den Benutzer, die Prozedur an einem beliebigen Punkt zu starten, anstatt ihm zu erlauben, seinen eigenen Standardstartpunkt zu wählen. Aus der Hilfedatei, mit der Sie verlinkt haben:

  • start - Startwerte für die Parameter im linearen Prädiktor.
  • etastart - Startwerte für den linearen Prädiktor.
  • mustart - Startwerte für den Mittelwertvektor.
Peter Ellis
quelle
Danke Peter! Es ähnelt völlig dem Bayes'schen MCMC-Verfahren! Ich dachte, Frequentist-Pakete sind klüger und funktionieren nicht so :-) Das war es, worüber ich verwirrt war ... warum um alles in der Welt gibt es so etwas wie Anfangswerte im Frequentist-Paket :-)
Neugierig
1
Manchmal können Sie ohne Anfangswerte nicht konvergieren oder auf ein lokales Maximum konvergieren, das keine global optimale Lösung darstellt. Es ist also gut, die Option zu haben, verschiedene Startwerte auszuprobieren.
Peter Ellis
Ich habe das Gefühl, dass es sogar glm()bayesianisch ist :-)
Neugierig
4
@Curious Es ist nicht besonders bayesianisch. Alles, was Sie verlangen, ist, dass das Softwarepaket einen bestimmten Punkt über eine Suchtechnik findet. Die Startwerte geben nur an, wo man anfangen soll - diese Antwort hat kein besonderes Gewicht, aber es kann hilfreich sein, wenn sie über einen komplizierten Raum wandert. Es gibt nichts besonders Bayesianisches an "Ich würde beispielsweise mit 0,05 anfangen und von dort aus arbeiten ..."
Fomite