Ich weiß, dass diese Frage ziemlich naiv und einfach ist, aber ich weiß nicht genau, warum die kanonische Linkfunktion so nützlich ist
Ist es wirklich so nützlich? Eine kanonische Verknüpfungsfunktion ist meist eine mathematische Eigenschaft. Es vereinfacht die Mathematik etwas, aber bei der Modellierung sollten Sie auf jeden Fall die Verknüpfungsfunktion verwenden, die wissenschaftlich sinnvoll ist.
Welche zusätzlichen Eigenschaften hat eine kanonische Verknüpfungsfunktion?
Dies führt zur Existenz ausreichender Statistiken. Das könnte vielleicht eine etwas effizientere Schätzung bedeuten, aber moderne Software (wie glm
in R) scheint kanonische Links nicht anders zu behandeln als andere Links.
Es vereinfacht einige Formeln, so dass theoretische Entwicklungen erleichtert werden. Viele schöne mathematische Eigenschaften, siehe Was ist der Unterschied zwischen einer "Link-Funktion" und einer "kanonischen Link-Funktion" für GLM .
Die Vorteile scheinen also meist mathematisch und algorithmisch zu sein, nicht wirklich statistisch.
Einige weitere Details: Sei unabhängige Beobachtungen aus dem Modell der exponentiellen Dispersionsfamilie
mit Erwartung und linearem Prädiktor mit Kovariate Vektor . Die Verknüpfungsfunktion ist kanonisch, wenn . In diesem Fall kann die Wahrscheinlichkeitsfunktion geschrieben werden als
und durch den Faktorisierungssatz können wir daraus schließenY.1, … , Y.nfY.( y;; θ , ϕ ) = exp{ ( yθ - b ( θ ) ) / a ( ϕ ) + c ( y, ϕ ) }
E.Y.ich= μichηich= xT.ichβxichηich= θichL (β;; ϕ ) = exp{ ∑ichyichxT.ichβ- b ( xT.ichβ)a ( ϕ )+ ∑ichc ( yich, ϕ ) }
∑ixiyiβ∑ichxichyich ist ausreichend für .β
Ohne auf Details einzugehen, werden die für IRLS benötigten Gleichungen vereinfacht. Ebenso scheint diese Google-Suche meist kanonische Links zu finden, die im Zusammenhang mit Vereinfachungen erwähnt wurden, und keine statistischen Gründe mehr.
Die kanonische Verknüpfungsfunktion beschreibt die Mittelwert-Varianz-Beziehung in einem GLM. Zum Beispiel hat eine binomische Zufallsvariable die Verknüpfungsfunktion wobei ein linearer Prädiktor . Beachten Sie, dass die geeignete Mittelwert-Varianz-Beziehung für eine Bernoulli-Zufallsvariable ist. Gleiches gilt für Poisson-Zufallsvariablen, bei denen die inverse Verknüpfungsfunktion und wobei in einer Poisson-Zufallsvariablen die Varianz ist der Mittelwert.μ=exp(ν)/(1−exp(ν)) ν XTβ ∂∂νμ=μ(1−μ) μ=exp(ν) ∂∂νμ=μ
Das verallgemeinerte lineare Modell löst eine Schätzgleichung der Form:
Dabei ist und . Wenn die Verknüpfung kanonisch ist, ist daher und die Schätzfunktion ist:D=∂∂βg(XTβ) V=var(Y) D=V
Wie in Wedderburns 1976 veröffentlichtem Artikel über Quasilikelihood festgestellt wurde, hat die kanonische Verknüpfung den Vorteil, dass erwartete und beobachtete Informationen gleich sind und dass iterativ neu gewichtete kleinste Quadrate Newton-Raphson entsprechen, was die Schätzverfahren und die Varianzschätzung vereinfacht.
quelle