Binäre Modelle (Probit und Logit) mit einem logarithmischen Offset

12

Hat jemand eine Ableitung, wie ein Offset in binären Modellen wie probit und logit funktioniert?

Bei meinem Problem kann das Nachverfolgungsfenster unterschiedlich lang sein. Angenommen, die Patienten erhalten zur Behandlung eine prophylaktische Spritze. Die Aufnahme erfolgt zu unterschiedlichen Zeiten. Wenn das Ergebnis also ein binärer Indikator dafür ist, ob es zu Aufflackern gekommen ist, müssen Sie die Tatsache berücksichtigen, dass einige Personen mehr Zeit haben, Symptome zu zeigen. Es scheint, dass die Wahrscheinlichkeit eines Aufflammens proportional zur Länge des Nachbeobachtungszeitraums ist. Mathematisch ist mir nicht klar, wie ein binäres Modell mit einem Offset diese Intuition erfasst (im Gegensatz zum Poisson).

Der Versatz ist sowohl in Stata (S.1666) als auch in R eine Standardoption , und ich kann ihn für ein Poisson leicht sehen , aber der binäre Fall ist ein bisschen undurchsichtig.

Wenn wir zum Beispiel das ist algebraisch äquivalent zu einem Modell mit E[y| x]=exp{xβ+logZ}, das ist das Standardmodell, bei dem der Koeffizient fürlogZauf1 beschränkt ist. Dies wird alslogarithmischer Offset bezeichnet. Ich habe Probleme herauszufinden, wie dies funktioniert, wenn wirexp{}durchΦ()oderΛersetzen

E[y|x]Z=exp{xβ},
E[y|x]=exp{xβ+logZ},
logZ1exp{}Φ() .Λ()

Update Nr. 1:

Der Logit-Fall wurde weiter unten erläutert.

Update Nr. 2:

Hier finden Sie eine Erklärung für die Hauptverwendung von Offsets für Nicht-Poisson-Modelle wie probit. Der Offset kann verwendet werden, um Likelihood-Ratio-Tests für Indexfunktionskoeffizienten durchzuführen. Zuerst schätzen Sie das uneingeschränkte Modell und speichern die Schätzungen. Angenommen, Sie möchten die Hypothese testen, dass . Dann erstellen Sie die Variable z = 2 x , passen das Modell an, lassen x fallen und verwenden z als nicht-logarithmischen Versatz. Dies ist das beschränkte Modell. Der LR-Test vergleicht die beiden und ist eine Alternative zum üblichen Wald-Test.βx=2z=2xxz

Dimitriy V. Masterov
quelle

Antworten:

8

Sie können in jede GLM immer einen Offset einfügen: Es ist nur eine Prädiktorvariable, deren Koeffizient auf 1 festgelegt ist. Die Poisson-Regression ist ein sehr häufiger Anwendungsfall.

Beachten Sie, dass in einem Binomialmodell das Analogon zur logarithmischen Belichtung als Versatz nur der Binomialnenner ist, sodass er normalerweise nicht explizit angegeben werden muss. So wie Sie ein Poisson-Wohnmobil als Anzahl mit logarithmischer Exposition als Offset oder als Verhältnis mit Exposition als Gewicht modellieren können, können Sie ein binomiales Wohnmobil auf ähnliche Weise als Anzahl von Erfolgen und Misserfolgen oder als Häufigkeit mit Versuchen wie modellieren ein Gewicht.

In einer logistischen Regression würden Sie einen Versatz in Bezug auf die Quotenverhältnisse interpretieren : Eine proportionale Änderung von Z führt zu einer gegebenen proportionalen Änderung von p / ( 1 - p ) .logZZp/(1p)

log(p/(1p))=βX+logZp/(1p)=Zexp(βX)

Dies hat jedoch keine besondere Bedeutung, wie dies bei einer Poisson-Regression der Fall ist. Das heißt, wenn Ihre Binomialwahrscheinlichkeit klein genug ist, nähert sich ein logistisches Modell einem Poisson-Modell mit logarithmischer Verknüpfung (da der Nenner auf der LHS sich 1 nähert), und der Offset kann als logarithmischer Expositionsterm behandelt werden.

(Das in Ihrer verknüpften R-Frage beschriebene Problem war ziemlich eigenwillig.)

Hong Ooi
quelle
Pr(Y=1|X)=Φ(xβ+ln(t))tt
Es ist nicht die Wahrscheinlichkeit, sondern die Quote. Hoffentlich macht die Bearbeitung es klarer.
Hong Ooi
Das Problem in Bezug auf die Odds Ratio auszudrücken, macht es sehr deutlich. Was ist mit dem Probit?
Dimitriy V. Masterov
Φ()
@StasK Das scheint richtig zu sein, aber warum gibt es diese Optionen in Stata und R? Was erreichen sie?
Dimitriy V. Masterov
1

Würde Sie ein Logistikmodell mit einem Zeitversatz (in) nicht effektiv zu einer parametrischen Überlebensfunktion verpflichten, die möglicherweise gut zu den Daten passt oder nicht?

p / (1-p) = Z * exp (xbeta)

p = [Z * exp (xbeta)] / [1 + Z * exp (xbeta)]

Voraussichtliches Überleben zum Zeitpunkt Z = 1- [Z * exp (xbeta)] / [1 + Z * exp (xbeta)]

Eric
quelle