Nichtlineares vs. verallgemeinertes lineares Modell: Wie verweisen Sie auf logistische, Poisson usw. Regression?

23

Ich habe eine Frage zur Semantik, zu der ich die Meinungen anderer Statistiker haben möchte.

Wir wissen, dass Modelle wie Logistik, Poisson usw. unter den Schirm verallgemeinerter linearer Modelle fallen. Das Modell enthält nichtlineare Funktionen der Parameter, die wiederum unter Verwendung des linearen Modellgerüsts unter Verwendung der entsprechenden Verknüpfungsfunktion modelliert werden können.

Ich frage mich, ob Sie Situationen wie logistische Regression in Betracht ziehen (lehren?) Als:

  1. Nichtlineares Modell in Form der Parameter
  2. Lineares Modell, da die Verknüpfung uns zum linearen Modell-Framework transformiert
  3. Gleichzeitig (1) und (2): Es "startet" als nichtlineares Modell, kann aber so bearbeitet werden, dass wir es als lineares Modell betrachten können

Ich wünschte, ich könnte eine aktuelle Umfrage starten ...

Meg
quelle

Antworten:

24

Das ist eine gute Frage.

Wir wissen, dass Modelle wie Logistik, Poisson usw. unter den Schirm verallgemeinerter linearer Modelle fallen.

Ja und nein Angesichts des Kontextes der Frage müssen wir sehr sorgfältig angeben, wovon wir sprechen - und "Logistik" und "Poisson" allein reichen nicht aus, um zu beschreiben, was beabsichtigt ist.

(i) "Poisson" ist eine Verteilung. Als Beschreibung einer bedingten Verteilung ist sie nicht linear (und daher auch nicht GLM), es sei denn, Sie geben ein lineares Modell (in Parametern) an, um den bedingten Mittelwert zu beschreiben (dh es reicht nicht aus, nur "Poisson" zu sagen). Wenn Leute "Poisson-Regression" spezifizieren, beabsichtigen sie fast immer ein Modell, das in Parametern linear ist und daher ein GLM ist. Aber "Poisson" allein kann eine beliebige Anzahl von Dingen sein *.

(ii) "Logistik" bezieht sich andererseits auf die Beschreibung eines Mittelwerts (dh der Mittelwert ist in Prädiktoren logistisch). Es ist kein GLM, es sei denn, Sie kombinieren es mit einer bedingten Verteilung, die zur Exponentialfamilie gehört. Wenn die Leute andererseits " logistische Regression " sagen , meinen sie fast immer ein Binomialmodell mit logit link - das heißt, das ist logistisch in Prädiktoren, das Modell ist linear in Parametern und gehört zur Exponentialfamilie, ebenso wie ein GLM.

Das Modell enthält nichtlineare Funktionen der Parameter,

Ja und nein.

η=G(μ)η=Xβ

Dies kann wiederum unter Verwendung des linearen Modellgerüsts unter Verwendung der entsprechenden Verknüpfungsfunktion modelliert werden.

Richtig

Ich frage mich, ob Sie Situationen wie logistische Regression in Betracht ziehen (lehren?) Als:

(Ich ändere die Reihenfolge Ihrer Frage hier)

Lineares Modell, da die Verknüpfung uns zum linearen Modell-Framework transformiert

Genau aus diesem Grund ist es üblich, einen GLM als "linear" zu bezeichnen. In der Tat ist es ziemlich klar, dass dies die Konvention ist, weil es genau dort im Namen steht .

Nichtlineares Modell in Form der Parameter

Wir müssen hier sehr vorsichtig sein, da sich "nichtlinear" im Allgemeinen auf ein Modell bezieht, das in Parametern nichtlinear ist. Kontrast nichtlineare Regression mit verallgemeinerten linearen Modellen.

Wenn Sie also den Begriff "nichtlinear" zur Beschreibung eines GLM verwenden möchten, müssen Sie sorgfältig angeben, was Sie meinen - im Allgemeinen, dass der Mittelwert nicht linear mit den Prädiktoren zusammenhängt.

In der Tat, wenn Sie "nichtlinear" verwenden, um sich auf GLMs zu beziehen, werden Sie nicht nur mit Konventionen in Schwierigkeiten geraten (und werden wahrscheinlich missverstanden), sondern auch, wenn Sie versuchen, über verallgemeinerte nichtlineare Modelle zu sprechen . Es ist ein bisschen schwierig, den Unterschied zu erklären, wenn Sie GLMs bereits als "nichtlineare Modelle" charakterisiert haben!

G(μ)

Y.Poisson(μx)

xY.xμxx

μx=α+exp(βx).

(Normalerweise hätten wir hier einen Ausgleich für die Bevölkerung im Alter xα

Hier repräsentiert der erste Begriff eine konstante Sterblichkeitsrate aufgrund von Unfällen (oder anderen altersbedingten Effekten), während der zweite Begriff eine altersbedingt steigende Sterblichkeitsrate aufweist. Ein solches Modell ist vielleicht manchmal über kurze Zeiträume im Alter von Erwachsenen möglich, aber nicht älter. Es ist im Wesentlichen das Gesetz von Makeham (dort als eine Gefährdungsfunktion dargestellt, für die eine annualisierte Rate eine vernünftige Annäherung wäre).

Das ist ein verallgemeinertes nichtlineares Modell.

Glen_b - Setzen Sie Monica wieder ein
quelle
Danke für deinen Beitrag. Daran versuche ich heranzukommen. Offensichtlich ist "linear" im Namen von GLMs. Ich versuche, diese Modelle zu klassifizieren, die von Natur aus nichtlinear sind (sie sind in den Parametern nichtlinear), aber "transformierbar linear" sind und daher unter das GLM-Framework fallen. Ich schätze, ich habe gerade meine eigene Frage beantwortet - der beste Weg, auf sie zu verweisen, ist "transformierbar nichtlinear".
Meg
1
Die gebräuchlichste Art, auf ein Modell zu verweisen, das durch eine Transformation in Parametern linearisiert werden kann, ist "linearisierbar" (im Gegensatz zu "instrumentell nichtlinear"). Ich denke, wir müssen bei der Erörterung des Modells klar sein, was linear ist (im Vergleich zu dem, was nichtlinear ist), und vielleicht auch klar sein, wie solche Dinge herkömmlich bezeichnet werden, da Menschen in der Lage sein müssen, Informationen zu lokalisieren und auch verstanden zu werden wenn sie besprechen. Jemand, der von GLMs als "nichtlinear" spricht, wird wahrscheinlich missverstanden, es sei denn, er fügt die richtigen Qualifikatoren hinzu, die seine Bedeutung klar machen.
Glen_b -Reinstate Monica
Genau. Ich sehe es nur als nichtlineare Regression in Texten und wurde von meinen Professoren gelehrt, dass es nichtlinear ist. Ich persönlich finde es verwirrend, da wir uns im GLM-Framework damit befassen, aber ich kann (zumindest) nachvollziehen, es auch so zu nennen. Ich denke, ich gehe mit linearisierbarer / transformierbarer Linearität und einer Diskussion darüber, wie wir von Punkt A zu Punkt B gelangen (dh wie wir mit einer nichtlinearen Funktion beginnen und sie in das lineare Gerüst transformieren).
Meg
Ja, ich verstehe das total. Auch wenn ich mich in ihren Impuls einfühlen würde, würde ich sie, wenn ich ihr Ohr hätte, aus den oben genannten Gründen davor warnen, sie als nichtlineare Modelle zu bezeichnen (zumindest nicht, ohne den Begriff immer zu qualifizieren). Das ist ein großer Teil des Grundes, warum ich denke, dass dies eine so wichtige Frage ist - die Leute nennen sie manchmal nichtlinear, was meiner Meinung nach in Ordnung ist, solange wir uns darüber im Klaren sind, was wir als nichtlinear bezeichnen, da dies nicht der herkömmlichste Weg ist Beziehen Sie sich auf die Modelle - wenn wir uns der Konvention widersetzen, sollten wir dies sorgfältig und bewusst tun.
Glen_b -Reinstate Monica