Cox-Modell vs. logistische Regression

15

Nehmen wir an, wir haben das folgende Problem:

Sagen Sie voraus, welche Kunden in den nächsten 3 Monaten am wahrscheinlichsten aufhören, in unserem Shop einzukaufen.
Wir kennen für jeden Kunden den Monat, in dem der Kauf in unserem Shop begonnen hat, und haben darüber hinaus viele Verhaltensmerkmale in monatlichen Aggregaten. Der älteste Kunde kauft seit fünfzig Monaten; Geben wir die Zeit an, seit ein Kunde mit ( ) zu kaufen begann . Es ist davon auszugehen, dass die Anzahl der Clients sehr groß ist. Wenn ein Kunde für drei Monate aufhört zu kaufen und dann zurückkommt, wird er als neuer Kunde behandelt, sodass ein Ereignis (Kauf beenden) nur einmal auftreten kann.tt[0,50]

Mir fallen zwei Lösungen ein:

Logistische Regression - Für jeden Kunden und jeden Monat (möglicherweise mit Ausnahme der drei neuesten Monate) können wir angeben, ob ein Kunde aufgehört hat zu kaufen oder nicht, sodass wir Stichproben mit einer Beobachtung pro Kunden und Monat durchführen können. Wir können die Anzahl der Monate seit Beginn als kategoriale Variable verwenden, um ein Äquivalent der Basisgefahrenfunktion zu erhalten.

Erweitertes Cox-Modell - Dieses Problem kann auch mit dem erweiterten Cox-Modell modelliert werden. Es scheint, dass dieses Problem besser für die Überlebensanalyse geeignet ist.

Frage: Was sind die Vorteile der Überlebensanalyse bei ähnlichen Problemen? Die Überlebensanalyse wurde aus irgendeinem Grund erfunden, daher muss es einen ernsthaften Vorteil geben.

Mein Wissen über die Überlebensanalyse ist nicht sehr tief und ich denke, dass die meisten potenziellen Vorteile des Cox-Modells auch durch logistische Regression erzielt werden können.

  • Ein Äquivalent des geschichteten Cox-Modells kann unter Verwendung einer Wechselwirkung von und der Schichtungsvariablen erhalten werden . t
  • Das Interaktions-Cox-Modell kann erhalten werden, indem die Population in mehrere Teilpopulationen unterteilt und der LR für jede Teilpopulation geschätzt wird.

Der einzige Vorteil, den ich sehe, ist, dass das Cox-Modell flexibler ist. Beispielsweise können wir leicht die Wahrscheinlichkeit berechnen, dass ein Kunde in 6 Monaten aufhört zu kaufen.

Tomek Tarczynski
quelle

Antworten:

10

Das Problem mit dem Cox-Modell ist, dass es nichts vorhersagt. Der "Achsenabschnitt" (Basislinien-Gefährdungsfunktion) in Cox-Modellen wird niemals tatsächlich geschätzt. Die logistische Regression kann verwendet werden, um das Risiko oder die Wahrscheinlichkeit eines Ereignisses vorherzusagen, in diesem Fall, ob ein Subjekt in einem bestimmten Monat etwas kauft oder nicht.

Das Problem mit den Annahmen hinter der normalen logistischen Regression besteht darin, dass Sie jede Beobachtung pro Person und Monat als unabhängig behandeln, unabhängig davon, ob es sich um dieselbe Person oder denselben Monat handelte, in dem Beobachtungen erfolgten. Dies kann gefährlich sein, da einige Artikel in Abständen von zwei Monaten gekauft werden und aufeinanderfolgende Beobachtungen von Person zu Monat negativ korrelieren. Alternativ kann ein Kunde von guten oder schlechten Erfahrungen gehalten oder verloren werden, was dazu führt, dass Beobachtungen aufeinanderfolgender Personen von Monat zu Monat positiv korreliert werden.

Ich denke, ein guter Anfang für dieses Prognoseproblem ist die Prognose, bei der wir frühere Informationen verwenden können, um unsere Prognosen über das Geschäft des nächsten Monats zu informieren. Ein einfacher Anfang für dieses Problem ist das Anpassen eines verzögerten Effekts oder ein Indikator dafür, ob ein Proband im letzten Monat eingetroffen ist , um vorherzusagen, ob er in diesem Monat eintrifft .

AdamO
quelle
2
Könnte hier nicht eine mehrstufige logistische Regression eingesetzt werden, um das Problem der Unabhängigkeit zu lösen? Level 2 wären Kunden und Level 1 würden sich über die Zeit wiederholende Maßnahmen sein.
Zum Beispiel
1
@AdamO, der Achsenabschnitt kann geschätzt werden, und in Kombination mit der Vorhersage der partiellen Gefahr des Individuums können individuelle Überlebenskurven erstellt werden. Ich bin mir nicht sicher, warum das Cox-Modell Ihrer Meinung nach "nichts" vorhersagen kann.
Cam.Davidson.Pilon
δ
Für Vorhersagezwecke denke ich, dass dies keine Blocker sind. Es ist nicht ungewöhnlich, mehrere Schätzungen zu kombinieren, um eine einzelne Vorhersage zu erstellen, und (ich befürworte dies leider nicht) Vorhersageintervalle werden nicht häufig verwendet oder sind sowieso nicht verfügbar.
Cam.Davidson.Pilon
@ Cam.Davidson.Pilon Ich habe nicht gesagt, dass Risikovorhersagen nicht aus Überlebensdaten gewonnen werden können. Ich sagte, dass Cox-Modelle kein Risiko vorhersagen. Die Schritte zwischen dem Aufrufen coxphund dem Abrufen von Risikoeinschätzungen sind steil und zahlreich.
AdamO
3

TjjPr(Tj>3)j3

Die Überlebensanalyse berücksichtigt die Tatsache, dass jeder Kunde eine eigene Einstiegszeit für die Studie hat. Die Tatsache, dass die Nachbeobachtungszeit von Kunde zu Kunde unterschiedlich ist, ist daher kein Problem.

j


Anmerkung : hier ist ein Papier , das zeigt , dass unter gewissen Einschränkungen, sowohl die Logistik und das Cox - Modell verknüpft ist.

Ocram
quelle
Danke für die Antwort. Wenn SA die Zensur ordnungsgemäß handhabt, bedeutet dies, dass die LR-Lösung die Zensur nicht ordnungsgemäß handhabt. Wie ist das Ergebnis? Ich kann mich immer noch nicht davon überzeugen, dass SA für ein festes Zeitziel besser ist. Kann ich diesen Artikel irgendwo kostenlos finden?
Tomek Tarczynski
Y.=0
Meine E-Mail lautet: [email protected] Vielen Dank!
Tomek Tarczynski
@TomekTarczynski: erhalten?
Ocram
Ja, danke nochmal! Ich werde morgen Zeit haben, es genauer zu lesen. Ich habe es nur überflogen und wenn ich es richtig verstanden habe, geht es um ein etwas anderes Problem. Unter Verwendung der Shop-Analogie werden LR und COX mit dem Problem "Wie groß ist die Wahrscheinlichkeit, dass der Kunde nach einer festgelegten Anzahl von Monaten von Anfang an nicht mehr Kunde ist?" Verglichen.
Tomek Tarczynski
2

In der Marketingliteratur wird hier ein Pareto / NBD oder ähnliches vorgeschlagen. Sie gehen grundsätzlich davon aus, dass der Kauf - während des Kaufs - einer negativen Binomialverteilung folgt. Sie müssen jedoch die Zeit modellieren, in der der Kunde anhält. Das ist der andere Teil.

Pete Fader und Bruce Hardie haben zusammen mit Abe einige Artikel darüber.

Es gibt mehrere einfachere Ansätze für das Pareto / NBD, auch wenn nur die verschiedenen Papiere von Fader und Hardie gezählt werden. Verwenden Sie NICHT den einfacheren Ansatz, bei dem davon ausgegangen wird, dass die Wahrscheinlichkeit eines Anhaltens zu jedem Zeitpunkt konstant ist - das bedeutet, dass Ihre schwereren Kunden eher ausfallen. Es ist einfacher zu montieren, aber falsch.

Ich habe eine davon eine Weile nicht mehr gepasst; Es tut mir leid, ein bisschen unspezifisch zu sein.

Hier ist ein Verweis auf das Abe-Papier, das dieses Problem als hierarchisches Bayes umformuliert. . Wenn ich wieder in diesem Bereich arbeiten würde, würde ich diesen Ansatz ausprobieren.

Radfahrer
quelle