RFM & Customer Lifetime Value Modellierung in R

12

Kann mir jemand sagen, wie man die Modellierung von Aktualität, Häufigkeit und Geldwert (RFM) sowie die Modellierung des Kundenwerts in R durchführt?

Kann mir jemand Literatur dazu geben?

Beta
quelle
1
Sie können sich auch das BTYD- Paket in R ansehen . Oder Sie kaufen, bis Sie das Paket sterben. Ich denke Bruce Hardie ist einer der Autoren. Ich bin mir allerdings nicht sicher.

Antworten:

10

In Bezug auf Referenzen sollte Data Mining mit RFM-Analyse in Bezug auf Terminologie und weitere Referenzen hilfreich sein.

Eine der einfachsten (und beliebtesten) Möglichkeiten, die Wahrscheinlichkeit einer Kundenreaktion zu modellieren, ist die Verwendung der logistischen Regression mit RFM als erklärende Variablen (neben anderen verfügbaren Variablen).

Für die Modellierung des Geldwerts kann man die Einnahmen aus RFM direkt zurückführen (indem man zunächst ein einfaches lineares Modell verwendet), was normalerweise überraschend gut funktioniert. Fortgeschrittenere / nichtlineare Modelle (wie Random Forest oder Gradient Boosting Machine) sind meiner Erfahrung nach besser als lineare Modelle.

Ein weiterer populärer Ansatz besteht darin, ein etwas komplexeres Modell für die Vorhersage des Geldwerts auf der Grundlage von zwei Untermodellen zu erstellen: eines für die Wahrscheinlichkeit der Reaktion (z. B. unter Verwendung der logistischen Regression als Funktion von RFM) und das andere für die von der Reaktion abhängigen Einnahmen (wiederum). es könnte so einfach sein wie ein lineares Modell von RFM). Der erwartete Geldwert ist das Produkt der beiden Vorhersagen.

Wenn randomisierte Test- / Kontrolldaten verfügbar sind, sind auf Uplift / Netlift basierende Techniken sehr beliebt, um den inkrementellen Nutzen einer Behandlung zu modellieren.

Informationen zum Wert für den Kundenlebenszyklus finden Sie unter Modellieren des Werts für die Lebensdauer des Kunden .

In Bezug auf die Modellierung in R sind mir keine Standardpakete für diese Art der Modellierung bekannt. R stellt jedoch alle erforderlichen Bausteine ​​dafür bereit (es sei denn, Sie verfügen über eine enorme Datenmenge - in diesem Fall müssen Sie möglicherweise auf skalierbarere Tools zurückgreifen).

Jewgeni
quelle
1
Sehr nette Antwort, aber ich denke, der erste Link könnte unterbrochen sein.
Dimitriy V. Masterov
@ Jewgeni, ich habe zwei Fragen zu den Vorschlägen, die Sie gemacht haben. Erstens, was die Modellierung des Geldwerts angeht, ist es in Ordnung, Einnahmen unter Verwendung von Geld unter den Prädiktorvariablen zu regressieren? Ich fürchte, sie werden ziemlich die gleiche Variable sein. Verfügen Sie zweitens über Online-Ressourcen, die mir helfen könnten, zu verstehen, wie eine von der Antwort abhängige lineare Regression durchgeführt wird (unter Verwendung des von Ihnen beschriebenen zweiten Ansatzes)? Vielen Dank!
nhern121
1) Es ist in Ordnung, solange Sie die Erklärungs- / Eingabevariablen (aus früheren Daten) und die Zielvariable (aus "zukünftigen" Daten) nicht verwechseln die erklärenden Variablen
Jewgeni
5

Ich bin mir nicht sicher, ob Sie noch an der RFM-Modellierung arbeiten. Hier ( pdf ) ist ein Artikel / die Vignette für das BTYD-Paket in R, die für Sie hilfreich sein könnte. Der gesamte Artikel basiert auf R und hat 3 verschiedene Modelle zum Ansehen. Auf Seite 1, 2.1 Datenaufbereitung sehen Sie den Kontext zu RFMs.

Scharf
quelle
Danke Gung! Auch wenn ich momentan nicht daran arbeite. Aber das ist sehr hilfreich. Auch hilfreich für andere Leute, die gerade daran arbeiten.
Beta