Ich mache derzeit eine Analyse auf einer Website, für die ich ein Entscheidungsbaumdiagramm erstellen muss, das den wahrscheinlichen Weg zeigt, den Menschen bei jeder Ankunft auf der Website einschlagen. Ich habe es mit einem zu tun, data.frame
der die Wege aller Kunden zur Site zeigt, beginnend von der Homepage. Ein Kunde könnte beispielsweise den folgenden Weg einschlagen:
Homepage - pg 1
Kitchen Items page - pg 2
Pots and Pans page - pg 3
Dieser Kunde hätte also eine 3-seitige Reise. Was ich in R versuchen möchte, ist, alle Kundenpfade zu kombinieren und dadurch einem Kunden eine Wahrscheinlichkeit zuzuweisen, die einem bestimmten Pfad auf der Site folgt. Wenn ich zum Beispiel alle Pfade untersuchen würde, könnte ich feststellen, dass 34% der Personen, die auf der Homepage ankommen, auf die Seite "Küchenartikel" gehen. Hat R diese Möglichkeit?
Ich habe verschiedene Methoden in den Paketen rpart und partykit nachgeschlagen, aber sie schienen keine Hilfe zu sein.
Jede Lenkung in die richtige Richtung dafür wird sehr geschätzt!
quelle
igraph
Paket scheint ziemlich umfassend zu sein.Antworten:
Ist nicht eine Möglichkeit zu beginnen, ist eine Matrix (sagen wir ), wobei die Anzahl der Seiten ist. Dann basierend auf Ihrem Rohdateninkrement-Matrixelement um eins, wenn ein Benutzer von Seite zu Seite . Damit erhalten Sie die Übergangswahrscheinlichkeiten.M n × n n M r c r cn×n Mn×n n Mrc r c
Ihre erste Frage wird bereits beantwortet: "Wie viel Prozent der Benutzer auf der Homepage (z. B. Seite 1) reisen neben beispielsweise Küchenartikeln (z. B. Seite 2)?"
Oder ist das zu simpel?
quelle
Anscheinend versuchen Sie, den PageRank-Algorithmus von Google neu zu erstellen. Der größte Teil des PageRank-Algorithmus wurde unter Verwendung von Markov-Ketten entwickelt. In R finden Sie viele Erwähnungen zur Entwicklung von PageRank-Methoden.
igraph.sourceforge.net/doc/R/page.rank.htm
quelle
Nach allem, was ich hier sehe, stimme ich zu, dass Igraphs / Markov-Ketten wahrscheinlich der richtige Weg sind, aber Sie könnten definitiv rpart und / oder das Partykit verwenden.
Es fällt mir schwer, mit Ihrem begrenzten Beispiel eine einfache Antwort zu geben, aber ich kann allgemein erklären, wie Sie es tun würden.
Sie möchten sehen, wo sich alle Benutzer befunden haben, und dies beispielsweise in einer Zeichenfolge zusammenfassen
Sie können Ihre Benutzer dann in Kategorien unterteilen, z. B. diejenigen, die auf der Seite "Jetzt kaufen" gelandet sind, und diejenigen, die dies nicht getan haben. Dann könnten Sie einfach anfangen, das Endergebnis vorherzusagen. In diesem Beispiel würden Sie vielleicht herausfinden, dass Leute, die den meisten Vergleichsladen betrieben haben, etwas gekauft haben / nicht gekauft haben.
Sie können auch weitere Variablen festlegen, z. B. "Was war die Seite vor der Buynow-Seite?", "Wie viele Seiten haben sie vor dem Kauf besucht?" Oder "Wann haben sie ihr erstes Konto erstellt?", Und Sie können diese Metriken zu Ihrer Analyse hinzufügen.
Es gibt viele verschiedene Wege, die Sie gehen könnten, und dies beginnt, verschiedene Fragen zu beantworten, aber mein Punkt ist, dass Sie die Bäume verwenden könnten und für einige Probleme könnte es ein schnellerer und einfacherer Weg zum Einblick sein.
Übrigens müssten Sie nicht numerische Variablenfaktoren mithilfe von
factor
oder festlegenas.factor
, wenn Sie party verwenden möchten . Party hat einige schöne Vignetten, um Ihnen den Einstieg zu erleichtern.quelle