Wie modelliere ich das Kaufverhalten eines Nutzers bei Amazon?

9

Für unser Abschlussprojekt in Data Science haben wir Folgendes vorgeschlagen:

Geben Sie den Amazon Reviews-Datensatz an . Wir planen, einen Algorithmus zu entwickeln (der grob auf dem personalisierten PageRank basiert), der eine strategische Position für die Platzierung von Anzeigen bei Amazon festlegt. Zum Beispiel gibt es bei Amazon Millionen von Produkten. Und der Datensatz gibt Ihnen eine Vorstellung davon, welche Produkte verwandt sind, welche Produkte zusammengebracht, zusammen betrachtet usw. wurden. (Wir können ein Diagramm mit diesen Informationen erstellen, die auch angezeigt und auch gekauft wurden.) Außerdem erhalten Sie die Bewertungen, die mit jedem Produkt verknüpft sind 14 Jahre. Mit all diesen Informationen werden wir Produkte bei Amazon bewerten / bewerten. Jetzt sind Sie ein Anbieter bei Amazon, der den Traffic auf seiner Produktseite verbessern möchte. Unser Algorithmus hilft Ihnen dabei, strategische Positionen in der Grafik zu identifizieren, an denen Sie Ihre Anzeige platzieren können, um maximalen Traffic abzuleiten.

Die Frage unseres Professors lautet nun: Wie werden Sie Ihren Algorithmus ohne echte Benutzer validieren? Wir sagten-

Wir können eine feste Gruppe von Benutzern modellieren. Einige Benutzer folgen also_boughtund also_viewedverlinken häufiger zum dritten Hop als zum ersten oder fünften Hop. Dort ist das Verhalten der Benutzer normal verteilt. Einige andere Benutzer navigieren kaum über den ersten Sprung hinaus. Dieses Benutzerverhalten ist exponentiell verteilt.

Unser Professor sagte: - Unabhängig von der Verteilung, der die Benutzer folgen, navigieren Benutzer über Links für ähnliche Produkte. Ihr Ranking-Algorithmus berücksichtigt auch die Ähnlichkeit von s / w 2-Produkten mit Ranking-Produkten. Die Verwendung dieses Validierungsalgorithmus ist also ein bisschen cheating. Kommen Sie mit einem anderen Benutzerverhalten, das realistischer und orthogonal zum Algorithmus ist.

Irgendwelche Ideen, wie man das Verhalten der Benutzer modelliert? Gerne gebe ich weitere Details zum Algo bekannt.

Pavan Manjunath
quelle

Antworten:

1

Wie werden Sie Ihren Algorithmus validieren?

Anstatt zu versuchen, die zweite Frage zu beantworten, sollten Sie bedenken, dass Ihre Antwort auf die erste Frage möglicherweise überarbeitet werden muss ...

Welche Methoden haben Sie zur Validierung von Lernmethoden in Ihrem Data Science-Kurs verwendet? Zunächst möchten Sie einen bestimmten Satz numerischer Metriken definieren, um den Erfolg oder Misserfolg Ihres Modells zu bewerten. Zweitens: Mit welchen Methoden können Sie eine sehr realistische Testpopulation erstellen (realistischer als die Modellierung der Population)? Der erste Hinweis, den ich geben werde, ist, dass der Amazon Reviews- Datensatz sehr groß ist, sodass Ihre Daten für diese Methode sehr änderbar sind. Der zweite Hinweis, den ich geben werde, ist, dass diese Methode wahrscheinlich die ist, die Sie in 95% der überwachten Lernprobleme verwendet haben, an denen Sie im Unterricht gearbeitet haben ...

Hoffe, das hilft ... Ich werde dies bei Bedarf anhand der vom OP hinzugefügten Kommentare bearbeiten, möchte aber nicht sofort die Lösung bereitstellen, um organische Gedanken hervorzurufen, z. B. da dies ein Klassenproblem ist und der Prof es ist Versuchen Sie auch, selbst die richtige Lösung zu finden.

AN6U5
quelle
0

Es gibt zwei Anforderungen für das Verhaltensmodell, die Sie verwenden sollten: (1) "realistischer" und (2) orthogonal zu Ihrem Algorithmus.

(1) Nehmen wir realistisch an, dass das Verhalten Verhaltensweisen widerspiegeln sollte, die in anderen, umfassenderen Kontexten als dem spezifischen Kontext von Amazon-Käufen beobachtet wurden.

(2) Orthogonal ist einfacher zu verstehen. Das modellierte Verhalten sollte nicht durch Ähnlichkeiten zwischen Produkten bestimmt werden.

Ein einfacher Ansatz zur Erfüllung dieser beiden Anforderungen würde sich aus der Tatsache ergeben, dass das Kaufverhalten von soziodemografischen Merkmalen wie Geschlecht, Alter, Standort (z. B. Stadtgebiet / Land) und wirtschaftlichen Zwängen (Einkommen und Preis) abhängt.

Sie haben eine Reihe von Benutzern und eine Reihe von Produkten. Sie können die Beziehung zwischen den soziodemografischen Variablen und der Produktnachfrage mithilfe einfacher, aber sorgfältiger Regressionstechniken abschätzen. Bei Bedarf können Sie externe Datenquellen verwenden, um Annahmen zu wichtigen fehlenden Variablen wie dem Einkommen zu treffen.

Wenn Sie ein Anbieter sind, würde das soziodemografische Modell vorhersagen, welche Gruppen am wahrscheinlichsten Ihr Produkt kaufen.

Ich hoffe das hilft :)

Ben

Benjamin Tannenbaum
quelle