Ich versuche, den chinesischen Restaurantprozess (CRP) und den gewichteten chinesischen Restaurantprozess (WCRP) zu verstehen, die in einem Forschungsbericht "Automatische Entdeckung kognitiver Fähigkeiten" beschrieben sind - Robert V. Lindsey, Mohammad Khajah, Michael C. Mozer zur Verbesserung der Vorhersage von Schüler lernen. In CRP wird bei allen Implementierungen (vgl. Unendliche Mischungsmodelle mit nichtparametrischen Bayes und dem Dirichlet-Prozess ) ein Vergleich mit der Zufallszahl durchgeführt, um zu entscheiden, ob der Kunde auf einem neuen oder vorhandenen Tisch sitzt. Warum wird diese Prüfung durchgeführt und wie unterscheidet sich diese Prüfbedingung in WCRP?
clustering
nonparametric-bayes
Nakshu
quelle
quelle
Antworten:
Diese Implementierung verwendet die Polya-Urnen-Darstellung des Dirichlet-Prozesses, wie sie von Blackwell und MacQueen (1973) beschrieben wurde. In dem Link, den Sie bereitgestellt haben, wird dieser bestimmte Teil des Prozesses als "Mit der Wahrscheinlichkeit α / (1 + α) setzt er sich an einen neuen Tisch" beschrieben. Konzeptionell kann man sich das so vorstellen, als würde man die Idee erfassen, dass es im Prinzip unendlich viele mögliche Tabellen gibt, die verbunden werden können.
Der einzige Unterschied bei einem gewichteten chinesischen Restaurantprozess in Bezug auf die Zufallszahlenprüfung besteht darin, dass die Wahrscheinlichkeit, eine neue Tabelle (Cluster) zu eröffnen, unterschiedlich ist.
quelle
Das CRP ist ein Modell, das mit grafischen Modellen verwendet wird, um zu simulieren, wie viele Cluster Sie haben.
Es wird nicht auf Datenpunkte angewendet. Tatsächlich ist es ein Prior und hängt überhaupt nicht von den Daten ab.
quelle