Ich implementiere einen Naive Bayes-Algorithmus für die Textkategorisierung mit Laplace-Glättung. Das Problem, das ich habe, ist, dass sich die Wahrscheinlichkeit Null nähert, weil ich viele kleine Brüche multipliziere. Daher ergibt die Wahrscheinlichkeit schließlich Null. Dies liegt daran, dass die Dokumente und Schulungssätze mehrere Wörter enthalten.
Aus diesem Grund kann ich die Texte nicht kategorisieren. Gibt es eine Möglichkeit, dieses Problem zu umgehen? Mache ich bei meiner Implementierung etwas falsch?
Antworten:
quelle