Als «text-mining» getaggte Fragen

8
R Fehler mit Paket tm (Text-Mining)

Ich versuche, das tm-Paket zu verwenden, um einen Vektor von Textzeichenfolgen in ein Korpuselement zu konvertieren. Mein Code sieht ungefähr so ​​aus Corpus(d1$Yes) Dabei d1$Yeshandelt es sich um einen Faktor mit 124 Ebenen, die jeweils eine Textzeichenfolge enthalten. Zum Beispiel, d1$Yes[246] =...

7
Wie kann man Cluster schön plotten?

Ich habe einen großen Textdatensatz geclustert. Jeder Cluster wird durch einen Schwerpunkt der dazugehörigen vektorisierten Texte, die Anzahl der Texte, das Erstellungsdatum und andere Parameter dargestellt. Ich kann die Cluster nicht in einem n-dimensionalen Raum darstellen. Welche Möglichkeiten...

6
Vergleich zweier Korpora mit dem Themenmodell

Ich möchte zwei Korpora (zwei verschiedene Textsammlungen) mithilfe der Themenmodellierung vergleichen. Ich habe das Modell separat für die beiden Sammlungen trainiert und ähnliche Themen anhand ihrer häufigen Wörter manuell abgeglichen. Ich habe mich gefragt, ob es eine systematische Möglichkeit...