Data Science

8
Ähnlichkeit der Score-Matrix-Zeichenfolge

Ich habe eine Menge Dokumente, die eine Menge Schlüsselwertpaare enthalten. Der Schlüssel ist möglicherweise nicht eindeutig, sodass möglicherweise mehrere Schlüssel desselben Typs mit unterschiedlichen Werten vorhanden sind. Ich möchte die Ähnlichkeit der Schlüssel zwischen 2 Dokumenten...

8
Ähnlichkeit der Berufsbezeichnung

Ich versuche, eine Metrik zwischen Berufsbezeichnungen im IT-Bereich zu definieren. Dazu benötige ich eine Metrik zwischen Wörtern von Berufsbezeichnungen, die nicht zusammen in derselben Berufsbezeichnung erscheinen, z. B. eine Metrik zwischen den Wörtern Senior, Primary, Lead, Head, VP, Director,...

8
R Fehler mit Paket tm (Text-Mining)

Ich versuche, das tm-Paket zu verwenden, um einen Vektor von Textzeichenfolgen in ein Korpuselement zu konvertieren. Mein Code sieht ungefähr so ​​aus Corpus(d1$Yes) Dabei d1$Yeshandelt es sich um einen Faktor mit 124 Ebenen, die jeweils eine Textzeichenfolge enthalten. Zum Beispiel, d1$Yes[246] =...

8
Wie erstelle ich eine Textsuchmaschine?

Ich habe eine HTML-Zeichenfolge und möchte herausfinden, ob ein von mir angegebenes Wort in dieser Zeichenfolge relevant ist. Die Relevanz könnte anhand der Häufigkeit im Text gemessen werden. Ein Beispiel zur Veranschaulichung meines Problems: this is an awesome bike store bikes can be purchased...

8
Gewerkschaftsgruppierung in zweigeteilten Graphen?

Ich versuche eine gute (und schnelle) Lösung für das folgende Problem zu finden: Ich habe zwei Modelle, mit denen ich arbeite. Nennen wir sie Spieler und Teams. Ein Spieler kann in mehreren Teams sein und ein Team kann mehrere Spieler haben. Ich arbeite daran, ein UI-Element in einem Formular zu...

8
Tutorials zu Themenmodellen und LDA

Ich würde gerne wissen, ob Sie Leute einige gute Tutorials (schnell und unkompliziert) über Themenmodelle und LDA haben, die intuitiv lehren, wie man einige Parameter einstellt, was sie bedeuten und wenn möglich, mit einigen realen