Ich verbrachte drei Tage damit, mich mit tm
einem Entwurf eines Freundes zu beschäftigen, in dem er mit UCINET einen Textkorpus erkundete, der Textwolken, Zwei-Modus-Netzwerkgraphen und Einzelwertzerlegung (mit Grafiken, unter Verwendung von Stata) zeigte. Ich habe viele Probleme: Unter Mac OS X gibt es Probleme mit Java hinter Bibliotheken wie Snowball (stemming) oder Rgraphviz (graphs).
Könnte jemand Punkt aus nicht - Paketen - Ich habe betrachtet tm
, wordfish
und wordscores
, und weiß über NLTK - aber Forschung, wenn möglich mit dem Code, auf Textdaten, dass Anwendungen erfolgreich tm
oder etwas anderes zu Daten wie Parlamentsdebatten oder Legislativdokumente zu analysieren? Ich kann nicht viel zu diesem Thema finden und noch weniger Code, von dem ich lernen kann.
Mein eigenes Projekt ist eine zweimonatige parlamentarische Debatte. Diese Variablen sind in einer CSV-Datei enthalten: Parlamentssitzung, Sprecher, Fraktion, Text der mündlichen Intervention. Ich suche nach Unterschieden zwischen Sprechern und insbesondere zwischen Fraktionen bei der Verwendung seltener und weniger seltener Begriffe, z. B. "Sicherheitsgespräch" gegen "Bürgerrechtsgespräch".
quelle
Antworten:
Die Dissertation des Autors von tm, Ingo Feinerer aus Österreich, ist in englischer Sprache verfasst. Die Kapitel 7-10 dieses Dokuments enthalten Anwendungen des tm-Pakets mit zunehmender Komplexität.
http://epub.wu.ac.at/1923/
Lesen Sie das gesamte Dokument vollständig durch. Beachten Sie jedoch, dass das Dokument im Jahr 2008 verfasst wurde und seitdem einige API-Änderungen vorgenommen wurden. In der Doktorarbeit wird beispielsweise eine Funktion erwähnt
tmMap()
, in die umbenannt wurdetm_map()
. Die Codebeispiele funktionieren also nicht wie sie sind. Sie können sie nicht mit Ausschneiden und Einfügen testen.Sie können auch zu gehen
http://tm.r-forge.r-project.org/users.html
Suchen Sie auf dieser Seite nach der Phrase "schrieb ein Papier" und Sie werden viele Links finden. Ich habe nur eine der Abhandlungen gelesen: "Automatische Themenerkennung in Liedtexten". Sehr interessant und lustig.
quelle
Ein guter Anfang könnte die Liste der Veröffentlichungen auf der Website für sein
tm
, wie zum Beispiel diese:Die Referenzliste am Ende jeder dieser Veröffentlichungen enthält erfolgreiche Anwendungen von
tm
, nach denen Sie anscheinend suchen. Es gibt viele - vor allem dann, wenn Sie den Referenzen der Referenzen folgen.Zum Beispiel ist hier eine, die von Relevanz sein könnte:
Viel Glück.
quelle
tm
. Trotzdem vielen Dank :)