Doppelter Thread: Ich habe gerade die neueste Version von R installiert. Welche Pakete sollte ich erhalten?
Was sind die R- Pakete, die Sie sich bei Ihrer täglichen Arbeit mit Daten nicht vorstellen können? Bitte listen Sie sowohl allgemeine als auch spezifische Tools auf.
UPDATE: Stand 24.10.10 ggplot2
scheint der Gewinner mit 7 Stimmen zu sein.
Andere Pakete, von denen mehr als eines erwähnt wird, sind:
plyr
- 4RODBC
,RMySQL
- 4sqldf
- 3lattice
- 2zoo
- 2Hmisc/rms
- 2Rcurl
- 2XML
- 2
Vielen Dank für Ihre Antworten!
Antworten:
Siehe Link: TOP 100 R-PAKETE FÜR 2013 (JAN-MAI) http://www.r-statistics.com/2013/06/top-100-r-packages-for-2013-jan-may/
quelle
Ich benutze täglich am häufigsten plyr und ggplot2 .
Ich verlasse mich auch stark auf Zeitreihenpakete. vor allem das Zoo- Paket.
quelle
Ich benutze das Paket xtable . Das Paket xtable wandelt die von R erstellten Tabellen (insbesondere die Tabellen mit den anova-Ergebnissen) in LaTeX-Tabellen um, die in einen Artikel aufgenommen werden sollen.
quelle
Multicore ist ein nützliches Tool, um schnellere Skripte zu erstellen.
cacheSweave spart viel Zeit bei der Verwendung
Sweave
.quelle
ggplot2 - zweifellos die beste Visualisierung für R.
RMySQL / RSQLite / RODBC - zum Verbinden mit einer Datenbank
sqldf - manipuliert data.frames mit SQL-Abfragen
Hmisc / rms - Pakete von Frank Harrell mit praktischen Zusatzfunktionen und nützlichen Funktionen für Regressionsanalysen.
GenABEL - schönes Paket für genomweite Assoziationsstudien
Rcmdr - eine anständige Benutzeroberfläche für R, wenn Sie eine benötigen.
Schauen Sie sich auch CRANtastic an - dieser Link enthält eine Liste der beliebtesten R-Pakete. Viele, die ganz oben auf der Liste stehen, wurden bereits erwähnt
quelle
data.table ist jetzt mein Favorit! Freuen Sie sich sehr auf die neue Version mit der mehr Wunschliste implementiert.
quelle
Pakete, die ich oft benutze, sind Raster , sp , spatstat , vegan und splancs . Ich benutze manchmal ggplot2, tcltk und lattice.
quelle
Für mich persönlich verwende ich die drei folgenden Pakete, die alle aus dem großartigen Omega Project for Statistical Computing stammen (ich behaupte nicht, ein Experte zu sein, aber für meine Zwecke sind sie sehr einfach zu verwenden):
RCurl : Es gibt viele Optionen, die den Zugriff auf Websites ermöglichen, bei denen die Standardfunktionen in Base R meines Erachtens Probleme bereiten . Es ist eine R-Schnittstelle zur libcurl-Bibliothek, die den zusätzlichen Vorteil hat, dass eine ganze Community außerhalb von R sie entwickelt. Auch bei CRAN erhältlich .
XML : Es ist sehr verzeihend, fehlerhaftes XML / HTML zu analysieren. Es ist eine R-Schnittstelle zur libxml2-Bibliothek und hat erneut den zusätzlichen Vorteil, dass eine ganze Community außerhalb von R sie entwickelt. Auch auf CRAN verfügbar .
quelle
Mit Sweave können Sie R-Code in ein LaTeX-Dokument einbetten. Die Ergebnisse der Ausführung des Codes und optional des Quellcodes werden Teil des endgültigen Dokuments.
Anstatt beispielsweise ein von R erstelltes Bild in eine LaTeX-Datei einzufügen, können Sie den R- Code in die Datei einfügen und alles an einem Ort aufbewahren.
quelle
knitr
anstelle von Sweave anzusehen . Es ist im Grunde auf Steroiden Sweave. Es ist genauso einfach, wenn nicht sogar einfacher zu lernen und weitaus flexibler.Zoo und XTS sind ein Muss in meiner Arbeit!
quelle
Ich finde Gitter zusammen mit dem Begleitbuch "Gitter: Multivariate Datenvisualisierung mit R" von Deepayan Sarkar von unschätzbarem Wert.
quelle
Wenn Sie Vorhersagemodelle erstellen, ist Caret ein Glücksfall. Insbesondere in Kombination mit dem Multicore- Paket sind einige erstaunliche Dinge möglich.
quelle
Täglich muss das nützlichste Paket "fremd" sein, das Funktionen zum Lesen und Schreiben von Daten für andere Statistikpakete, z. B. Stata, SPSS, Minitab, SAS usw., enthält. In einem Bereich zu arbeiten, in dem R nicht alltäglich ist, bedeutet dies ist ein sehr wichtiges Paket.
quelle
ich benutze
auto, doBy, Epi, ggplot2, gregmisc (gdata, gmodels, gplots, gtools), Hmisc, plyr, RCurl, RDCOMClient, umgestalten, RODBC, TeachingDemos, XML.
viel.
quelle
Ich könnte nicht leben ohne:
quelle
RODBC für den Zugriff auf Daten aus Datenbanken, sqldf für die Ausführung einfacher SQL-Abfragen für Datenrahmen (obwohl ich mich dazu zwinge, native R-Befehle zu verwenden) sowie ggplot2 und plyr
quelle
Ich arbeite sowohl mit R als auch mit MATLAB und verwende R.matlab viel, um Daten zwischen den beiden zu übertragen.
quelle
Wir verwenden meistens:
quelle
Gitter, Auto, Masse, fremd, Partei.
quelle
Für mich verwende ich Kernlab für das Kernel-basierte Machine Learning Lab und e1071 für SVM und ggplot2 für Grafiken
quelle
Ich benutze ggplot2, vegan und forme ziemlich oft um.
quelle
Ich mag Sauerstoff wegen seiner Curry () - Funktion.
quelle
RColorBrewer wurde hier nicht erwähnt, ich verwende es oft zum Plotten, wenn ich Farbschemata benötige
quelle
Ich bin ein großer Fan von RCPP, wenn ich eine schnelle for-Schleife oder nicht sehr R-konforme Behandlungen benötige. Es ist sehr gut im R-Eco-System implementiert, kann Matrix / Sparse-Matrix ohne Konvertierung als Argumente in einer Funktion empfangen.
Die C ++ - Syntax ist einfach, wenn Sie einfache Dinge tun (was oft mein Fall ist).
Wirklich, Sie müssen kein Paketersteller sein, um diese großartige Bibliothek zu brauchen.
Habe ich gesagt, C ++ ist sehr schnell?
quelle
Die Pakete doParallel und foreach haben mir das Leben so erleichtert, dass ich meinen Code parallelisieren und auf einer rechneroptimierten Instanz auf Amazon EC2 ausführen konnte ! Ich benutze sie sehr oft. Ohne die von Louis Aslett herausgegebenen RStudio AMIs wäre das nicht möglich gewesen . Zum Schluss muss ich noch das stringr- Paket erwähnen , das das Arbeiten mit Streichern zu einem Spaziergang im Park macht. Verwenden Sie es in jeder Text-Mining-Anwendung. Außerdem benutze ich knitr sehr häufig, um qualitativ hochwertige Berichte über meine Arbeit zu erstellen. Vielen Dank für dieses erstaunliche Paket Yihui Xie!
quelle
Ich benutze ggplot2, umformen, Gitter, knitr öfter.
quelle