Als «dplyr» getaggte Fragen

94
Summe über mehrere Spalten mit dplyr

Meine Frage besteht darin, Werte über mehrere Spalten eines Datenrahmens zu summieren und eine neue Spalte zu erstellen, die dieser Summierung entspricht dplyr. Die Dateneinträge in den Spalten sind binär (0,1). Ich denke an ein zeilenweises Analogon der summarise_eachoder mutate_eachFunktion...

91
Abrufen der Top-Werte nach Gruppe

Hier ist ein Beispieldatenrahmen: d <- data.frame( x = runif(90), grp = gl(3, 30) ) Ich möchte die Teilmenge dder Zeilen mit den Top 5 Werten von xfür jeden Wert von grp. Mit base-R wäre mein Ansatz ungefähr so: ordered <- d[order(d$x, decreasing = TRUE), ] splits <- split(ordered,...

89
dplyr on data.table, verwende ich data.table wirklich?

Wenn ich dplyr Syntax auf eine Datentabelle , erhalte ich alle die Geschwindigkeitsvorteile der Datentabelle , während immer noch die Syntax von dplyr verwenden? Mit anderen Worten, verwende ich die Datentabelle falsch, wenn ich sie mit der Dplyr-Syntax abfrage? Oder muss ich eine reine datierbare...

88
dplyr mutiert mit bedingten Werten

In einem großen Datenrahmen ("myfile") mit vier Spalten muss ich eine fünfte Spalte mit Werten hinzufügen, die bedingt auf den ersten vier Spalten basieren. Bevorzugen Sie Antworten mit dplyrund mutate, hauptsächlich wegen der Geschwindigkeit in großen Datenmengen. Mein Datenrahmen sieht...

81
Zählen Sie die Anzahl der Zeilen nach Gruppe mit dplyr

Ich benutze den mtcarsDatensatz. Ich möchte die Anzahl der Datensätze für eine bestimmte Datenkombination ermitteln. Etwas sehr Ähnliches wie die count(*)Group by-Klausel in SQL. ddply()von plyr arbeitet für mich library(plyr) ddply(mtcars, .(cyl,gear),nrow) hat Ausgabe cyl gear V1 1 4 3 1 2 4 4 8...

79
Fehler: Funktion "%>%" konnte nicht gefunden werden

Ich führe ein Beispiel in R aus, gehe die Schritte durch und alles funktioniert bis jetzt, außer dass dieser Code einen Fehler erzeugt: words <- dtm %>% as.matrix %>% colnames %>% (function(x) x[nchar(x) < 20]) Fehler: Funktion "%>%" konnte nicht gefunden werden Ich verstehe...

73
Verwenden Sie%>% mit Ersatzfunktionen wie colnames () <-

Wie kann ich den Pipe Operator verwenden, um in die Ersatzfunktion zu leiten colnames()<-? Folgendes versuche ich zu tun: library(dplyr) averages_df <- group_by(mtcars, cyl) %>% summarise(mean(disp), mean(hp)) colnames(averages_df) <- c("cyl", "disp_mean", "hp_mean") averages_df #...

18
So ersetzen Sie NA durch eine Reihe von Werten

Ich habe folgenden Datenrahmen: library(dplyr) library(tibble) df <- tibble( source = c("a", "b", "c", "d", "e"), score = c(10, 5, NA, 3, NA ) ) df Es sieht aus wie das: # A tibble: 5 x 2 source score <chr> <dbl> 1 a 10 . # current max value 2 b 5 3 c NA 4 d 3 5 e NA Was...