Als «data.table» getaggte Fragen

89
dplyr on data.table, verwende ich data.table wirklich?

Wenn ich dplyr Syntax auf eine Datentabelle , erhalte ich alle die Geschwindigkeitsvorteile der Datentabelle , während immer noch die Syntax von dplyr verwenden? Mit anderen Worten, verwende ich die Datentabelle falsch, wenn ich sie mit der Dplyr-Syntax abfrage? Oder muss ich eine reine datierbare...

86
Textzeichenfolge in eine data.table-Spalte teilen

Ich habe ein Skript, das Daten aus einer CSV-Datei in eine einliest data.tableund dann den Text in einer Spalte in mehrere neue Spalten aufteilt. Ich benutze derzeit die lapplyund strsplitFunktionen, um dies zu tun. Hier ist ein Beispiel: library("data.table") df = data.table(PREFIX =...

75
Entfernen Sie mehrere Spalten aus data.table

Was ist der richtige Weg, um mehrere Spalten aus einer data.table zu entfernen? Ich verwende derzeit den folgenden Code, habe jedoch ein unerwartetes Verhalten festgestellt, als ich versehentlich einen der Spaltennamen wiederholt habe. Ich war mir nicht sicher, ob dies ein Fehler war oder ob ich...

75
Verwenden des data.table-Pakets in meinem eigenen Paket

Ich versuche, das Paket data.table in meinem eigenen Paket zu verwenden. MWE ist wie folgt: Ich erstelle eine Funktion, test.fun, die einfach ein kleines data.table-Objekt erstellt und dann die Spaltengruppierung "Val" durch die Spalte "A" summiert. Der Code ist test.fun<-function () {...

70
Wie gruppiere ich data.table nach mehreren Spalten?

Ich verwende das data.tablePaket, um eine zusammenfassende Statistiksammlung für einen Datensatz zu beschleunigen. Ich bin gespannt, ob es eine Möglichkeit gibt, nach mehr als einer Spalte zu gruppieren. Meine Daten sehen folgendermaßen aus: purchaseAmt adShown url 15.54 00001 150000001...

18
Datentabelle, die NA-Werte ohne Gruppen linear interpoliert

Ich wollte einige NA-Werte in eine Datentabelle ohne Gruppen eintragen. Bitte beachten Sie diesen Auszug der Datentabelle, die Zeit und Entfernungen darstellt: library(data.table) df <- data.frame(time = seq(7173, 7195, 1), dist = c(31091.33, NA, 31100.00, 31103.27, NA, NA, NA, NA, 31124.98,...