Ich möchte eine Zusammenfassung einer Variablen in einem data.frame für jede eindeutige Kombination von Faktoren im data.frame berechnen. Soll ich dazu plyr verwenden? Ich bin in Ordnung mit der Verwendung von Schleifen im Gegensatz zu apply (); Es würde also ausreichen, nur jede einzelne Kombination herauszufinden.
r
categorical-data
aggregation
plyr
russellpierce
quelle
quelle
Antworten:
Ich denke, dies
aggregate
ist wahrscheinlich die Lösung, die Sie suchen. Wenn Sie jedoch eine explizite Liste aller möglichen Faktorenkombinationen erstellen möchten,expand.grid
wird dies für Sie erledigt. z.BSie können dann jede Zeile im resultierenden Datenrahmen durchlaufen, um Datensätze aus Ihren Originaldaten abzurufen.
quelle
Siehe
aggregate
undby
. Zum Beispiel aus der Hilfedatei füraggregate
:quelle
Hier ist die Plyr-Lösung, die den Vorteil hat, dass mehrere Zusammenfassungsstatistiken zurückgegeben und ein Fortschrittsbalken für lange Berechnungen erstellt werden:
quelle
Neben anderen Vorschlägen kann die
describe.by()
Funktion impsych
Paket hilfreich sein. Es kann verwendet werden, um zusammenfassende Statistiken zu numerischen Variablen über Ebenen einer Faktorvariablen hinweg anzuzeigen.quelle
Ich persönlich mag
cast()
das Umformungspaket wegen seiner Einfachheit:quelle
Darin
library(doBy)
liegt auch diesummaryBy()
Funktion, zquelle