Kennt jemand ein R-Äquivalent zu SAS PROC FREQ
?
Ich versuche, zusammenfassende beschreibende Statistiken für mehrere Variablen gleichzeitig zu generieren.
r
descriptive-statistics
sas
z0lo
quelle
quelle
Antworten:
Ich benutze
table
undprop.table
, aberCrossTable
in demgmodels
Paket können Sie Ergebnisse noch näher an SAS geben. Siehe diesen Link .Um ausserdem "beschreibende Statistiken für mehrere Variablen gleichzeitig zu erstellen", würden Sie die
summary
Funktion verwenden. zBsummary(mydata)
.quelle
Das Zusammenfassen von Daten in Base R bereitet nur Kopfzerbrechen. Dies ist einer der Bereiche, in denen SAS recht gut funktioniert. Für R empfehle ich das
plyr
Paket.In SAS:
mit
plyr
:quelle
Ich benutze kein SAS.
SAS PROC FREQ
Daher kann ich nicht kommentieren, ob das folgende Replikat vorhanden ist , aber dies sind zwei schnelle Strategien zum Beschreiben von Variablen in einem data.frame, die ich häufig verwende:describe
inHmisc
bietet eine nützliche Zusammenfassung von Variablen, einschließlich numerischer und nicht numerischer Datendescribe
inpsych
bietet beschreibende Statistiken für numerische DatenR Beispiel
Folgendes ist die Ausgabe von
Hmisc
describe
:Nachfolgend sehen Sie die Ausgabe
psych
describe
für die numerischen Variablen:quelle
Ich verwende die Codebuchfunktion von {EPICALC}, die zusammenfassende Statistiken für eine numerische Variable und eine Häufigkeitstabelle mit Ebenenbezeichnungen und Codes für Faktoren enthält. http://cran.r-project.org/doc/contrib/Epicalc_Book.pdf (siehe S.50) Darüber hinaus ist dies sehr nützlich, da es SD für quantitative Variablen bereitstellt.
Genießen !
quelle
codebook()
wird. Ein Problem ist, dassna
s gelöscht werden, was Sie möglicherweise in Ihre Ausgabe aufnehmen möchten. Eine Möglichkeit, mit diesem Problem umzugehen (zumindest mit Faktoren), besteht darin ,? Recode.is.na 1st zu verwenden (z. B. "missing"). Für numerische Variablen können Sie unmittelbar links von der Spalte eine neue Variable mit einem darauf basierenden logischen Wert erstellenis.na()
und dann ausführencodebook()
. Es ist allerdings ein bisschen kluge.Sie können sich mein Summarytools- Paket ( CRAN-Link ) ansehen , das eine Codebuch-ähnliche Funktion mit Markdown- und HTML-Formatierungsoptionen enthält.
Dataframe-Zusammenfassung
CO2
BEARBEITEN
In neueren Versionen von Summarytools akzeptiert die
freq()
Funktion (die einfache Häufigkeitstabellen erstellt, die in Bezug auf die ursprüngliche Frage auf den Punkt gebracht werden) sowohl Datenrahmen als auch einzelne Variablen. Für Kreuztabellen (was auch proc freq tut), siehe diectable()
Funktion.Frequenzen
CO2 $ AnlageTyp : Bestellfaktor
CO2 $ TypTyp : Faktor
CO2 $ BehandlungTyp : Faktor
quelle
Vielen Dank für all die Vorschläge an alle. Am Ende habe ich entweder Tabelle oder Rcmdrs numSummary-Funktion verwendet und Folgendes angewendet:
Das funktioniert ganz gut und ist nicht zu umständlich. Allerdings werde ich auf jeden Fall einige dieser anderen Lösungen ausprobieren!
quelle