Nach dem Lesen eines Datensatzes:
dataset <- read.csv("forR.csv")
- Wie kann ich R veranlassen, mir die Anzahl der darin enthaltenen Fälle mitzuteilen?
- Wird der zurückgegebene Wert auch Ausschlussfälle enthalten, die mit weggelassen wurden
na.omit(dataset)
?
str()
da es weitere nützliche Details zu Ihrem Objekt enthält. Kann oft erklären, warum sich eine Spalte nicht wie gewünscht verhält (Faktor anstelle von numerisch usw.).Antworten:
dataset
wird ein Datenrahmen sein. Da ich keine habeforR.csv
, erstelle ich einen kleinen Datenrahmen zur Veranschaulichung:Um die Anzahl der Fälle zu ermitteln, zählen Sie die Anzahl der Zeilen mit
nrow()
oderNROW()
:Um die Daten nach dem Weglassen von zu zählen
NA
, verwenden Sie dieselben Tools, aber wickeln Sie Folgendesdataset
einna.omit()
:Der Unterschied zwischen
NROW()
undNCOL()
und ihren Kleinbuchstaben (ncol()
undnrow()
) besteht darin, dass die Kleinbuchstaben nur für Objekte mit Dimensionen (Arrays, Matrizen, Datenrahmen) funktionieren. Die Großbuchstaben funktionieren mit Vektoren, die so behandelt werden, als wären sie eine Einspaltenmatrix. Sie sind robust, wenn Sie Ihre Daten so unterteilen, dass R eine leere Dimension löscht.Alternativ können Sie auch
complete.cases()
andsum
it (verwenden,complete.cases()
um einen logischen Vektor [TRUE
oderFALSE
] zurückzugeben, der angibt, ob BeobachtungenNA
für Zeilen vorliegen.quelle
Kurz:
Führen Sie diesen Befehl aus
dim(dataset)
, um sowohl n als auch k abzurufen. Sie können auchnrow(df)
und verwendenncol(df)
(und sogarNROW(df)
undNCOL(df)
- Varianten werden auch für andere Typen benötigt).Wenn Sie z. B. über transformieren
dataset <- na.omit(dataset)
, sind die Fälle verschwunden und werden nicht gezählt. Aber wenn Sie dies tun, werden zBsummary(dataset)
die NA-Fälle berücksichtigt.quelle