Ich möchte das Format (die Klasse) einiger Spalten meines data.frame-Objekts ( mydf) von Zeichen zu Faktor ändern . Ich möchte dies nicht tun, wenn ich die Textdatei nach read.table()Funktion lese . Jede Hilfe wäre
Ich möchte das Format (die Klasse) einiger Spalten meines data.frame-Objekts ( mydf) von Zeichen zu Faktor ändern . Ich möchte dies nicht tun, wenn ich die Textdatei nach read.table()Funktion lese . Jede Hilfe wäre
Ich habe eine CSVDatei in einen R-Datenrahmen eingelesen. Einige der Zeilen haben dasselbe Element in einer der Spalten. Ich möchte Zeilen entfernen, die Duplikate in dieser Spalte sind. Beispielsweise: platform_external_dbus 202 16 google 1 platform_external_dbus 202 16 space-ghost.verbum...
Wann sollte man a verwenden data.frameund wann ist es besser, a zu verwenden matrix? Beide halten Daten in einem rechteckigen Format, so dass es manchmal unklar ist. Gibt es allgemeine Faustregeln für die Verwendung des
Von einem Datenrahmen, gibt es eine einfache Möglichkeit , aggregieren ( sum, mean, maxet c) gleichzeitig mehrere Variablen? Nachfolgend einige Beispieldaten: library(lubridate) days = 365*2 date = seq(as.Date("2000-01-01"), length = days, by = "day") year = year(date) month = month(date) x1 =...
Ich habe Probleme beim Versuch, große Objekte in R zu verwenden. Zum Beispiel: > memory.limit(4000) > a = matrix(NA, 1500000, 60) > a = matrix(NA, 2500000, 60) > a = matrix(NA, 3500000, 60) Error: cannot allocate vector of size 801.1 Mb > a = matrix(NA, 2500000, 60) Error: cannot...
Ich habe einen Datenrahmen mit einigen numerischen Spalten. Einige Zeilen haben einen Wert von 0, der in der statistischen Analyse als Null betrachtet werden sollte. Was ist der schnellste Weg, um den gesamten 0-Wert in R durch NULL zu ersetzen?
Ich habe eine Frage zu Legenden in ggplot2. Ich habe es geschafft, drei Linien im selben Diagramm zu zeichnen und möchte eine Legende mit den drei verwendeten Farben hinzufügen. Dies ist der verwendete Code library(ggplot2) require(RCurl)
In einem data.frame (oder einer data.table) möchte ich NAs mit dem nächsten vorherigen Nicht-NA-Wert "vorwärts füllen". Ein einfaches Beispiel für die Verwendung von Vektoren (anstelle von a data.frame) ist das folgende: > y <- c(NA, 2, 2, NA, NA, 3, NA, 4, NA, NA) Ich möchte eine Funktion...
Ich habe gerade das Scoping im R-Intro gelesen und bin sehr gespannt auf die <<-Aufgabe. Das Handbuch zeigte ein (sehr interessantes) Beispiel, für <<-das ich mich verstanden zu fühlen glaube. Was mir noch fehlt, ist der Kontext, in dem dies nützlich sein kann. Was ich gerne von Ihnen...
Ich mache ein ausgewichenes Balkendiagramm mit ggplot mit diskreter x-Skala. Die x-Achse ist jetzt in alphabetischer Reihenfolge angeordnet, aber ich muss es neu anordnen, damit es nach dem Wert der y-Achse geordnet ist (dh der höchste Balken wird links positioniert sein). Ich habe versucht, zu...
Kann mir bitte jemand sagen, wie man nur die ersten 6 Monate (7 Spalten) für jedes Jahr der folgenden Daten liest, zum Beispiel unter Verwendung von read.table()? Year Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 2009 -41 -27 -25 -31 -31 -39 -25 -15 -30 -27 -21 -25 2010 -41 -27 -25 -31 -31 -39...
Ich verstehe nicht, warum ich diese Warnmeldung erhalten habe. > fixed <- data.frame("Type" = character(3), "Amount" = numeric(3)) > fixed[1, ] <- c("lunch", 100) Warning message: In `[<-.factor`(`*tmp*`, iseq, value = "lunch") : invalid factor level, NA generated > fixed Type...
Ich versuche Rpy2 und ggplot2 zu verwenden, erhalte jedoch eine Fehlermeldung. Nachdem ich online nach dem Fehler gesucht hatte, stellte ich fest, dass der Fehler auftritt, weil das ggplot2-Paket Änderungen enthält, die noch nicht in Rpy2 berücksichtigt wurden (siehe z diesen Beitrag (Bearbeiten:...
Geschlossen. Diese Frage ist nicht zum Thema . Derzeit werden keine Antworten akzeptiert. Möchten Sie diese Frage verbessern? Aktualisieren Sie die Frage so dass es beim Thema für Stack - Überlauf. Geschlossen vor 7 Jahren . Verbessere diese Frage...
Ich habe einen Vektor mit verschiedenen Spaltennamen und möchte in der Lage sein, jeden von ihnen zu durchlaufen, um diese Spalte aus einem data.frame zu extrahieren. Betrachten Sie beispielsweise den Datensatz mtcarsund einige Variablennamen, die in einem Zeichenvektor gespeichert sind cols. Wenn...
Ich habe einen Datenrahmen und möchte die Anzahl der Zeilen innerhalb jeder Gruppe zählen. Ich benutze die aggregateFunktion regelmäßig, um Daten wie folgt zu summieren: df2 <- aggregate(x ~ Year + Month, data = df1, sum) Jetzt möchte ich Beobachtungen zählen, kann aber anscheinend nicht das...
Ich erhalte eine Fehlermeldung, wenn ich eine von mir geschriebene R-Funktion verwende: Warning messages: 1: glm.fit: algorithm did not converge 2: glm.fit: algorithm did not converge Was habe ich getan: Schritt durch die Funktion Das Hinzufügen von print, um herauszufinden, in welcher Zeile...
Ich versuche eine Funktion zu schreiben, um ein data.frame ( x) und ein columndavon zu akzeptieren . Die Funktion führt einige Berechnungen für x durch und gibt später einen anderen data.frame zurück. Ich bleibe bei der Best-Practice-Methode, um den Spaltennamen an die Funktion zu übergeben. Die...