Gibt es einen guten Browser / Viewer, um einen R-Datensatz (.rda-Datei) zu sehen?

38

Ich möchte eine .rda-Datei (R-Datensatz) durchsuchen. Ich weiß über den View(datasetname)Befehl Bescheid . Die voreingestellte R.app für Mac hat keinen sehr guten Browser für Daten (sie öffnet ein Fenster in X11). Ich mag den RStudio-Datenbrowser, der mit dem ViewBefehl geöffnet wird . Es werden jedoch nur 1000 Zeilen angezeigt und die verbleibenden weggelassen. ( UPDATE: RStudio Viewer zeigt jetzt alle Zeilen an. ) Gibt es einen guten Browser, der alle Zeilen im Datensatz anzeigt und den Sie mögen / verwenden?

Curious2learn
quelle

Antworten:

22

Hier sind ein paar grundlegende Optionen, aber wie Sie kann ich nicht sagen, dass ich mit meinem aktuellen System völlig zufrieden bin.

Vermeiden Sie die Verwendung des Viewers :

  • Dh Verwenden Sie die Befehlszeilentools, um die Daten zu durchsuchen
  • headund tailzum Anzeigen von Anfangs- und Endzeilen
  • str für eine Übersicht der Variablentypen
  • dplyr::glimpse()für eine Übersicht der Variablentypen aller Spalten
  • Grundlegende Extraktionswerkzeuge [,1:5]zeigen gerne die ersten fünf Spalten
  • Verwenden Sie einen Pager zum Anzeigen und Navigieren der Daten (z. B. page(foo, "print")), möglicherweise in Verbindung mit einigen variablen Extraktionswerkzeugen. Dies funktioniert ziemlich gut unter Linux, das verwendet less. Ich bin nicht sicher, wie es auf Windows oder Mac geht.

In eine Tabellenkalkulationssoftware exportieren :

Jeromy Anglim
quelle
(+1) Am häufigsten exportiere ich auch in Tabellenkalkulationen. Manchmal edit(your_data_object)ist dies auch nützlich, da ich nicht sicher bin , ob diese Funktion in Zeilen und Spalten eingeschränkt ist.
Dmitrij Celov
3
(+1) auch. Der Datenbrowser in Stata ist nicht perfekt, aber es ist einer der Gründe, warum ich unter vielen Umständen Stata anstelle von R (Studio) starte.
Fr.
1
In re: your second bullet macht RExcel die Datenübertragung zwischen R und Excel angeblich nahtloser, obwohl es nur unter Windows verfügbar ist. Ich habe es nicht ausprobiert (ich bin nicht unter Windows); Ich bin im Grunde zufrieden mit write.csv :)
JMS
@ Jeromy Pager funktioniert gut auf dem Mac.
Chl
2
@ Curious2learn: Wirst du ernsthaft 700 MB Daten manuell durchsehen? Die meisten der von Jeromy angegebenen Optionen ( head, tail, stretc.) sollte ausreichen. Wenn Sie eine „größere“ Ansicht Ihrer Daten wollen ... plotten es ( plot, qqplot, histetc)
nico
26

Ich empfehle dringend das R-Paket googleVis , R-Bindungen an die Google Visualization API . Die Autoren des Pakets sind Markus Gesmann und Diego de Castillo.

Der Daten-Frame-Viewer in googleVis ist erstaunlich einfach zu bedienen.

Diese Leute haben großartige Arbeit geleistet, da die Verwendung von googleVis unkompliziert ist, die Google Visualization-API jedoch nicht.

googleVis ist bei CRAN erhältlich .

Die Funktion in googleVis zum Rendern eines Datenrahmens als gestaltete HTML-Tabelle ist gvisTable () .

Wenn Sie diese Funktion aufrufen und einen R-Datenrahmen übergeben, werden R-Datenrahmen als interaktive HTML-Tabellen in einer Form gerendert, die sowohl Dashboard-Qualität als auch Funktionalität bietet .

Ein paar Features von googleVis / gvisTable habe ich besonders gut gefunden:

  • Benutzerdefinierte Parameterwerte für die Paginierung (mithilfe der Pfeiltasten), um die Reaktionsfähigkeit mit zunehmender Zeilenanzahl aufrechtzuerhalten . Wenn Sie keine Paginierung wünschen, können Sie über eine Bildlaufleiste auf der rechten Seite der Tabelle auf Zeilen außerhalb der Ansicht zugreifen , die den im Funktionsaufruf gvisTable () angegebenen Parametern entsprechen

  • Spaltenweises Sortieren durch Klicken auf die Spaltenüberschrift

  • Der Aufruf von gvisTable gibt HTML zurück, ist also portabel, und obwohl ich diese Funktion nicht verwendet habe, kann die gesamte Tabelle mit CSS so gestaltet werden, wie jede HTML-Tabelle.

Importieren Sie dazu einfach das googleVis- Paket, rufen Sie gvisTable () auf, das in Ihrem Datenrahmen übergeben wird, und binden Sie das Ergebnis (das ein gvis- Objekt ist) an eine Variable. Rufen Sie dann plot auf dieser gvis- Instanz auf:

library(googleVis)

gvt = gvisTable(DF)

plot(gvt)

Sie können auch eine Reihe von Parametern übergeben, obwohl Sie dies über ein einzelnes Argument an gvisTable, options , tun , bei dem es sich um eine R-Liste handelt, z.

gvt = gvisTable(DF, options=list(page='enable', height=300))

Natürlich können Sie Ihr eigenes CSS verwenden, um jedes gewünschte feinkörnige Styling zu erhalten.

Wenn ein Diagramm für ein gvis-Objekt aufgerufen wird, wird ein Browserfenster geöffnet und die Tabelle wird mit Flash geladen

:

doug
quelle
3
Dies scheint bei mittleren bis großen Datenmengen nicht allzu gut zu funktionieren.
Zach
13

RStudio (RStudio.org) verfügt über einen integrierten Datenrahmen-Viewer, der ziemlich gut ist. Zum Glück ist es schreibgeschützt. RStudio ist sehr einfach zu installieren, sobald Sie eine aktuelle Version von R installiert haben. Wenn Sie Linux verwenden, installieren Sie zuerst das r-base-Paket.

Frank Harrell
quelle
2
Ja, ich mag den Viewer in RStudio. Wie ich in meinem Beitrag bereits sagte, werden nur die ersten 1000 Zeilen angezeigt. Kann ich dies erhöhen, indem ich eine Einstellung ändere? Ich habe versucht, max.print zu ändern, aber das hat den Data Viewer nicht beeinflusst.
Curious2learn
@ Curious2learm: Sie sollten sie bitten, diese Option in der nächsten RStudio-Version auf support.rstudio.org/help/discussions/suggestions hinzuzufügen. Sie antworten normalerweise innerhalb von 2 Tagen
RockScience
12

Hier sind einige andere Gedanken (obwohl ich Emacs immer ungern verlasse):

  • Deducer (mit JGR ) ermöglicht das Anzeigen eines Datenrahmens mit einer kombinierten Variablen- / Datenansicht (à la SPSS).
  • Der Rcmdr von J Fox bietet auch Bearbeitungs- / Anzeigeeinrichtungen , obwohl in einer X11-Umgebung.
  • J Verzanis Poor Man Gui ( pmg ) ermöglicht nur eine schnelle Vorschau für data.frame- und andere R-Objekte. Ich weiß nicht viel über Rasselfunktionen .

Unten sind zwei Screenshots zu sehen, wenn ein data.frame 704 x 348 (als RData geladen) mit Deducer (oben) und Rcmdr (unten) angezeigt wird.

Bildbeschreibung hier eingeben

Bildbeschreibung hier eingeben

chl
quelle
9

Sie können erhalten Sie View()alle Ihre Daten angezeigt werden in RStudio. Der Trick ist, dass Sie utils::View()stattdessen die Befehlssyntax verwenden müssen. (Weitere Informationen finden Sie in meiner Antwort zum Stapelüberlauf hier: R View () zeigt nicht alle Spalten des Datenrahmens an .)

Gung
quelle
Ich habe eine einfache Funktion mit der Funktion utils :: View () geschrieben, die mir auch die Spaltennummern anzeigt und diese in die Datei [Rprofile.site] ( statmethods.net/interface/customizing.html ) kopiert, damit die Funktion geladen wird R Startup. Das Beste daran ist, dass Zeilennummern und Spaltennamen immer sichtbar sind. Hier ist der Code für die Funktion:view <- function(x){ numberColumns <- ncol(x) numbers <- seq(1, numberColumns) names <- names(x) names(x) <- paste0(numbers, "_", names) utils::View(x) }
Elevendollar
3

Vor kurzem habe ich begonnen, die Daten in einer SQLite-Datenbank zu speichern, direkt von R aus mit sqldf auf die Datenbank zuzugreifen und sie mit einem Datenbank-Tool namens tksqlite anzuzeigen / zu bearbeiten

Eine weitere Möglichkeit besteht darin, die Daten zu exportieren und mit Google Refine anzuzeigen / zu bearbeiten

Karsten W.
quelle
Danke für die Information. Ich werde herausfinden, wie die Daten zu Google Refine exportiert werden und ob das gut funktioniert.
Curious2learn
1
Ein weiteres sehr nützliches Tool zum Anzeigen oder Bearbeiten von Daten in SQLite-Datenbanken ist sqlitebrowser.org
Dominic Comtois,
0

Die datatableFunktion aus DTPaket erzeugt HTML-Tabellen. Sie können schöne breite Tabellen anzeigen.

Edgar Santos
quelle