Ich habe gerade die comment
Funktion in R entdeckt. Beispiel:
x <- matrix(1:12, 3,4)
comment(x) <- c("This is my very important data from experiment #0234",
"Jun 5, 1998")
x
comment(x)
Dies ist das erste Mal, dass ich diese Funktion besuche und mich frage, welche häufigen / nützlichen Verwendungen es gibt. Da es ziemlich schwierig ist, in Google nach "R comment" zu suchen und relevante Ergebnisse zu finden, hatte ich gehofft, dass jemand hier seine Erfahrungen mitteilt.
Antworten:
Zum zweiten Mal hat Frank Harrell in seinem Hmisc- Paket effiziente Methoden entwickelt, um mit Anmerkungen versehene data.frame-Dateien in R zu verarbeiten . Mit den Funktionen
label()
undunits()
können Sie beispielsweise R-Objekten dedizierte Attribute hinzufügen. Ich finde sie sehr praktisch, wenn ich eine Zusammenfassung von data.frame (zdescribe()
. B. mit ) erstelle .Eine weitere nützliche Möglichkeit, ein solches zusätzliches Attribut zu verwenden, besteht darin, einen Zeitstempel auf einen Datensatz anzuwenden. Ich füge auch ein Attribut für Dinge wie Random Seed, Fold Number (wenn ich k-kold oder LOO Cross-Validation verwende) hinzu.
quelle
Ich würde es
comment()
als eine gute Möglichkeit sehen, diese Informationen als zukünftige Referenz an einen Datenrahmen anzuhängen.quelle
comment()
keine Kommentare im Code sind. Es fügt dem Objekt ein bestimmtes Attribut hinzu, das ein Vektor sein kann, wobei ein Element pro Spalte des Datenrahmens die Einheiteninformationen enthält. Es ist einfach, diese Informationen zu extrahieren, sodass ich nicht verstehe, warum die Implementierung von etwas schwierig oder unmöglich ist.R
ist definitiv nicht der richtige Ort , um Datenbanken zu erhalten und Verfahren dieser Art durchgeführt wird , auch wenn es dazu in der Lage ist. Es wird am besten durch ein gutes Datenbankverwaltungssystem für solche Arbeiten ergänzt.comment()
et al. sind praktisch für Ad-hoc-Notizen und -Infos, aber für die Datenverarbeitung in größerem Maßstab ist ein geeignetes System erforderlich. Interessanterweise müssen wir dies jetzt innerhalb der Forschungsgruppe und des Beratungsunternehmens, für das ich arbeite, in Bezug auf unsere Chemiedaten ansprechen und in eine geeignete Datenbank aufnehmen.Ähnliche Funktionen gibt es in anderen Paketen, z. B. im Befehl -notes- in Stata . Wir verwenden dies, um vollständige Details einer Variablen zu dokumentieren , z. B. Details eines Assays für eine biochemische Messung oder den genauen Wortlaut der Frage, die für Fragebogendaten gestellt wurde. Dies sind oft zu viele Informationen für den Variablennamen oder die Bezeichnung, von denen eine oder beide in der Ausgabe jeder die Variable betreffenden Analyse angezeigt werden und daher angemessen kurz gehalten werden sollten.
quelle
Eines der Dinge, die ich häufig tue, ist das Verfolgen der Befehle, die zum Generieren von Daten und Objekten verwendet werden, und der Kommentar hat sich als nützliches Werkzeug dafür erwiesen.
Die 'matched.call.data' und 'generate.command.string' machen den Trick. Nicht perfekt, aber hilfreich und eine Verwendung für 'comment ()'. :)
quelle
Gestatten Sie mir, meine allgemeine Lösung für die Objektverwaltung in R: das
repo
Paket vorzuschlagen . Damit können Sie jeder Variablen einen langen Namen, eine Beschreibung, eine Reihe von Tags, eine Remote-URL und Abhängigkeitsrelationen zuweisen sowie Abbildungen oder generische externe Dateien anhängen. Beispielsweise kann Quellcode als Repository-Element gespeichert und an von ihm erstellte Ressourcen angehängt werden. Finden Sie die neueste stabile Version auf CRAN (install.packages("repo")
) oder die neueste Entwicklung auf Github . Ein kurzer Überblick hier . Ich hoffe es hilft.quelle