Bei der Durchführung explorativer Datenanalysen drucke ich häufig die Grafiken aus und schreibe Kommentare / Anmerkungen usw. auf.
Haben die Leute Vorschläge für eine bessere elektronische Methodik? Ich interessiere mich besonders für Python / R.
Ich bin auf der Suche nach etwas 'Schnellem (und Schmutzigem)', das die Erkundungsarbeit nicht verlangsamt, sondern dabei hilft, die von mir gewonnenen Erkenntnisse zu protokollieren.
Was ich mir vorstellen kann, ist, Diagramme als PDFs zu generieren und dann Kommentare hinzuzufügen.
Idealerweise möchte ich die Option, dies programmgesteuert zu tun, damit ich, wenn ich die Grafiken wiederhole, die Kommentare 'automatisch' wieder hinzufügen kann.
data-visualization
eda
project-management
seanv507
quelle
quelle
R
ist, einen separaten Plot (auf einer separaten Seite am Ende des PDFs) hinzuzufügen und diesen fürpaste
einige Kommentare zu verwenden.Antworten:
Hier ist eine einfache Lösung, die viele Leute als nützlich empfunden haben. Wenn Sie es trivial finden, werde ich nicht widersprechen. Dies umfasst statistische Software, Betriebssysteme und andere Computerdetails.
Kopieren Sie einfach Ihre Grafiken, fügen Sie sie in Ihr bevorzugtes Text- oder Textverarbeitungsprogramm ein und fügen Sie dann Ihre eigenen Kommentare hinzu. Das kann MS Word, Software zur Unterstützung von TeX, LaTeX usw. bedeuten.
Das ist es. Die Vorteile sind eindeutig Einfachheit (nichts Neues zu lernen) und Flexibilität (fügen Sie das hinzu, was Sie möchten, so wie Sie es möchten).
Dies ist keine automatisierte Lösung. Aber auch automatisierte Lösungen hängen davon ab, dass Informationen in den Diagrammen und Ihren Kommentaren eingespeist werden. Was ist das anders?
quelle
Ich empfehle Jupyter Notebook , mit dem Sie Dokumente erstellen können, die eingestreute Codeblöcke, Diagramme und Notizen / Dokumentationen enthalten. Das Dokument kann Markdown und Latex enthalten, die automatisch gerendert werden (ähnlich wie beim Schreiben auf CrossValidated). Wenn Sie einen Codeblock ausführen, werden alle von ihm generierten Textausgaben und Diagramme inline zum Dokument hinzugefügt. Sie können einen Codeblock ändern und erneut ausführen, um die Ausgabe / Diagramme zu aktualisieren. Dies ist gut geeignet, um Dinge interaktiv zu testen (z. B. Code / Parameter anpassen, um zu sehen, was passiert). Ich denke, es ist einfacher, als Zahlen zu exportieren und in ein traditionelles, statisches Dokument einzufügen, insbesondere wenn Sie etwas ändern. Sie können ein Notizbuch als PDF usw. exportieren, um eine statische Kopie zu erhalten.
Es ist Open Source und funktioniert mit Python, R und anderen Sprachen. Die Benutzeroberfläche ist browserbasiert, daher plattformübergreifend und einfach zu verwendende Notebooks. Sie können das Backend auf Ihrem eigenen Computer ausführen oder Notebooks auf einer Website hosten, damit Sie / andere sie von überall aus bearbeiten / anzeigen / ausführen können (der Code wird auf dem Server ausgeführt). Anscheinend gibt es eine Möglichkeit, das Notebook als Frontend für einen Computercluster für parallele Berechnungen zu konfigurieren.
quelle
Ich neige dazu, immer mehr Analysen
R notebooks
innerhalb von RStudio durchzuführen. Auf diese Weise kann ich Code, Anmerkungen und Grafiken an einem Ort zusammenfassen und muss nicht ständig PDFs erstellen - das spart Zeit. Sie schreiben Text und Code in einen Editor und durch Klicken auf eine Schaltfläche wird der Code ausgeführt (und das Diagramm gezeichnet). So bleiben Text, Code und Plot ordentlich zusammen. Es ist auch sehr einfach, mit wenigen Mausklicks in HTML oder PDF zu konvertieren. Ich weiß nicht, wie gut das mit Python funktioniert, da ich meistens R benutze.quelle
Es hört sich so an, als ob Sie eine Art literarische Programmierung wollen .
R
bietet Sweave und Knitr diese Schnittstelle zu LaTeX . Es gibt andere Optionen für verschiedene Arten von Ausgabeformaten, z. B. ODFweave für bearbeitbare Dokumente (wie Word-Dokumente) und RMarkdown , die mehrere Typen ausgeben können (wie HTML zusätzlich zu den oben genannten). Andere Statistiksoftware weisen üblicherweise analoge Merkmale auf.(Die Verwendung dieser Dateien erfordert einige Vorarbeiten. Ich mache normalerweise einmalige Projekte anstelle längerfristiger Projekte, für die regelmäßige und ähnliche Berichte erforderlich sind. Daher verwende ich normalerweise die Methode von @ NickCox zum Speichern oder Kopieren in eine Datei und Kommentare dazu schreiben.)
quelle
In
R
: Manchmal füge ich einem PDF einen zusätzlichen Plot mit einigen grundlegenden Informationen hinzu. Dies ist am nützlichsten, wenn die Anmerkungen kurz sind und sich auf die Plotdaten beziehen, sodass Siepaste
zusätzliche Informationen erhalten können. Zum Beispiel:Wenn Sie längere Anmerkungen haben, kann alternativ die Erstellung eines Berichts mit R Markdown eine Lösung sein.
quelle