Ich habe Tukeys Buch "Exploratory Data Analysis" gelesen. Das Buch wurde 1977 geschrieben und konzentriert sich auf Papier / Bleistift-Methoden. Gibt es einen "moderneren" Nachfolger, der berücksichtigt, dass wir jetzt große Datenmengen sofort zeichnen können?
data-visualization
references
descriptive-statistics
eda
Biofreezer
quelle
quelle
Antworten:
Das nächstgelegene ist Clevelands Visualizing Data . Es geht um explorative Datenanalyse, es geht um computergenerierte Visualisierungen, es ist tiefgreifend, es ist ein Klassiker.
quelle
Nun, es ist keine exakte Nachbildung, aber ich habe in Gelman und Hill's Datenanalyse unter Verwendung von Regression und mehrstufigen / hierarchischen Modellen jede Menge nützliche Hinweise zum Zeichnen (und R-Code) gefunden
Außerdem steckt sein Blog oft voller nützlicher Grafikratschläge.
quelle
Interaktive Grafiken für die Datenanalyse: Prinzipien und Beispiele gefallen mir; In der Buchbeschreibung heißt es: "Erläutert die explorative Datenanalyse (EDA) und wie interaktive grafische Methoden helfen können, Erkenntnisse zu gewinnen und neue Fragen und Hypothesen aus Datensätzen zu generieren."
quelle
Hadley Wickhams ggplot2-Buch ist interessant, da es sowohl die Grammatik der Grafiken als auch die Verwendung der ggplot2-Software lehrt.
quelle
Erwähnenswert sind hier Ronald Pearsons Forschungsdaten in den Bereichen Ingenieurwesen, Naturwissenschaften und Medizin . Die Hauptzielgruppe scheinen Wissenschaftler zu sein, die keine Angst vor etwas Mathematik haben und sich wünschen, mehr Statistiken zu kennen. Das ist eine ziemlich große Gruppe, und eine, die hier gut vertreten ist. Es ist ein wenig schrullig und ungewöhnlich, aber es deckt viel Boden ab und enthält viele vernünftige Ratschläge. Es ist nicht Tukey in dem Sinne, dass es viele neue Ideen bietet, aber es kann sich lohnen zu studieren, auch wenn Sie denken, dass es ein wenig falsch ist.
Dieses Buch scheint sehr wenig Beachtung gefunden zu haben, möglicherweise, weil es sehr teuer ist, offensichtlich nicht als Kurstext geeignet ist und noch nur als gebundenes Buch erhältlich ist. Aber es ist intelligent und lesbar und frei von dem Müll moderner Einführungslehrbücher (Seiten und Seiten mit Grundübungen, dummen Ikonen, unentgeltlichen Fotos von glücklichen jungen Menschen, pingeligen Layouts mit Kisten usw.).
quelle
Auch interaktive und dynamische Grafiken für die Datenanalyse: Mit Beispielen unter Verwendung von R und GGobi, Cook und Swayne
Hier finden Sie zwei öffentlich im Internet verfügbare Kapitel, die den Prozess der Datenanalyse und den Umgang mit fehlenden Werten beschreiben. In Kürze erscheint ein neues Buch von Antony Unwin.
quelle
Weitere gute Bücher sind Beautiful Visualization und Beautiful Data. Dies sind bearbeitete Bücher, es gibt erstaunlich gute Beispiele für das Durchsuchen von Daten mit Zeichnungen und einige absolut entsetzliche Kapitel.
Ein weiteres Buch, das einige gute Beispiele für die Verwendung von ggplot2 enthält, ist ein neues von Winston Chang
quelle
Ich denke an das Verständnis einer robusten und explorativen Analyse von Hoaglin, Mosteller und Tukey und an das begleitende Buch über das Erforschen von Datentabellen und Formen als technische Fortsetzung von EDA. Ich sehe auch Datenanalyse und -regression, einen zweiten Kurs in Statistik von Mosteller und Tukey, als Follow-up zu EDA. Die verschiedenen oben erwähnten Cleveland-Bücher sind Schätze.
quelle