Ressourcen zum Erlernen der Verwendung (/ Erstellen) dynamischer (/ interaktiver) statistischer Visualisierung

14

Ich möchte mehr über die interaktive Datenvisualisierung (Zoomen, Zeigen, Bürsten, Punktzuordnen usw.) erfahren. Ich würde jeden begrüßen:

  1. Tutorial / Anleitung / Buch (?) / Video zur Verwendung solcher Methoden für statistische Erkundungen.
  2. Zeiger für gute / interessante interaktive Datenpakete (in R und außerhalb davon)

Um den Ball ins Rollen zu bringen, weiß ich, dass es in R verschiedene Möglichkeiten gibt, eine interaktive Visualisierung zu erhalten, wie z. B. rggobi , das neue googleViz R-Paket , das Animationspaket und einige andere. Aber wenn es andere Pakete gibt, die es wert sind, erkundet zu werden (und die Dinge anbieten, die R nicht bietet), wäre ich froh, wenn ich etwas darüber wissen würde (wie jmp, mathlab, spss, sas, excel usw.).

ps: dies ist die erste frage die das tag "interaktive visualisierung" verwendet

Tal Galili
quelle
Ich denke, @Shane wird hier etwas zu sagen haben, während er über Webvis (Parser für Protovis) spricht, da Protovis (gewidmet für Webvisualisierung ) die Möglichkeit interaktiver Grafiken enthält ...
Robin Girard
In R gibt es auch iPlots und Rgl , aber Javascript- oder Python-basierte Lösungen sind möglicherweise flexibler.
Vincent Zoonekynd

Antworten:

13

Neben Protovis (HTML + JS) oder MayaVi (Python), würde ich empfehlen Verarbeitung was

Eine Open-Source-Programmiersprache und -Umgebung für Menschen, die Bilder, Animationen und Interaktionen erstellen möchten. Ursprünglich entwickelt, um als Software-Skizzenbuch zu dienen und Grundlagen der Computerprogrammierung in einem visuellen Kontext zu vermitteln.

Es gibt viele Open-Source-Skripte auf http://www.openprocessing.org/ und viele verwandte Bücher , die sich mit der Verarbeitung, aber auch mit der Datenvisualisierung befassen.

Ich weiß, dass es ein Projekt gibt, das eine R-Schnittstelle bereitstellt , aber ich weiß nicht, wie es geht. Es gibt auch eine Schnittstelle mit Clojure / Incanter (siehe z. B. Erstellen von Verarbeitungsvisualisierungen mit Clojure und Incanter ).

Es gibt viele Online-Ressourcen, darunter Notizen der Stanford-Klasse, z. B. CS448B oder 7 Classic Foundational Vis Papers, die Sie möglicherweise nicht öffentlich gestehen möchten , dass Sie es nicht wissen .

chl
quelle
6

Weitere Pakete für die Erstellung interaktiver Visualisierungen, die Chl vorgeschlagen hat, Processing hinzuzufügen. Alle diese Funktionen basieren auf Javascript und können in einem Browser ausgeführt werden. Sie können daher sowohl zum Veröffentlichen als auch für Ihre eigene Analyse verwendet werden:

  • D3.js ist der Nachfolger von Protovis. Es ist insofern mächtiger, als Sie mehr Kontrolle über die erstellten Objekte haben (es sind richtige DOM-Objekte, dh Sie haben die volle Kontrolle über sie mit Javascript), aber einige bevorzugen Protovis aus Gründen der Einfachheit. Gute technische D3 vs Protovis Diskussion hier .
  • Raphael.js ist eine gute Option für hochgradig angepasste Web-Interaktivität im Massenmarkt, da es sowohl zukunftssicher (kein Flash) als auch auf Browsern ab IE6 funktioniert (das einzige, von dem ich weiß, dass es nicht funktioniert, sind alte Versionen von den Android-Browser). Wie bei D3 handelt es sich bei allem um ein DOM-Objekt, auf das abgezielt werden kann, und es verfügt über gut integrierte API-Steuerelemente für Animation und Interaktivität. Es bietet nichts Besonderes für die Visualisierung: Es ist ein sehr leistungsfähiger und flexibler Rohling, der sich hervorragend zum Entwerfen von benutzerdefinierten Visualisierungen eignet, jedoch nicht für Ihre eigene erste explorative Analyse. Machen Sie sich zuerst mit Ihren Daten vertraut.
  • gRaphael.js sind Standarddiagramme (Balken, Linien usw.) für Raphael. Es ist einfach, funktioniert aber und kann darauf aufgebaut werden - kann eine nützliche Zutat sein, wenn Sie Ihre eigene Suite bauen.

In Bezug auf Ihre andere Frage zum Lernen verdient Information Dashboard Design eine Erwähnung, wenn Sie eine Reihe allgemeiner interaktiver Standardtools für Ihre Daten erstellen möchten.

Interaktive Visualisierungen bewegen sich im Spannungsfeld zwischen Statistik und Interaktivitätsdesign. Bücher darüber können also hilfreich sein. Ich habe keine persönliche Erfahrung mit einem der vielen Lehrbücher für Interaktionsdesign, aber ich bin ein großer Fan von Universal Principles of Design . Es könnte für Ihre Bedürfnisse übertrieben sein, aber schauen Sie in der Usability- Spalte auf der Seite mit den ausgezeichneten kategorialen Inhalten nach und lesen Sie die aufgelisteten Kapitel (progressive Offenlegung, Signal-zu-Rauschen usw.).

Für Programmieranfänger ist Programming Interactivity ein guter Einstieg, um die technischen Fähigkeiten zu verbessern (es enthält auch ein umfangreiches Kapitel über die Verarbeitung).

Aber um zu wissen, was funktioniert und was möglich ist, ist Lernen unschlagbar . Ein guter Einstieg könnte darin bestehen, die bekannten interaktiven Visualisierungspakete für allgemeine Zwecke wie Tableau und JMP zu analysieren und überlegen Sie, warum ihre Funktionen so gestaltet sind, wie sie sind.

user56reinstatemonica8
quelle
Vielen Dank für die Bearbeitung in den Links whuber - schlagen Sie mich dazu!
user56reinstatemonica8
4

Schauen Sie sich zusätzlich zu Processing die Python-basierte Nodebox (1, 2, OpenGL) an, die von Processing inspiriert wurde:

Nodebox 1 ist nur Mac, während Nodebox 2 und die OpenGL-Version plattformübergreifend sind.

Python verfügt über eine Vielzahl von Data-Crunching-Bibliotheken, die in Nodebox importiert werden können, z. B. scipy.org

Ed Hagen
quelle
1

Kurz nachdem ich meine erste lange Liste veröffentlicht hatte, entstand WEAVE , eine Open-Source-Suite für die dedizierte Datenvisualisierung. Hier ist eine kurze Zusammenfassung von WEAVE im führenden Blog Flowing Data

Es ist ratsam, die Datenvisualisierung anders zu gestalten, je nachdem, wo Sie sich gerade befinden. Je früher Sie sind - je roher und unerforschter Ihre Daten sind - desto wahrscheinlicher profitieren Sie von vorgefertigten, flexiblen Allzweck-Suiten wie WEAVE und seinen kommerziellen Closed-Source-Gegenstücken wie Tableau und JMP schmerzlos, um die Daten kennenzulernen und herauszufinden, welche Angriffslinien erforderlich sind, um das Beste aus ihnen herauszuholen.

Wenn Sie mehr über die Daten erfahren, wird sich Ihr Fokus wahrscheinlich auf Kommunikation oder "geführte Erkundung" verlagern - individuellere Visualisierungen von Erkundungsdaten, die auf den Vorbehalten, Nuancen und Interessensgebieten basieren, die Sie jetzt in den Daten entdeckt haben. Hier kommen Schieferrohlingprodukte wie die oben aufgeführten programmatischen Vektorzeichentools voll zur Geltung.

user56reinstatemonica8
quelle