Gibt es eine "Hallo Welt" für statistische Grafiken?

25

In der Computerprogrammierung gibt es ein klassisches erstes Programm zum Lernen / Lehren einer neuen Sprache oder eines neuen Systems, das "Hallo Welt" heißt. http://en.wikipedia.org/wiki/Hello_world_program

Gibt es eine klassische erste Datenvisualisierung für die Verwendung eines Grafikpakets? Wenn ja, was ist das? Und wenn nicht, was wären gute Kandidaten?

Abraham D Flachsmann
quelle
3
Willkommen auf unserer Webseite! Unsere FAQ lautet : "Sie sollten nur praktische und beantwortbare Fragen stellen, die auf tatsächlichen Problemen beruhen, mit denen Sie konfrontiert sind." Könnten Sie näher auf Ihr eigentliches Problem eingehen?
Whuber
3
Ich möchte das "Standardtestelement" für statistische Grafiken, sofern vorhanden, identifizieren, um es in das von mir entwickelte Schulungsmaterial aufzunehmen.
Abraham D Flaxman
2
Da die grafischen Anwendungen so unterschiedlich sind, ist es schwierig, sich eine Standard- oder Universalgrafik vorzustellen. Es gibt einige Standards für bestimmte Arten von Grafikpaketen, wie beispielsweise historisch berühmte Hasen und Teekannen für 3D-Grafiken. Damit Ihre Frage beantwortet werden kann, ist es hilfreich, genauer zu bestimmen, welche Pakete in Ihrem Schulungsmaterial behandelt werden sollen.
Whuber
1
Guter Punkt, danke. Ich werde zumindest etwas über statistische Grafiken in R, STATA, Python und Javascript hinzufügen.
Abraham D Flaxman
@AbrahamDFlaxman Ich bin gespannt auf dieses "Trainingsmaterial" und auf wen und wofür es gedacht ist. Kannst du noch mehr sagen
Peter Flom - Reinstate Monica

Antworten:

9

Zwei Gedanken:

A. Wenn ich versuche, das Wesentliche von "Hello World" zu verstehen, muss mindestens die Programmiersprache verwendet werden, um ein gültiges Programm zu generieren, das eine einzelne Textzeile ausgibt. Das legt für mich nahe, dass Ihre "Hallo Welt" ein univariater Datensatz sein sollte, das grundlegendste, was Sie in ein Statistik- oder Grafikprogramm einbinden können.

B. Mir ist keine Grafik "Hello World" bekannt. Das nächste, was ich erreichen kann, sind typische Datensätze, die in verschiedenen Statistikpaketen enthalten sind, z. B. die AirPassenger von R. In R wäre eine Hello World-Grafikaussage:

plot (AirPassengers)  # Base graphics, prints line graph

oder

qplot (AirPassengers) # ggplot2, prints a bar chart

oder

xyplot (AirPassengers) # lattice, which doesn't have a generic plot

Persönlich denke ich, dass das einfachste Diagramm ein Liniendiagramm ist, bei dem N Elemente in Y und X im Bereich von 1: N liegen. Aber das ist kein Standard.

Wayne
quelle
1
Diese und andere Antworten stimmen darin überein, dass es derzeit keine "Hallo-Welt" statistischer Grafiken gibt. Ich halte Ihren Vorschlag für einen univariaten Datensatz mit N Elementen in Y und X im Bereich von 1: N für überzeugend. In weiterer Analogie zu "Hallo Welt" wäre es schön, ein kleines N und ein einprägsames Y zu haben. Was halten Sie von N = 5 und Y = (3,1,4,1,5,9) (dh Ziffern von pi)? Vielleicht ist das zu mathematisch.
Abraham D Flaxman
1
@AbrahamDFlaxman: Ich finde es nicht zu mathematisch, ich finde es großartig. Denkwürdig, kurz und die Grafik ist nicht nur eine gerade Linie oder irgendetwas. Die Daten sind bekannt und nicht an ein bestimmtes Programm gebunden und können von jedem, der mehr Punkte möchte, beliebig erweitert werden. Ich stimme dafür!
Wayne
24

Ich würde wahrscheinlich mit Streudiagrammen beginnen und die vier hässlichen Zusammenhänge aufzeigen .

StasK
quelle
2
+1. Vielleicht möchten Sie jedoch etwas allgemeineres in Betracht ziehen, beispielsweise eine Art Liniendiagramm. Denn sobald Sie ein Liniensegment zeichnen können , können Sie alles zeichnen . Dies spiegelt die Idee hinter "Hallo Welt!" Wider: Sobald Sie eine lesbare Ausgabe von einem Programm erhalten, wissen Sie, dass Sie mit dem Computer kommunizieren können, und der Rest besteht nur aus Details :-). (Die Details können schwierig sein . Wenn Sie lernen, Assembly-Code für den IBM 360-Mainframe zu schreiben, war es die einfachste Möglichkeit, die Ausgabe im RAM zu speichern und am Ende der Ausführung einen Fehler zu erzeugen, der dazu führte, dass das System einen hexadezimalen Core-Dump druckte !)
whuber
Ich denke, Anscombes Quartett enthält insgesamt zu viel, um als "Hallo, Welt" der statistischen Grafiken verwendet zu werden, aber Abbildung 1 aus seiner Arbeit könnte ein guter Kandidat sein. Andere Antworten sprechen jedoch für einen univariaten Datensatz, zu dem ich mich neige.
Abraham D Flaxman
7

Das Histogramm einer Stichprobe einer normalverteilten Zufallsvariablen.

Karsten W.
quelle
Ich mag die Art und Weise, wie dies aussehen würde, aber vielleicht erfordern Histogramme mehr Datenverarbeitung als Streuungen, und Proben aus der Normalverteilung zu finden, kann ablenken.
Abraham D Flaxman
Mir ist gerade aufgefallen, dass dies das erste Beispiel von der Matplotlib-Webseite ist: matplotlib.org
Abraham D Flaxman
5

Ich denke die Antwort ist "nein". Das heißt, es gibt keine allgemein vereinbarte Antwort auf Ihre Frage.

@StasK zeigt auf das Streudiagramm.

Aber ich würde überlegen, was plotin R: Es kommt auf die Daten an!

Man könnte argumentieren, dass univariate Statistiken einfacher sind als bivariate. Also ... vielleicht ist das Grundlegendste ein Histogramm; oder vielleicht eine Bar Handlung; vielleicht ein Dichtediagramm.

Wenn der Punkt "Hallo, Welt!" ist zu zeigen, dass Sie den Computer dazu bringen können, etwas zu tun, was dann jeder Plot tun würde.

Peter Flom - Wiedereinsetzung von Monica
quelle
1
Möglicherweise zeigt das Fehlen eines Standardtestobjekts an, dass Sie korrekt sind, und es ist sinnvoller, dasjenige Diagramm zu verwenden, das in dem demonstrierten System am einfachsten ist. Das macht es jedoch schwer zu vergleichen.
Abraham D Flaxman
5

Ich bin nicht sicher, ob es sich genau um eine Hallo-Welt handelt, aber in R gibt es auch Demos, die in viele Pakete eingebaut sind. z.B

library(graphics)
demo(graphics)

führt den Benutzer durch einige grundlegende Grafiken, die im Paket enthalten sind. Klicken Sie einfach mit der Maus über jedes Bild, um die grundlegenden grafischen Darstellungen durchzugehen. Mit nur zwei Zeilen wird der Benutzer in einige der inspirierenden Fähigkeiten von R-Grafiken für die Statistik eingeführt.

Der entsprechende Code zum Erzeugen der Grafiken wird in der R-Konsole angezeigt.

Bildbeschreibung hier eingeben

klopfen
quelle
2

Ich würde sagen, es gibt zwei "Hello World" -Programme für die Datenvisualisierung:

Print ("Hello World"): So etwas wie das Histogramm einer normalverteilten Variablen oder vielleicht ein einfaches X, Y-Streudiagramm.

Für etwas etwas komplexeres, wie den Abschnitt, in dem man die Prinzipien von Hello World aufgreift und mit Benutzereingaben, Escape-Zeichen und dergleichen beginnt, würde ich sagen, dass es mit dem Iris-Datensatz herumspielt.

Fomite
quelle