Wie heißt dieses Diagramm mit vertikalen Linien, um eine Verteilung anzuzeigen?

14

Gibt es einen offiziellen Namen für dieses extrem einfache Diagramm, in dem vertikale Linien die Verteilung einiger Proben in einem Bereich anzeigen?

Bildbeschreibung hier eingeben

Januar
quelle
8
"Teppich", wenn mit anderen Grundstücken verwendet.
Gimelist
7
Es gibt keinen offiziellen Namen. Viel hängt davon ab, ob die Verwendung vertikaler Linien erforderlich ist oder ob andere Symbole akzeptiert werden und ob das Stapeln oder Zittern bei Gleichstand zulässig ist. Unter stats.stackexchange.com/questions/102735/… gebe ich 22 verschiedene Namen an, die für den weiteren Sinn dieser Art von Handlung gefunden wurden.
Nick Cox

Antworten:

24

Das erste Beispiel, auf das ich sie in Bezug genommen habe, sind Streifen mit empirischen Verteilungen: I. Strukturierte Punktstreifen (Tukey und Tukey, 1990), obwohl ich diesen technischen Bericht nie bekommen habe.

Tim hat recht: Sie werden oft als Teppich auf einer zusätzlichen Zeichnung begleitet, um den Ort der einzelnen Beobachtungen anzuzeigen, aber die Teppichzeichnung ist etwas allgemeiner und diese Art von Zeichnung ist nicht immer auf der Decke einer anderen Zeichnung, wie Ihre Frage zeigt!

  • Hier ist ein Beispiel für die Verwendung von Punkten auf dem Teppich anstelle von Linien.
  • Hier ist ein Beispiel dafür, dass der Teppich Punkte ist und nicht alle Daten anzeigt, sondern nur Daten, die in der anderen Dimension eines Streudiagramms fehlen .

Ein Teppichplot ist also nicht immer ein Satz von Linien an den Rändern eines anderen Diagramms, und diese Art von Plot befindet sich in Ihrer Frage nicht immer am Rand eines anderen Diagramms. Hier ist ein Beispiel für die Linien, die einer Kerneldichte überlagert sind, anstatt dem Teppich des Plots, der als Beanplot bezeichnet wird . Die größeren Linien werden meines Erachtens verwendet, um verschiedene Quantile (auch Buchstabenwerte genannt) der Verteilung darzustellen.


(Quelle: biomedcentral.com )

In Wilkinsons Grammatik der Grafiken kann es als eindimensionales Streudiagramm betrachtet werden, das jedoch Liniensegmente anstelle des typischen Standardwerts für Kreise verwendet. Damit soll verhindert werden, dass viele der nahe gelegenen Punkte überlagert werden. Wenn Sie viele Punkte haben und diese halbtransparent zeichnen, werden sie schließlich zu einem Dichtestreifen. Siehe das endgültige Bild in diesem Beitrag .

Ich habe sie sogar als Sparklines vorgeschlagen ( Greenhill et al., 2011 ), um binäre Daten zu visualisieren. Greenhill nennt sie in diesem Beispiel Trennung Plots , und hier ist ein Beispiel aus dem referenzierten Papier (p.995) genommen:

Bildbeschreibung hier eingeben

In diesem Beispiel gibt es also Werte entlang der gesamten Achse, und die Farbe wird zur Visualisierung einer Binärvariablen verwendet. Die schwarze Linie in diesem Diagramm gibt den kumulativen Anteil der roten Beobachtungen an.

Andy W
quelle
6
+1 Strip-Plot ist auch ein gebräuchlicher Begriff.
Whuber
1
@whuber: Strip-Plot, ja, oder ein Strip-Chart .
Amöbe sagt Reinstate Monica
1/nnn
Das ist eine faire Beschreibung @NickCox, aber ich denke nicht, dass Trennungspläne so unterschiedlich sind. In der Wilkinson-Grammatik kann es als eindimensionales Streudiagramm betrachtet werden, bei dem der Rang auf der einzelnen Dimension liegt und anschließend die Farbe zur Unterscheidung der beiden Punkttypen verwendet wird. Mit nur zwei Arten von Punkten brauchen Sie nicht einmal die Daten haben für einen der Sätze, so dass die ursprüngliche grafische Darstellung des OP könnte eine Trennkurve mit den schwarzen Balken eine Kategorie angezeigt wird und der Hintergrund des Komplementsystems grau.
Andy W
Es unterscheidet sich nicht so sehr von einigen Sparklines, die ich bei der Visualisierung von Gewinnen / Verlusten für Sportmannschaften gesehen habe. (Alle Diagramme müssen auf ein endliches Intervall abgebildet werden, um die Daten auf die Seite / den Computerbildschirm zu projizieren. Daher ist es für die Beschreibung des Diagramms nicht wichtig, ob die tatsächlichen Daten auf das Einheitsintervall beschränkt sind.) Ich würde nicht anrufen ein Streudiagramm von Rangdaten mit einem anderen Namen, da die Punkte nicht dort platziert werden, wo sie hingehören.
Andy W
20

Man spricht von einem Teppichgrundstück (siehe zB hier oder hier ). In R kann es mit einer rugFunktion gemacht werden.

Die Handlung scheint auch unter einem anderen Namen zu erscheinen, als Strip-Chart , so wird sie von Phillip I bezeichnet. Gut in Einführung in die Statistik durch Resampling-Methoden und R / S-Plus (2005, Wiley). In R wird es von der stripchartFunktion aufgerufen .

Es scheint, dass die winzige Version, die oft mit einem größeren Plot einhergeht, als Teppichplot bezeichnet wird, während das eigenständige Plot, das aus Punkten oder vertikalen Linien besteht, als Streifendiagramm bezeichnet wird.

Tim
quelle
Verdammt, ich war so nah dran - ich suchte nach einem Flickenteppich (und fand vorhersehbar nichts). Vielen Dank!
Januar
2
Ich denke, in der Praxis werden solche Diagramme nur dann als Teppichdiagramme bezeichnet, wenn sie an einem anderen Punkt, wie einem Histogramm oder einem Streudiagramm, am Rande liegen.
Nick Cox
3

Bei der kommerziellen Kennzeichnung von Waren, Barcode oder

Wenn es sich um zeitlich geplottete Frequenzlinien handelt, wird Spectrum .

EDIT1

Wenn in elektromagnetischen Wolken oder Gaschromatographen die Stärken linear auf der Frequenzskala aufgetragen werden, kann man auch Spektrum sagen .

Narasimham
quelle
3
Hallo, willkommen auf der Seite. Leider beantwortet dies die Frage nicht, da die Linien in Barcodes oder Spektren nicht "die Verteilung einiger Proben in einem Bereich anzeigen", wie in der Frage angegeben.
Juho Kokkala
4
@JuhoKokkala Ich stimme teilweise nicht zu. In der Industrie verwendete Barcodes stimmen nicht überein, aber der Begriff Barcode-Plot wurde verwendet, um diese Art von Plot für reale Daten anzugeben. Ebenso qualifizieren sich spektroskopische Daten mit Sicherheit auch als Daten. Ich würde mich nicht an den Wortlaut des OP halten, da er "Samples" und "Sample Values" verwechselt.
Nick Cox
2
Teppichgrundstück ist am nächsten, da stimme ich zu. Man nennt es aber auch einen Barcode-Plot. Das Strichcode-Diagramm weist jedoch häufig eine Linienstärke oder eine Schattierung / Transparenz auf, um die Dichte von nahe gelegenen Werten anzuzeigen. Wir verwenden diese Art von Plot mit DNA-Daten häufig, um Orte von Merkmalen zu markieren.
Dianne Cook
0

Ich habe das gleiche Problem: Wie heißt der "Barcode" wie die Visualisierung für True / False-Daten

Mein Ziel ist es, eine Liste von wahr / falsch-Arrays darzustellen, die einem Array von Wörtern an einer festen Stelle im Array entsprechen. Wie die Darstellung des "Lichtspektrums", um die Assorption einer bestimmten Lichtwelle zu identifizieren

Ich habe auf Vega den Strip Plot gefunden

https://vega.github.io/vega-lite/examples/tick_strip.html

Ich denke, dass für mein Ziel ein besserer Name ist, um meine Visualisierungsidee darzustellen

Domenico M.
quelle