Sollte ich eine diskrete oder kontinuierliche Skala zum Färben eines Chloroplethen verwenden?

8

Ich mache mit D3 ein Choroplethen für ein bevorstehendes lokales Rennen . Es gibt zwei Kandidaten, die sich für eine Wahl bewerben. Wenn der rote Kandidat für ein bestimmtes Polygon auf meiner Karte mehr Stimmen hat, sollte die Farbe rot sein. Wenn der blaue Kandidat mehr Stimmen hat, sollte die Farbe blau sein. Wenn der blaue Kandidat viel gewinnt, sollte die Farbe ein tieferes Blau sein. Wenn der rote Kandidat viel gewinnt, sollte die Farbe ein tieferes Rot sein.

Sollte ich dafür eine diskrete oder kontinuierliche Skala verwenden? Das heißt, sollte ich für eine bestimmte Sättigung oder Intensität eine Farbrampe von Rot nach Blau erstellen? Oder sollte ich Bins so erstellen, dass dem Polygon eine von wenigen Farben zugewiesen wird, wenn Rot / Blau in einen bestimmten Bereich fällt? Aus Tutorials geht hervor, dass die meisten Leute Mülleimer herstellen.

cartography symbology visualisation d3 choropleth bernie2436
quelle

Suchen Sie auch im Thema bivariate Farbkartografie / Karten, falls Sie weitere Ideen zu Ihrer gewählten Technik wünschen.

Martin F

Ausgewogene Daten (zwei Kategorien, eine Zunahme in einer impliziert notwendigerweise eine Abnahme in der anderen) können als eine einzige Variable verstanden werden. Da bei vielen Wahlen die überwiegende Mehrheit der Stimmen für zwei Kandidaten gilt (selbst wenn mehr als zwei Kandidaten im Rennen sind), ist eine Zunahme für einen eine Abnahme für einen anderen. Daher muss dies nicht unbedingt als bivariate Karte betrachtet werden.

Lee Hachadoorian

13

Jede Vorgehensweise hat Vor- und Nachteile. Um es kurz zu machen, ich würde empfehlen, "Behälter" zu erstellen. Ein paar Hinweise zur Auswahl und zum Entwerfen von Choroplethen im Allgemeinen:

Eine direkte Zuordnung des Datenwerts zur Farbe (eine "nicht klassifizierte" Karte) könnte als die genaueste Methode zur Anzeige der Daten angesehen werden. Klassifizierte Karten (Karten mit "Bins") können jedoch aus mehreren Gründen besser lesbar sein.

Wenn Sie eine nicht klassifizierte Karte verwenden und die Daten verzerrt sind oder der Datensatz Ausreißer enthält, werden die Ausreißer deutlich hervorgehoben, während viele der Polygone farblich sehr ähnlich sein können. Dies würde die Tatsache hervorheben, dass einige Bereiche sich radikal von anderen unterscheiden (in Ihrem Fall, wenn einige Bereiche einen Kandidaten gegenüber den anderen Bereichen deutlich stärker bevorzugen als die meisten anderen Bereiche), es jedoch schwieriger ist, die Beziehungen innerhalb dieser Bereiche zu unterscheiden der Rest des Kartenbereichs.

In einer klassifizierten Karte sollte jede Klasse visuell unterschiedlich sein, sodass leicht zu erkennen ist, wo sich ein Bereich in den Daten befindet, wobei einige der feineren Unterscheidungen verloren gehen.

Ein weiteres Problem besteht darin, dass die Wahrnehmung der Farbintensität nicht streng linear ist. Wenn Sie also eine Farbrampe von Weiß nach Blau hatten, die keinem Kandidaten entspricht, der mehr Stimmen für den maximalen Vorsprung für einen Kandidaten erhält, wird die Farbe, die 75% des Weges zwischen Weiß und Blau beträgt, möglicherweise nicht als 75% der Farbe wahrgenommen Weg zwischen den beiden Farben, und daher würde der Kartenbenutzer eine falsche Annahme darüber machen, welchen Datenwert er darstellt.

Bei klassifizierten Karten hingegen kann die Farbe jeder Klasse sorgfältig ausgewählt werden, um klar und deutlich wahrgenommen zu werden. Ich weiß nicht genug, um eine Reihe von Farben zu entwerfen, die dies tun, aber Cynthia Brewer und Mark Harrower tun dies und sie haben colorbrewer2.org erstellt , ein großartiges (kostenloses) Tool, mit dem Kartografen gute Farbschemata für ihre Karten auswählen können. Sie können aus einer Vielzahl von Schemata auswählen, die Anzahl der Klassen auswählen und eine Vorschau des Schemas in der Praxis sowie der RBG-, HEX- oder CMYK-Werte für jede Farbe im Schema anzeigen. Sehr nützlich und macht einfach Spaß.

Aus diesen Gründen würde ich empfehlen, eine klassifizierte Karte zu erstellen. Die empfohlene Anzahl von Klassen ist normalerweise eine ungerade Anzahl von 5-9 oder so. Die Verwendung einer ungeraden Zahl ergibt einen eindeutigen Durchschnittswert, und diese Anzahl von Klassen wird im Allgemeinen als ausreichend angesehen, um nützliche Unterscheidungen in den Daten zu treffen, jedoch nicht zu viele, um nicht mehr zu unterscheiden. Da Sie ein divergierendes Farbschema verwenden (helle Farbe in der Mitte, zwei verschiedene Farben an jedem Ende), können Sie mit mehr Klassen davonkommen, vielleicht 7-9.

Gehen Sie zu Colorbrewer, wählen Sie "divergent" für die Art Ihrer Daten, wählen Sie das Farbschema von Rot nach Blau, wählen Sie die Anzahl der Klassen und los geht's!

Für vieles davon gibt es keine harte Regel. Der Standard lautet: "Kommuniziert die Karte die Daten gut?" Es kann eine gute Sache sein, mit Parametern herumzuspielen, bis Sie etwas bekommen, das "funktioniert".

Nun ein Hinweis zur Herstellung von Choroplethen. Ich entschuldige mich, wenn dies ein vertrauter Grund für Sie ist:

Ein interessanter Punkt bei der Verwendung einer klassifizierten Karte ist die Aufteilung der Daten in Klassen. Ist es in gleichen Abständen entlang der Reichweite gebrochen? Ist jeder Klasse eine bestimmte Anzahl von Datenpunkten zugeordnet? Eine bestimmte Anzahl von Standardabweichungen vom Mittelwert? Ist es bei "natürlichen" Datenbrüchen kaputt? Welche Methode Sie verwenden, hängt davon ab, wie Daten dargestellt werden. Ich bin kein großer Programmierer und ich bin mir nicht sicher, welche Methode das Skript verwendet, mit dem Sie verknüpfen. "Natürliche Pausen" sind normalerweise eine gute Wahl. Für Daten mit einem klaren Mittelpunkt wie Abfragedaten (der Mittelpunkt ist eine 50/50-Aufteilung) können Standardabweichungen hilfreich sein.

Bei der Herstellung eines Choroplethen empfiehlt es sich, Daten zu verwenden, die über eine Flächeneinheit standardisiert sind. Anstatt die Gesamtbevölkerung in einem Landkreis zu verwenden, ist es beispielsweise besser, die Bevölkerung pro Quadratmeile in jedem Landkreis abzubilden. Der Grund dafür ist, dass in einem größeren Bereich tendenziell mehr Personen als in einem kleineren Bereich leben. Wenn Sie also durch den Bereich jeder zugeordneten Einheit dividieren, werden Trends genauer dargestellt. Daten können auch in Prozent standardisiert werden. Zum Beispiel eher eine Armutsquote als eine Reihe von Menschen in Armut.

Für Ihre Zwecke ist es aufschlussreicher, den Prozentsatz der abgegebenen Stimmen für einen Kandidaten abzubilden, als die rohe Anzahl der abgegebenen Stimmen für diesen Kandidaten.

Wie auch immer, ich hoffe, einiges davon ist nützlich und Ihre Karte wird gut!

Für einen Großteil dieser Diskussion habe ich mich auf die thematische Kartographie und Geovisualisierung von Slocum et al.

bakern
quelle

Die diskreten Pro-Kopf-Farbkarten der NYT sind heutzutage ziemlich schrecklich. So viele Details gehen verloren, weil ihre Farbfächer idiotisch riesig sind. Ich denke, es ist definitiv ein Beispiel, wo eine kontinuierliche Farbskala verwendet werden sollte.

Andy

(die Coronavirus-Karten also)

Andy

5

Sie sprechen einen von vielen Aspekten der Symbolisierung an : die Darstellung quantitativer Werte über eine variable Farbdarstellung - unter Verwendung einer diskreten oder kontinuierlichen Skala der Farbsättigung oder -intensität. Gute Frage. Die Antwort ist, wie oft, es kommt darauf an ...

Die traditionelle thematische Kartographie erkennt an, dass Karten als vereinfachte Modelle der Realität Produkte einer großen Verallgemeinerung sind. Der Einfachheit halber, Mengen werden in Klassen eingeteilt (Bins) - und es gab viele Diskussionen über nur gewesen , wie viele solcher Klassen dort sein sollte (5 oder 7 wurden oft propagiert). Die Vorteile: Mit herkömmlichen fotomechanischen Methoden viel einfacher zu konstruieren und die Botschaft leichter zu vermitteln. Schauen Sie, hier wird Red Ken bevorzugt, während dort drüben Blue Peter ist.

Moderne thematische Kartographie ermöglicht es, Karten von weit näher , wo kontinuierlichen Mengen können durch Farbskalen von sehr hohen Bereichen dargestellt werden. Die Vorteile: objektiver und detaillierter. Kartenleser können die Quelldaten möglicherweise genauer neu erstellen.

Was ist der tiefere Zweck Ihrer Karte?

Möchten Sie objektiver sein und die detaillierten Variationen der Daten untersuchen? Verwenden Sie die kontinuierlichen Farbskalen. Dieses Konzept "Karte als Untersuchungswerkzeug" enthält (neue) Namen wie "Datenvisualisierung" und "Wärmekartierung".

Möchten Sie eine einfache Geschichte erzählen? Verwenden Sie diskrete Farbskalen. Dies ist "Karte als Kommunikationsmittel".

Da Ihre Karte räumlich bereits stark in Abstimmungsbereiche verallgemeinert ist, kann ich vorschlagen, als Kompromiss kontinuierliche Farbskalen zu verwenden - Sie haben räumliche Diskretisierung, aber statistische Kontinuität. Nur eine Idee.

Letztendlich liegt es an Ihnen. Warum nicht mit ein paar Variationen experimentieren?

Martin F.
quelle

Ich denke, wenn die Geschichte der Visualisierung mit modernen Computern begonnen hätte, anstatt billig mit einer begrenzten Anzahl von Tintenfarben zu drucken, wären die Menschen eher geneigt, kontinuierliche Farbskalen zu verwenden.

Andy

1

Ich sehe zwei Optionen:

a) Sie verwenden nur Behälter: (Zahlen sind nur ein Beispiel)

Kandidat Rot hat> 50% - 70% der Stimmen -> Farbe hellrot
Kandidat Rot hat> 70% der Stimmen -> Farbe ist tiefrot
für blau entsprechend

b) Sie verwenden eine Farbrampe.

Kontinuierliche Farbverstärkung von hellrot / blau bis tiefrot / blau mit einer kontinuierlichen Zuordnung von Werten von> 50% bis 100% zu hellen Farben bis tiefrot / blau.

Was Sie ausgewählt haben, hängt davon ab, was Sie mit der Karte kommunizieren möchten. Wenn die Informationen "gewinnt" und "gewinnt um xy%" ausreichen, wählen Sie a). Wenn Ihre Leser in der Lage sein sollten, anhand der Anzahl der führenden Kandidaten für Rot oder Blau zu schätzen, wählen Sie b)

Chris P.
quelle

Sollte ich eine diskrete oder kontinuierliche Skala zum Färben eines Chloroplethen verwenden?

Antworten: