Effektives Anzeigen demografischer Daten auf einer gedruckten Karte

29

Ich möchte die folgenden Daten pro Zone (insgesamt 30 Zonen) auf einer druckbaren / nicht interaktiven Karte darstellen:

  • Durchschnittsalter
  • Durchschnittliches Haushaltseinkommen
  • Anzahl der Haushalte
  • Bevölkerungsdichte
  • Anzahl der Personen
  • Anzahl der Arbeiter

Wie würden Sie die oben genannten 6 Ebenen effektiv auf einer Karte anzeigen?

dassouki
quelle
1
Wie groß sind die Zonen im Verhältnis zur Seitengröße? Können Sie in jede Zone ein kleines Grundstück einbauen? (zB eine Radarkarte)
djq
@celenius -Es ist ein typischer Zensus-Umfragetyp, bei dem die Innenstadtzonen viel kleiner sind als die
Wohnzonen,
1
Diese 6 Ebenen auf einer statischen Karte sind eine schwierige Konstruktionsaufgabe. Was ist das Problem, das die Verwendung einer interaktiven Karte verhindert?
Trevesy
@ Trevesy - zum größten Teil ist die Anforderung, eine druckbare Karte zu entwerfen, die die 6 Variablen hervorhebt, um die visuelle Analyse zu fördern
dassouki
1
Ich habe mir erlaubt, das Visualisierungs-Tag hinzuzufügen. Sie können es jederzeit entfernen, wenn Sie der Meinung sind, dass es unangemessen ist.
Andy W

Antworten:

20

Ich würde sagen, dass Sie nicht alle diese Daten auf einer Karte aufnehmen können und es keinen Sinn macht. Ich würde empfehlen, dass Sie nach dem Prinzip der kleinen Vielfachen von Tufte denken und mehrere kleinere Karten desselben Gebiets verwenden, die jeweils eine andere Variable verwenden. Beispiel: http://www.juiceanalytics.com/writing/better-know-visualization-small-multiples/

Selbst dann haben Sie das Problem, dass Sie eine Reihe von verschiedenen Einheiten verwenden, so dass Sie einen Schlüsselbund benötigen. Eine andere Möglichkeit, die Daten anzuzeigen (aber nicht in einer Karte), wäre die Verwendung einer Tabelle mit allen Werten in Farbe (dh - verschiedene Farben für unterdurchschnittlich, durchschnittlich, überdurchschnittlich).

Wir empfehlen Ihnen auch, den Volkszählungsatlas zu Rate zu ziehen, um weitere Kartenvorschläge zu erhalten: http://www.census.gov/population/www/cen2000/censusatlas/

Könnte helfen, genauer zu reflektieren, welche Nachricht Sie kommunizieren möchten (nicht nur welche Daten Sie haben).

neuhausr
quelle
5
+1 Dies ist weitaus besser als ein Durcheinander, indem versucht wird, sechs Variablen gleichzeitig zu symbolisieren. Warum nicht auch eine Tabelle der Daten ausdrucken? Sechs Spalten + ID, 30 Zeilen: Es ist ausreichend klein und bietet alle Details, die jeder benötigen würde.
whuber
13

Es ist nicht möglich, so viele Daten auf einer einzelnen Karte effizient darzustellen. Zwei Möglichkeiten:

  • Produziere 6 Karten,

  • Analysieren Sie Ihre Daten, um Ihre Regionen zu klassifizieren und das Ergebnis der Klassifizierung anzuzeigen. Eine Hauptkomponentenanalyse kann helfen , die wichtigsten Zusammenhänge innerhalb Ihrer Variablen zu bestimmen. Diese Methode wurde verwendet, um diese synthetische Karte zu erstellen:

Alt-Text

von diesen:

Alt-Text Alt-Text

julien
quelle
Das Problem mit 6 Karten ist, dass es schwierig ist, Trends visuell zu bestimmen. Manchmal ist es schön, sich eine Karte mit mehreren Variablen anzuschauen und zu sehen, wie sich die Dinge entwickeln
dassouki 20.12.10
2
@dassouki, um zu sehen, wie sich die Dinge aneinanderreihen, müssen Sie sie nicht unbedingt zuordnen. Bivariate Streudiagramme würden diese Kriterien erfüllen und wären viel einfacher zu interpretieren.
Andy W
3
Der Vorteil von 6 Karten besteht darin, dass Trends einfach visuell identifiziert werden können! Wenn Sie versuchen, sechs (oder mehr) Variablen in einer einzelnen Karte zusammenzufassen, kann es schwierig werden, Muster zu finden. (Wenn diese Karte Tausende von Funktionen enthalten würde, würde ich diese Bemerkung jedoch ändern: Bestimmte Arten der Zuordnung, wie die Glyphenvisualisierung , können bemerkenswert effektiv sein, um Muster in multivariaten Datensätzen zu finden: lmi.bwh.harvard.edu/papers/papers/ KindlmannTVCG2006.html )
whuber
@julien, Cool stuff, können Sie in diesem Artikel interessiert sein Ich kam gerade über, e-publications.org/ims/submission/index.php/AOAS/user/... , hat es Karten mit den dazugehörigen PCA Analyse ähnlicher multivariaten Daten sowie R-Code, um die Plots zu machen.
Andy W
Wirklich interessant, ich muss darüber nachlesen.
Neuhausr
9

Ich bin damit einverstanden, dass kleine Vielfache wahrscheinlich ein guter Weg sind, um dieses Problem anzugehen. Zur Ergänzung der Karte würde ich auch eine Streudiagramm-Matrix Ihrer Variablen vorschlagen, die bivariate Korrelationen identifiziert. Während Sie den geografischen Aspekt Ihrer Daten verlieren, ist es viel einfacher, die Beziehungen zwischen Variablen in einem Streudiagramm zu visualisieren, als zwei Karten (sogar nebeneinander) zu vergleichen.

Wenn Sie weiterhin räumliche Trends erfassen möchten, können Sie räumliche Statistiken (z. B. das lokale Moran-I) zwischen den Verteilungen und / oder den ursprünglichen Variablen einfügen.

Bearbeiten: Ich bin kürzlich auf eine Arbeit gestoßen, die die von Andre-Michel Guerry (ursprünglich 1883) veröffentlichten Moralstatistiken überarbeitet und die darauf abzielt, multivariate Beziehungen im Raum zu visualisieren. Die Implementierungen dieser Autoren ähneln den in diesem Thread vorgeschlagenen, kleinen Vielfachen, Hauptkomponentenanalyse, Streudiagramm-Matrizen und Polygondiagrammen. Anbei einige Bilder von A.-M. Guerrys Moralstatistik von Frankreich: Herausforderungen für die multivariable räumliche Analyse von: Michael Friendly Statistical Science, Vol. 22, No. 3. (August 2007), S. 368-399 (Das PDF ist kostenlos). Auch ein anderer Artikel ( Dray und Jombart, 2010 ) analysiert die gleichen Daten und enthält einen Quellcode in R, um die Diagramme zu erstellen.

Ein Bild ist eine Streudiagramm-Matrix, das andere ist ein so genanntes Sternendiagramm (eine andere Art, Balkendiagramme wie von Pablo vorgeschlagen darzustellen). Alt-Text Alt-Text

Andy W
quelle
8

Hier ist ein wunderbares Beispiel für kleine Multiples, die auf Andrew Gelmans (und Firmenblogs) Statistical Modeling, Causal Inference und Social Science veröffentlicht wurden . Die Karte dient der Unterstützung der Wähler für Schulgutscheine durch den Staat, abhängig vom Einkommen und verschiedenen Rassen- und Religionskategorien. Weiße Nicht-Evangelikale mögen keine Schulgutscheine! (Wenn Sie zum aktuellen Blog gehen, obwohl er in den Umfragedaten von 2004 enthalten ist, werden Schulgutscheine in dieser Gruppe besser unterstützt.) Bildbeschreibung hier eingeben

Andy W
quelle
Die Grafik ist cool, aber die Farbskala ist schrecklich. Warum ist 50% so priorisiert, indem es grau dargestellt wird? Sicherlich sollte es nur Heatmap-Farben verwenden, oder so? Warum sind nur die Weißen in Religion gespalten? Sicherlich wäre es sinnvoller, sich nach Rasse und dann nach Religion zu trennen.
Naught101
@ naught101, ich bin ein bisschen durch deine Negativität verwirrt. Sicherlich ist grau deemphasized im Vergleich zu den helleren oder dunkleren Farben an jedem Ende des Spektrums. Während ich die willkürlich abweichenden Werte von 45% nicht kenne, ist es bei der Erstellung kleiner Mehrfachkarten wie dieser von Vorteil, sehr kontrastreiche Werte zu haben. Der Kommentar zu den Religions- / Rassensplits macht auch bei der IMO wenig Sinn. Dies sind Kategorien , die offensichtlich stark davon abhängen, ob eine Person Gutscheine unterstützt, und es scheint, dass einige der von Ihnen vorgeschlagenen Untergruppen nicht existieren. Fortsetzung ...
Andy W
IE Ich bezweifle sehr, dass es in der Umfrage genug "Schwarze Katholiken" gibt, um etwas Bestimmtes über eine solche Gruppe zu sagen (oder "Hispanic Non-Evang Protestants") die Untergruppen
Andy W
Vielleicht ist es nur das bestimmte Grau, das auf meinem Bildschirm hervorsteht. Ich denke, es wäre besser mit Weiß und vielleicht einem grauen Hintergrund, um es zu unterscheiden. Erwähnenswert ist auch, dass die beiden Bilder auf Gelmans Blog unterschiedliche Maßstäbe haben ... Ich hatte den Eindruck, dass die schwarze Bevölkerung viel höher war, aber ich habe mir nur die Volkszählungsdaten angesehen und stand korrigiert. Eine seltsame Sache ist jedoch, dass die Volkszählung den hispanischen Ursprung als orthogonal zur Rasse definiert (es ist eine separate Frage). Ich denke, Gelmans Unterscheidungen sind unterschiedlich definiert.
naught101
@ Naught101 Dies sind keine Informationen aus der Volkszählung, es ist aus einer anderen Umfrage (Volkszählung hat keine öffentliche Meinung dazu)
Andy W
5

Um zwischen den hier vorgestellten Lösungen zu wählen, können Sie zwei wichtige Informationen eingeben:

  • Was ist der Zweck der Karte? (Entdecken, aussetzen?)
  • Was ist die Zielgruppe der Karte? (Sie, Analystenkollegen, Stadtplaner, Öffentlichkeit?)

Die hier genannten Lösungen können je nach Zweck und Publikum unterschiedlich effizient sein.

Ich möchte die Antwort von Julien (eine synthetische Karte mittels einer PCA) verallgemeinern, indem ich die von J. Bertin beschriebene Technik der Matrixdiagonalisierung zitiere. Es ist nützlich, wenn man nach einer Synthese aller Informationen sucht und nicht nach einer vollständigen Datenpräsentation.

Kurz gesagt, besteht es darin, jede Variable mit einem Histogramm darzustellen, die Histogramme so zu stapeln, dass die Werte (die Kartenzonen) diagonal ausgerichtet sind, um eine Typologie zu erhalten:

Alt-Text

(Quelle: http://books.google.com/books?id=2tlQAAAAMAAJ&dq=bertin%20graphique%20information&hl=fr&source=gbs_similarbooks )

Laurent Jégou
quelle
4

Das sind viele Informationen, und es ist eine Tatsache, dass eine einzelne Karte, die alle auf thematische Weise kombiniert, zu einer nutzlosen Präsentation führen würde, da die Sicht verschmutzt ist. Andererseits gibt es 30 Zonen, so dass viele Karten für jede Zone ebenfalls zu Umweltverschmutzung führen würden.

Meine Lösung: Wählen Sie die wichtigsten Informationen aus, sagen wir 'Haushaltseinkommen', und unterteilen Sie die Karte in einige Einkommenskategorien. Und schließlich zeichnen Sie für jede Einnahmequelle einen Balkenchat mit den anderen 5 Attributen auf.

Mit dieser Karte lassen sich einige Vergleiche anstellen, beispielsweise: "Gebiete mit hohem Einkommen weisen immer eine große Anzahl von Arbeitnehmern und ein Durchschnittsalter von mehr als 21 Jahren auf".

Schau dir das Beispiel an...

Alt-Text

Pablo
quelle
4

Vielleicht könnten einige dieser Ideen helfen?

Angenommen, Sie haben sechs Dimensionen:

1: Choroplethen : Haushaltseinkommen Beispiel 0

2, 3 und 4: Symbole : Stellen die Anzahl der Personen als Punkte dar, damit Sie den Hintergrund sehen können: Beispiel 1, Beispiel 2 mit Graustufen für Arbeiter / Nichtarbeiter und einem anderen Farbschema, um das Alter anzuzeigen

5: 3D : Bevölkerungsdichte als Geländebeispiel verwenden 3

6: (Mir fällt kein 6. Weg ein!)

Ist es überflüssig, die Anzahl der Haushalte, die Bevölkerungsdichte und die Anzahl der Personen anzugeben?

Ich wäre skeptisch, wenn jemand außer Ihnen eine Karte mit dieser Komplexität erkennen würde. Wenn ich es präsentierte, zeigte ich jedes Element zuerst separat und fügte es dann hinzu, damit das Publikum die Schritte verstehen kann.


Eine alternative Möglichkeit (wenn Sie nicht für jede Zone Platz für eine Radar-Grafik haben, können Sie einen „Glyphen“ erstellen, der dieses Informationsbeispiel 4 darstellt, Abb. 10.28 . Ich denke, diese sind normalerweise schwer zu verstehen und nicht einfach zu entwerfen klar, aber das verknüpfte Beispiel könnte in diesem Fall verwendet werden.


Ein anderer Gedanke, den ich hatte, wäre, die Polygone für jedes Polygon auf die gleiche Höhe zu extrudieren und dann einen Abschnitt der Höhe zu verwenden, um diese Parameter darzustellen. Ähnlich wie beim Erstellen eines Balkendiagramms für jeden Bereich, wobei jedoch jeder Abschnitt in ähnlichen Abständen übereinander gelegt wird. Dies müsste aus 3D betrachtet werden, was bedeuten würde, dass ein Teil davon verdeckt wäre.

djq
quelle
Ich liebe und meine alle Ihre Vorschläge. Ich plane die Implementierung von 1-> 4. Aber für das 3D-Zeug: Ich finde, wenn man 3D-Karten macht, werden Innenstädte, die normalerweise zentral liegen, zum größten Teil von der Höhe
erfasst
@dassouki - dem stimme ich normalerweise zu. Vielleicht könnten Sie eine Variable verwenden, die für diesen Zweck keinen großen Bereich hat (Durchschnittsalter?), Oder Sie könnten sie logarithmisch transformieren, wenn dies der Fall ist.
20.12.10
3
@celenius Interessante Frage zu möglicher Redundanz: Bevölkerungsdichte ist die Anzahl der Menschen im Verhältnis zur Fläche ; Anzahl der Personen ist eine absolute Zahl; und die Anzahl der Haushalte gibt Auskunft darüber, wie Menschen zusammenleben. Obwohl diese drei Variablen eindeutig miteinander zusammenhängen (und bei Regressionen zu Kollinearitätsproblemen führen können), handelt es sich bei ihnen tatsächlich um drei verschiedene Informationen. Übrigens ist es "Choroplethen". (Glücklicherweise erkennt Google diesen Tippfehler und führt die beabsichtigte Suche trotzdem durch.)
whuber
1
@whuber - Ich denke, es ist wahrscheinlich mit Flash gemacht (leider!).
20.12.10
2
Ich bin sehr misstrauisch über den Vorschlag von 3D. AFAIK niemand hat gezeigt, 3D ist sehr brauchbar. Die Verbindung zum Verbrechen von San Fran funktioniert jedoch nur, weil es sehr einfach ist - ein komplexeres Muster wäre schwer zu entschlüsseln. Ich glaube nicht, dass 3D in diesem Fall der richtige Weg ist.
Trevesy
2

Es ist eine herausfordernde Aufgabe. Meine Antwort ist, mit einer multivariaten Karte zu gehen. Schauen Sie sich diese Karte an . Die Karte sieht ausgelastet aus, wenn Sie alle Variablen auf einer Karte anzeigen. Stellen Sie sicher, dass Sie das richtige Farbschema auswählen, wenn Sie sich für eine multivariate Karte entscheiden.

Raj
quelle
Google
Text
hat auch nicht funktioniert und ich kann es nicht kratzen, wenn es am Ende keine Dateierweiterung hat
dassouki
Immer noch nicht los ....
dassouki
Das ist ein Block von meiner Seite. :( Ich habe nichts dagegen, Ihnen die Karte per E-Mail zu senden.
Raj
0

Ein Grad der Vereinfachung würde darin bestehen, ein Element wie die Bevölkerungsdichte durch ein Kartogramm auszudrücken, dh die Fläche jeder Einheit so zu verzerren, dass sie im Verhältnis zur Bevölkerung steht:

US-Präsidentschaftswahl 2008
(Quelle: amherst.edu )

Der Hauptnachteil ist, dass der Betrachter in der Lage sein muss, die Verzerrung der Zonen von ihren "üblichen" Formen zu erkennen.

Weitere Informationen finden Sie hier: http://gis.amherstma.gov/data/SpringNearc2009/Session4Cartograms.pdf

Andy
quelle
1
Ich denke, das hat Potenzial, aber es ist unklar, wie gut Kartogramme auf diese spezielle Situation angewendet werden können (wenn mehrere Attribute gleichzeitig auf demselben Raum angezeigt werden). Sie könnten theoretisch viele kleine Mehrfachkartogramme erstellen, aber es ist möglicherweise schwierig zu interpretieren (Sie verlieren die Konsistenz zwischen den Karten, was für kleine Mehrfachkarten von wesentlicher Bedeutung ist). Vielleicht kann das Kartogramm auf interessantere Weise mit Farbe kombiniert werden, um mehrere Attribute anzuzeigen.
Andy W
1
Ein Beispiel für kleine Mehrfachkartogramme, gisandscience.com/2011/12/07/…
Andy W