Ich bin in der Statistik keineswegs gut, aber ich glaube, ich bin an der richtigen Stelle. Meine Frage ist einfach:
Mein Problem besteht darin, die Bevölkerung mehrerer Staaten in einem kleinen Land zu vergleichen, aber einige Staaten haben eine Bevölkerung von 3000.000 und einige eine Bevölkerung von 2.000.
Ich male es auf eine Karte, und die "Intensität" der Farbe hängt davon ab, wie die Bevölkerung jedes Staates mit der Bevölkerung des ganzen Landes verglichen wird.
Das Problem ist, dass die Staaten mit viel Bevölkerung mit sehr intensiven Farben dargestellt werden und die kleinen Staaten kaum Farbe haben.
Gibt es eine einfache Möglichkeit, die Daten zu "normalisieren" oder vergleichbar zu machen?
Ich weiß nicht, ob ich mich richtig erkläre, aber ich hoffe, jemand kann mir helfen. Bitte kommentieren Sie, wenn meine Frage nicht klar ist und ich klären werde.
Danke für deine Hilfe!
quelle
Antworten:
Es tut mir leid, aber für mich klingt es so, als würden Sie versuchen, das zu reparieren, was nicht kaputt ist. In der Tat könnten Sie sogar versuchen, das zu brechen, was nicht kaputt ist. Wenn Sie eine quantitative Variable (hier Population) haben, die einen weiten Bereich abdeckt, sollte jede Metrik, die Sie zur Darstellung verwenden, auch einen weiten Bereich umfassen.
Aber für alle Dinge, die mit Farbe (und insbesondere Karten) zu tun haben , ist die Hauptquelle meiner Meinung nach ColorBrewer
quelle
Gute Frage, eine Lösung besteht darin, die Farben neu zu skalieren, um sie gleichmäßiger zu verteilen, oder auf eine Verteilung mit niedrigeren Schwänzen ... aber dann muss Ihre Legende klar genug sein, weil es irgendwie unfair ist, die Skala zu verformen ...
Zum Beispiel in R das Skalieren einer Normalen in eine Uniform. (Was du hast, geht vielleicht eher in die andere Richtung, da du große Schwänze hast und sie kleiner haben willst, aber das Prinzip ist dasselbe)
quelle
Sie könnten durch die Gesamtbevölkerung teilen. Dies würde sicherstellen, dass alles zwischen 0 und 1 liegt. Wenn die Skalen immer noch zu unterschiedlich sind, ziehen Sie eine Protokollskala in Betracht.
quelle
Es ist mir unangenehm, das zu fragen, aber sind Sie wirklich entschlossen, Farbe zur Darstellung einer quantitativen Menge zu verwenden? Gibt es keine Möglichkeit, in jedem Zustand einen Balken zu platzieren, dessen Höhe die Menge darstellt?
Eine andere Möglichkeit könnte darin bestehen, die Karte mit Gebieten anzuzeigen, die die geografischen Gebiete darstellen, zusammen mit einer Karte, auf der das Gebiet jedes Staates proportional zur Bevölkerungsgröße ist - ähnlich wie es der sensorische Homunkulus tut. Aber das wäre eine schmerzhafte Menge an Zeichnen - ich kenne keine Möglichkeit, das zu automatisieren (obwohl es existieren könnte)
quelle
Ihr erklärtes Ziel:
Ihr angegebenes Problem:
Ziel ist es, Ihre Daten vor dem Mapping zu normalisieren
Diese Antwort wird fehlen, da ich nicht sicher bin, warum Sie die Karte erstellen.
Dennoch sind hier einige Gedanken zu beachten: Normalisieren Sie Ihre Daten so, dass die Karte den potenziellen Lesern der Karte eine interessante Bedeutung bietet, damit sie das, was sie auf Ihrer Karte sehen, mit einem Konzept verknüpfen können, über das sie normalerweise nachdenken. Grundsätzlich denke ich, dass Ihre neuen normalisierten Zahlen mit einem qualitativen Konzept verknüpft sein sollten, das für die Kartenleser interessant zu verstehen ist (zufälliger Leckerbissen: Maß = Quantität x Qualität, Hegel).
Zwei vorgeschlagene Möglichkeiten zur Normalisierung Ihrer Daten
1. Um ein Gefühl dafür zu geben, wie viel Freiraum sich in jedem Zustand befindet.
Erstellen Sie eine neue Zustandsvariable für die Bevölkerungsdichte, indem Sie die Bevölkerung geteilt durch die gesamte Staatsfläche berechnen.
2. Um die Färbung der Zustände kontrastieren zu lassen.
Erstellen Sie eine neue Zustandsvariable, indem Sie die Abweichung vom Mittelwert jedes Zustands berechnen. Angenommen, Sie haben drei Bundesstaaten mit folgenden Bevölkerungsgruppen:
Der Mittelwert liegt bei etwa 50.
Die Werte der neuen Variablen für jeden Status lauten wie folgt:
Sie können jedes Farbschema verwenden, bei dem positive Zahlen im Gegensatz zu negativen Zahlen stehen (Google 'Colorbrewer' für viele Beispiele für Farbschemata für Karten).
quelle