Wenn man diese Grafik der New York Times über den Ort sieht, an dem gleichgeschlechtliche Paare leben , scheint es, dass die Bezirke mit der niedrigen Bevölkerung die größten Unterschiede aufweisen (zum Beispiel im Vergleich zu North Dakota und Ohio). Vermutlich ist ein Teil dieser Variation auf die geringeren Stichprobengrößen zurückzuführen. Was ist der richtige Weg, um dies anzupassen, insbesondere angesichts der Tatsache, dass dies aus Stichproben von Volkszählungsdaten stammt?
Ich habe versucht, einen Wert des Mittelwerts wie im Verhältnis zu berechnen , der unterschiedliche Stichprobengrößen berücksichtigt . Die resultierenden Werte scheinen übertrieben (-20 bis 200), und ich frage mich, ob dies daran liegt, dass ich die Anzahl der Haushalte als Stichprobengröße anstelle der Anzahl der in die Stichprobe einbezogenen Haushalte verwendet habe. Das heißt, bei der Volkszählung werden nur etwa 1% der Haushalte befragt (basierend auf einem Bericht von ~ 3 Millionen ACS-Umfragen). Daher sollte die Stichprobengröße möglicherweise 1/100 der Anzahl der Haushalte im Landkreis betragen. Die Werte werden dann um den Faktor 10 reduziert, und die Werte werden hier angezeigt (wobei das obere Ende des Bereichs immer noch abgeschnitten wird).
Die Verteilung der Proportionen ist leicht verzerrt, und ich habe sie nicht angepasst. Vermutlich sind einige der Abweichungen echte Ausreißer und keine systematische Variation.
Die NYT-Daten befinden sich in einer TSV-Datei, obwohl einige der County-Namen fehlen (verwenden Sie stattdessen die FIPS-Codes). Außerdem werden ihre Daten angepasst, um falsch codierte Umfragen zu berücksichtigen.
Ich versuche im Wesentlichen, eine Bewertung zu verwenden, die mit einem Trichterdiagramm vergleichbar ist , und hier ist, wie mein Trichterdiagramm mit den angepassten Stichprobengrößen aussieht.
Hauptfrage : Was als Stichprobengröße für diese Daten bei der Berechnung der zu verwenden istErgebnis? Grundlegende Frage: Ist dies der richtige Weg, um die Proportionen für den visuellen Vergleich zu standardisieren?