Ich habe oft diskrete Datensätze als Liniendiagramme gesehen, aber mir ist aufgefallen, dass die Linie an einem Punkt zwischen den Messintervallen einen Wert ableitet, der für diskrete Datensätze bedeutungslos ist. Ist es deshalb so, dass die Verwendung von Liniendiagrammen für diskrete Daten falsch ist?
Nehmen Sie als Beispiel zwei Zeitreihendatensätze, einen kontinuierlichen (mein Gewicht, täglich morgens gemessen) und einen diskreten (die Anzahl der Donuts, die ich pro Tag esse). Es ist sinnvoll, dass der erste Datensatz ein Liniendiagramm ist, da davon ausgegangen werden kann, dass mein Gewicht an einem bestimmten Nachmittag mit meinem Gewicht am vorhergehenden und am folgenden Morgen zusammenhängt. Wenn die Anzahl der Doughnuts jedoch als Liniendiagramm dargestellt wird, kann aus den Linien zwischen den Punkten keine Bedeutung abgeleitet werden.
BEARBEITEN
Hier ist ein weiteres Beispiel: Die Darstellung des föderalen Mindestlohns seit seiner Einführung unter http://mste.illinois.edu/courses/ci330ms/youtsey/lineinfo.html
Wenn ich mich nicht irre, sind die Änderungen des Mindestlohns diskret, und daher ist es nicht möglich, eine willkürlich gewählte Zeit nachzuschlagen und den Mindestlohn an dem Punkt unter Verwendung der Verbindungslinie zwischen den Punkten festzulegen.
quelle
Antworten:
Darstellungen verbundener Linien haben sich als zu nützlich erwiesen, um sich auf eine einzige Interpretation zu beschränken. Einige prominente Anwendungen:
quelle
Nun, die Donuts könnten mit dem Gewicht zusammenhängen :-)
Obwohl ich Ihren Punkt sehe, denke ich, dass dieses Beispiel nicht so schlecht ist, weil die Zeit (auf der horizontalen Achse, auf die sich die Linien beziehen) stetig ist. Die Bedeutung der Linie ist für mich nicht so sehr, dass Sie zu jeder Tageszeit eine bestimmte Anzahl von Donuts gegessen haben, sondern dass sich die Anzahl der Donuts pro Tag regelmäßig ändert. So könnten wir der Linie so etwas wie einen Lößglätter hinzufügen, und es würde Sinn machen. Es ist zumindest vernünftig, an Donuts zu denken, die zu jeder Stunde oder sogar in jeder Minute gegessen werden (obwohl dies bei einer Variablen mit einer höheren Anzahl pro Tag sinnvoller wäre).
Noch besorgniserregender ist es, wenn die horizontale Achse diskret ist (und insbesondere wenn sie nominal ist), aber Linien gezeichnet werden. Das macht wirklich keinen Sinn. Wenn Sie sich zum Beispiel die prozentuale Wahlbeteiligung von (etwa) Einwohnern verschiedener Regionen der USA für Obama ansehen, ist es nicht sinnvoll, eine Grenze zwischen Nordosten und Mittlerem Westen zu ziehen. zumal die Reihenfolge der Regionen willkürlich ist, eine Änderung der Reihenfolge jedoch die Zeilen verändern würde. Trotzdem habe ich solche Grafiken gesehen.
quelle