Angenommen, wir haben den folgenden Datenrahmen:
TY_MAX
141 1.004622
142 1.004645
143 1.004660
144 1.004672
145 1.004773
146 1.004820
147 1.004814
148 1.004807
149 1.004773
150 1.004820
151 1.004814
152 1.004834
153 1.005117
154 1.005023
155 1.004928
156 1.004834
157 1.004827
158 1.005023
159 1.005248
160 1.005355
25th: 1.0031185409705132
50th: 1.004634349800723
75th: 1.0046683578907745
Calculated 50th: 1.003893449430644
Ich bin hier etwas verwirrt. Wenn wir das 75. Przentil erhalten, sollten 75% der Daten unter diesem Perzentil liegen. Und wenn wir das 25. Perzentil erreichen können, sollten 25% der Daten unter dem 25. liegen. Jetzt denke ich, dass 50% der Daten zwischen dem 25. und 50. liegen sollten. Und auch das 50. Perzentil gibt mir einen anderen Wert. Fair genug, was bedeutet, dass 50% der Daten unter diesem Wert liegen sollten. Aber meine Frage ist, ob mein Ansatz richtig ist?
EDIT: Und können wir auch sagen, dass 98% der Daten zwischen dem 1. und 99. Perzentil liegen werden?
quantiles
statsmodels
Don Coder
quelle
quelle
Antworten:
Ja.
Diese Zahlen sind möglicherweise nicht vollständig korrekt, insbesondere wenn Sie nur wenige Daten haben. Beachten Sie auch, dass es unterschiedliche Konventionen gibt, wie Quantile und Perzentile tatsächlich berechnet werden .
quelle
type
Argument in Rsquantile()
? Hyndman & Fan empfehlen Typ 7, der ebenfalls die Standardeinstellung ist. Um ganz ehrlich zu sein, sind die Unterschiede gering. Oder meinst du, wie viel Prozent häufig verwendet werden? Das hängt von Ihrer Bewerbung ab, wir können Ihnen dabei nicht helfen. Und je mehr Daten Sie erhalten, desto genauer werden Sie natürlich sein. Welche Genauigkeit ausreicht, hängt von Ihren Daten und Ihrer Anwendung ab.?quantile
.)Im Idealfall ja.
Perzentile werden normalerweise als Normalverteilung interpretiert (da Normalität häufig eine zugrunde liegende, manchmal nicht angegebene Annahme ist, wenn elementare statistische Kennzahlen berechnet werden). Die Verteilung muss jedoch nicht normal sein.
Laut dieser Website ...
Wenn wir also von Normalität ausgehen, können wir jedes gesuchte Perzentil leicht berechnen. Perzentile erfordern jedoch keine Verteilungsannahmen und sind an die Daten gebunden, aus denen sie berechnet werden. Dies bedeutet, dass Perzentile sowohl für normale als auch für nicht normale Verteilungen aussagekräftige Benchmarks liefern können. Sie können auch Perzentile in einer Wahrscheinlichkeitsinterpretation verwenden, natürlich basierend auf den Messungen, die Sie derzeit haben. Dies können gute oder schlechte Indikatoren für die wahre zugrunde liegende Verteilung sein.
Laut dieser Seite ...
quelle