Definition von "Perzentil"

11

Ich lese jetzt einen Hinweis zur Biostatistik von PMT Education und beachte die folgenden Sätze in Abschnitt 2.7:

Ein Baby, das im 50. Massenperzentil geboren wurde, ist schwerer als 50% der Babys.
Ein Baby, das im 25. Massenperzentil geboren wurde, ist schwerer als 75% der Babys.
Ein Baby, das im 75. Massenperzentil geboren wurde, ist schwerer als 25% der Babys.

Aber wie ich weiß, sollte ein Baby, das im 25. Perzentil für Masse geboren wurde, schwerer sein als 25% der Babys. Gibt es in diesem Bereich eine spezielle Definition von "Perzentil" oder verstehe ich die Sätze als Nicht-Muttersprachler falsch?

wwtian
quelle
1
Du hast das richtig verstanden. Insbesondere in der Biomedizin folgen Perzentildeskriptoren der Grundidee von links nach rechts. Ich habe in der Vergangenheit mit Menschen von der WHO zusammengearbeitet und gesagt: " Ein Baby, das im 75. Perzentil der Masse geboren wurde, ist schwerer als 25% der Babys. " Würde sie wahrscheinlich glauben lassen, ich sei statistisch Analphabet.
usεr11852 sagt Reinstate Monic

Antworten:

17

Während die von Stephen Kolassa gegebene Definition von Perzentilen in der statistischen Theorie technisch korrekt ist (die beste Art von richtig?), Ist dies ein Problem, bei dem es in der Praxis große Unterschiede gibt - einige Leute bezeichnen Perzentile mit dem höchsten Perzentil als das Maximum, aber andere drehen es um, so dass das höchste Perzentil das Minimum ist. Im letzteren Fall wird manchmal davon gesprochen, dass sich jemand im 5. Perzentil befindet, wenn er sich in den oberen fünf Prozent und nicht im unteren befindetfünf Prozent. Manchmal sagen sie dies explizit (z. B. befindet sich John Smith im oberen 5. Perzentil für die Kugelstoßenentfernung), aber manchmal geben sie dies nicht klar an. Aus diesem Grund ist es immer wichtig, mit dem Leser / Sprecher zu klären, in welcher Richtung sie die Perzentile definieren. (In Ermangelung gegenteiliger Spezifikationen sollten sie wirklich die statistische Standarddefinition verwenden.)

Außerdem stimme ich Stephen in einem Punkt nicht zu. Ich bezweifle, dass dies ein Tippfehler ist. Wahrscheinlicher ist, dass der Verfasser des Dokuments einfach von Perzentilen im zweiten Sinne spricht, den ich beschrieben habe, der zwar technisch nicht korrekt ist, aber dennoch recht häufig vorkommt. Ich betrachte dies nicht wirklich als "Fehler", sondern als eine nicht standardmäßige Verwendung des Begriffs, die entschuldbar ist, wenn sie erklärt wird. Hier ist eine beispielhafte für die umgekehrte Verwendung von "Perzentilen" in einem Artikel über das Einkommensniveau im Wall Street Journal . (Die meisten Fälle der Umkehrung der Prozentsätze treten im Zusammenhang mit Diskussionen über das Vermögen / Einkommen auf. Obwohl dies viel seltener vorkommt als die technisch korrekte Verwendung, tritt es häufig genug auf, dass Sie vorsichtig sein müssen, um die Bedeutung zu überprüfen.) Hier ist einFolgefrage, in der ich Beispiele für diese umgekehrte Praxis suche.

Stellen Sie Monica wieder her
quelle
4
Das ist interessant, aber unplausibel: Wachstumskurven sind Standard. Ich habe dort noch nie eine umgekehrte Definition von Perzentilen gesehen. Siehe cdc.gov/growthcharts/who/boys_weight_head_circumference.htm das WHO - Diagramm, zum Beispiel. Daher würde ich Ihre Erklärung glaubwürdiger finden, wenn Sie einige Fälle der umgekehrten Perzentile im tatsächlichen Gebrauch zeigen könnten (vorzugsweise von einer erkennbaren Autorität und nicht nur von einem Schullehrer oder Webblogger).
whuber
2
Ich stimme @whuber zu. Ich habe die Praxis, auf die Sie sich beziehen, noch nie gesehen. "Top fünf Prozent", um sich auf jemanden mit oder über dem 95. Perzentil zu beziehen, ja, aber "am 5. Perzentil", um sich auf denselben Menschen zu beziehen, nein. Haben Sie Beispiele für diese Verwendung?
Stephan Kolassa
2
@ Stephen: Nun, Sie haben es beide mindestens einmal im zitierten Abschnitt der Frage gesehen. Das ist also ein Datenbeweispunkt für diese bestehende Praxis. Ich denke nicht, dass dies die Art von Dingen ist, die Sie wahrscheinlich in maßgeblichen Quellen sehen werden, gerade weil diese Quellen dazu neigen, die technische Bedeutung zu überprüfen. Ich habe jedoch gesehen, dass diese Umkehrung informell erfolgt (wohl aus Versehen, aber immer noch so häufig, dass es wichtig ist, sie zu überprüfen).
Stellen Sie Monica
2
In Diskussionen über Vermögen / Einkommen ist es nicht ungewöhnlich, dass sich Quellen auf die oberen X% des Vermögens / Einkommens beziehen, und in solchen Fällen ist es auch nicht ungewöhnlich, dass sie den Verweis auf die Spitze fallen lassen und einfach "die 1" sagen % "oder" die 10% ". Hier ist ein Beispiel für einen Artikel über "die globalen 1%", in dem Sie drei Absätze lesen müssen, bevor sie angeben, dass es sich um die obersten 1% handelt. Diese Umkehrung der Perzentilreferenz ist in Diskussionen über Vermögen / Einkommen ziemlich häufig.
Stellen Sie Monica
2
@ Ben: Danke. (Wenn Sie übrigens "@Stephan" und nicht "@Stephen" verwenden, werde ich benachrichtigt.) Ich gebe Ihren Standpunkt zu. Ich möchte jedoch darauf hinweisen, dass diese Verwendung normalerweise "1%" und selten "1% Perzentil " umfasst.
Stephan Kolassa
16

Dies ist nur ein Tippfehler im Dokument. Ihr Verständnis von Perzentilen ist korrekt.

Stephan Kolassa
quelle
12
Für eine breite Definition von "Tippfehler".
Akkumulation
Im Text heißt es weiter: Ein hohes Perzentil (z. B. 90. Perzentil oder höher) kann auf ein Gesundheitsproblem hinweisen. Es ist kein Tippfehler - der Autor irrt sich entweder oder verwendet aus irgendeinem Grund rückwärts gerichtete Wachstumstabellen.
JPhi1618
1
Oder obwohl dies zugegebenermaßen sehr verwirrend ist, ordnet der umgebende Kontext des Snippets das Gewicht auf einer umgekehrten Skala. Zum Beispiel benötigt das 90. Perzentil von 100-m-Läufern weniger Zeit, um 100 m zu laufen als 90% der Läufer. Der umgebende Kontext könnte eine solche Interpretation klarer machen, z. B. wenn man sich auf den Schweregrad von Untergewicht konzentriert: Der Schweregrad steigt mit abnehmendem Gewicht. Wenn der Schweregrad im Mittelpunkt steht, ist es sinnvoll, ihn nach Schweregrad (und damit umgekehrt nach Gewicht) zu sortieren. Ähnlich wie Sie Streckenläufer nach Leistung sortieren (und umgekehrt nach der Zeit, die für die Fertigstellung des Laufs benötigt wird).
Flater