Wann würden wir Tantiles und das Medial anstelle von Quantiles und dem Median verwenden?

14

Ich kann auf Wikipedia oder Wolfram Mathworld keine Definitionen für Tantile oder Medial finden, aber die folgende Erklärung findet sich in Bílková, D. und Mala, I. (2012), " Anwendung der L-Moment-Methode bei der Modellierung der Einkommensverteilung in der Tschechischen Republik ", Austrian Journal of Statistics , 41 (2), 125–132.

Das Medial ist der Wert eines (Stichproben-) Tantils, genau wie der Stichprobenmedian dem Wert eines 50 % -Stichprobenquantils entspricht . Probentantile sowie Probenquantile basieren auf einer bestellten Probe. Zunächst werden kumulative Beobachtungssummen in der bestellten Stichprobe ausgewertet. Dann wird für einen gegebenen Prozentsatz p , 0 < p < 100 , ein p % -Tantil als der Wert der analysierten Variablen definiert, der alle Beobachtungen in der geordneten Stichprobe in zwei Teile unterteilt: Die Summe kleinerer oder gleicher Beobachtungen ist p %.50%50%p0<p<100p%p%von der Gesamtsumme der Beobachtungen und der Summe der Beobachtungen, die größer sind, stellen die restlichen dieser Summe dar.(100p)%

Wann ist es sinnvoll, diese als Maß für die Position zu verwenden, anstatt den konventionelleren Median oder andere Quantile zu verwenden? Eine mögliche Situation, das Haushaltseinkommen, wird in diesem Papier angegeben:

Aus dieser Definition lässt sich ableiten, dass das Medial als angemessenes Merkmal für die Höhe des Einkommens herangezogen werden kann, da Haushalte mit einem niedrigeren oder gleichem Medial die Hälfte des Gesamteinkommens in der Stichprobe erhalten, diejenigen mit einem höheren Einkommen als das mediale Empfangen der anderen Hälfte.

In diesem Fall betrug das mittlere Haushaltseinkommen 117.497 CZK (dh die Hälfte der Haushalte, die mehr verdienten als dieses und die Hälfte der Haushalte, die darüber verdienten), verglichen mit einem mittleren Haushaltseinkommen von 133.930 CZK (Haushalte mit einem Einkommen über diesem Wert erhalten die Hälfte davon) Gesamteinkommen). Beachten Sie, dass dieser Vergleich nicht unbedingt die Schiefe des Haushaltseinkommens oder sogar seine Uneinheitlichkeit widerspiegelt: Selbst wenn das Haushaltseinkommen gleichmäßig verteilt wäre, würde das Medial immer noch über dem Median liegen. Soweit ich die Definition verstehe, würde das Medial nur dann dem Median entsprechen, wenn alle Haushalte das gleiche Einkommen erhielten.

Gibt es also einen besonderen Grund, das Medial in diesem Fall vorzuziehen oder zumindest als ergänzende Maßnahme zu verwenden? Was genau sagt uns der Vergleich zwischen Median und Medial? Es scheint nicht, dass das Medial aus den gerade erwähnten Gründen direkt mit anderen Maßstäben der zentralen Tendenz vergleichbar ist. Gibt es andere Situationen, in denen medial / tantiles weit verbreitet sind oder als besonders informativ angesehen werden? Praktische Beispiele für ihre Verwendung mit Musterrecherchen wären sehr willkommen, und eine intuitive Vorstellung des weiteren Kontexts, in dem sie sich als nützlich erweisen könnten, wäre noch besser.

Es muss erforderlich sein, dass Summen und Zwischensummen aussagekräftig sind - etwas, was für Geld relevant erscheint und wie "der Kuchen" verteilt ist -, aber selbst der Akt der Addition ist nur für bestimmte Mengen von Bedeutung. Bei intensiven und nicht umfangreichen Eigenschaften wie Dichte oder Temperatur wäre jede Art von Summierung physikalisch nicht sinnvoll. Ich halte ein umfangreiches Grundstück für notwendig, aber nicht ausreichend, um Tantiles zu unterstützen, da ich mir einen Schifffahrtsanalysten vorstellen kann, der daran interessiert ist, wie hoch der Grenzwert für das beförderte Frachtgewicht ist, sodass 50% der gesamten Fracht (nach Gewicht) sind Ich kann mir keinen Ökologen vorstellen, der daran interessiert ist, wie lang Molche sind, dass 50% der Gesamtlänge aller Molche von Molchen dieser Länge oder mehr stammen.

Silberfisch
quelle
3
@ NickCox Soweit ich weiß, gibt der Median einen Cut-Off-Wert an, bei dem ungefähr die Hälfte der Haushalte mehr als den Cut-Off und die Hälfte der Haushalte weniger als den Cut-Off erhalten (ich ignoriere das Bindungsproblem vollständig). Das Medial gibt einen anderen Cutoff an, sodass das Gesamteinkommen der Haushalte, die mehr als den Cutoff erhalten, 50% des gesamten Einkommens ausmacht, während das Gesamteinkommen der Haushalte, die weniger als den Cutoff erhalten, 50% des gesamten Einkommens ausmacht.
Silberfischchen
2
Ein Hut-Tipp: Ich wurde neugierig, nachdem @ttnphns eine meiner vorherigen Fragen kommentiert hatte . Mittelwerte (arithmetisch, geometrisch, harmonisch, aktiv, exponentiell, kombinatorisch usw.) sind "analytische Mittelwerte". Median, Quantile, Tantile sind "Positionsmittelwerte".
Silverfish
4
Vielen Dank; Ich habe das falsch verstanden und schätze die Korrektur. Ich würde von "Summe der Beobachtungen" zu "Summe der Werte" umformulieren, da "Summe der Beobachtungen" für mich der "Anzahl der Beobachtungen" zu nahe kommt. Oder vielleicht greife ich nach einer Ausrede ... Es sollte eine Verbindung zu Lorenzkurven geben. Die Maßnahme erscheint nur dann sinnvoll, wenn die betreffende Variable fiktiv additiv oder umfangreich ist. Sir David Cox betont oft, wie wichtig es ist, ob Variablen umfangreich sind. Daher ist es inhaltlich sinnvoll, das Gesamteinkommen, den Gesamtniederschlag, nicht jedoch das Gesamteinkommen oder die Gesamttemperatur zu berücksichtigen.
Nick Cox
2
@ NickCox Ich denke, Extensivität ist ein ausgezeichneter Punkt (und Ihre vorgeschlagene Neuformulierung wäre meiner Meinung nach auch eine Verbesserung gewesen), obwohl es mir so vorkommt, dass eine umfangreiche Eigenschaft notwendig ist, aber nicht ausreicht, damit Tantiles hilfreich sind. Es erscheint plausibel, dass wir uns beispielsweise dafür interessieren, welches Gewicht der beförderten Fracht der Grenzwert ist, sodass 50% der gesamten Fracht (nach Gewicht) in Ladungen ab diesem Gewicht befördert werden. aber ich kann mir nicht vorstellen, interessiert zu sein, wie lang der Molch ist, so dass 50% der Gesamtlänge aller Molche von Molchen dieser Länge oder mehr beigesteuert werden.
Silberfischchen
1
In der Praxis stimme ich zu, aber ich glaube nicht, dass das Prinzip betroffen ist. Die Antwort auf "Aber das wäre nicht interessant oder nützlich" muss nicht immer eine Darstellung des mathematischen oder statistischen Prinzips sein. es gibt auch Raum für "Dann mach es nicht!".
Nick Cox

Antworten:

3

p=0.5Xf(x)μ=EXμ=xf(x)dx

G(t)=txf(x)dx
tG(t)=μ/2

Ist diese Interpretation richtig? War das so gemeint?

Um auf die ursprüngliche Frage zurückzukommen: Im Kontext einer Einkommensverteilung ist der Tantil der Wert des Einkommens, sodass die Hälfte des Gesamteinkommens für Personen mit einem höheren Einkommen und die Hälfte des Gesamteinkommens für Personen mit einem niedrigeren Einkommen gilt.

EDIT

G(t) oben) stehen im Zusammenhang mit verschiedenen Risikomaßnahmen, die in einigen Finanzliteraturen verwendet werden, wie z. B. dem "erwarteten Fehlbetrag".

G(t)t

Ein anderer Begriff für diese Idee ist "Teilerwartung". Siehe zum Beispiel /math/1080530/the-partial-expectation-mathbbex-xk-for-an-alpha-stable-distributed-r und benutze google!

X>0

Fk(x)=1EXk0xtkf(t)dt
kG(t)=μF1(t)F1FF0. In Bezug auf die Erstmomentverteilung kann die Lorenzkurve als angegeben werden
{(u,L(u))}={(u,v):u=F(x),v=F1(x);x0}

kjetil b halvorsen
quelle
1
Vielen Dank für die Hinzufügung - ich werde mich ein wenig um das Aussehen kümmern müssen!
Silverfish