Ich analysiere die Verteilung der Netzwerklatenz. Die mittlere Upload-Zeit (U) beträgt 0,5 s. Die mittlere Downloadzeit (D) beträgt 2s. Die mittlere Gesamtzeit (für jeden Datenpunkt T = U + D) beträgt jedoch 4 s.
Welche Schlussfolgerungen könnten gezogen werden, wenn man weiß, dass der Median der Summe viel größer ist als die Summe der Mediane der Addenden?
Was würde es aus Neugier für Statistiken bedeuten, wenn diese Frage den Median durch den Durchschnitt ersetzen würde?
random-variable
median
summations
David Faux
quelle
quelle
Antworten:
Mediane sind nicht linear, daher gibt es eine Vielzahl von Umständen, unter denen so etwas (dhmedian(X1)+median(X2)<median(X1+X2) passieren kann ).
Es ist sehr einfach, diskrete Beispiele zu konstruieren, in denen so etwas vorkommt, aber es ist auch in kontinuierlichen Situationen üblich.
Zum Beispiel kann es bei verzerrten kontinuierlichen Verteilungen vorkommen - bei einem schweren rechten Schwanz sind die Mediane möglicherweise beide klein, aber der Median der Summe wird "hochgezogen", weil es eine gute Chance gibt, dass es eine gibt groß ist, der beiden Werte höher ist Der Median liegt normalerweise weit darüber, sodass der Median der Summe größer ist als die Summe der Mediane.
Hier ist ein explizites Beispiel: Nehmen Sie . Dann habenX1undX2den Medianlog(2)≈0,693,so dass die Summe der Mediane kleiner als1,4 ist, aberX1+X2∼Gamma(2,1),der den Median≈1,678 hat(tatsächlich-W-1(-1X1,X2∼i.i.d.Exp(1) X1 X2 log(2)≈0.693 1.4 X1+X2∼Gamma(2,1) ≈1.678 nach Wolfram Alpha)−W−1(−12e)−1
quelle