Wie berechnet man den abgeschnittenen oder abgeschnittenen Mittelwert?

8

Wie kann ich den abgeschnittenen oder abgeschnittenen Mittelwert berechnen? Sagen wir um 10% abgeschnitten?

Ich kann mir vorstellen, wie es geht, wenn Sie 10 Einträge oder so haben, aber wie kann ich es für viele Einträge tun?

Queops
quelle
1
Sollte dies als beschnitten anstatt abgeschnitten markiert werden?
Ich würde sagen, dass entweder en.wikipedia.org/wiki/Truncated_mean ausreicht .
Queops

Antworten:

19

Der getrimmte Mittelwert beinhaltet das Trimmen von Prozent-Beobachtungen von beiden Enden.P

Beispiel: Wenn Sie aufgefordert werden, einen um 10% getrimmten Mittelwert zu berechnen, ist .P=10

Angesichts einer Reihe von Beobachtungen hat :Xi

  1. Finden Sie zuerst = Anzahl der Beobachtungen.n
  2. Ordnen Sie sie als "Bestellstatistik" vom kleinsten zum größten neu an. Xi
  3. Finden Sie Kleinbuchstaben = Anteil getrimmt.p=P/100
  4. Berechne .np

Wenn eine ganze Zahl ist, verwenden Sie und schneiden Sie Beobachtungen an beiden Enden ab. npk=npk

R = verbleibende Beobachtungen = .n2k

Beschnittener Mittelwert =(1/R)(Xk+1+Xk+2++Xnk).

Beispiel : Finden Sie 10% getrimmten Mittelwert von

2, 4, 6, 7, 11, 21, 81, 90, 105, 121

Hier ist was eine ganze Zahl ist. Trimmen Sie also genau eine Beobachtung an jedem Ende, da . Schneiden Sie also 2 und 121 ab. Wir haben Beobachtungen.n=10,p=0.10,k=np=1k=1R=n2k=102=8

10% getrimmter Mittelwert = (1/8) * (4 + 6 + 7 + 11 + 21 + 81 + 90 + 105) = 40,625

Wenn in ein Bruchteil vorhanden ist, ist der getrimmte Mittelwert etwas komplizierter. Wenn wir im obigen Beispiel einen um 15% getrimmten Mittelwert wollten, ist . Dies hat den ganzzahligen Teil 1 und der Bruchteil 0,5 ist vorhanden. . Somit bleiben Beobachtungen erhalten.P = 15 , p = 0,15 , n = 10 , k = n p = 1,5 R = n - 2 k = 10 - 2 1,5 = 10 - 3 = 7 R = 7npP=15,p=0.15,n=10,k=np=1.5R=n2k=1021.5=103=7R=7

Nachtrag zu @ whubers Kommentar: Um unvoreingenommen zu bleiben (nach dem Entfernen von 2 und 121), müssen wir anscheinend die Hälfte der 4 und die Hälfte der 105 entfernen, um einen getrimmten Mittelwert von(4/2+6+7+11+21+81+90+105/2)/7=38.64

Quelle: Klassennotizen zum um P Prozent getrimmten Mittelwert

Mehper C. Palavuzlar
quelle
@Mehper Welche drei Beobachtungen würden Sie im letzten Beispiel entfernen? Natürlich die 2 und die 121, aber was noch? Um unvoreingenommen zu bleiben, müssen Sie anscheinend die Hälfte der 4 und die Hälfte der 105 entfernen, um einen getrimmten Mittelwert von (4/2 + 6 + 7 + 11 + 21 + 81 + 90 + 105/2) / 7 = 34,64
whuber zu erhalten
@Mehper: Nur zu Ihrer Information, Sie können Mathematik formatieren, indem Sie den TeX-Ausdruck zwischen $ -Zeichen schreiben. Eg$X_i$
nico
@whuber: Danke für deinen Kommentar, ich habe deinen Kommentar zur Antwort hinzugefügt; @nico: Danke, dass du mich über die TeX-Formatierung informiert hast. Ich habe versucht, die Antwort im TeX-Format zu aktualisieren, konnte sie jedoch nicht gut verwalten. Könnten Sie mir bitte einen Link geben, der erklärt, wie man den TeX-Stil in Posts verwendet? Ich habe keine Erfahrung in TeX.
Mehper C. Palavuzlar
1
@Mehper: Google "TeX Manual" und treffen Sie Ihre Wahl. Ich mag die "sanfte Einführung", weil sie nützliche, lesbare Tabellen enthält: tex.ac.uk/tex-archive/info/gentle/gentle.pdf
whuber
1
@Mepher: klar, los geht's! mathjax.org/help/user (Beachten Sie, dass ein Kontextmenü mit dieser Seite verknüpft ist, wenn Sie mit der rechten Maustaste auf eine mathematische Formel klicken.) Sie können auch MathML anstelle von TeX verwenden (wenn Sie sehr mutig sind: P).
Nico
5

Wenn zusätzlich zu der obigen Antwort viele Einträge vorhanden sind (z. B. n), dauert das erste Sortieren diese Zeit O (n log n). Es gibt jedoch eine zeitlineare Lösung.

  1. Berechnen Sie das P-Quantil L und das (1-P) -Quantil U. Hierfür gibt es einen einfachen (Quicksort-ähnlichen) Algorithmus, der in der erwarteten linearen Zeit abläuft. Es gibt auch einen komplizierteren Algorithmus, der im schlimmsten Fall eine lineare Zeit ausführt. Beides findet sich zum Beispiel in: Cormen, Leiserson, Rivest, Stein: Einführung in die Algortithmen.

  2. Scannen Sie alle Werte und addieren Sie diese zwischen L und U. Dies dauert offensichtlich linear.

  3. Wenn es Bindungen gibt und die berechneten Quantile mehrmals zwischen den Werten existieren, haben wir möglicherweise zu viele oder zu wenige Werte hinzugefügt und müssen dies möglicherweise entsprechend korrigieren. Da wir wissen, wie viele Zahlen wir in Schritt 2 hinzugefügt haben und wie oft wir L und U gesehen haben, kann dies in konstanter Zeit erfolgen.

  4. Teilen Sie die Gesamtsumme durch die Anzahl der Summanden.

Beachten Sie, dass sich das obige Rezept nur lohnt, wenn n wirklich groß ist und das Sortieren aller Rezepte ein Leistungseinbruch wäre, vielleicht ein paar Millionen.


quelle