Bedeutet Mean = Median, dass eine unimodale Verteilung symmetrisch ist?

19

Wenn für eine unimodale Verteilung der Mittelwert = Median ist, ist es dann ausreichend zu sagen, dass die Verteilung symmetrisch ist?

Wikipedia sagt in Beziehung zwischen Mittelwert und Median:

"Wenn die Verteilung symmetrisch ist, ist der Mittelwert gleich dem Median und die Verteilung hat eine Schiefe von Null. Wenn die Verteilung außerdem unimodal ist, ist der Mittelwert = Median = Modus. Dies ist der Fall eines Münzwurfs oder des Serie 1, 2, 3, 4, ... Beachten Sie jedoch, dass das Gegenteil im Allgemeinen nicht zutrifft.

Es ist jedoch nicht ganz einfach (für mich), die benötigten Informationen zu sammeln. Hilfe bitte.

Kaka
quelle

Antworten:

27

Hier ist ein kleines Gegenbeispiel, das nicht symmetrisch ist: -3, -2, 0, 0, 1, 4 ist unimodal mit mode = median = mean = 0.

Bearbeiten: Ein noch kleineres Beispiel ist -2, -1, 0, 0, 3.

Wenn Sie sich eine Zufallsvariable anstelle einer Stichprobe vorstellen möchten, nehmen Sie die Unterstützung als {-2, -1, 0, 3} mit einer Wahrscheinlichkeitsmassenfunktion von 0,2 für alle Variablen mit Ausnahme von 0 für 0,4.

Silberfisch
quelle
6
Ich glaube, -2, -1, 0, 0, 3 ist das "kleinste" diskrete Gegenbeispiel: Wir brauchen zwei gleiche Werte, um einen Modus zu erstellen. Das Hinzufügen eines dritten unterschiedlichen Werts würde den Mittelwert-Median verhindern, und ein vierter Wert kann nur den Wert wiederherstellen Mittelwert, der dem Median entspricht, indem die Symmetrie wiederhergestellt wird. Ich vermute auch, dass diese Zahlen die "kleinsten" (nahe 0) möglichen ganzen Zahlen sind, da 3 die kleinste ganze Zahl ist, die wir als Summe von zwei verschiedenen ganzen Zahlen schreiben können. Unterscheidung ist von entscheidender Bedeutung, da der Versuch von -1, -1, 0, 0, 2 nicht mehr unimodal wäre! Natürlich können wir skalieren und übersetzen, um einen neuen Datensatz mit dieser Eigenschaft zu erhalten.
Silverfish
19

Dies begann als Kommentar, wurde aber zu lang; Ich beschloss, es eher zu einer Antwort zu machen.

EINBBEIN

Ich möchte auf einige zusätzliche Fragen eingehen und hier bereits einige ausführliche Antworten geben, die zum Teil im Zusammenhang stehen.

  1. Die Aussage auf der Wikipedia-Seite, die Sie zitieren, ist auch nicht unbedingt wahr. Betrachten Sie zum Beispiel die Cauchy-Verteilung, die zwar symmetrisch zum Median ist, aber keinen Mittelwert hat. Die Anweisung benötigt ein Qualifikationsmerkmal wie "sofern der Mittelwert und die Schiefe vorhanden sind". Auch wenn wir es auf die schwächere Aussage in der ersten Hälfte des ersten Satzes reduzieren, braucht es immer noch "vorausgesetzt, der Mittelwert existiert".

  2. Ihre Frage steht teilweise in Konflikt mit der Symmetrie ohne Versatz (ich gehe davon aus, dass Sie einen Versatz im dritten Moment beabsichtigen, aber eine ähnliche Diskussion könnte für andere Versatzmaße geschrieben werden). Eine Neigung von 0 bedeutet keine Symmetrie. Der spätere Teil Ihres Zitats und der von Alexis zitierte Abschnitt aus Wikipedia erwähnen dies, obwohl die im zweiten Zitat gegebene Erklärung einige Optimierungen gebrauchen könnte.

Diese Antwort zeigt, dass die Beziehung zwischen Schiefe des dritten Moments und der Richtung der Beziehung zwischen Mittelwert und Median schwach ist (Schiefe des dritten Moments und Schiefe des zweiten Pearson müssen nicht übereinstimmen).

Punkt 1. zu dieser Antwort gibt ein diskretes Gegenbeispiel, das dem von Silverfish ähnelt, sich jedoch von diesem unterscheidet.

Edit: Ich habe endlich das unimodale Beispiel ausgegraben, nach dem ich früher gesucht habe.

In dieser Antwort erwähne ich die folgende Familie:

124exp(-x1/4)[1-αSünde(x1/4)]

α=0α=12

Bildbeschreibung hier eingeben

(Graue Linien zeigen die um die x-Achse gekippte blaue Dichte, um die Asymmetrie zu verdeutlichen.)

Whuber gibt ein weiteres Beispiel hier mit Null Schiefe, die einem kontinuierlichen, unimodal und asymmetrisch sind. Ich habe sein Diagramm reproduziert:

Fortlaufende Beispiele

Das zeigt das Beispiel und das gleiche umgedreht über den Mittelwert (um die Asymmetrie deutlich zu zeigen), aber Sie sollten das Original lesen, das eine Menge nützlicher Informationen enthält.

[Whubers Antwort hier gibt eine weitere asymmetrische kontinuierliche Familie von Verteilungen mit den gleichen Momenten. Das Gleiche zu tun "Wähle zwei, drehe eine und nimm eine 50: 50-Mischung" hat das gleiche Ergebnis von Asymmetrie mit allen ungeraden Momenten Null, aber ich denke, es gibt hier keine unimodalen Ergebnisse (obwohl es vielleicht einige Beispiele gibt). ]

Die Antwort hier diskutiert die Beziehung zwischen Mittelwert, Median und Modus.

Diese Antwort diskutiert Hypothesentests der Symmetrie.

Glen_b - Setzen Sie Monica wieder ein
quelle
Danke vielmals. Ihr Verweis auf stats.stackexchange.com/questions/56511/… war tatsächlich der Grund für die oben gestellte Frage.
Kaka
8

Nein.

Ist die Verteilung zusätzlich unimodal, so ist der Mittelwert = Median = Modus.

In der gleichen Weise, wie "Wenn das Tierbaby ein Huhn ist, dann ist sein Ursprung ein Ei", bedeutet dies nicht, dass "Wenn der Ursprung ein Ei ist, dann ist das Tierbaby ein Huhn".

Aus demselben Wikipedia-Artikel:

In Fällen, in denen ein Schwanz lang ist, der andere Schwanz jedoch fett, folgt die Schräglage keiner einfachen Regel. Beispielsweise gibt ein Nullwert an, dass sich die Schwänze auf beiden Seiten des Mittelwerts ausgleichen, was sowohl für eine symmetrische Verteilung als auch für asymmetrische Verteilungen gilt, bei denen sich die Asymmetrien ausgleichen, z andere sind kurz, aber fett.

Alexis
quelle
1
Beachten Sie, dass Sie im unimodalen symmetrischen Fall (einfach zu konstruierende Beispiele) mean = meadian = point mit minimaler (0) Dichte haben können!
kjetil b halvorsen
2

Interessante und leicht verständliche Beispiele stammen aus der Binomialverteilung.

×=

            1        2
    +-------------------+
  1 |       0   .32768  |
  2 |       1    .4096  |
  3 |       2    .2048  |
  4 |       3    .0512  |
  5 |       4    .0064  |
  6 |       5   .00032  |
    +-------------------+

Der Statuscode für diese Anzeige war mata : (0..5)' , binomialp(5, (0..5), 0.2)'und ist vermutlich in jeder erwähnenswerten Statistiksoftware so einfach oder einfacher.

In psychologischer Hinsicht und nicht in logischer Hinsicht kann dieses Beispiel nicht überzeugend als pathologisch (wie bei anderen Problemen auch) oder als bizarres oder triviales Beispiel abgetan werden zum Beispiel die von @Silverfish oder 0, 0, 1, 1, 1, 3) beschriebenen erfundenen Daten.

Nick Cox
quelle