Ich weiß, dass, wenn der Median und der Mittelwert ungefähr gleich sind, dies bedeutet, dass es eine symmetrische Verteilung gibt, aber in diesem speziellen Fall bin ich nicht sicher. Der Mittelwert und der Median liegen ziemlich nahe beieinander (nur 0,487 m / Gallonen Unterschied), was mich zu der Annahme veranlassen würde, dass es eine symmetrische Verteilung gibt, aber wenn man das Boxplot betrachtet, sieht es so aus, als ob es leicht positiv verzerrt ist (der Median ist näher an Q1 als Q3, wie bestätigt) durch die Werte).
(Ich verwende Minitab, wenn Sie spezielle Ratschläge für diese Software haben.)
Antworten:
Zweifellos wurde Ihnen etwas anderes gesagt, aber Mittelwert Median bedeutet keine Symmetrie.=
Es gibt ein Maß für die Schiefe basierend auf dem Mittelwert minus dem Median (der zweiten Pearson-Schiefe), aber es kann 0 sein, wenn die Verteilung nicht symmetrisch ist (wie bei allen gängigen Schiefheitsmaßen).
In ähnlicher Weise impliziert die Beziehung zwischen Mittelwert und Median nicht notwendigerweise eine ähnliche Beziehung zwischen der Mitte ( ) und dem Median. Sie können eine entgegengesetzte Schiefe vorschlagen, oder einer kann dem Median entsprechen, während der andere dies nicht tut.( Q1+ Q3) / 2
Eine Möglichkeit zur Untersuchung der Symmetrie besteht in einem Symmetriediagramm *.
Wenn sind die geordneten Beobachtungen vom kleinsten bis zum größten (Ordnungsstatistik), und M ist der Median, dann zeichnet ein Symmetriediagramm Y ( n ) - M gegen M - Y ( 1 ) , Y ( n - 1 ) - M gegen M - Y ( 2 )Y.( 1 ), Y( 2 ), . . . , Y( n ) M Y.( n )- M M- Y( 1 ) Y.( n - 1 )- M M- Y( 2 ) , ... und so weiter.
* Minitab kann das . In der Tat hebe ich diese Handlung als Möglichkeit hervor, weil ich sie in Minitab gesehen habe.
Hier sind vier Beispiele:
(Die tatsächlichen Verteilungen waren (von links nach rechts, erste obere Reihe) - Laplace, Gamma (Form = 0,8), Beta (2,2) und Beta (5,2). Der Code ist Ross Ihaka's, von hier )
Bei stark schwanzförmigen symmetrischen Beispielen können die extremsten Punkte oft sehr weit von der Linie entfernt sein. Sie würden weniger auf den Abstand von der Linie von einem oder zwei Punkten achten, wenn Sie sich oben rechts in der Figur befinden.
Es gibt natürlich auch andere Darstellungen (ich erwähnte die Symmetriedarstellung nicht aus einem bestimmten Sinn für Befürwortung dieser bestimmten, sondern weil ich wusste, dass sie bereits in Minitab implementiert war). Also lasst uns ein paar andere erforschen.
Hier sind die entsprechenden Skewplots, die Nick Cox in Kommentaren vorgeschlagen hat:
In diesen Darstellungen würde ein Aufwärtstrend einen typisch schwereren rechten Schwanz als einen linken anzeigen und ein Abwärtstrend würde einen typisch schwereren linken Schwanz als einen rechten anzeigen, während Symmetrie durch eine relativ flache (obwohl vielleicht ziemlich verrauschte) Darstellung angezeigt würde.
Nick schlägt vor, dass diese Handlung besser ist (speziell "direkter"). Ich bin geneigt zuzustimmen; Die Interpretation des Diagramms erscheint folglich etwas einfacher, obwohl die Informationen in den entsprechenden Diagrammen oft sehr ähnlich sind (nachdem Sie die Einheitssteigung im ersten Satz subtrahiert haben, erhalten Sie etwas, das dem zweiten Satz sehr ähnlich ist).
[Natürlich sagt uns keines dieser Dinge, dass die Verteilung, aus der die Daten stammen, tatsächlich symmetrisch ist. Wir erhalten einen Hinweis darauf, wie nahe die Stichprobe an der Symmetrie liegt, und können daher beurteilen, ob die Daten mit einer nahezu symmetrischen Grundgesamtheit in Einklang stehen.]
quelle
skewplot
(SSC). Die Idee geht zumindest auf einen Vorschlag zurück, der JW Tukey in Wilk, MB und Gnanadesikan, R. 1968, zugeschrieben wurde. Methoden zur Wahrscheinlichkeitsaufzeichnung für die Analyse von Daten. Biometrika 55: 1-17.Am einfachsten ist es, die Schiefe der Probe zu berechnen . Dafür gibt es in Minitab eine Funktion. Die symmetrischen Verteilungen haben eine Neigung von Null. Keine Schrägstellung bedeutet nicht unbedingt symmetrisch, aber in den meisten praktischen Fällen würde dies der Fall sein.
Wie @NickCox feststellte, gibt es mehr als eine Definition von Versatz. Ich verwende das, das mit Excel kompatibel ist , aber Sie können jedes andere verwenden.
quelle
Zentrieren Sie Ihre Daten um Null, indem Sie den Stichprobenmittelwert abziehen. Teilen Sie nun Ihre Daten in zwei Teile auf, den negativen und den positiven. Nehmen Sie den absoluten Wert der negativen Datenpunkte. Führen Sie nun einen Kolmogorov-Smirnov-Test mit zwei Stichproben durch, indem Sie die beiden Partitionen miteinander vergleichen. Treffen Sie Ihre Schlussfolgerung basierend auf dem p-Wert.
quelle
Ordnen Sie Ihre Beobachtungen in aufsteigenden Werten in einer Spalte an und ordnen Sie sie in absteigenden Werten in einer anderen Spalte an.
Berechnen Sie dann den Korrelationskoeffizienten (nennen Sie ihn Rm) zwischen diesen beiden Spalten.
Berechnen Sie den chiralen Index: CHI = (1 + Rm) / 2.
CHI nimmt Werte im Intervall [0..1] an.
CHI ist null, wenn und nur wenn Ihre Probe symmetrisch verteilt ist.
Keine Notwendigkeit für den dritten Moment.
Theorie:
http://petitjeanmichel.free.fr/itoweb.petitjean.skewness.html
http://petitjeanmichel.free.fr/itoweb.petitjean.html
(die meisten auf diesen beiden Seiten zitierten Artikel können dort im PDF-
Format heruntergeladen werden) Hoffe es hilft auch in letzter zeit.
quelle