Ich habe gehört (leider kann kein Link zu einem Text angegeben werden, was mir gesagt wurde), dass eine hohe positive Kurtosis von Residuen für genaue Hypothesentests und Konfidenzintervalle problematisch sein kann (und daher Probleme mit statistischen Schlussfolgerungen). Ist das wahr und wenn ja, warum? Würde eine hohe positive Kurtosis von Residuen nicht darauf hinweisen, dass sich die Mehrheit der Residuen in der Nähe des Residuenmittelwerts von 0 befindet und daher weniger große Residuen vorhanden sind? (Wenn Sie eine Antwort haben, versuchen Sie bitte, eine Antwort mit wenig detaillierter Mathematik zu geben, da ich mathematisch nicht sehr geneigt bin).
13
Antworten:
Für einige Arten von Hypothesentests ist es wahr.
Nein.
Es sieht so aus, als würden Sie das Konzept der Varianz mit dem der Kurtosis in Einklang bringen. Wenn die Varianz kleiner wäre, würde eine Tendenz zu mehr kleinen Residuen und weniger großen Residuen zusammenkommen. Stellen Sie sich vor, wir halten die Standardabweichung konstant, während wir die Kurtosis ändern.
Vergleichen Sie verschiedene Varianzen (aber die gleiche Kurtosis):
mit unterschiedlicher Kurtosis aber gleicher Varianz:
(Bilder von diesem Beitrag )
Ein hoher Kurtosis ist in vielen Fällen mit mehr kleinen Abweichungen vom Mittelwert zugeordnet ‡ - mehr kleinen Residuen als mit einer normalen Verteilung finden würdest .. aber die Standardabweichung auf dem gleichen Wert zu halten, müssen wir auch mehr haben große Residuen (weil mehr kleine Residuen den typischen Abstand zum Mittelwert verringern würden). Um mehr von den großen und den kleinen Residuen zu erhalten, haben Sie weniger Residuen mit "typischer Größe" - solche, die ungefähr eine Standardabweichung vom Mittelwert entfernt sind.‡
Eine höhere Kurtosis geht mit größeren Residuen einher, auch wenn Sie die Varianz konstant halten.
[Außerdem kann die Konzentration kleiner Residuen in einigen Fällen zu einem größeren Problem führen als der zusätzliche Anteil der größten Residuen - je nachdem, was Sie sich ansehen.]
Schauen wir uns ein Beispiel an. Betrachten Sie einen T-Test mit einer Stichprobe und eine Stichprobengröße von 10.
Wenn wir die Nullhypothese ablehnen, wenn der Absolutwert der t-Statistik größer als 2,262 ist, wenn die Beobachtungen unabhängig und identisch von einer Normalverteilung verteilt sind und der hypothetische Mittelwert der wahre Populationsmittelwert ist, lehnen wir den Nullwert ab Hypothese 5% der Zeit.
Betrachten Sie eine bestimmte Verteilung mit einer wesentlich höheren Kurtosis als die Normalverteilung: 75% unserer Bevölkerung beziehen ihre Werte aus einer Normalverteilung und die restlichen 25% beziehen ihre Werte aus einer Normalverteilung mit einer 50-mal so großen Standardabweichung.
Wenn ich richtig gerechnet habe, entspricht dies einer Kurtosis von 12 (eine überschüssige Kurtosis von 9). Die resultierende Verteilung ist viel höher als die normale und hat schwere Schwänze. Die Dichte wird mit der normalen Dichte unten verglichen - Sie können den höheren Peak sehen, aber Sie können den schwereren Schwanz im linken Bild nicht wirklich sehen, deshalb habe ich auch den Logarithmus der Dichten aufgezeichnet, der sich über den unteren Teil von erstreckt das Bild und komprimiert die Oberseite, wodurch es einfacher ist, sowohl die Spitze als auch die Schwänze zu sehen.
(Sie werden auch einen wesentlichen Effekt auf die Abdeckung der Konfidenzintervalle sehen.)
Beachten Sie, dass sich eine andere Verteilung mit derselben Kurtosis unterschiedlich auf das Signifikanzniveau auswirkt.
Warum sinkt die Ablehnungsrate? Dies liegt daran, dass der schwerere Schwanz zu einigen großen Ausreißern führt, was sich geringfügig stärker auf die Standardabweichung auswirkt als auf den Mittelwert. Dies wirkt sich auf die t-Statistik aus, da es zu mehr t-Werten zwischen -1 und 1 führt, wodurch der Anteil der Werte im kritischen Bereich verringert wird.
Lass mich dir zeigen. Hier ist ein Beispiel von Größe 10:
Machen Sie jetzt den größten Wert 50:
Klar, wir ziehen den Mittelwert nach oben, also sollte er einen noch größeren Unterschied anzeigen als zuvor, oder? Nun, nein, das tut es nicht. Die t-Statistik geht zurück . Es ist jetzt 1.106 und der p-Wert ist ziemlich groß (nahe 30%). Was ist passiert? Nun, wir haben den Mittelwert hochgezogen (auf 7,257), aber die Standardabweichung ist über 15 gestiegen.
Standardabweichungen sind für Ausreißer etwas empfindlicher als für Mittelwerte. Wenn Sie einen Ausreißer eingeben, tendieren Sie dazu, die Ein-Stichproben-T-Statistik in Richtung 1 oder -1 zu verschieben.
Wenn die Wahrscheinlichkeit besteht, dass mehrere Ausreißer auftreten, geschieht dasselbe, nur dass sie manchmal auf entgegengesetzten Seiten liegen (in diesem Fall ist die Standardabweichung noch größer, während sich die Auswirkung auf den Mittelwert im Vergleich zu einem Ausreißer verringert), so die t-Statistik nähert sich tendenziell 0 an.
Ähnliches gilt für eine Reihe anderer gängiger Tests, bei denen von Normalität ausgegangen wird. Eine höhere Kurtosis ist in der Regel mit schwereren Schwänzen verbunden, was zu mehr Ausreißern führt. Dies bedeutet, dass die Standardabweichungen im Verhältnis zu den Mittelwerten zunehmen und die Unterschiede, die Sie aufgreifen möchten, tendenziell zunehmen durch den Einfluss der Ausreißer auf den Test "überflutet" zu werden. Das heißt, geringer Stromverbrauch.
quelle
Kurtosis misst Ausreißer. Ausreißer sind problematisch für die Standardinferenzen (z. B. t-Tests, t-Intervalle), die auf der Normalverteilung basieren. Das ist das Ende der Geschichte! Und es ist wirklich eine ziemlich einfache Geschichte.
Der Grund, warum diese Geschichte nicht sehr geschätzt wird, ist, dass der uralte Mythos, dass Kurtosis "Peakedness" misst, weiterhin besteht.
Hier ist eine einfache Erklärung, warum Kurtosis Ausreißer und nicht "Peakedness" misst.
Betrachten Sie den folgenden Datensatz.
0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 1
Kurtosis ist der erwartete Wert der (z-Werte) ^ 4. Hier sind die (z-Werte) ^ 4:
6,51, 0,30, 5,33, 0,45, 0,00, 0,30, 6,51, 0,00, 0,45, 0,30, 0,00, 6,51, 0,00, 0,30, 0,00, 27,90, 0,00, 0,30, 0,45
Der Durchschnitt liegt bei 2,78, und das ist eine Schätzung der Kurtosis. (Subtrahieren Sie 3, wenn Sie übermäßige Kurtosis wünschen.)
Ersetzen Sie nun den letzten Datenwert durch 999, damit er zu einem Ausreißer wird:
0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 999
Hier sind die (z-Werte) ^ 4:
0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 360,98
Der Durchschnitt liegt bei 18,05, und das ist eine Schätzung der Kurtosis. (Subtrahieren Sie 3, wenn Sie übermäßige Kurtosis wünschen.)
Es ist klar, dass nur die Ausreißer eine Rolle spielen. Nichts über den "Peak" oder die Daten in der Nähe der Mitte ist von Bedeutung.
Wenn Sie statistische Standardanalysen mit dem zweiten Datensatz durchführen, sollten Sie mit Problemen rechnen. Die große Kurtosis macht Sie auf das Problem aufmerksam.
Hier ist ein Papier, das ausgearbeitet wird:
Westfall, PH (2014). Kurtosis as Peakedness, 1905 - 2014. RIP The American Statistician, 68, 191–195.
quelle
Kurtosis zeigt auch asymmetrische Schwänze an. Bei einem zweiseitigen Hypothesentest ist ein Schwanz ein langer Schwanz und der andere ein kurzer Schwanz. Einer der Schwänze kann> alpha, aber <beta sein. Ein Schwanz würde den p-Wert überschreiten, der andere nicht.
Grundsätzlich geht die statistische Inferenz von einer Standardnormalen aus. Wenn dies kein normaler Standard ist, können Sie mit einer Inferenz auskommen, die auf einer ausgefeilteren Inferenzmechanik basiert. Sie können möglicherweise auf Poisson schließen, aber mit einer Verteilung, die nicht normal ist, können Sie keine auf Normalen basierenden Schlüsse ziehen.
Schrägstellung und Kurtosis sind ein Maß für die Nichtnormalität. Wir lernen, Mittel zu nehmen und Normalverteilungen zu verwenden, bevor wir wissen, dass wir auf Normalität testen müssen. Für eine Norm sind 36 oder mehr Datenpunkte aus jeder Dimension erforderlich. Sie können auf 20 Datenpunkte schätzen, haben aber immer noch einen Versatz und eine Kurtosis. Wenn sich die Verteilung der Normalität nähert, verschwinden die Verzerrung und Verteilung.
Eine der Erklärungen definierte Kurtosis als Peakedness. Ein anderer tat es nicht. Dies ist ein ungeklärter Kampf zu diesem Zeitpunkt. Kurtosis ist der vierte Moment, ein Bereich. Ich bin auf dem Höhepunkt des Problems.
Eine andere Idee, die es gibt, ist, dass sich der Median mit einem Versatz zu dem Modus beugt, der ein Dreieck bildet. Genießen.
quelle