Ich habe mich gefragt, ob mir jemand mit Informationen über Kurtosis helfen könnte (dh gibt es eine Möglichkeit, Ihre Daten zu transformieren, um sie zu reduzieren?)
Ich habe einen Fragebogendatensatz mit einer großen Anzahl von Fällen und Variablen. Für einige meiner Variablen zeigen die Daten ziemlich hohe Kurtosis-Werte (dh eine leptokurtische Verteilung), die sich aus der Tatsache ergibt, dass viele der Teilnehmer genau die gleiche Punktzahl für die Variable angegeben haben. Ich habe eine besonders große Stichprobengröße, daher sollten Verstöße gegen die Normalität nach dem zentralen Grenzwertsatz immer noch in Ordnung sein.
Das Problem ist jedoch die Tatsache, dass die besonders hohen Kurtosis-Werte eine Reihe von univariaten Ausreißern in meinem Datensatz erzeugen. Selbst wenn ich die Daten transformiere oder die Ausreißer entferne / anpasse, bedeutet das hohe Maß an Kurtosis, dass die nächst extremeren Werte automatisch zu Ausreißern werden. Ich möchte verwenden (Diskriminanzfunktionsanalyse). DFA soll gegenüber Abweichungen von der Normalität robust sein, vorausgesetzt, der Verstoß wird durch Schiefe und nicht durch Ausreißer verursacht. Darüber hinaus soll DFA auch besonders von Ausreißern in den Daten beeinflusst werden (Tabachnick & Fidel).
Irgendwelche Ideen, wie man das umgehen kann? (Mein erster Gedanke war eine Möglichkeit, die Kurtosis zu kontrollieren, aber ist es nicht gut, wenn die meisten meiner Stichproben ähnliche Bewertungen abgeben?)