Wie teste ich, ob sich zwei (nicht normale) Verteilungen unterscheiden?

13

Ich habe über Student's T-Test gelesen, aber es scheint zu funktionieren, wenn wir davon ausgehen können, dass die ursprünglichen Distributionen normal verteilt sind. In meinem Fall sind sie definitiv nicht.

Muss ich 13^2Tests durchführen , wenn ich 13 Distributionen habe ?

Hier ist ein Beispiel von zwei Distributionen.  Es gibt 13 Verteilungen.

Martin Velez
quelle
@ Glen_b Die Daten sind nicht diskret. Die Werte reichen von -2 bis 2.
Martin Velez

Antworten:

19

Es gibt verschiedene Sinne, in denen "es darauf ankommt".

(Möglicherweise besteht die Sorge, dass die ursprünglichen Daten möglicherweise diskret sind. Dies sollte geklärt werden.)

  1. Abhängig von der Stichprobengröße ist die Nicht-Normalität möglicherweise kein so großes Problem wie beim T-Test. Zumindest bei großen Samples ist die Pegel-Robustheit im Allgemeinen gut. Die Fehlerraten von Typ I sollten nicht zu stark beeinflusst werden, wenn sie nicht wirklich weit vom Normalen entfernt sind. Bei schweren Schwänzen ist die Leistung möglicherweise ein größeres Problem.

  2. Wenn Sie nach Unterschieden in der Verteilung suchen, ist möglicherweise ein Zwei-Stichproben-Anpassungstest geeignet, z. B. der Kolmogorov-Smirnov-Test mit zwei Stichproben (stattdessen können auch andere Tests durchgeführt werden).

  3. Wenn Sie nach Unterschieden zwischen Ortstypen in einer Ortsfamilie oder nach Unterschieden zwischen Maßstäben in einer Maßstabsfamilie oder sogar nur nach einer Beziehung vom Typ P (X> Y)> P (Y> X) suchen, sollten Sie nach Wilcoxon-Mann-Whitney suchen Test mit zwei Proben könnte geeignet sein.

  4. Sie können Resampling-Tests wie Permutationstests oder Bootstrap-Tests in Betracht ziehen, wenn Sie eine geeignete Statistik für die Art (en) von Unterschieden finden, für die Sie eine Empfindlichkeit haben möchten.

Muss ich 13 ^ 2-Tests durchführen, wenn ich 13 Distributionen habe?

Nun, nein .

EINB BEIN

EINEIN

Diese beiden Dinge haben die paarweisen Vergleiche von 169 auf 78 reduziert.

Drittens wäre es viel mehr üblich (aber nicht zwingend) zu Test kollektiv für jeden Unterschiede, und dann vielleicht bei paarweise Unterschieden in aussehen post-hoc paarweise Tests , wenn die erste Null wurde abgelehnt.

Beispielsweise kann anstelle eines Wilcoxon-Mann-Whitney wie in Punkt 3 oben ein Kruskal-Wallis-Test durchgeführt werden, der auf Unterschiede in der Position zwischen den Gruppen empfindlich reagiert.

Es gibt auch k-Stichprobenversionen des Kolmogorov-Smirnov-Tests , und ähnliche Tests für einige der anderen Zwei-Stichproben-Anpassungstests könnten existieren oder konstruiert werden.

Es gibt auch k-Stichprobenversionen von Resampling-Tests und des t-Tests (dh ANOVA, was in Ordnung sein könnte, wenn die Stichprobengröße angemessen groß ist).


Es wäre wirklich nett, mehr Informationen darüber zu erhalten, womit wir es zu tun haben und welche Unterschiede Sie am meisten interessieren. Andernfalls werden QQ-Diagramme einiger Beispiele angezeigt.

Glen_b - Setzen Sie Monica wieder ein
quelle
(+1) Fügen Sie hinzu, dass der WMW-Test eine Interpretation als Test für die stochastische Dominanz enthält, wenn Sie bereit sind anzunehmen, dass sich die Populations-CDFs nicht überschneiden. IMO-Leute würden das öfter wollen, wenn sie davon wüssten.
Scortchi
1
P(X<Y.)12
@ Glen_b Die Daten sind nicht diskret. Die Werte reichen von -2 bis 2.
Martin Velez
Wow - wichtige Information! Sind sie an diesen Bereich gebunden (2.1 ist unmöglich) oder liegen die Werte einfach in diesem Bereich?
Glen_b -Reinstate Monica
Sie sind an diesen Bereich gebunden.
Martin Velez
5

Ja, ich denke, Sie können es nicht besser machen, als jede Distribution gegen die anderen zu testen ...

Wenn Sie denken, dass Ihre Frage mit dieser zusammenhängt: Vergleich von 2 Distributionen

Sie empfehlen die Verwendung eines Kolmogorov-Sminorv-Tests oder eines Cramér-Von-Mises-Tests. Sie sind beide sehr klassische Angemessenheitstests.

In implementiert Rfunction ks.testin stats package das erste. Die zweite finden Sie in Paketen wie cramer.

Informationen zu diesen beiden Tests finden Sie unter: http://en.wikipedia.org/wiki/Kolmogorov%E2%80%93Smirnov_test http://en.wikipedia.org/wiki/Cram%C3%A9r%E2%80%93von_Mises_criterion

Pop
quelle
2

Sie können die einseitige Kruskal-Wallis-Varianzanalyse ausprobieren

"Es wird zum Vergleichen von mehr als zwei unabhängigen oder nicht verwandten Stichproben verwendet."

Normalitätsverletzungen in ANOVA wurden in
Rutherford diskutiert. Einführung in Anova und Ancova: Ein GLM-Ansatz 9.1.2 Normalitätsverletzungen

Die erste Zeile lautet "Obwohl die meisten Quellen ANOVA als robust in Bezug auf Verstöße gegen die Normalitätsannahme bezeichnen ...".

abbat_VL
quelle
Vielen Dank! Es scheint, dass man diesen Test durchführen sollte, bevor paarweise Vergleiche durchgeführt werden.
Martin Velez