Ich wurde gefragt, ob ein Fehler vom Typ I im Shapiro-Wilk-Test die Hauptanalyse beeinflussen würde und ob der falsche Test verwendet wurde, ob es wichtig wäre oder nicht, ob meine Daten normal verteilt waren ...
nonparametric
DaisyRiver
quelle
quelle
Antworten:
Wenn Ihre Daten bei der statistischen Analyse einer parametrischen Verteilung folgen, sollten Sie den Vorteil der Kenntnis der Verteilung nutzen und die auf dieser Verteilung basierenden statistischen Methoden anwenden.
Manchmal kennen wir die Verteilung der Zufallsvariablen jedoch nicht. Daher wurden nichtparametrische statistische Methoden entwickelt, um den weiten Bereich der Verteilungen zu berücksichtigen und gleichzeitig die Effizienz zu beeinträchtigen.
Wenn Sie die Verteilung der Zufallsvariablen kennen und die nichtparametrische statistische Methode anstelle der parametrischen statistischen Methode verwenden, die auf der Kenntnis der Verteilung basiert, ist sie ineffizient, dh die Testleistung nimmt ab, der Standardfehler nimmt zu und die Konfidenzintervalle steigen breiter sein als mit der parametrischen Methode.
quelle
Wenn Ihre Daten zufällig aus einer normalen Grundgesamtheit stammen (und die anderen üblichen Annahmen für einen normalen T-Test gelten), funktioniert der Test wie er sollte (er ist nicht parametrisch, er soll funktionieren). In dieser Hinsicht gibt es kein Drama.
Wenn Sie genug wissen, dass Sie sicher sind, Normalität anzunehmen, möchten Sie dieses Wissen vielleicht nutzen, aber für viele Tests hilft es Ihnen nicht viel.
Wenn Sie einen der gängigen Standorttests durchführen (Wilcoxon-Signed-Rank-Test, Wilcoxon-Mann-Whitney-Test), verlieren Sie bei einem Test für eine Standortverschiebung fast nichts (in Bezug auf die Leistung), indem Sie die Normalität ignorieren. [Sie benötigen eine zusätzliche Beobachtung pro 21 Beobachtungen, um die Leistung des leistungsstärksten Tests zu erreichen, wenn alle Annahmen zutreffen.]
Wenn Sie mit anderen Tests zu tun haben, ist dies möglicherweise etwas wichtiger (obwohl einige sogar noch weniger wichtig sind). Ein Beispiel, bei dem es einen etwas größeren Unterschied macht, ist die Verwendung eines Friedman-Tests im Vergleich zum entsprechenden ANOVA-Test in einem randomisierten Blockdesign.
quelle