Was passiert, wenn ich einen nichtparametrischen Test mit normalverteilten Daten verwende?

8

Ich wurde gefragt, ob ein Fehler vom Typ I im Shapiro-Wilk-Test die Hauptanalyse beeinflussen würde und ob der falsche Test verwendet wurde, ob es wichtig wäre oder nicht, ob meine Daten normal verteilt waren ...

DaisyRiver
quelle
@a_statistician - möchte das vielleicht ein wenig erweitern und als Antwort posten, da es so ist!
Jbowman

Antworten:

14

Wenn Ihre Daten bei der statistischen Analyse einer parametrischen Verteilung folgen, sollten Sie den Vorteil der Kenntnis der Verteilung nutzen und die auf dieser Verteilung basierenden statistischen Methoden anwenden.

Manchmal kennen wir die Verteilung der Zufallsvariablen jedoch nicht. Daher wurden nichtparametrische statistische Methoden entwickelt, um den weiten Bereich der Verteilungen zu berücksichtigen und gleichzeitig die Effizienz zu beeinträchtigen.

Wenn Sie die Verteilung der Zufallsvariablen kennen und die nichtparametrische statistische Methode anstelle der parametrischen statistischen Methode verwenden, die auf der Kenntnis der Verteilung basiert, ist sie ineffizient, dh die Testleistung nimmt ab, der Standardfehler nimmt zu und die Konfidenzintervalle steigen breiter sein als mit der parametrischen Methode.

user158565
quelle
12

Wenn Ihre Daten zufällig aus einer normalen Grundgesamtheit stammen (und die anderen üblichen Annahmen für einen normalen T-Test gelten), funktioniert der Test wie er sollte (er ist nicht parametrisch, er soll funktionieren). In dieser Hinsicht gibt es kein Drama.

Wenn Sie genug wissen, dass Sie sicher sind, Normalität anzunehmen, möchten Sie dieses Wissen vielleicht nutzen, aber für viele Tests hilft es Ihnen nicht viel.

Wenn Sie einen der gängigen Standorttests durchführen (Wilcoxon-Signed-Rank-Test, Wilcoxon-Mann-Whitney-Test), verlieren Sie bei einem Test für eine Standortverschiebung fast nichts (in Bezug auf die Leistung), indem Sie die Normalität ignorieren. [Sie benötigen eine zusätzliche Beobachtung pro 21 Beobachtungen, um die Leistung des leistungsstärksten Tests zu erreichen, wenn alle Annahmen zutreffen.]

Wenn Sie mit anderen Tests zu tun haben, ist dies möglicherweise etwas wichtiger (obwohl einige sogar noch weniger wichtig sind). Ein Beispiel, bei dem es einen etwas größeren Unterschied macht, ist die Verwendung eines Friedman-Tests im Vergleich zum entsprechenden ANOVA-Test in einem randomisierten Blockdesign.

Glen_b -State Monica
quelle
Sind diese Tests nicht nur Standortverschiebungstests, wenn die Verteilungen dieselbe Form (hier normal) und dieselbe Varianz haben?
Alexis
1
@Alexis Die Annahme unter der Null für einen Permutationstest ist die Austauschbarkeit (so dass das Permutieren von Beschriftungen / Zeichen usw. nach Bedarf die Verteilung der Statistik nicht ändert); Typischerweise wird für H0 die etwas stärkere "unabhängige identisch verteilte" angenommen, was bequeme Berechnungen des Signifikanzniveaus für Rangprüfungen ergibt. In Kombination mit einer Standortverschiebungsalternative (die bereits in meiner Antwort angegeben ist) können Sie die von Ihnen erwähnte Form und Ausbreitung identifizieren. Vielleicht muss ich algebraisch aufschreiben, was "Standortverschiebungsalternative" algebraisch bedeutet, damit die Leute sehen können, dass es abgedeckt ist
Glen_b - Monica
1
Wenn wir nicht bereit sind, eine Standortverschiebungsalternative anzugeben (oder zumindest zu sagen, "das ist es, woran wir interessiert sind, die Macht dagegen zu sehen), würde ich sagen, wir sollten keinen T-Test als Test durchführen." Vergleichsgrundlage in erster Linie, da dies auch betroffen wäre, wenn wir keine Standortverschiebungsalternative hätten. Wenn wir den Standortverschiebungsteil des Vergleichs aufgeben, bis wir dann eine Folge von Alternativen angeben, die uns interessieren In bleibt uns eine Frage, die zu wenig angibt, um die Stromversorgung
einzuschalten
1
@Alexis Eigentlich denke ich, dass ich zum Nachdenken sowohl etwas Algebra als auch mehr Erklärungen hinzufügen werde; Es ist wichtig klar zu sein, was die Umstände bedeuten, die bereits in der Frage und Antwort angegeben sind. Leider kann ich das momentan nicht tun. Vielen Dank für Ihren Kommentar, es macht deutlich, dass ich hier nicht genug erkläre.
Glen_b -State Monica