Friedman-Test und Post-Hoc-Test für Python

9

In meinem Datensatz habe ich fünf (ordinale) Gruppen mit einem x-Maß. Da die Homoskedastizität verletzt wird, habe ich den Friedman-Chi-Quadrat-Test durchgeführt, um festzustellen, ob es statistische Unterschiede zwischen den Gruppen gibt:

fried = stats.friedmanchisquare(*[grp for idx, grp in df.iteritems()]))

Dies ergab einen statistischen Unterschied, aber jetzt möchte ich herausfinden, zwischen welchen Gruppen die Unterschiede bestehen. Hierfür Rgibt es eine gute Lösung ( Friedmans Test und Post-hoc-Analyse , https://www.r-statistics.com/2010/02/post-hoc-analysis-for-friedmans-test-r-code/ ) , wo sie den Wilcoxon-Nemenyi-McDonald-Thompson-Test verwenden, aber ich kann keinen für Python finden.

Gibt es eine Möglichkeit, Post-hoc-Analysen für den Friedman-Test durchzuführen? Was wäre alternativ eine gute Alternative für den Friedman-Test, mit dem ich zwischen Gruppen vergleichen kann, z. B. eine verallgemeinerte Schätzgleichung?

Robin Kramer
quelle

Antworten:

6

Ich beschäftige mich derzeit selbst mit diesem Thema. nach diesem Papier gibt es eine Reihe von Möglichkeiten posthoc-Tests (durchzuführen aktualisieren : eine Erweiterung in Bezug auf die Verwendung von nicht-parametrischen Tests gefunden werden hier ):

  • Führen Sie den Nemenyi- Test für alle paarweisen Kombinationen durch; Dies ähnelt dem Tukey- Test für ANOVA.
  • Führen Sie den Bonferroni-Dunn- Test durch; In dieser Einstellung werden alle Werte mit einer Liste von Steuerwerten verglichen.
  • Alternativ kann man Step-up- und Step-down-Verfahren durchführen, bei denen Hypothesen nach ihrer Signifikanz geordnet werden. Man kann Holms Step-Down-Verfahren, Hochbergs Step-Up-Verfahren oder Hommels Verfahren anwenden .

Die STAC Python-Bibliothek scheint alle diese Tests zu enthalten, mit Ausnahme von Hommels Verfahren.

Archie
quelle
3

Ergänzt die andere Antwort, da Sie nach der Implementierung der Post-Hoc-Tests in Python gefragt haben: Die Orange-Bibliothek implementiert die Post-Hoc-Tests (Nemenyi und Bonferroni-Dunn), einschließlich einer Funktion zum Zeichnen eines Diagramms für kritische Unterschiede [1].

http://docs.orange.biolab.si/3/data-mining-library/reference/evaluation.cd.html (siehe Abschnitt "CD-Diagramm")

[1] Janez Demsar, Statistische Vergleiche von Klassifikatoren über mehrere Datensätze, 7 (Jan): 1–30, 2006.

Luiz Gustavo Hafemann
quelle