Ich habe eine Menge online verfügbarer Literatur durchgesehen, einschließlich dieses Forums, und gehofft, dass jemand bei einem statistischen Problem helfen kann, mit dem ich derzeit konfrontiert bin:
Ich habe 5 Listen mit Rangdaten, von denen jede 10 Elemente von Position 1 (am besten) bis Position 10 (am schlechtesten) enthält. Aus Gründen des Kontextes sind die 10 Elemente in jeder Liste gleich, jedoch in unterschiedlicher Reihenfolge, da die Technik, mit der der Rang bestimmt wird, unterschiedlich ist.
Beispieldaten:
List 1 List 2 List 3 ... etc
Item 1 Ranked 1 Ranked 2 Ranked 1
Item 2 Ranked 3 Ranked 1 Ranked 2
Item 3 Ranked 2 Ranked 3 Ranked 3
... etc
Ich suche nach einer Möglichkeit, die obigen Daten zu interpretieren und zu analysieren, damit ich ein Endergebnis erhalte, das den Gesamtrang jedes Elements basierend auf jedem Test und seiner Position anzeigt, z
Result
Rank 1 = Item 1
Rank 2 = Item 3
Rank 3 = Item 4
... etc
Bisher habe ich versucht, diese Informationen anhand von Pearson-Korrelationstests, Spearman-Korrelationstests, Kendall Tau-B- und Friedman-Tests zu interpretieren. Ich habe jedoch festgestellt, dass diese Ergebnisse im Allgemeinen meine Listen gepaart haben (dh Liste 1 mit Liste 2 verglichen, dann Liste 1 mit Liste 3 usw.) oder Ergebnisse wie Chi-Quadrat, P-Werte usw. über den Gesamtwert hervorgebracht haben Daten.
Weiß jemand, wie ich diese Daten in einer statistisch fundierten Methode interpretieren kann (auf postgradualer / promovierter Ebene), damit ich die Gesamtrangfolge nachvollziehen kann, die die Wichtigkeit der einzelnen Elemente in der Liste über die 5 Tests hinweg anzeigt? Wenn es eine andere Art von Technik oder statistischen Test gibt, die ich untersuchen kann, würde ich mich über Hinweise oder Anleitungen freuen.
(Vielleicht ist es auch erwähnenswert, dass ich auch die einfacheren mathematischen Techniken wie Summen, Mittelwertbildung, Minimum-Maximum-Tests usw. durchgeführt habe, aber ich bin der Meinung, dass diese auf dieser Ebene statistisch nicht wichtig genug sind.)
Jede Hilfe oder Beratung wäre sehr dankbar, danke für Ihre Zeit.
Antworten:
Ich bin mir nicht sicher, warum Sie sich mit Korrelationen und ähnlichen Maßnahmen befasst haben. Es scheint keine Korrelation zu geben.
Stattdessen gibt es eine Reihe von Optionen, von denen keine wirklich besser ist als die andere, je nachdem, was Sie möchten:
Nehmen Sie den durchschnittlichen Rang und ordnen Sie dann die Durchschnittswerte (aber dies behandelt die Daten als Intervall)
Nehmen Sie den Medianwert und dann den Medianwert (dies kann jedoch zu Unentschieden führen)
Nehmen Sie die Anzahl der Stimmen für den ersten Platz, die jeder Gegenstand erhalten hat, und ordnen Sie sie danach
Nimm die Anzahl der letzten Stimmen und ordne sie (umgekehrt, offensichtlich) basierend darauf.
Erstellen Sie eine gewichtete Rangkombination, je nachdem, was Sie für sinnvoll halten.
quelle
Wie andere betont haben, gibt es viele Optionen, die Sie verfolgen könnten. Die Methode, die ich empfehle, basiert auf durchschnittlichen Rängen, dh dem ersten Vorschlag von Peter.
In diesem Fall kann die statistische Bedeutung der endgültigen Rangfolge durch einen zweistufigen statistischen Test überprüft werden. Dies ist ein nicht parametrisches Verfahren, das aus dem Friedman-Test und einem entsprechenden Post-Hoc-Test, dem Nemenyi-Test, besteht . Beide basieren auf durchschnittlichen Rängen. Der Zweck des Friedman - Test ist die Nullhypothese abzulehnen und dem Schluss , dass es gibt einige Unterschiede zwischen den einzelnen Einträgen. Wenn dies der Fall ist, fahren wir mit dem Nemenyi-Test fort, um herauszufinden, welche Elemente sich tatsächlich unterscheiden. (Wir beginnen nicht direkt mit dem Post-Hoc-Test, um eine zufällige Signifikanz zu vermeiden.)
Weitere Einzelheiten, wie z. B. die kritischen Werte für diese beiden Tests, finden Sie in der Veröffentlichung von Demsar .
quelle
Verwenden Sie Tau-x (wobei sich "x" auf "erweitertes" Tau-b bezieht). Tau-x ist das Korrelationsäquivalent der Kemeny-Snell-Entfernungsmetrik - erwiesenermaßen die eindeutige Entfernungsmetrik zwischen Listen von Ranglistenelementen, die alle Anforderungen einer Entfernungsmetrik erfüllen. Siehe Kapitel 2 von "Mathematische Modelle in den Sozialwissenschaften" von Kemeny und Snell, auch "Ein neuer Rangkorrelationskoeffizient mit Anwendung auf das Konsensranking-Problem", Edward Emond, David Mason, Journal of Multi-Criteria Decision Analysis, 11: 17- 28 (2002).
quelle