Gesamtrang aus mehreren Ranglisten

13

Ich habe eine Menge online verfügbarer Literatur durchgesehen, einschließlich dieses Forums, und gehofft, dass jemand bei einem statistischen Problem helfen kann, mit dem ich derzeit konfrontiert bin:

Ich habe 5 Listen mit Rangdaten, von denen jede 10 Elemente von Position 1 (am besten) bis Position 10 (am schlechtesten) enthält. Aus Gründen des Kontextes sind die 10 Elemente in jeder Liste gleich, jedoch in unterschiedlicher Reihenfolge, da die Technik, mit der der Rang bestimmt wird, unterschiedlich ist.

Beispieldaten:

            List 1      List 2      List 3     ... etc
Item 1     Ranked 1    Ranked 2    Ranked 1     
Item 2     Ranked 3    Ranked 1    Ranked 2
Item 3     Ranked 2    Ranked 3    Ranked 3
... etc

Ich suche nach einer Möglichkeit, die obigen Daten zu interpretieren und zu analysieren, damit ich ein Endergebnis erhalte, das den Gesamtrang jedes Elements basierend auf jedem Test und seiner Position anzeigt, z

Result
Rank 1 = Item 1
Rank 2 = Item 3
Rank 3 = Item 4
... etc

Bisher habe ich versucht, diese Informationen anhand von Pearson-Korrelationstests, Spearman-Korrelationstests, Kendall Tau-B- und Friedman-Tests zu interpretieren. Ich habe jedoch festgestellt, dass diese Ergebnisse im Allgemeinen meine Listen gepaart haben (dh Liste 1 mit Liste 2 verglichen, dann Liste 1 mit Liste 3 usw.) oder Ergebnisse wie Chi-Quadrat, P-Werte usw. über den Gesamtwert hervorgebracht haben Daten.

Weiß jemand, wie ich diese Daten in einer statistisch fundierten Methode interpretieren kann (auf postgradualer / promovierter Ebene), damit ich die Gesamtrangfolge nachvollziehen kann, die die Wichtigkeit der einzelnen Elemente in der Liste über die 5 Tests hinweg anzeigt? Wenn es eine andere Art von Technik oder statistischen Test gibt, die ich untersuchen kann, würde ich mich über Hinweise oder Anleitungen freuen.

(Vielleicht ist es auch erwähnenswert, dass ich auch die einfacheren mathematischen Techniken wie Summen, Mittelwertbildung, Minimum-Maximum-Tests usw. durchgeführt habe, aber ich bin der Meinung, dass diese auf dieser Ebene statistisch nicht wichtig genug sind.)

Jede Hilfe oder Beratung wäre sehr dankbar, danke für Ihre Zeit.

Liam
quelle
1
Ich finde zwei Fragen, die, angemessen interpretiert, doppelt zu sein scheinen (und daher bereits Antworten liefern): stats.stackexchange.com/search?q=valuation+rank . Sind diese ausreichend? Wenn nicht, helfen Sie uns bitte zu verstehen, was an Ihrer Situation besonders ist.
Whuber
Vielen Dank für Ihre Antwort. Ich habe mir diese Artikel angesehen und bin mir nicht sicher, ob sie nicht das sind, wonach ich suche, oder ob es an meinem Verständnis liegt. In diesen Artikeln habe ich den Eindruck, dass jeder Datensatz viele Variablen mit unterschiedlichen Bedeutungen hat und dass die Ränge unterschiedlich sein können oder mehr Ganzzahlwerte als nur der Rang enthalten können. Ich bin nur auf der Suche nach einem statistisch nachgewiesenen Weg, um sagen zu können: "Insgesamt ist das wichtigste Element das Element X, gefolgt von Y ... und schließlich (oder dem am wenigsten wichtigen) Element Z". Ich denke fast darüber nach, diese Ränge 1-10 als einfache Zahlen zu analysieren
Liam
1
Ein wichtiger Punkt dieser Threads ist, dass es keinen solchen "statistisch nachgewiesenen Weg" gibt. Es ist eine Frage der Bewertung : Jede statistische Kombination Ihrer Ergebnisse spiegelt ein Gefühl von Kompromissen zwischen ihnen wider. Zum Beispiel könnten Ihre "Objekte" Autos sein und die "Techniken" könnten sie nach verschiedenen Attributen ordnen: Kosten, Kraftstoffeffizienz, Leistung, Komfort usw. Ihr persönlicher Sinn für das "Beste" kann sich erheblich von dem des anderen unterscheiden und Sie beide hätten recht.
Whuber
hast du die antwort bekommen Bitte hinterlassen Sie hier einen
Ray Coder

Antworten:

7

Ich bin mir nicht sicher, warum Sie sich mit Korrelationen und ähnlichen Maßnahmen befasst haben. Es scheint keine Korrelation zu geben.

Stattdessen gibt es eine Reihe von Optionen, von denen keine wirklich besser ist als die andere, je nachdem, was Sie möchten:

Nehmen Sie den durchschnittlichen Rang und ordnen Sie dann die Durchschnittswerte (aber dies behandelt die Daten als Intervall)

Nehmen Sie den Medianwert und dann den Medianwert (dies kann jedoch zu Unentschieden führen)

Nehmen Sie die Anzahl der Stimmen für den ersten Platz, die jeder Gegenstand erhalten hat, und ordnen Sie sie danach

Nimm die Anzahl der letzten Stimmen und ordne sie (umgekehrt, offensichtlich) basierend darauf.

Erstellen Sie eine gewichtete Rangkombination, je nachdem, was Sie für sinnvoll halten.

Peter Flom - Wiedereinsetzung von Monica
quelle
4
Ein wichtiger Punkt in den Threads, auf die ich in einem Kommentar verwiesen habe - und ich denke, das ist der Kern der gesamten Ausgabe - ist, dass alle diese Methoden willkürlich sind . Es gibt objektive Methoden, die jedoch die Verwendung von Informationen erfordern, die den Daten nicht inhärent sind. Deshalb ist dies eher ein Bewertungsproblem als eine Statistik.
Whuber
Welche gewichtete Rangkombination schlagen Sie vor?
Archie
4

Wie andere betont haben, gibt es viele Optionen, die Sie verfolgen könnten. Die Methode, die ich empfehle, basiert auf durchschnittlichen Rängen, dh dem ersten Vorschlag von Peter.

In diesem Fall kann die statistische Bedeutung der endgültigen Rangfolge durch einen zweistufigen statistischen Test überprüft werden. Dies ist ein nicht parametrisches Verfahren, das aus dem Friedman-Test und einem entsprechenden Post-Hoc-Test, dem Nemenyi-Test, besteht . Beide basieren auf durchschnittlichen Rängen. Der Zweck des Friedman - Test ist die Nullhypothese abzulehnen und dem Schluss , dass es gibt einige Unterschiede zwischen den einzelnen Einträgen. Wenn dies der Fall ist, fahren wir mit dem Nemenyi-Test fort, um herauszufinden, welche Elemente sich tatsächlich unterscheiden. (Wir beginnen nicht direkt mit dem Post-Hoc-Test, um eine zufällige Signifikanz zu vermeiden.)

Weitere Einzelheiten, wie z. B. die kritischen Werte für diese beiden Tests, finden Sie in der Veröffentlichung von Demsar .

Weiwei
quelle
2

Verwenden Sie Tau-x (wobei sich "x" auf "erweitertes" Tau-b bezieht). Tau-x ist das Korrelationsäquivalent der Kemeny-Snell-Entfernungsmetrik - erwiesenermaßen die eindeutige Entfernungsmetrik zwischen Listen von Ranglistenelementen, die alle Anforderungen einer Entfernungsmetrik erfüllen. Siehe Kapitel 2 von "Mathematische Modelle in den Sozialwissenschaften" von Kemeny und Snell, auch "Ein neuer Rangkorrelationskoeffizient mit Anwendung auf das Konsensranking-Problem", Edward Emond, David Mason, Journal of Multi-Criteria Decision Analysis, 11: 17- 28 (2002).

Stephen
quelle