Was ist der Unterschied zwischen ordinaler Regression und Rangfolge?

10

Sowohl in der ordinalen Regression als auch in der Rangfolge lernen Sie aus einer geordneten abhängigen Variablen. Meine Frage lautet also:

Was ist der Unterschied in der Formulierung (falls vorhanden) zwischen dem ordinalen Regressionsproblem und dem Lernen, ein Rangproblem zu lösen?

Fabian Pedregosa
quelle
1
"Ranking" pro Everitt (zumindest eine frühere Ausgabe) bedeutet nur "das Sortieren einer Reihe von Variablen in aufsteigender oder absteigender Reihenfolge". Also, was meinst du mit Ranking?
Peter Flom
2
Ich meine Ranking im Kontext des maschinellen Lernens: en.wikipedia.org/wiki/Learning_to_rank
Fabian Pedregosa

Antworten:

13

3 Jahre später beantworte ich meine eigene Frage.

Für mich besteht der Hauptunterschied darin, was die Ausgabe der Modelle in den verschiedenen Problemen ist. Bei der ordinalen Regression besteht die Aufgabe darin, eine Bezeichnung für eine bestimmte Stichprobe vorherzusagen, daher ist die Ausgabe einer Vorhersage eine Bezeichnung (wie dies beispielsweise bei der Klassifizierung mehrerer Klassen der Fall ist). Andererseits ist bei dem Problem des Ranglernens die Ausgabe eine Reihenfolge einer Folge von Abtastwerten. Das heißt, die Ausgabe eines Ranking-Modells kann als Permutation angesehen werden, die bewirkt, dass die Proben so beschriftet wie möglich beschriftet werden. Daher kann der Ranking-Algorithmus im Gegensatz zum ordinalen Regressionsmodell keine Klassenbezeichnung vorhersagen. Aus diesem Grund muss für die Eingabe eines Ranking-Modells keine Klassenbezeichnung angegeben werden, sondern nur eine Teilreihenfolge zwischen den Stichproben (siehe z. B. [0] für eine Anwendung hierfür). In diesem Sinne ist das Ranking ein einfacheres Problem als die ordinale Regression:

Dies wird anhand eines Beispiels besser erklärt. Angenommen, wir haben die folgenden Paare von (Probe, Etikett): . Bei dieser Eingabe sagt ein Rangmodell eine Reihenfolge dieser Sequenz von Stichproben voraus . Beispielsweise sind für einen Rangfolgenalgorithmus die Permutationen und Vorhersagen mit perfekter Punktzahl seit dem Beschriftungen beider Sequenzen und sind geordnet. Andererseits würde eine ordinale Regression eine Markierung für jede der Proben vorhersagen, und in diesem Fall würde die Vorhersage (1, 2, 2) eine perfekte Punktzahl ergeben, jedoch nicht (1, 2, 3) oder (1, 3, 2).{(x1,1),(x2,2),(x3,2)}(1,2,3)(1,2,3)(1,2,3)(1,3,2){(x1,1),(x2,2),(x3,2)}}{(x1,1),(x3,2),(x2,2)}}

[0] Suchmaschinen mithilfe von Klickdaten optimieren Thorsten Joachims

Fabian Pedregosa
quelle
2
Können Sie einige Ranking-Algorithmen empfehlen? Ich stehe vor einem Ranking-Problem, weiß aber immer noch nicht, welche Algorithmen damit umgehen können. Vielen Dank.
Catbuilts
-2

Das ist eine gute Frage! Im Allgemeinen kann der Unterschied zwischen Statistik und maschinellem Lernen oder den Ansätzen anderer Bereiche für "unsere" Fragen schwer zu verstehen sein, da jedem Bereich ein Zoo von Begriffen zugeordnet ist.

Als die Leute zum Beispiel herausfanden, dass neuronale Backprop-Netze "nur" eine nichtlineare Regression durchführen, war dies ein wichtiger Befund unter Forschern .

Ich denke, das ist das Gleiche: Es gibt nur eine Menge Techniken, die sich die Leute ausgedacht haben, um das gleiche Problem anzugreifen. Ordentliche Logistik ist eine.

Isomorphismen
quelle