Sowohl in der ordinalen Regression als auch in der Rangfolge lernen Sie aus einer geordneten abhängigen Variablen. Meine Frage lautet also:
Was ist der Unterschied in der Formulierung (falls vorhanden) zwischen dem ordinalen Regressionsproblem und dem Lernen, ein Rangproblem zu lösen?
regression
ordinal-data
ranking
Fabian Pedregosa
quelle
quelle
Antworten:
3 Jahre später beantworte ich meine eigene Frage.
Für mich besteht der Hauptunterschied darin, was die Ausgabe der Modelle in den verschiedenen Problemen ist. Bei der ordinalen Regression besteht die Aufgabe darin, eine Bezeichnung für eine bestimmte Stichprobe vorherzusagen, daher ist die Ausgabe einer Vorhersage eine Bezeichnung (wie dies beispielsweise bei der Klassifizierung mehrerer Klassen der Fall ist). Andererseits ist bei dem Problem des Ranglernens die Ausgabe eine Reihenfolge einer Folge von Abtastwerten. Das heißt, die Ausgabe eines Ranking-Modells kann als Permutation angesehen werden, die bewirkt, dass die Proben so beschriftet wie möglich beschriftet werden. Daher kann der Ranking-Algorithmus im Gegensatz zum ordinalen Regressionsmodell keine Klassenbezeichnung vorhersagen. Aus diesem Grund muss für die Eingabe eines Ranking-Modells keine Klassenbezeichnung angegeben werden, sondern nur eine Teilreihenfolge zwischen den Stichproben (siehe z. B. [0] für eine Anwendung hierfür). In diesem Sinne ist das Ranking ein einfacheres Problem als die ordinale Regression:
Dies wird anhand eines Beispiels besser erklärt. Angenommen, wir haben die folgenden Paare von (Probe, Etikett): . Bei dieser Eingabe sagt ein Rangmodell eine Reihenfolge dieser Sequenz von Stichproben voraus . Beispielsweise sind für einen Rangfolgenalgorithmus die Permutationen und Vorhersagen mit perfekter Punktzahl seit dem Beschriftungen beider Sequenzen und sind geordnet. Andererseits würde eine ordinale Regression eine Markierung für jede der Proben vorhersagen, und in diesem Fall würde die Vorhersage (1, 2, 2) eine perfekte Punktzahl ergeben, jedoch nicht (1, 2, 3) oder (1, 3, 2).{ ( x1, 1 ) , ( x2, 2 ) , ( x3, 2 ) } ( 1 , 2 , 3 ) → ( 1 , 2 , 3 ) ( 1 , 2 , 3 ) → ( 1 , 3 , 2 ) { ( x1, 1 ) , ( x2, 2 ) , ( x3, 2 ) } { ( x1, 1 ) , ( x3, 2 ) , ( x2, 2 ) }
[0] Suchmaschinen mithilfe von Klickdaten optimieren Thorsten Joachims
quelle
Das ist eine gute Frage! Im Allgemeinen kann der Unterschied zwischen Statistik und maschinellem Lernen oder den Ansätzen anderer Bereiche für "unsere" Fragen schwer zu verstehen sein, da jedem Bereich ein Zoo von Begriffen zugeordnet ist.
Als die Leute zum Beispiel herausfanden, dass neuronale Backprop-Netze "nur" eine nichtlineare Regression durchführen, war dies ein wichtiger Befund unter Forschern .
Ich denke, das ist das Gleiche: Es gibt nur eine Menge Techniken, die sich die Leute ausgedacht haben, um das gleiche Problem anzugreifen. Ordentliche Logistik ist eine.
quelle