AUC in der ordinalen logistischen Regression

9

Ich verwende zwei Arten der logistischen Regression - eine ist die einfache Art für die binäre Klassifizierung und die andere ist die ordinale logistische Regression. Zur Berechnung der Genauigkeit der ersten habe ich eine Kreuzvalidierung verwendet, bei der ich die AUC für jede Falte berechnet und dann die mittlere AUC berechnet habe. Wie kann ich das für die ordinale logistische Regression tun? Ich habe von generalisierten ROC für Prädiktoren mit mehreren Klassen gehört, bin mir aber nicht sicher, wie ich sie berechnen soll.

Vielen Dank!

Noam Peled
quelle
1
nicht AUC, sondern verwandt: auf Mikro- / Makro-Präzisionsrückrufkurven unter stats.stackexchange.com/questions/21551/…
Jewgeni

Antworten:

4

Ich mag den Bereich unter der ROC-Kurve ( Index) nur, weil es sich zufällig um eine Konkordanzwahrscheinlichkeit handelt. ist ein Baustein von Rangkorrelationskoeffizienten. Zum Beispiel ist Somers ' . Für die Ordnungszahl ist ein hervorragendes Maß für die prädiktive Diskriminierung, und das R- Paket bietet einfache Möglichkeiten, um Bootstrap-überanpassungskorrigierte Schätzungen von . Sie können einen generalisierten Index (generalisierter AUROC) rückwärts auflösen. Es gibt Gründe, nicht jede Ebene von einzeln zu betrachten, da dies die Ordnungszahl von nicht ausnutzt .ccDxy=2×(c12)YDxyrmsDxycYY

Es rmsgibt zwei Funktionen für die ordinale Regression: lrmund ormletztere, die kontinuierliches handhaben und mehr Verteilungsfamilien (Verknüpfungsfunktionen) als proportionale Quoten bereitstellen.Y

Frank Harrell
quelle
Die Hauptfrage wird sein, wie der Effektivwert den in Sommers verwendeten berechnet . cindexDxy
Chamberlain Foncha
1
Es ist Somers geschrieben . Der verallgemeinerte Index wird einfach durch Rücklösung der oben aufgeführten Gleichung I berechnet. Intern werden alle möglichen Kombinationen von Beobachtungen mit unterschiedlichen Werten untersucht, und der Anteil solcher Paare, für die Vorhersagen in derselben Reihenfolge vorliegen, ist die Schätzung der Konkordanzwahrscheinlichkeit. Ich habe eines falsch angegeben: Die Funktion verwendet Spearmans anstelle von . cYormρDxy
Frank Harrell
Danke für die Rechtschreibkorrektur. Bei der ordinalen Regression ist es viel interessanter, nicht nur die paarweise Reihenfolge zu betrachten, wie dies in der von Ihnen erwähnten Orm-Funktion der Fall ist, sondern auch die konsistente Reihenfolge (mit ternären oder höheren Operatoren) in Abhängigkeit von der Anzahl Ihrer Klassen. Zusammenfassend sage ich: Wenn beispielsweise eine kumulative logistische Regression angepasst wird, wird die Reihenfolge der Klassen im Modell berücksichtigt. Ein Vorhersagemaß sollte auch nicht in der Lage sein, einen paarweisen Vergleich sondern einen Vergleich der Form $ P (pred_1 <pred_2 <pred_3 | obs_1 <obs_2 <oP(pred1<pred2|obs1<obs2)
Chamberlain Foncha
Ohne über solche Maßnahmen Bescheid zu wissen, ist meine erste Reaktion, dass sie eine hohe Messlatte für die Hürde setzen.
Frank Harrell
1

AUC für ordinale Regression ist etwas schwierig. Möglicherweise möchten Sie die AUC für jede Klasse berechnen, indem Sie Dummies erstellen, die für die Klasse, für die Sie die AUC berechnen, den Wert 1 und für die übrigen anderen Klassen den Wert 0 annehmen. Wenn Sie 4 Klassen haben, erstellen Sie 4 AUCs und zeichnen sie in demselben Diagramm auf. Das Hauptproblem bei dieser Methode ist die Tatsache, dass die Fehlklassifizierung gleichermaßen bestraft wird. Eine viel intuitivere Fehlklassifizierung einer Klasse 1 in Klasse 3 sollte am schlimmsten sein als eine Fehlklassifizierung von Klasse 1 in Klasse 2.

Chamberlain Foncha
quelle