Ich verwende den Bootstrap-Ansatz für die interne Validierung eines multivariaten Modells, das entweder mit einer logistischen Standardregression oder einem elastischen Netz erstellt wurde.
Das Verfahren, das ich verwende, ist wie folgt:
1) Modell unter Verwendung des gesamten Datensatzes erstellen, vorhergesagte Werte erhalten und AUC berechnen (AUC_ap, offensichtlich)
2) Generieren Sie 100-500 Bootstrap-Beispiele, die aus dem Originaldatensatz abgeleitet wurden
3) Befolgen Sie für jedes Bootstrap-Beispiel das gleiche Verfahren wie in Nr. 1 und erhalten Sie vorhergesagte Werte und auc für i) das aktuelle Bootstrap-Beispiel und ii) den Originaldatensatz
4) Berechnen Sie die Differenz zwischen i) und ii) (in # 3) für jedes der 100-500 Bootstrap-Beispiele und nehmen Sie den Durchschnitt -> "Optimismus"
5) optimismuskorrigierte AUC berechnen: AUC_ap - Optimismus
Meine Frage ist, welche ROC-Kurve am besten in einem Artikel dargestellt werden kann. Zum Beispiel ist der in Schritt 1 abgeleitete ROC eine Wahl, aber eindeutig optimistisch. Alternativ habe ich versucht, einen "durchschnittlichen ROC" unter Verwendung des R-Pakets ROCR zu erzeugen, basierend auf den in Schritt 3 (ii) abgeleiteten ROC-Kurven. Ich glaube jedoch nicht, dass die AUC für den [Durchschnitt dieser ROC-Kurven] dem in Schritt 5 erhaltenen Wert entspricht.
Jede Eingabe wird sehr geschätzt! -M