Als «validation» getaggte Fragen

14
Was ist die Kostenfunktion in cv.glm im Boot-Paket von R?

Ich führe eine Kreuzvalidierung mit der Methode "Auslassen" durch. Ich habe eine binäre Antwort und benutze das Boot-Paket für R und die cv.glm-Funktion . Mein Problem ist, dass ich den Teil "Kosten" in dieser Funktion nicht vollständig verstehe. Nach meinem Verständnis ist dies die Funktion, die...

14
Was sind die Fallstudien in der gesundheitspolitischen Forschung, in denen unzuverlässige / verwirrte / ungültige Studien oder Modelle missbraucht wurden?

Ich erstelle eine Literaturübersicht zu einem aktuellen Thema der öffentlichen Gesundheit, in der die Daten verwechselt werden: Was sind übliche historische Fallstudien, die in der Aufklärung über Volksgesundheit / Epidemiologie verwendet werden, in denen ungültige oder verwechselte Beziehungen...

14
logloss vs gini / auc

Ich habe zwei Modelle trainiert (binäre Klassifikatoren mit h2o AutoML) und möchte eines zur Verwendung auswählen. Ich habe folgende Ergebnisse: model_id auc logloss logloss_train logloss_valid gini_train gini_valid DL_grid_1 0.542694 0.287469 0.092717 0.211956 0.872932 0.312975 DL_grid_2...

13
Wenn Sie ein Regressionsmodell mit separaten Modellierungs- / Validierungssätzen erstellen, ist es angemessen, die Validierungsdaten erneut zu verteilen?

Angenommen, ich habe eine 80/20 Aufteilung zwischen Modellierungs- / Validierungsbeobachtungen. Ich habe ein Modell an den Modellierungsdatensatz angepasst und bin mit dem Fehler, den ich im Validierungsdatensatz sehe, einverstanden. Ist es angebracht, die Validierung mit den Modellierungsdaten zu...

13
Bewerten Sie Random Forest: OOB vs CV

Wenn wir die Qualität einer zufälligen Gesamtstruktur beurteilen, zum Beispiel mithilfe der AUC, ist es angemessener, diese Mengen anhand der Out-of-Bag-Proben oder anhand des Hold-out-Satzes der Kreuzvalidierung zu berechnen. Ich habe gehört, dass die Berechnung über die OOB-Samples eine...