Ich habe über die k-fach-Validierung gelesen und möchte sicherstellen, dass ich verstehe, wie es funktioniert.
Ich weiß, dass für die Holdout-Methode die Daten in drei Gruppen aufgeteilt werden und die Testgruppe nur ganz am Ende zur Bewertung der Leistung des Modells verwendet wird, während die Validierungsgruppe zum Optimieren von Hyperparametern usw. verwendet wird.
Halten wir bei der K-Fold-Methode noch einen Testsatz ganz zum Schluss aus und verwenden nur die verbleibenden Daten für das Training und die Optimierung der Hyperparameter, dh, wir teilen die verbleibenden Daten in K-Fold- Werte auf und verwenden dann die durchschnittliche Genauigkeit nach dem Training Mit jeder Falte (oder welcher Leistungsmetrik auch immer, die wir für die Optimierung unserer Hyperparameter auswählen)? Oder verwenden wir überhaupt keinen separaten Testsatz und teilen einfach den gesamten Datensatz in k-Faltungen auf (wenn dies der Fall ist, gehe ich davon aus, dass wir nur die durchschnittliche Genauigkeit der k-Faltungen als unsere endgültige Genauigkeit betrachten)?
quelle
Antworten:
Ja. In der Regel sollte das Testset niemals zum Ändern Ihres Modells (z. B. seiner Hyperparameter) verwendet werden.
Die gegenseitige Validierung kann jedoch manchmal auch für andere Zwecke als die Optimierung von Hyperparametern verwendet werden, z. B. um festzustellen, inwieweit die Aufteilung von Zug und Test die Ergebnisse beeinflusst.
quelle
Im Allgemeinen ja. Grundsätzlich sprechen Sie über den Bias-Varianz-Kompromiss. Wenn Sie Daten zum Aufbau Ihres Modells verwenden (Trainings- und Validierungsdaten) und über verschiedene Hyperparameter iterieren und versuchen, eine gemittelte Leistungsmetrik zu maximieren, ist Ihr Modell möglicherweise nicht so gut wie angegeben.
Insbesondere in kleinen Datensätzen kann die zusätzliche Aufteilung jedoch zu einem noch kleineren Trainingssatz führen und zu einem schlechten Modell führen.
quelle
Im Idealfall sollten Validierung (für die Modellauswahl) und Abschlusstest nicht gemischt werden. Wenn Ihr k-Wert jedoch hoch ist oder weggelassen wird, ist es weniger schädlich, die Testergebnisse als Richtschnur für Ihre Modellauswahl zu verwenden. Wenn Sie in diesem Szenario eine akademische Arbeit schreiben, tun Sie dies nicht (es sei denn, Sie haben die Mühe zu erklären) - dh, Sie haben immer einen separaten Testsatz. Wenn Sie ein praktisches Projekt erstellen, ist dies in Ordnung.
quelle