Angenommen, ich habe mehrere Modelle auf dem Trainingsset trainiert und das beste mit dem Kreuzvalidierungsset und der gemessenen Leistung auf dem Testset ausgewählt. Jetzt habe ich ein letztes bestes Modell. Sollte ich alle verfügbaren Daten oder Schiffslösungen, die nur auf dem Schulungsset trainiert wurden, erneut trainieren? Wenn letzteres, warum dann?
UPDATE: Wie @ P.Windridge feststellte, bedeutet der Versand eines umgeschulten Modells im Wesentlichen den Versand eines Modells ohne Validierung. Wir können jedoch die Leistung von Test-Sets melden und anschließend das Modell mit vollständigen Daten neu trainieren, wobei wir zu Recht erwarten, dass die Leistung besser wird - weil wir unser bestes Modell und mehr Daten verwenden. Welche Probleme können sich aus einer solchen Methodik ergeben?
Antworten:
Nach dem Umrüsten des gesamten Musters erhalten Sie fast immer ein besseres Modell. Aber wie andere gesagt haben, haben Sie keine Validierung. Dies ist ein grundlegender Fehler im Datenaufteilungsansatz. Die Aufteilung von Daten ist nicht nur eine verpasste Gelegenheit, Stichprobenunterschiede in einem Gesamtmodell direkt zu modellieren, sondern sie ist auch instabil, es sei denn, Ihre gesamte Stichprobe ist möglicherweise größer als 15.000 Probanden. Dies ist der Grund, warum 100 Wiederholungen der 10-fachen Kreuzvalidierung (abhängig von der Stichprobengröße) erforderlich sind, um Präzision und Stabilität zu erzielen, und warum der Bootstrap für eine starke interne Validierung noch besser ist. Der Bootstrap macht auch deutlich, wie schwierig und willkürlich die Auswahl der Funktionen ist.
Ich habe die Probleme mit der "externen" Validierung unter Biostatistik in der biomedizinischen Forschung in Abschnitt 10.11 ausführlicher beschrieben .
quelle
Sie müssen nicht erneut trainieren. Wenn Sie Ihre Ergebnisse melden, melden Sie immer Testergebnisse, da diese ein viel besseres Verständnis bieten. Anhand des Testdatensatzes können wir genauer erkennen, wie gut ein Modell mit Daten außerhalb der Stichprobe abschneidet.
quelle