Die Hauptkomponentenanalyse (PCA) wird verwendet, um n-dimensionale Daten auf k-dimensionale Daten zu reduzieren, um das maschinelle Lernen zu beschleunigen. Nachdem PCA angewendet wurde, kann überprüft werden, wie viel von der Varianz des ursprünglichen Datensatzes im resultierenden Datensatz verbleibt. Ein gemeinsames Ziel ist es, die Varianz zwischen 90% und 99% zu halten.
Meine Frage ist: Wird es als eine gute Praxis angesehen, verschiedene Werte des k-Parameters (Größe der Dimension des resultierenden Datensatzes) auszuprobieren und dann die Ergebnisse der resultierenden Modelle auf die gleiche Weise wie bei der Auswahl mit einem Kreuzvalidierungsdatensatz zu vergleichen gute Werte anderer Hyperparameter wie Regularisierungs-Lambdas und Schwellenwerte?
quelle