Hat jemand Erfahrung mit Ansätzen zur Auswahl der Anzahl der Hauptkomponenten mit geringer Dichte, die in ein Regressionsmodell aufgenommen werden sollen?
pca
sparse
regression-strategies
Frank Harrell
quelle
quelle
Antworten:
Obwohl ich keine direkten Einblicke in Ihre Frage habe, bin ich auf einige Forschungsarbeiten gestoßen , die für Sie von Interesse sein könnten. Das heißt natürlich, wenn ich richtig verstehe, dass Sie über spärliche PCA , Regression der Hauptkomponenten und verwandte Themen sprechen . In diesem Fall sind hier die Papiere:
quelle
http://ieeexplore.ieee.org/xpl/login.jsp?tp=&arnumber=5876870&url=http%3A%2F%2Fieeexplore.ieee.org%2Fxpls%2Fabs_all.jsp%3Farnumber%3D5876870
Ich kann eine Kopie posten, wenn Sie kein ieee-Mitglied sind.
Dies ist aus einem Artikel, den ich in der Grundschule geschrieben habe. Ich hatte ein Problem, bei dem ich entscheiden musste, wie viele Dimensionen (Latent Semantic Indexing ähnelt PCA) in meinem logistischen Regressionsmodell verwendet werden sollen. Ich habe eine Metrik ausgewählt (dh die Fehlerrate bei Verwendung einer Markierungswahrscheinlichkeit von 0,5) und die Verteilung für diese Fehlerrate für verschiedene Modelle untersucht, die auf verschiedenen Dimensionen trainiert wurden. Ich habe dann das Modell mit der niedrigsten Fehlerrate ausgewählt. Sie können auch andere Metriken wie die Fläche unter der ROC-Kurve verwenden.
Sie können auch eine schrittweise Regression verwenden, um die Anzahl der Dimensionen für Sie auszuwählen. Welche Art von Regression führen Sie speziell durch?
Was meinst du übrigens mit spärlich?
quelle