Ich bin sehr neu in R. Ich lerne gerade maschinelles Lernen. Es tut mir sehr leid, wenn diese Frage sehr einfach zu sein scheint. Ich versuche, ein gutes Feature-Auswahlpaket in R zu finden. Ich habe das Boruta-Paket durchgesehen. Es ist ein gutes Paket, aber ich habe gelesen, dass es nur für die Klassifizierung nützlich ist.
Ich möchte die Feature-Auswahl in R für Regressionsaufgaben implementieren. Ich habe die Caret-Paketdokumentation durchgesehen, aber für mein Niveau ist es sehr schwer zu verstehen.
Kann jemand mir bitte ein gutes Tutorial zeigen oder ein gutes Paket oder die am häufigsten verwendeten Pakete in R für die Funktionsauswahl auflisten.
Jede Hilfe wäre dankbar. Danke im Voraus.
r
feature-selection
user1787687
quelle
quelle
Antworten:
Sie können sich auch FSelector , varSelRF , ansehen . FSelector enthält mehrere Funktionen zur Merkmalsauswahl, die beispielsweise auf dem Chi-Quadrat-Test, der Informationstheorie (Entropie, gegenseitige Information, Verstärkungsverhältnis, ...), der Korrelation zwischen Merkmal, Konsistenz usw. basieren. VarSelRF ist ein nützliches Paket zur Merkmalsauswahl mit zufälligen Wäldern mit abwärts variabler Elimination und mit Wichtigkeitsspektrum.
quelle
Haben Sie sich die CRAN-Aufgabenansicht für Maschinelles Lernen und Statistisches Lernen angesehen, in der neben caret und Boruta noch einige andere Pakete erwähnt werden?
Im Allgemeinen ist es für Sie möglicherweise besser, eine gezielte Frage zu stellen, wenn Sie ein bestimmtes statistisches Verfahren zur Featureauswahl nicht verstehen. Der folgende Link zum Lebenslauf ist vielleicht ein Anfang: Algorithmen für die automatische Modellauswahl .
quelle
Ich schlage Rattle vor, das eine zufällige Auswahl von Waldmerkmalen hat (und vieles mehr). Es hat eine schöne GUI und ist sehr einfach zu bedienen.
quelle
GLMNET mit Lasso-Regression führt die Featureauswahl durch.
quelle
Zusätzlich
Caret
bietet package auch Methoden zur Funktionsauswahl. Hier und hier finden Sie einige Tutorials zur Verwendung der Funktionsauswahl inCaret package
. Seit kurzem ist im CRAN ein Feature-Auswahlpaket verfügbar, das auf dem SISAL-Algorithmus von Tikka und Hollmén basiert .quelle