Feature Selection Packages in R, die sowohl Regression als auch Klassifikation ausführen

12

Ich bin sehr neu in R. Ich lerne gerade maschinelles Lernen. Es tut mir sehr leid, wenn diese Frage sehr einfach zu sein scheint. Ich versuche, ein gutes Feature-Auswahlpaket in R zu finden. Ich habe das Boruta-Paket durchgesehen. Es ist ein gutes Paket, aber ich habe gelesen, dass es nur für die Klassifizierung nützlich ist.

Ich möchte die Feature-Auswahl in R für Regressionsaufgaben implementieren. Ich habe die Caret-Paketdokumentation durchgesehen, aber für mein Niveau ist es sehr schwer zu verstehen.

Kann jemand mir bitte ein gutes Tutorial zeigen oder ein gutes Paket oder die am häufigsten verwendeten Pakete in R für die Funktionsauswahl auflisten.

Jede Hilfe wäre dankbar. Danke im Voraus.

user1787687
quelle
3
Boruta eignet sich gut für die Regression.

Antworten:

13

Sie können sich auch FSelector , varSelRF , ansehen . FSelector enthält mehrere Funktionen zur Merkmalsauswahl, die beispielsweise auf dem Chi-Quadrat-Test, der Informationstheorie (Entropie, gegenseitige Information, Verstärkungsverhältnis, ...), der Korrelation zwischen Merkmal, Konsistenz usw. basieren. VarSelRF ist ein nützliches Paket zur Merkmalsauswahl mit zufälligen Wäldern mit abwärts variabler Elimination und mit Wichtigkeitsspektrum.

WAF
quelle
2
Hallo FWaldner, das sieht ein wenig kurz nach einer Antwort aus. Könnten Sie darüber nachdenken, es um einen oder zwei Sätze zu erweitern, um kurz zu erwähnen, was diese Pakete bewirken, wenn sie den anderen Vorschlägen ähnlich oder nicht ähnlich sind, oder vielleicht sogar gegen andere Dinge? Im Grunde genommen sind es nur ein paar Links.
Glen_b
Es scheint, dass varSelRF auch ausschließlich auf die Klassifizierung von Zufallsforsten und nicht auf die Regression abzielt.
Blmoore
7

Haben Sie sich die CRAN-Aufgabenansicht für Maschinelles Lernen und Statistisches Lernen angesehen, in der neben caret und Boruta noch einige andere Pakete erwähnt werden?

Im Allgemeinen ist es für Sie möglicherweise besser, eine gezielte Frage zu stellen, wenn Sie ein bestimmtes statistisches Verfahren zur Featureauswahl nicht verstehen. Der folgende Link zum Lebenslauf ist vielleicht ein Anfang: Algorithmen für die automatische Modellauswahl .

usεr11852
quelle
3

Ich schlage Rattle vor, das eine zufällige Auswahl von Waldmerkmalen hat (und vieles mehr). Es hat eine schöne GUI und ist sehr einfach zu bedienen.

Sashkello
quelle
1

GLMNET mit Lasso-Regression führt die Featureauswahl durch.

user100653
quelle
1
Können Sie eine ausführliche Antwort geben?
Anfänger
1

Zusätzlich Caretbietet package auch Methoden zur Funktionsauswahl. Hier und hier finden Sie einige Tutorials zur Verwendung der Funktionsauswahl in Caret package. Seit kurzem ist im CRAN ein Feature-Auswahlpaket verfügbar, das auf dem SISAL-Algorithmus von Tikka und Hollmén basiert .

Discipulus
quelle
Der Link zum Tutorial ist nicht mehr verfügbar. Dieser Link könnte jedoch hilfreich sein.
Ekaba Bisong